[아이뉴스24 김국배기자] 데이터 비식별화를 둘러싼 갈등이 지속되고 있다.
개인정보 비식별화가 데이터 경제의 필수불가결한 요소라는 주장이 나오는 반면, 다른 한쪽에서는 재식별 가능성에 따른 프라이버시 문제를 제기하며 개인정보 활용과 보호 입장이 평행선을 달리는 모습이다.
비식별화는 개인정보에서 개인을 알아볼 수 있는 식별성을 제거하는 것을 말한다. 개인정보가 포함된 유용한 데이터를 사전동의 등 까다로운 절차를 거치지 않고 활용할 수 있게 해준다는 점에서 기업에는 매력적인 해결책이나, 국내에서는 불안감과 불신으로 활용이 미미하다.
◆'도돌이표 논쟁' 왜? 재식별 가능성 '쟁점'
비식별화 논란의 중심에는 재식별 가능성이 자리하고 있다. 아무리 비식별화 과정을 거친 개인정보라도 다른 정보와 결합해 개인을 식별할 수 있는 정보가 될 수 있는 것이 아니냐는 우려가 끊이지 않는 것이다.
심지어 데이터 활용 활성화를 위해 나온 '개인정보 비식별 조치 가이드라인'이 정부가 개인정보보호법을 우회해 개인정보 유통 길을 터준 것이라는 비판까지 나왔다.
실제로 추혜선 정의당 의원은 "비식별조치를 거친 개인정보라도 원래 보유하고 있던 개인정보, 공개정보 등과 대조하면 재식별 가능성이 여전히 남는다"며 "개인정보보호에 대한 안전장치 없이 추진된 개인정보 비식별 조치 가이드라인을 폐기해야 한다"고 주장했다.
그러나 가이드라인은 정작 데이터를 활용하려는 기업에도 환영받지 못하고 있다. 가이드라인이 제시한 방식을 따를 경우 데이터 왜곡, 손실이 워낙 커 유용한 결과를 도출할 가능성이 낮은 데다 법적 구속력이 없다는 이유에서다. 이 때문에 한국인터넷진흥원(KISA)은 가이드라인 개선을 검토중이다.
고학수 서울대 법학전문대학원 교수는 "가이드라인은 경우에 따라 'k-익명성' 개념을 두 번 적용하도록 하는 등 k-익명성 개념에 크게 의존하고 있다"며 "그 과정에서 데이터 상당부분은 삭제되는 결과가 초래되며, 원본 데이터의 통계적 속성을 유지한다는 보장이 없어져 남는 데이터의 유용성이 줄어드는 경우가 많다"고 설명했다.
'k-익명성' 개념은 흔하게 사용되는 통계학적 기준으로 동일한 속성을 지닌 레코드가 하나의 데이터셋 안에 적어도 k개 이상 존재하도록 해 프라이버시를 보호하는 방법이다.
이진규 네이버 정보보호최고책임자(CISO)는 "정보주체 입장에서는 비식별화 데이터에 '내 정보가 들어있는 자체가 싫다'는 감정적 요소가 많이 작용하고 있다"며 "프라이버시 측면에서 감정적 우려사항을 어떻게 해소할지에도 초점을 맞춰야 한다"고 지적했다.
◆"100% 재식별 불가능 없다, '흑백' 아닌 '정도'의 문제"
전문가 사이에서는 비식별화에 관한 논의가 사회적 합의를 이루려면 재식별 가능성을 최소화하겠다는 실용적 관점에서 접근해야 한다는 의견이 나온다.
재식별 가능성을 기술적으로 완벽히 차단하거나 불가능하다는 것을 과학적으로 입증하기 어렵기 때문이다. 또, 비식별 개념은 '식별 상태'나 '비식별 상태' 흑백으로 파악되는 것이 아니라 '정도(degree)'의 문제로 봐야 한다는 의견이다.
고학수 교수는 "어떻게 법과 규정을 정해도 재식별 가능성을 완벽히 차단할 수는 없다"며 "비식별, 재식별 논의는 근본적으로 통계적 추론에 관한 문제이기 때문에 어떻게 재식별 가능성과 그와 관련된 문제 발생을 줄일지 논의하는 것이 현실적"이라고 말했다.
이어 "EU 법제에서는 합리적인(reasonable) 수준에서 재식별 가능성을 파악하고, 합리성 여부를 판단함에 있어 비용이나 시간 등을 고려하도록 하고 있다"며 "내년 시행되는 유럽 개인정보보호법(GDPR)은 개인정보 보호를 강화하는 내용도 있지만 반대로 가명처리(pseudonimization)를 전제로 활용 가능성을 상당히 크게 열어준 부분도 있다"고 덧붙였다.
영국 사례도 시사점을 준다. 영국에서는 익명화된 정보의 재식별 가능성을 평가할 때 '의도된 공격자' 기준을 사용한다. 의도된 공격자에는 해당 영역에 관한 전문 지식을 갖추거나 높은 해킹 능력 등을 갖춘 자는 포함되지 않는다.
영국의 법제는 전문가에 의한 재식별 가능성까지 완벽히 차단할 것을 요구하지 않는다고 해석될 수 있다. 다만 재식별 가능성을 현실적으로 차단하려면 계약과 기타 절차상의 통제 장치를 마련해 문제가 발생할 상황을 줄이고 있다. 영국 국민의료보험(NHS)과 구글 딥마인드가 두 건의 정보공유 계약을 체결할 수 있었던 배경이다.
보안업계 관계자는 "재식별 가능성이 조금이라도 있다면 데이터를 사용할 수 없게 하는 것은 근본적으로 데이터 활용을 불가능하게 만든다"며 "비식별 조치에 대한 안전장치를 추가하고 법적 근거를 마련해 데이터를 활용할 수 있도록 해야 한다"고 말했다.
김국배기자 vermeer@inews24.com
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기