식별력 있는 개인정보, 가명정보, 익명정보 명확한 구분 쉽지 않아
가명정보로 생산된 빅데이터 가치평가·수익분배 사회적 논의 거쳐야
해외에선 데이터 활용 이익 '데이터 세금' 부과 환자 위해 사용 의견도
보건의료 데이터 활용 문제는 의료인공지능 산업의 발전과 맞물려 4차산업시대 화두가 되고 있다.
현재 보건의료 데이터 활용을 위한 국내 인프라는 좋은 편이다. 전국민 건강보험 가입, 의료기관의 전자의무기록 90% 이상 도입, 뛰어난 정보통신기술(ICT) 확보 등 의료AI 산업 발전의 기반을 갖추고 있으며, 국민 인식도 조사에서 80% 이상이 자신의 의료정보를 의료기술 개발을 위해 제공하겠다고 답해 국민적 합의 수준 역시 높다.
정부도 데이터 댐 프로젝트 등 대규모 디지털 뉴딜 사업의 막대한 예산 일부를 보건의료 데이터 및 의료AI 혁신전략에 투입하는 상황이다.
게다가 지난 2020년 8월 '데이터 3법'(개인정보보호법·정보통신망법·신용정보법)이 시행되면서 '가명정보'일 경우 개인의 동의없이 국가, 공공기관, 기업 등이 사용할 수 있고, 제3자에게 제공도 가능하다.
그러나 긍정적인 모습만 있는 것은 아니다.
민감한 보건의료 데이터를 산업 목적으로 활용할 필요성이 있는지에 대한 근본적인 문제부터, 적정한 가명·익명 처리 방법, 데이터의 가치평가, 보건의료 데이터의 귀속과 권리주체, 데이터 활용의 이익 배분까지 세심하게 살피고 법·제도적으로 정비해야 한다는 목소리도 높다.
정상태 변호사(법무법인 율촌)는 대한의학회 발간 뉴스레터 최근호에 '보건의료 데이터 활성화 문제, 데이터의 권리주체 및 활용성과에 관하여' 기고를 통해 보건의료 데이터 활용에 앞서 예상되는 문제점을 촘촘하게 짚고, 선제적으로 폭넓게 사회적 논의 과정을 거쳐야 한다고 진단했다.
먼저 개인정보·가명정보·익명정보 등 정보의 구분 문제다. 개별 데이터가 식별력이 있는 개인정보인지 가명정보인지, 익명정보인지 구분하는 게 쉽지 않다는 지적이다. 익명정보의 경우 개인정보보호법이 적용되지 않고 자유롭게 활용이 가능하기 때문에 익명정보와 개인정보(또는 가명정보)는 정보주체의 자기결정권이나 정보의 활용도 면에서 매우 큰 차이가 있다.
이같은 구분은 법적 결정으로도 명확하게 판단하기 쉽지 않다.
정상태 변호사는 "개인정보보호위원회는 과거 태아 초음파 사진을 개인정보라고 판단한 반면 최근 가이드라인에서는 정보주체를 알아 볼 수 없는 치아 X-ray 사진은 개인정보라고 보기 어려울 수 있다(익명정보)고 판단하고 있다"라며 "또 최근 처방전 관련 개인정보 사건에서 민사법원은 암호화된 정보라도 쉽게 복호화할 수 있다면 개인정보라고 판단한 반면, 형사법원은 개인정보는 구분 가능성이나 선별 가능성 만으로는 부족하고 식별가능성이 있어야 한다는 등의 이유로 개인정보법 위반이라고 보기 어렵다고 판단했다"라며 판례를 소개했다.
사안에 따라 개인정보의 특성이 바뀔 수 있는 부분은 보건의료 데이터의 민감성과 결합해 데이터의 활용도를 크게 저하시킬 수 있다는 인식이다.
데이터의 권리 주체 문제도 불거질 수 있다.
현행 개인정보보호법상 정보 주체(환자)는 병원이나 AI업체 등 개발사에게 자신의 개인정보에 대한 열람·정정·삭제·처리정지 등을 요청할 수 있다. 그러나 가명처리 후엔 얘기가 달라진다. 정보주체가 가명처리된 정보에 대해 열람·정정·삭제·처리정지 등을 요청할 수 없으며, 사전에 자신의 개인정보를 가명처리 대상에서 제외해 줄 것을 요청할 수 있을 뿐이다.
병원이나 개발사는 어떨까.
정보주체의 손을 떠난 빅데이터에 대해 병원이나 개발사는 저작권법(데이터베이스), 형법(배임죄), 부정경쟁방지법(영업비밀보호·데이터부정사용 금지) 등을 통해 보호받는다.
상업적인 행위도 발생한다. 가명처리된 데이터는 환자의 동의 없이 과학적 연구 목적 등으로 제3자에게 유상 또는 무상으로 제공할 수 있다. 실제로 가명처리된 보건의료 데이터는 다수의 제3자에게 유상 제공되고 있다.
정상태 변호사는 "이 지점에서 데이터의 가치평가, 이익배분의 문제가 발생한다. 데이터의 가치평가 방법으로 여러 가지 이론이 제시되고 있지만, 실제 데이터 가치 평가는 어떤 정밀한 이론에 의해 결정된다기 보다 데이터 제공자와 수령자 사이의 거래 협상에 따르거나, 분쟁 단계에 이르게 되는 경우에는 법원의 재량에 의해 결정되는 것이 대부분"이라며 "현행법상 데이터의 활용으로 인한 이익은 원칙적으로 현재 데이터를 보유하고 있는 병원이나 개발사에게 귀속되는 구조다. 환자는 자신들이 제공하는 데이터의 미래 가치를 현재 정확히 예측할 수 없고, 사후적으로 이익 배분을 요청할수 있는 법·제도가 없기 때문에 실질적으로 이익배분에 참여하기가 어렵다"고 지적했다.
미국 캘리포니아주 대법원의 사례 역시 정보 주체의 권리에 대한 판단을 엿볼 수 있게 한다.
정상태 변호사는 "미국 캘리포니아주 대법원은 hairy cell leukemia 치료에 특별한 세포와 혈액구성성분을 가졌던 환자가 이를 연구해 큰 수익을 낸 제약회사와 교수 등을 상대로 한 이익배분청구 사건에서, 일단 비장세포 등이 인체로부터 적출되면 환자의 소유권 내지 재산권이 미치지 않는다고 판단했다"라며 "일각에서는 데이터 활용 이익에 대한 데이터 세금(Data Tax)을 부과해 환자를 위해 사용해야 한다는 의견도 제시되고 있다"고 설명했다.
문제는 또 있다. 병원이나 개발사 사이의 이익 배분 비율도 관건이다.
국가연구개발혁신법은 연구개발기관(주로 개발사)이 연구개발 성과를 소유하고, 연구개발 과제 참여 유형과 비중 등에 따라 연구개발기관이 공유할 수 있다고 규정하고 있다.
정상태 변호사는 "데이터를 가공해 제공한 병원과 이를 활용해 최종결과물(특허 또는 소프트웨어 등)을 개발한 개발사 사이의 공헌도를 정확하게 배분하기가 쉽지 않다"라며 "이로 인해 병원이 외부 기관에 데이터 제공하는 것을 주저하거나 어떤 경우에는 지나치게 많은 대가나 권리를 주장하는 사례도 발견된다"고 짚었다.
데이터의 정당한 가치 평가 방법이나 각 권리주체에게 데이터 활용 수익을 배분하는 방법을 획일적으로 규정하거나 명확하게 산정하기는 어렵다는 판단이다.
정상태 변호사는 "개정 개인정보보호법 시행에 따라 보건의료 빅데이터의 활용 가능성이 대폭 확대됐다. 국제적 경쟁이 치열해지는 상황에서 한국 보건의료 산업의 발전과 환자의 권익 향상을 위해 빅데이터 활용은 필요하다"라며 "다만 관련 법령의 명확화, 데이터의 귀속·가치평가, 데이터 활용에 대한 이익 배분 등 해결해야 할 과제들도 속속 발생하고 있다. 이에 관한 폭넓은 사회적 논의가 시작돼야 한다"고 강조했다.