심평원· 공단에 쌓인 빅데이터 어떻게 이용할까

심평원· 공단에 쌓인 빅데이터 어떻게 이용할까

  • 고수진 기자 sj9270@doctorsnews.co.kr
  • 승인 2015.08.20 05:59
  • 댓글 0
  • 페이스북
  • 트위터
  • 네이버밴드
  • 카카오톡
이 기사를 공유합니다

심평원, 빅데이터센터 개방...원격PC도 가능
건보공단, 학회 통해 정보 요청...분석교육도 제공

빅데이터를 활용할 수 있는 정보의 공개 범위도 넓어지고 있는 추세다.

건강보험심사평가원이 빅데이터 개방시스템을 본격 가동하면서, 6년치 자료를 공개했다. 보건의료 연구를 목적으로 하는 연구자들이 심평원과 국민보험공단이 보유하고 있는 방대한 빅데이터를 어떻게 이용하고 활용하면 좋을지 그 방법을 알아봤다.

심평원, 원격PC·센터내에서 정보 분석 가능

심평원이 보유한 빅데이터는 의료기관·제약회사 등 보건의료산업분야와 식품의약품안전처·국민건강보험공단 등 유관기관에서 수집한 의료분야 약 2조 8879억 건에 해당된다. 이 중 진료정보 등 7개 분야 18개 데이터와 함께 2007년부터 누적된 3258억건에 달하는 데이터를 올해 7월부터 개방하고 있다.

기존 빅데이터를 이용하기 위해서는 서버의 데이터용량이 작은 관계로 3년의 자료만 확인이 가능했다. 반면 이번 시스템과 포털 구축으로 2007년부터 2013년초까지 6년치 6개월에 대한 자료를 확인할 수 있게 됐다.

▲ 이태선 심평원 의료정보분석실장
이태선 심평원 의료정보분석실장은 <의협신문>과 만난 자리에서 "그동안 제공한 데이터는 복잡하고 접근하기 어려운 부분이 많았다"며 "심평원이 보유한 자료를 토대로 민간·개인·학계 등에서 쉽게 데이터를 활용할 수 있도록 개선했다"고 말했다.

심평원이 보유한 빅데이터는 ▲진료정보 ▲의약품정보 ▲치료재료정보 ▲의료자원정보 ▲비급여정보 ▲의료질평가정보 ▲연계정보 등이다.

심평원 데이터를 이용하기 위해서는 개방시스템 인터넷 홈페이지(http://opendata.hira.or.kr)에서 일반적인 공공데이터를 확인할 수 있다. 만약 연구나 사업분석을 위해 통계분석 정보를 얻기 위해서는 데이터 신청을 통해 활용할 수 있다.

데이터 신청을 위해서는 원격으로 자신의 지정된 PC를 활용해 분석이 가능한데, 원격계정을 신청하고 인증을 받으면 이용할 수 있다. 현재 심평원이 보유하고 있는 원격계정은 150개로 동시에 많은 연구자들이 작업을 해도 충분히 가능하다. 심평원 빅데이터센터 내에서도 분석할 수 있는 곳이 40석 마련됐다.

최근 환자정보가 유출되는 사건이 발생한 만큼 개인정보 보안에도 신경썼다. 개인정보 부분은 수집단계부터 암호화작업이 들어가며, 개개인 식별이나 개별기관·업체 등을 식별할 수 없도록 했다.

또 신청한 정보와 데이터 전부를 개인 PC에 전달할 수 없으며, 보안사항을 거치고 산출된 결과물만 외부에서 볼 수 있도록 했다.

▲ 심평원 빅데이터센터에는 정보를 분석할 수 있는 40석의 공간이 마련됐다.
일반 공공데이터는 무료로 이용할 수 있지만, 통계와 분석이 요구되는 부분은 30만원으로 책정, 데이터 이용에 따라 달라질 수 있다. 원격으로 이용하거나, 센터내에서 작업할 경우에는 5만원의 이용료가 있다.

이태선 실장은 "심평원 빅데이터센터 내에는 3분의 1에 해당하는 직원들이 정보분석사 등의 분석활용능력을 보유하고 있는 만큼 정보제공과 함께 요청 시 실무자들의 분석도 주어진다"고 설명했다.

이어 "이번 개방시스템으로 의료인들이 보다 쉽게 접근이 가능하게 됐다"며 "빅데이터 정보와 병원내 진료정보를 활용해 좋은 임상근거를 찾아내고 양질의 의료서비스가 제공될 수 있도록 활발한 연구를 해달라"고 당부했다. 

건보공단 "학회 위주의 요청 자료 제공"

국민건강보험공단의 빅데이터도 활용할 수 있다.

건보공단은 2012년 1조 5669억건의 데이터 중 유의미한 자료를 모아 연구용 국민건강정보DB를 구축했으며, 이를 기반으로 '표본코호트 DB'를 2014년 7월부터 일반연구자에게 공개를 시작했다.

건보공단의 데이터는 ▲국민의 자격 및 소득수준 정보 ▲건강검진 결과 ▲진료내역 ▲요양기관 정보 ▲노인장기요양보험 등의 자료등이 축적돼 있다. 현재 질병치료 중심에서 예방 중심으로 변화하는 건강패러다임에 맞게 국민의 건강과 관련된 연구를 진행할 수 있다.

건보공단의 빅데이터는 대한당뇨병학회·한국역학회·골대사학회·뇌졸중학회 등과 MOU를 맺어 학회 연구에 지원하고 있다.

신순애 건보공단 빅데이터센터 운영실장은 "의사 개인이 필요한 자료를 제공하기 보다는 학회에서 회원들의 요구에 맞는 공통된 자료를 요청하면 관련 데이터 서비스를 제공하고 있다"고 밝혔다.

건보공단은 학회가 보유하고 있는 임상 데이터와 건강보험 빅데이터를 연계하면서 연구용 DB를 구축하고 있다. 또 연구결과를 기반으로 질병의 예방 및 관리를 위한 대국민 건강서비스를 개발 중에 있다.

건보공단의 빅데이터 이용료는 100만원 정도로 책정됐으며, 데이터 사용량에 따라 금액은 달라진다.
표본코호트 자료는 개방하고, 이를 통계분석하는 것은 연구자가 직접 해야 한다.

분석작업에 어려움을 느끼는 의료진들을 위해서 건보공단은 데이터 분석을 분기별로 진행한다. 직접 건보공단의 데이터를 사용해 논문을 발표한 연구자를 초빙해 사례를 알아보고, 관련 교육을 마련하고 있다.  교육을 원한다면 홈페이지에서 자유롭게 신청이 가능하다.

의료계 "빅데이터 활용 위한 정확한 목적있어야"

한편 빅데이터를 활용하기 위해서는 정확한 목적이 있어야 한다고 제언했다.

 
오상우 동국대일산병원 가정의학과 교수는 "빅데이터 보유기관에서는 개인이 정보를 원한다고 해서 모든 정보를 다 제공해주지 않는다"며 "연구하기 위한 정보의 목적이 무엇인지, 정당한 정보인지 공익적인 정보인지를 판단한 후에 이용하는 것이 옳다"고 말했다.

예를들어 어떤 제약회사에서 정보를 원하는 경우, 경쟁 제약사의 정보를 얻기 위한 것이거나 타사에 피해가 발생할 수 있는 정보를 얻으려는 목적으로 데이터를 신청하는 것은 불가능하다는 지적이다.

또 자신이 하고 있는 연구 내용에 맞는 데이터를 보유한 기관에 요청하는 것이 좋다고 조언했다.  오 교수는 "나의 경우는 국민건강정보와 관련해 건강증진 연구를 주로 하기 때문에 건보공단에서 빅데이터를 많이 활용한다"며 "만약 심사기준별로 연구하기 위해서는 심평원 데이터를 이용하는 것이 효과적"이라고 설명했다.

건보공단의 빅데이터를 이용할 때 불편한 점도 지적했다. 그는 "건보공단의 데이터를 활용하기 위해서는 건보공단내의 빅데이터센터에서만 분석할 수 있다"며 "개인정보보호 때문에 밖으로 정보를 유출할 수 없으므로 분석에 어려움이 존재한다"고 말했다.

데이터 활용을 위해 적극적인 지원이 필요하다는 의견도 나왔다.

의료계 관계자는 "심평원과 건보공단의 데이터는 민감한 개인정보가 담겨있어서 활용하는데 제한이 있는 게 사실"이라며 "이런 부분을 해소하기 위해 해외에서는 빅데이터 R&D에 투자계획을 발표하면서 본격적인 활용방안을 모색하고 있는 만큼, 우리도 정부에서 적극 투자해 활용 범위를 넓힐 수 있어야 한다"고 강조했다.
 

개의 댓글
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
* 기사속 광고는 빅데이터 분석 결과로 본지 편집방침과는 무관합니다.