연세의대 연구진, 차세대염기서열분석법에 AI 딥러닝 접목
30억개의 염기서열 모두 분석 가능... 돌연변이 유전자 찾아내
국내 연구진이 인공지능(AI) 딥러닝을 활용해 희귀 안질환 원인 분석에 나섰다.
연세대 강남세브란스병원 안과 한진우, 이준원 교수팀은 희귀 안질환인 영아 눈떨림증후군의 원인을 분석하는 유전자 검사 기법에 AI 딥러닝을 접목해 기존 분석법을 크게 개선했다.
영아 눈떨림증후군은 생후 6개월 이전의 영아에게서 눈동자가 좌우, 상하 또는 복합적으로 떨리는 증상이 나타나는 희귀 안질환이다. 명확한 원인을 찾기 어려운 질환으로 인구 2000명 당 1명꼴로 발생한다.
최근 환자의 유전자를 분석하는 차세대 염기서열 분석법(Next Generation Sequencing, NGS)이 정착되면서 영아 눈떨림증후군의 원인 규명과 진단 및 치료에 도움이 되고 있다. 그러나 NGS 기법으로도 40~50%의 환자는 여전히 원인 돌연변이를 찾지 못하고 있다.
연구팀은 NGS 기법에 인공지능 딥러닝을 활용해 모든 유전체(genome)를 검사하는 방식으로 원인 돌연변이를 찾고자 했다. 기존 분석법은 염기서열의 일부를 검사하는 엑솜 유전체 검사법과 유전자 패널 검사법이 주로 활용된다. 유전체를 전부 분석하기에는 범위가 방대하고 시간과 비용이 많이 들기 때문이다.
이번에 연구팀이 AI 딥러닝으로 시행한 전장유전체 분석법은 약 30억개에 이르는 유전체의 광범위한 영역을 검사한다. 단백질 생성에 관여하지 않는 비전사영역(deep intronic region)도 분석이 가능하며, 유전체 구조적 변이(Structural variation)와 조절 부위(Regulatory variation)를 검출하기 쉽다.
연구팀은 기존 분석법에서 원인이 규명되지 않은 영아 눈떨림증후군 환자와 가족 4개군을 대상으로 전장유전체 분석법을 시행해 영아 눈떨림증후군 연관 유전자인 FRMD7의 돌연변이 여부를 확인했다. 분석에는 SpliceAI와 SpliceRover 프로그램이 활용됐으며, 기존 이어맞추기(splice) 예측에 활용한 Alamut 프로그램과 비교했다.
분석 결과, 연구진은 FRMD7 유전자의 비전사영역에서 c.285-12A>G, c.284+63T>A, c.383-1368A>G 변이체를 발견했으며, 해당 변이가 스플라이싱(DNA가 전자되어 전령 RNA가 되는 과정에서 인트론이 제거되어 엑손이 연결되는 것)에 오류(mis-splicing)를 일으키는 것을 확인했다. 스플라이싱 오류는 암, 희귀질환 등 각종 질병을 유발한다.
한진우 교수는 “비전사영역의 변이와 질병과의 연관성을 증명하기 쉽지 않은데, AI 딥러닝을 바탕으로 스플라이싱 오류 예측이 가능했다. 이번 연구는 향후 희귀 질환에서 원인 변이를 찾지 못한 환자들에게 AI 딥러닝과 전장유전체분석의 활용 방향을 제시하는 초석이 될 것으로 기대한다”고 말했다.
이번 연구는 Noncanonical Splice Site and Deep Intronic FRMD7 Variants Activate Cryptic Exons in X-linked Infantile Nystagmus이라는 제목으로 국제 학술지 <Translation Visual Science and Technologies>에 게재됐다.