초록 |
□ 연구개발 목표 및 내용 ■ 최종 목표 본 연구는 돌연변이 등의 DNA 서열상의 유전적 변이, 후성유전학적 변이, 임상정보, 환자의 암 이미지 등 4종류 이상의 이종 데이터(heterogeneous data)로부터 학습을 통해 이종 데이터 간 통합 및 도메인 교차 생성을 가능하게 하는 딥 생성 모델인 Genetic Generative Adversarial Networks (GGANs)을 개발하고, 이를 분석하여 5종류 이상의 암에 대하여 암 발생 및 기전의 주요 공통 / 특이적 유전인자들을 탐색∙발굴하는 암 유전체/ 암 후성유전체/ 임상 정보/ 암 이미지 통합 분석 연구를 위한 새로운 딥러닝 기술 개발을 최종 목표로 한다. ■ 전체 내용 TCGA와 TCIA 데이터를 활용하여 DNA 서열상 유전적 변이(돌연변이), 후성유전학적 변이(DNA methylation), 환자 암 이미지, 임상정보 등 다양한 이종의 데이터를 동일한 latent space 상에서 표현 될 수 있도록 통합하고, 통합 표현된 latent feature로부터 도메인 교차 생성이 가능한 새로운 딥 생성 모델인 Genetic Generative Adversarial Networks (GGAN)를 개발한다. 또한 학습된 모델로부터 암을 정밀하게 구분 할 수 있는 특정 암에 큰 영향력이 있는 유전인자를 분석 할 수 있는 기법을 연구하여 암 발생 및 기전에 연관된 정확도 높은 주요 유전자 후보군을 제시한다. 제안한 모델은 암 기전 관련 대규모 이종데이터를 기반으로 다양한 인자간 통합 모델링 및 분석이 가능하며 이는 암 연구에 있어 새로운 분석 시각을 제공하고 암연구 역량 강화 및 선도적 딥러닝 기반 암 유전체 분석 기술 연구를 수행함으로써 글로벌 경쟁력 확보에 기여한다. □ 연구개발성과 본 연구는 암 유전인자 규명을 위해 최신 딥러닝을 중심 기계학습 기술 기반 암 연관 대규모 이종 데이터 분석 연구를 수행하여 유의미한 연구 결과를 도출하였다. 연구 수행 중 관련 연구 결과를 SCI 학술지에 3편 이상 발표하여 연구 기간 내 매년 성과를 보고하였다. 특히 암 유전인자 규명에 적합한 고차 인자 관계를 모델링 할 수 있는 해석 가능한 새로운 기계학습 기술을 개발하여 대규모 암 데이터를 분석한 연구 결과를 computer science & artificial intelligence 분야 상위 15% 이내, computer science & interdisciplinary application 분야 상위 10% 이내 저널에 연구 결과를 게재하여 기계학습 기반 대규모 데이터 분석 기반 암 연구에 기틀을 마련하였다. 이를 기반으로 암 연관 대규모 이종 데이터 분석 연구를 위한 딥러닝 기술 연구를 수행하여 Genetic Generative Adversarial Networks 모델을 개발하여 복잡한 암 유전인자 규명 연구에 새로운 통찰력을 제공하였으며 관련 분석 결과는 SCI 학술지에 제출 예정이다. □ 연구개발성과 활용계획 및 기대 효과 최신 딥러닝 기술 GAN을 기반으로 이종 데이터 교차 생성 기반의 TCGA-TCIA 데이터 통합 모델을 제시하여 암 연구 뿐 만 아니라 대규모 이종 의생명과학 데이터 분석연구에 활용하여 다양한 인자를 고려한 데이터 통합 모델링 및 분석을 가능하게 한다. 이를 활용하여 기존에 찾지 못했던 새로운 분석 결과 및 가설을 획득하여 새로운 전문 지식을 창출하고 의생명과학 연구에 새로운 통찰력을 제공 할 수 있다. 더 나아가 다양한 유전적/환경적 인자를 고려한 암 통합 분석의 기반 기술로 새로운 통합적 유전체 의학 발전 및 국내 기초 의생명과학 연구 향상에 크게 기여 할 수 있다. (출처 : 요약문 2p) |