초록 |
연구개요 네트워크 형태의 구조화된 고차원 데이터나 이미지 데이터 및 소셜 미디어상의 멀티 모달 데이터와 같은 고차원 데이터를 효과적으로 융합하고, 이의 잠재 정보 및 구조를 반영하는 통합적 분석 기법을 개발하고자 한다. 또한, 해당 기법을 최신 기계학습 알고리즘을 이용하여 딥러닝 기반의 데이터 분석 모델로 확장함으로써 연구 목표인 ‘고차원 융합 데이터의 통합적 분석을 용이하게 하는 잠재 구조 기반 확장성 있는 기계학습 방법론 개발/적용’을 달성하였다. 연구 목표대비 연구결과 ·소셜 미디어 멀티 모달 데이터의 네트워크 통합 분석법 개발 텍스트 데이터와 이미지 데이터를 이용하고 여러 뷰의 특징을 통합적으로 활용하여 네트워크 기반 이미지 군집화 프레임워크를 개발하여 기존의 군집화 알고리즘 대비 성능을 크게 향상시켰으며, 본 연구는 2017년 9월 국제학술대회 ICIP 에 발표됨 ·네트워크 기반 멀티 오믹스 데이터 통합적 분석 프레임워크 개발 유전자 pathway 데이터를 기반으로 멀티 오믹스 데이터 통합 모델과 이를 벤치마크하여 모델 적용 영역을 확장하는 연구를 진행함. 후속 연구로서 단백질 수준의 데이터까지 통합하여 3편 모두 SCI급 국제학술지에 게재됨(2018.9 BMC Medical Genomics ,2019.4 Biology Direct, 2019.7 BMC Medical Genomics) ·샘플의 사전 지식을 활용한 유전자 연관 네트워크 모델링 유방암 환자들의 methylation과 유전자 발현 간의 선형 네트워크를 통계적으로 도출하여 유방암의 subtype에 관련된 유전자 식별 모델을 제안하여 2017년 5월 SCI급 국제학술지 BMC Medical Genomics 에 게재됨 ·Feature vector 학습을 위한 시계열 인코딩 기반 분석법 개발 다양한 도메인의 시계열 데이터를 고정된 크기의 feature vector로 변환한 후 통합하는 딥러닝 기반의 모델을 제안하였으며, 경도인지장애 환자의 알츠하이머 경과 예측의 실제 응용 문제에서 좋은 성능을 입증하여 2019년 2월 SCI급 국제학술지 Scientific Reports에 게재됨 ·이미지 데이터 기반 데이터 왜곡 검출 시스템 개발 왜곡 데이터 복원 사전 지식을 위한 데이터 왜곡 정보 및 영역 검출하는 모델을 제안하여 2017년 11월 국제학술대회 ACPR에 발표함. 더 나아가 이미지 왜곡 사전 정보를 기반으로 이미지 데이터의 왜곡을 복원하는 프레임워크를 제안하여 2018년 6월 CVPR Workshop 에 발표함 해당 연구 주제와 관련하여 총 7편의 논문을 SCI급 국제학술지에 게재했으며, 13 편의 연구 결과를 국내 및 국제 학술대회에서 발표했으며, 3개의 특허 출원과 1개의 특허 등록 결과를 보임 연구개발결과의 중요성 딥 러닝 분야의 멀티 모달 학습(Multimodal deep learning)은 이미지와 텍스트, 비디오와 텍스트와 같이 접근 가능한 데이터의 타입이 다양해짐에 따라 다양한 분야에서 요구되고 있는 기술이다. 특히, 의생명과학 응용 분야 또한 환자들의 시계열 데이터가 사용 가능해짐에 따라 MRI 이미지, 고차원 유전체 데이터 등의 데이터를 통합하는 모델을 필요로 하고 있다. 본 연구를 통해 이와 같은 이기종 데이터들을 효과적으로 융합할 수 있으며, 실제 응용문제에 적용하였을 때도 본 연구에서 제시하는 모델이 데이터의 내제 정보와 구조적 정보를 모두 반영하여 주어진 데이터들을 통합적으로 분석할 수 있음을 입증하였다. (출처 : 요약문 3p) |