초록 |
□ 연구개요 본 연구에서는 특정 질병을 대상으로 하는 유전형-표현형 상관관계 지식베이스 구축을 위한 큐레이션 작업 자동화 시스템 개발을 목적으로 한다. 구체적으로는 텍스트 마이닝 기법을 기반으로 하는 특이 질병 관련 문서 추출, 유전형-표현형 관련 정보 추출, 정보 순위 매김, 정보의 정제 및 검증, 지식베이스 생성 등의 일련의 작업을 자동화하기 위한 요소 알고리즘 및 분석 툴의 개발을 목적으로 한다. 또한 장기간 연구 협력을 진행하고 있는 의생명과학 전문가 그룹과 구축된 협력 체계를 기반으로 융합 연구를 진행하여, 사례 연구로서 뇌신경질환 전문연구자 그룹과의 협력 작업에 의하여 퇴행성 뇌질환을 위한 데이터베이스 구축 및 공개에 관한 연구를 수행한다. □ 연구 목표대비 연구결과 1) 1차년도: - 의/생명과학 분야의 공용 Bibliome 데이터베이스 분석 - 공용 텍스트마이닝 툴의 기능/성능/활용도 분석 - relationship/similarity/priority 분석을 위한 요소 알고리즘 개발 - 바이오메디컬 분야의 공용 온토로지 성능/활용도 분석 및 온토로지 개발 - 실적: 국제전문학술논문지(SCI) 1편 게재, 국내외 학술대회 논문 8편 발표 2) 2차년도: - IR, Named entity recognition 모듈 개발 - Co-occurrence-based/NLP-based relationship extraction 모듈개발 - Genotype-Phenotype 상관관계 지식베이스 구축 밑 정보 선별/정제 - 퇴행성 뇌질환을 위한 지식베이스 개발 - 실적: 국내외 학술대회 논문 4편 발표, 박사학위 인력배출 1명 3) 3차년도: - 정량적/정성적 성능 개선 및 통합 시스템 개발 - 시각적 분석 도구의 개발 - 전문가와의 human study를 통한 정성적 성능 평가 수행 - 지식베이스 공개 - 실적: 국제전문학술논문지(SCI) 2편 게재, 국내학술대회 논문 2편 발표, 석사학위 인력배출 1명 □ 연구개발결과의 중요성 1) 본 연구에서 개발되는 bibliome 데이터 분석 알고리즘과 유전형-표현형 상관관계를 자동 추출하는 텍스트 마이닝 시스템은 생물정보학 분야에서 그 학문적/실용적 가치를 인정받을 수 있다. 2) 개발 완료된 텍스트 마이닝 파이프라인은 일반 연구자에게 공개되어 질병 원인 유전자 발견 연구에 활용 가능하며, 결과적으로 질병의 기전 이해, 진단 및 예방법 개발에 기여하게 된다. 3) 퇴행성 뇌질환을 대상으로 하는 유전형-표현형 상관관계 데이터베이스는 퇴행성 뇌질환 연구자를 위한 귀중한 자료로 활용될 수 있을 뿐 아니라, 데이터베이스 개발 노하우는 타 분야 질병을 대상으로 하는 데이터베이스 개발에 직접 활용될 수 있다. 4) 학제간 연구 교류의 성과가 있으며, 의생명공학과 컴퓨터공학 관련 전문 지식을 모두 겸비한 전문 인력을 양성할 수 있다. (출처 : 연구결과 요약문 2p) |