초록 |
연구의 목적 및 내용 기 수행 연구를 통해 수집한 유전자 변화와 복잡 질환(complex diseases) 간 관계에 대한 대용량 텍스트 마이닝 데이터를 활용하여 새로운 질병에 대한 인과관계와 조건 정보 등 새로운 생물학 지식을 식별하는 시스템을 구축하고 이를 기반으로 다양한 질병에 대한 신호전달체계 구축을 돕고자 한다. 기존의 시스템의 부족한 성능을 보완하고자 새롭게 생물학 사건 주석 방법과 이를 활용한 시스템을 제안하였으며 분포 의미 모델을 이용한 생물학 객체들 간의 관계 식별 시스템을 개발함으로써 벡터 공간에서의 후속 연구를 위한 기반을 마련하였다. 또한, 생물학 분야의 전문가 시스템 개발을 위한 첫 단계로 효율적인 자동 주석 시스템을 개발하였다. 연구결과 다양한 복잡 질환의 신호전달체계 구축과 추론을 위한 기존 시스템들에 나타나는 문제점들을 해결하기 위하여 새로운 방법론을 제안하였다. 높은 성능의 생물학 사건 추출 시스템을 위해 기존에 생물학 말뭉치에 나타나는 애매성 해결을 통한 새로운 사건 추출 시스템을 개발하였다. 새로운 관계 식별 및 분류 방법으로 단어 임베딩을 통한 단어 벡터 구축과 이들의 벡터 공간상 위치를 이용해 관계를 식별하고 분류하였다. 또한, 새로운 복잡질환으로서 우울증관련 연구에서 밝혀진 다양한 생물학 사건의 인과 관계와 위치 정보를 주석한 생물학 말뭉치를 구축하였다. 조건 정보를 파악하기 위한 선행 연구로 일반 문헌에서의 사건이 일어난 위치 정보를 수집한 말뭉치와 우울증과 유전자에 영향을 주는 환경요인 식별을 위한 우울증 관련 유전자-환경 상호작용 식별 시스템을 개발하였다. 마지막으로 생물학 전문가 시스템인 검증 문서와 추론을 이용하여 효율적으로 문헌들을 검증하는 인공 신경 정리 증명계를 개발하였다. 본 연구에서 집중한 주제들은 생물학 자연언어처리에서 주목하고 있는 분야로 제안한 시스템들과 방법론들은 다양한 응용 분야에서 높은 활용성을 보일 것이다. 연구결과의 활용계획 벡터 공간에서의 관계 식별 연구를 고도화하기 위해서 보다 다양한 말뭉치와 데이터를 활용하여 성능 향상을 도모하고 새로운 관계 추론 시스템을 위한 연구로 발전시킬 예정이다. 우울증 관련 말뭉치, 개선된 생물학 사건 추출 시스템과 환경 조건 식별 시스템을 이용해 완성도가 높은 신호전달체계를 구축하고자 한다. 이어서 이들을 다른 질병 및 약물간의 기작에 적용해서 다양한 질병의 발생 기작 및 신약 개발에 기여를 하고자 한다. 인공 신경 정리 증명계를 기반으로 한 질의응답 시스템을 구축하여 질의에 대한 정답 뿐만 아니라 그 근거가 되는 문장 및 문헌을 자동 파악함으로써 생물학 전문가들의 심화된 연구를 돕고자 한다. (출처:한글요약문 p.5) |