초록 |
□ 연구개요 최근 다양하고 수많은 자료들이 급증하면서 유용한 자료들도 많아졌지만, 다른 한편으로는 불필요하게 얻어지는 자료들도 많아지고 있다. 이러한 자료의 홍수 속에서 예측 및 활용에 유용한 정보와 그렇지 않은 정보를 분별해 내는 것은 중요한 통계문제로 대두되어 다양한 접근방법들이 제안되어 왔다. 본 연구에서는 기존의 베이지안 MCMC 알고리즘보다 더 효율적으로 모수공간을 탐색할 수 있는 알고리즘을 제안함으로써, 고차원 모수공간에서도 정상분포(stationary distribution)로 수렴하는 MCMC 샘플을 생성하여 효과적 추론을 할 수 있도록 한다. 1차년도에는 회귀분석에 대해 알고리즘을 개발한 뒤, 이를 2차년도에 로지스틱 회귀모형 및 cox 비례위험 모형으로 확장하고자 한다. 3차년도에 베이지안 변수 선택 문제를 Hidden Markov Random Field (HMRF) 다중검정문제로 확장하고자 한다. 1차원 HMRF에서 2차원 HMRF로 순차적 확장을 목표로 한다. □ 연구 목표대비 연구결과 1차년도: 일반회귀모형에서의 변수선택을 중점적으로 연구하였다. 기존의 변수선택 방법들을 고찰한 뒤, 교호작용을 고려한 변수선택 방법을 일차적으로 제안한 방법을 SCI 논문에 출판하였다. 이후 베이지안 방법으로 접근한 방법론을 새로이 개발하여 SCIE 논문에 투고하고 출판완료하여 1차년도 목표를 100프로 달성하였다. 2차년도: 1차년도에 일반회귀모형을 바탕으로 개발된 알고리즘을 로지스틱 회귀모형과 생존자료 모형으로 확장하였다. 다양한 데이터 생성 조합에서의 성능을 탐색하였다. 또한 실증자료 적용을 위하여 건강보험공단 자료를 탐색하여 연구대상 및 사용 변수들을 추출하였다. 일차적으로 탐색된 자료를 기반으로 SCIE 논문 출판 완료하였다. 3차년도: 베이지안 변수선택에서의 잠재변수 의 사용은 회귀모형에서의 변수선택 문제를 Hidden Markov Random Field (HMRF)를 기반으로 모형구축 후, 다중검정 수행 알고리즘을 개발하였다. 일차적으로, 1차원 Markov chain 의존성과, two-state HMRF를 가정하여 모델을 구축하고 data adaptive한 다중검정을 알고리즘을 개발하였다. 특히 correlation이 존재하는 고차원 HMRF에서의 효과적 MCMC알고리즘 개발에 중점을 두었고, 모의실험을 실행하였다. □ 연구개발결과의 중요성 과학기술의 발달 및 측정 기기의 발전 및 자동 자료 수집 등의 시스템 변화는 이전보다 훨씬 다양하고 많은 양의 정보를 생성하였다. 기후학, 의학, 금융 등 다양한 분야에서 쏟아져 나오는 자료들을 이해하고, 자료로부터 의미 있는 결과를 이끌어내기 위한 노력이 통계학 전 분야에서 이뤄지고 있다. 특히, 변수의 개수가 많은 경우 효과적인 추론을 위한 노력들은 지난 20년 동안 풀고자 한 가장 중요한 문제 중 하나라고 할 수 있다. 본 연구에서 개발하는 베이지안 변수선택 모형은 변수들 간의 다양한 상관성에 유연하게 대응할 수 있는 효과적인 방법으로 볼 수 있다. 베이지안 변수 선택에서 확장되어 수행된 베이지안 다중 검색은 다양한 상관구조의 HMRF에 적용될 수 있고, 뇌 이미지 같은 의학 영상자료나, 기후변화와 같은 공간자료 분석에 효과적으로 적용될 것으로 기대한다. (출처 : 연구결과 요약문 3p) |