초록 |
본연구에서는 데이터에 내재된 행렬구조를 고려한 통계방법론을 개발하였으며 핵심 연구주제는 평균벡터 및 공분산행렬의 동시 모형화, 리만구조를 가지는 행렬데이터에 대한 자율학습론 및 지도학습론으로 구성된다. 첫 번째 주제는 평균벡터 및 공분산행렬의 동시 모형화이다. 다변량데이터의 평균벡터와 공분산행렬이 동일한 입력변수들에 의해 설명되는 모형을 설정하였으며 특히 공분산행렬이 항상 양정치가 되게 하는 모형을 도입하였다. 모수적 추론에서는 제안된 추정량의 대표본성질을 규명하기 위하여 기존 연구에서 더 나아가 최소한의 정칙조건 하에서 바하두어 재표현과 점근정규성을 증명하였다. 모수적 추론 결과를 기반으로 변수선택 문제와 비모수적 함수추정 방법으로서 스플라인 방법론에 대하여 확장 연구를 진행하였다. 두 번째 주제는 리만구조를 가지는 행렬데이터에 대한 자율학습론이다. 통계학을 포함한 여러 분야에서 관측되는 데이터는 양정치 행렬인 경우가 많으므로 양정치 행렬의 군집화에 대해 연구하였다. 양정치 행렬들은 유클리드 공간이 아닌 리만구조를 가지는 대칭 공간인 콘에 속하게 되며 이는 다양체 공간의 한예가 된다. 본 과제에서는 양정치 행렬이 가지는 리만구조에 의해 정의되는 거리들이 유클리드 거리와는 개념적으로 다르고, 산술평균이 다양체에서는 여러 형태의 평균들로 확장될 수 있다는 사실들을 고려한 군집화 방법론을 개발하였다. 세 번째 주제는 리만구조를 가지는 행렬데이터에 대한 지도학습론이다. 의료영상의 확산텐서영상데이터 분석을 포함한 여러 분야에서 반응변수가 양정치 행렬데이터 형태로 관측되는 경우 적절한 설명변수에 의해 정의되는 회귀함수 추정문제가 중요하게 연구되었다. 본 과제에서는 회귀함수 행렬이 양정치가 되도록 하는 모형을 도입하였다. 제안된 모형에 대해 스플라인 추정법을 적용하였으며 대표본 성질로서 스플라인 추정량의 수렴속도가 최소최대 하한과 같게 된다는 사실에 대하여 연구하였다. 설명변수의 수가 많은 경우에 대해서는 해석 및 추정의 어려움이 생기는 다차원의 저주를 극복하기 위해 함수형분산분해 기반 스플라인 방법론에 대해 연구하였다. 본 연구 결과에 대한 기대효과는 다음과 같다. 최근 여러 과학 및 기술 분야에서 이루어지고 있는 데이터 분석에서는 데이터의 행렬구조를 모형화 및 분석하고자 하는 방법론이 중요하게 인식되고 있다. 본 연구에서 개발된 행렬구조를 가지는 데이터의 모형화 및 분석을 위한 새로운 통계적 방법론은 기존의 많은 연구들이 개별적인 상황에서 임시방편적인 해결책을 모색하고 있다는 한계점을 극복할 수 있으며 특히 행렬구조를 고려한 고차원데이터의 모형화 및 분석에 대한 새로운 패러다임을 제시할 수 있을 것으로 기대된다. 새로운 통계학 분야를 창출할 수 있다는 점에서 통계 이론 발전 및 응용성 제고에 크게 기여할 수 있으며 개발된 원천기술은 빅데이터 분석, 확산텐서영상 분석 등 다양한 응용분야에 적용될 수 있을 것이다. 본 연구의 결과를 활용하여 향후 과제로서 능형(Ridge) 회귀, LASSO와 같은 벌점화를 적용하여 변수를 선택하는 것을 고려해 볼 수 있으며, 또한 경시적 자료, 기상학, 생명역학, 의료영상, 위험관리 및 포트폴리오 할당 등 많은 분야에 적용될 수 있을것이라고 기대한다. (출처 : 연구결과 요약문 3p) |