초록 |
□ 연구개요 예측 정확도가 가장 높다고 판단되는 빅데이터 기반 딥러닝을 이용하여 한국인 식이에 따른 심혈관계 대사질환(cardiometabolic disease) 유병률을 예측함으로써 잠재적인 대상 환자를 선별하여 그들의 영양 문제와 식이 패턴 추이를 발견, 결국은 심혈관대사질환을 예방하기 위한 연구이다. 1차년도는 국민건강영양조사(KNHANES) 자료 활용, 2차년도는 한국인유전체역학조사자료(KoGES) 안산&안성 자료를 이용하여 빅데이터 기반 딥러닝을 이용하여 식이 패턴에 따는 심혈관질환 유병률 예측 모형을 개발하고, 3차년도 에 이들 각각 결과들을 비교 또는 가능하다면 통합 분석 실시하고자 하였다. □ 연구 목표대비연구결과 Ⅰ. 국민건강영양조사 데이터 활용 결과 - 제4기-7기 국민건강영양조사(KNHANES)를 바탕으로 이상지질혈증, 고혈압, 제2형 당뇨병, 비만 질환을 공통적으로 잘 예측할 수 있는 딥러닝 예측 모델을 개발였음, 딥러닝 DNN모델은 3개의 은닉층과 1개의 출력층, 각 30개, 12개, 8개의 노드를 가진 DNN모델이 로지스틱회귀분석에서 높은 정확도를 나타내었음. - 제6기-7기 국민건강영양조사(KNHANES)를 바탕으로 딥러닝 DNN 모델을 일반특성변수(n=8) 및 영양소섭취(n=25) 33개 변수를 독립변수로 두고 대사증후군 여부를 종속변수로 설정한 후 모델을 구현하였으며, Python(version 3.8.5), Pytorch(version 1.9.0+cpu), Adam optimizer 손실함수, ReLU(Rectified Linear Unit) 활성화 함수 적용하였음, 은닉층 4개, 출력층 1개로 구성, 각층별 노드수는 30개, 20개, 10개, 1개로 모델을 개발. Ⅱ. KoGES 지역사회(안산, 안성)활용 결과 - KoGES 지역사회(안산, 안성) 기반자료(10,030개)를 활용하여 일반학적 변수(n=24개), 영양학적 변수(n=28) 52개를 독립변수로 두고 고혈압 여부를 종속변수로 두고 딥러닝 분석, Python(version 3.7.11.), Keras(version 2.3.1), Colaboratory(version 18.04.5)환경에서, TensorFlow(version 2.5.0) 사용, KNNImputer를 K최근접이웃을 활용 결측값 대체하는 작업 실시, ReLU 활성화 함수를 적용, kerastuner을 이용하여 4-64개 중 최적의 은닉층으로 학습시키는 작업을 실시함. 본 연구모델은 은닉층 2개, 출력층 1개, 각 층별 4-64개의 노드를 랜덤하게 가진 DNN모델 구축함. 콜레스테롤 섭취, 레티놀 섭취, 체중, Ca(Calcium), 식이패턴(Snack, Eggs, Seaweeds,Milk and dairy products, Beverages), Na(Sodium), Carotene이 상위 5분위로 높은 변수 중요도를 나타냄. - KoGES 지역사회(안산, 안성) 기반자료(10,030개)를 활용하여 일반학적 변수(n=24개), 영양학적 변수(n=28) 52개를 독립변수로 두고 당뇨, 대사증후군 여부를 종속변수로 두고 딥러닝 분석실시 하여 모델 구현을 앞두고 있음. Ⅲ. 국민건강영양조사 데이터와 KoGES 지역사회(안성, 안성) 데이터 통합 모델링 - 데이터를 수집하는 방법 및 독립변수의 종류가 KNHANES와 KoGES의 방법이 달라 데이터를 혼합하여 예측하면 정확도가 떨어진다고 판단하여 수행하지 않음. Ⅳ. 한국인 맞춤 식이평가지수 개발 - 본 연구실에서는 KoGES에서 제공되는 식습관(조리방법, 섭취빈도), 식품섭취빈도조사 (섭취량, 섭취빈도, 식품별섭취 무게, 영양소 섭취량)를 바탕으로 16개 항목으로 설정하여 가점과 감점을 통해 식이평가지수를 계산함. 또한, 식이섭취량을 Can-pro로 분석하였으며, MUFA:SFA 비율을 계산하는 방법. □ 연구개발성과의 활용 계획 및 기대효과 (연구개발결과의 중요성) √ 본 연구는 딥러닝을 활용한 한국인 식이 섭취 패턴에 따른 심혈관계 대사질환 유병률 예측하는 빅데이터 기반연구임. √ 변수중요도 파악을 통해 심혈관계 대사질환에 미치는 식이 패턴을 분석하여 효율적으로 질환을 사전예방 할 수 있을 것으로 기대됨. √ 기존연구에서 활용되는 DASH, 지중해식이 평가방식은 한국인들에게 적용 시 낮은 정확도를 나타내었음, 본 연구실에서 개발한 한국인 맞춤 식이평가지수 활용 시 높은 질환 유병률 예측 시 정확도를 나타낼 것으로 예상. (출처 : 연구결과 요약문 2p) |