초록 |
1. 연구개발 목표 및 내용 1) 최종목표 및 내용 국내 암생존자의 만기 재발, 이차암 및 심혈관질환 발생 예측모델 구축 최종 목표 위암, 대장암, 유방암, 갑상선암 및 전립선암 생존자의 만기 재발, 이차암, 심혈관질환 발생을 예측할 수 있는 인공 지능 기반 모델을 구축을 목표로 하며 세부 목표는 민간의 암 진단·치료·추적관찰 관련 빅데이터에 공공의 암 진단·장기 추적관찰 데이터베이스를 결합하여, 암 생존자에서 만기 재발, 이차암, 주요 심혈관 사건 발생의 위험 요인을 도출 및시계열·비정형 자료를 포함한 인공지능 기반의 알고리즘을 개발하고 임상에 적용할 수 있는 예측 모델 형태로 실용화 함. 전체 내용 본 연구는 2020년 보건복지부에서 안전한 가명정보 결합 및 활용을 위한 가이드라인과 플랫폼을 구축 및 제공하고 있음에 착안하여, 본원의 장기 암 생존자 빅데이터를 국민건강보험공단의 건강정보 DB (검진, 진료, 처방, 암 진단 및 생존 자료 포함)와 결합하여 암의 재발, 이차암, 주요 심혈관 질환을 예측하는 예측 모델을 개발하되, 인공지능 (Artificial intelligence, AI) 기법을 이용하여 시계열로 변화하는 변인과 단순 분석이 어려운 유전체, 영상자료, 라이프로그 등의 요인과 같은 비정형 자료를 통합한 통합 예측 모델을 구축하고자 함. 암 진단 전의 요인은 국민건강보험공단의 건강정보 DB를 연계해서 이용하고, 암 진단 및 치료 관련 요인은 본원의 빅데이터 자료 (영상, 병리검사, 진단검사, 생활습관 및 증상 관련)을 이용하고, 진단 이후 치료 및 재발, 이차암과 심혈관 질환 발생의 결과값은 국민건강보험공단의 건강정보 DB에서 확인되는 약물 처방 및 암 진단명 자료를 이용하여 결과변수 자료의 충실도를 높이고 충분한 사건 수를 확보하여 모델의 정확도를 높이고자 함. (연구개발과제1) 국내 암생존자의 만기 재발, 이차암 및 심혈 관질환 발생 예측모형 구축 최종 목표 민간의 암 진단·치료·추적관찰 관련 빅데이터에 공공의 암 진단·장기 추적관찰 데이터베이스를 결합하여, 암 생존자에서 만기 재발, 이차암, 주요 심혈관 사건 발생의 위험 요인을 도출할 예정임. 1차년도에는 인공지능 예측모델 개발을 위한 알고리즘을 개발할 예정이며, 2차년도에는 결합된 민간-공공 암환자 빅데이터를 이용한 인공지능 예측모델을 개발할 예정임. 전체 내용 본 연구는 연구는 2020년 보건복지부에서 안전한 가명정보 결합 및 활용을 위한 가이드라인과 플랫폼을 구축 및 제공하고 있음에 착안하여, 본원의 장기 암 생존자 빅데이터를 국민건강보험공단의 건강정보 DB (검진, 진료, 처방, 암 진단 및 생존 자료 포함)와 결합하여 암의 재발, 이차암, 주요 심혈관 질환을 예측하는 예측 모델을 개발하되, 인공지능 (Artificial intelligence, AI) 기법을 이용하여 시계열로 변화하는 변인과 단순 분석이 어려운 유전체, 영상자료, 라이프로그 등의 요인과 같은 비정형 자료를 통합한 통합 예측 모델을 구축하고자 함. 원내 데이터베이스에서 전통적인 통계학적 방법으로는 예측 모델에 포함되기 어려웠던 시계열 데이터, 비정형 자료, 라이프로그를 추출하고 이후 추출 및 활용을 위한 방안을 제시할 예정이며, EMR 빅데이터 처리를 위한 머신러닝 하드웨어 및 GPU 머신을 구축할 예정임. 다음으로는, 비정형 자료를 이용하여 재발·이차암·심혈관질환과 연관되는 알고리즘을 설계할 예정임. 비민감화 기법 및 비민감 ID를 기반으로 데이터를 결합하는 기술을 개발할 예정이며, 의료 데이터가 담지한 민감 정보를 삭제하는 비민감 기술을 개발하되, 비민감화된 ID를 기초로 하여 데이터를 결합하는 기술을 개발할 예정임. 또한, 필요한 의료 데이터를 임상의학적 의미에 맞추어 선별하는 기술을 개발 및 도입할 예정임. 다수준의 자료가 플랫폼을 통해 구현되는 데이터베이스를 설계 및 구축하여 빅데이터 분석을 위한 하드웨어 시스템을 마련할 예정임. 다음으로, 1차년도 2세부에서 구축한 빅데이터 결합데이터를 이용하여 인공지능 기반, 재발·이차암·심혈관질환의 예측모델을 개발할 예정이며, 실제 임상의와 임상 및 의학 지식에 근거해 수리적으로 구축된 본 모형의 성능을 평가하여 원내 임상 사용자를 위한 플랫폼의 UI와 UX의 형태를 제안할 예정임. (연구개발과제2) 국내 암생존자의 만기재발, 이차암 및 심혈관질환 발생 예측모델 구축 최종 목표 최종목표는 암환자의 민간-공공 빅데이터 결합 자료 구축과 재발, 이차암 예측의 통계적 모형 개발 및 검정이며 1년차에는 암환자의 재발과 이차암의 위험요인 파악 및 암환자의 민간-공공 빅데이터 결합자료 구축을 목표로 함. 2년차에는 민간-공공 빅데이터를 이용한 암 재발, 이차암 발생 통계모형 비교 및 타당도를 검증하며 암환자의 재발, 이차암 발생 위험(Risk appraisal model)에 대한 맞춤형 정보 제공 방안 마련을 목표로 함. 전체 내용 1년차에는 암환자에서 재발과 이차암 발생 위험요인에 대한 문헌 고찰을 수행합니다. 또한, 암 재발, 이차암 발생 관련 위험요인 변수 리스트를 정리함. 또한, 데이터중심병원에서 구축된 민간병원의 암환자 빅데이터에서 가용한 임상변수 리스트 추출,국민건강보험공단의 건강정보 DB에서 가용한 변수 리스트 추출, 공공의료 데이터 결합기관을 통한 민간-공공 빅데이터 결합자료 구축, 결합데이터 정리 및 기초통계 산출을 함. 2년차에는 1년차 내용을 이용하여 암환자의 재발과 이차암 발생에 영향을 미치는 요인을 고려한 통계분석 수행 및 통계적 모형과 인공지능(AI)모형 결과 및 타당도 비교함. 이를 이용하여 암환자의 재발, 이차암 발생에 대한 맞춤형 위험점수(Risk Score) 산출, 맞춤형 정보 제공 방안 제안하고자 함. 3) 연구개발 성과 및 기대효과 국내 암생존자의 만기재발, 이차암 및 심혈관질환 발생 예측모델 구축 연구개발성과 활용계획 및 기대효과 선행연구결과로 책임연구자는 이를 인공지능 기법을 통해 자동화하는 연구를 수행한 바 있음. 내시경 전 환자의 구강 사진과 같은 비정형 데이터를 추출하여 진정내시경 검사 전 Mallapati Score를 분류하는 인공지능 모형을 구축하였으며 여기에는 130매의 입력 데이터를 활용하고, 깊은 신경망 기법을 통해서 4개 층으로 지도학습을 수행하였음. 분류 정확도를 높이되, 과적합을 줄이고자 신경망의 층위 수를 과도하게 사용하지 않는 것이 특징입니다. 이후 병원의 EMR 기록 (입원기록, 진단기록, 생체징후 기록, 혈액검사 기록 등)과 연동하여 자동화 점수 체계를 구현할 수 있도록 모형에 입력의 port를 확보해 두었음. 또한 본 책임연구자는 ‘인공지능을 이용한 대장 내시경 영상 분석 방법 및 장치’로 2020년 특허를 획득하였음 (특허 제 10-2185886호). 실제 의료 영상 분석 및 인공지능 데이터 수집, 처리, 알고리즘 구축에 경험과 노하우가 있어 본 연구를 수행할 역량이 있음. 암의 만기 재발관련 연구로 암예방센터에서는 2002-2017년 사이에 암 재발을 경험한 위암환자군 305명을 추출하여 단기 재발에 비해 만기 재발을 경험한 환자군의 특성을 확인하고, 암 재발을 경험한 환자군에게서 장기 생존에 영향을 미치는 요인을 확인하였음.. 본 연구 결과는 2019년 대한암학회에서 발표되었으며, 논문으로 제출된 상태임. 이차암 발생 관련 연구로 2016-2017년에 암예방센터의 암생존자 클리닉에 내원한, 176명의 흡연 경험이 있는 대장암 생존자를 대상으로 저선량 컴퓨터 단층 촬영 검사를 시행한 결과 3명에게서 폐암이 발견되었고 기존의 폐암 예측모델은 이차암으로써의 폐암을 예측하지 못하였습니다. 본 연구결과는 2019년 Journal of Cancer Prevention에 발표되었음.장기 암생존자의 건강 위험 요인을 정확하게 예측하는 모델을 개발하고 본 연구 내에서 실용화 단계를 거쳐 의료진이 맞춤형 모델을 적용할 수 있도록 (원내 임상 사용자를 위한 UI, UX 제안, 혹은 소스 코드 배포) 할 예정이며 인공지능 혹은 통계학적 예측 모델을 진료에 적용할 수 있는 어플리케이션 개발이나 웹사이트 개발을 후속 연구 및 사업 방안으로 진행할 수 있음. 또한, 인공지능 예측모델을 기반으로 한 보건 서비스 제공 방안 및 실용성 검증을 후속 연구로 진행할 수 있습니다. 인공지능을 이용한 헬스케어와 예측모델 |