초록 |
1.분석자 서문 후생유전학은 후생적인 유전자 발현 조절을 연구하는 분야로 이에 대한 분자생물학적 기전은 완전히 밝혀진 바가 없지만, 예컨대 DNA 메틸화나 염색질 구조의 변화와 같은 기전이 이러한 유전자 발현 조절에 역할을 하는 것으로 알려져 있다. 이러한 기전들이 많이 확인되고, 체계적으로 파악이 될 경우에 의학 분야에도 큰 발전을 가져올 수 있다. 특히, 이러한 후생적 유전자 발현도 반복되어 누적되면 암 유발 유전자가 과발현되거나 혹은 암 억제 유전자가 과억제되는 후생유전적 변화로 특정 DNA의 손상 없이도 암을 유발할 수도 있기 때문에, 이러한 기전이 연구되는 것은 매우 중요한 의미를 가진다. 이러한 후생유전학에 이용되는 데이터는 보통 그 크기가 크고, 차원(dimension)이 높아 적절한 확률모델을 이용하여 모델링하는 것이 쉽지 않다. 특히 클래스 간 불균형 문제 등을 해결하기 위하여 기계학습이 그 역할을 할 수 있다. 기계학습은 많은 처리량의 후생유전 데이터에서 특정한 패턴을 추출하여 가능한 생물학적 기전을 제안하는 데에 도움이 될 수 있다. 2. 목차 1. 개요 2. 기계학습 2.1. 능동학습 2.2. 불균형 데이터 학습 2.3. 딥러닝 2.4. 생물학 데이터의 기계학습 3. 후생유전학 3.1. 후생유전학의 기계학습 3.2. 관련 유전 특징으로부터 후생유전 상태의 예측 4. 의료 응용 이미 많은 부분의 의료문제에 기계학습이 활용되고 있지만 유전체/후생유전 데이터를 포함한 빅데이터를 활용한 기계학습 연구는 정밀의료 시대를 여는 데에 큰 역할을 할 것이다. 예를 들어 특정한 에피돌연변이(epi-mutation)는 암, 신경퇴행성 질환과 같은 특정 질환과 연관이 되어 있음이 이미 밝혀졌다. 점점 대용량의 데이터와 새로운 타입의 데이터들을 이용하게 되면서 기계학습 기반의 계산학적 방법이 유용하게 될 것이다. 또한 이러한 응용의 성능을 높이기 위해 이론적, 실험적, 임상적 지식들이 융합되고 특정 도메인에 기계학습을 적용하는 방법론들이 중요시될 것이다. References 1. Lawrence B. Holder, M. Muksitul Haque Michael K. Skinner. Machine learning for epigenetics and future medical applications. Epigenetics 2017; 12(7):505-514. 2. M A Oquendo, E Baca-Garcia, A ArtEs-RodrIguez, F Perez-Cruz, H C Galfalvy, H Blasco-Fontecilla, D Madigan N Duan. Machine learning and data mining: strategies for hypothesis generation. Molecular Pychiatry 2012; 17:956-959. 3. M. K. Leung, A. Delong, B. Alipanahi, B. J. Frey. Machine learning in genomic medicine: A review of computational problems and data sets. Proc. IEEE 2016;104(1):176-197. 4. Y. LeCun, Y. Bengio, G. Hinton. Deep learning. Nature 2015;521(7553):436-444. ※ 이 자료의 분석은 지능정보기술연구원의 김휘영님께서 수고해주셨습니다. |