초록 |
□ 연구개발 목표 및 내용 - 최종 목표 대장암 전사체 데이터와 단백체 데이터의 융합 오믹스 분석을 통해 대장암 환자의 예후 예측을 위한 아형을 정립하고 이와 관련된 변이 단백질을 확인하여 변이 단백질의 암화 및 종양이질성과의 연관성을 확인함 - 전체 내용 • 전사체 및 단백체 데이터를 활용한 융합오믹스 분석법 정립 • 융합오믹스 분석법 적용을 통한 대장암 아형 구분 유전자 셋 발굴 • 대장암 아형에 따른 예후 예측 및 대장암 아형과 변이 단백질 연관 분석 • 대장암 아형 연관 변이 단백질 기능 분석을 통한 암화 기전 발굴 • 대장암 아형을 예측할 수 있는 표지 후보 단백질 셋트 발굴 • 변이 단백질 데이터베이스 고도화 및 스펙트럼 정보 연동형 웹사이트 구축 □ 연구개발성과 [초기 대장암 치료 예후 예측 유전자군 발굴] Stage 1기와 2기의 초기 대장암 환자의 전사체 데이터 및 단백체 데이터에서 환자간 유전자 발현값의 분포변이가 높은 유전자에 대해서 상위 조절인자를 확인함. 이를 통해 전사체와 단백체에서 공통적으로 확인되는 10개의 주요 상위조절인자를 확인하고 유전자 및 단백질 발현정보를 이용하여 초기 대장암 환자 중에서 치료 예후가 좋지 않은 환자를 예측할 수 있는 분자생물학적 아형을 발굴함 [초기 대장암 치료 예후 예측 후보 물질 발굴] 분자생물학적 아형 유전자군에 대해서 발현정보와 아형정보를 바탕으로 머신러닝을 수행하여 아형을 가장 잘 반영하는 유전자셋을 선정함. 이를 통해 전사체 데이터에서 59개 유전자와 단백체 데이터에서 50개 단백질을 확인하였고 두 오믹스 데이터에서 공통적으로 확인되는 5가지 유전자를 발굴함 [변이단백질 데이터베이스 고도화] 2022년 변이단백질 데이터의 수집 및 검증결과 9,745,273종의 SAAV 데이터베이스를 구축하여 SAAVpedia.org 웹사이트에 업데이트하고 각종 통계지표를 볼 수 있도록 웹사이트를 고도화함 [초기 대장암 치료 예후 예측 연관 변이단백질발굴] 본 연구를 통해 개선 된 변이단백질 데이터베이스를 활용하여 단백체 데이터셋에서 2,384개 단백질에 포함 된 6,392개의 변이펩타이드를 확인함. 이 중 전사체 데이터의 아형 사이에 통계적으로 유의미한 값을 가지는 190개 유전자와 단백체 데이터의 아형 간에 통계적으로 유의미한 값을 가지는 65개 펩타이드의 비교를 통해 TGF-β 클러스터의 아형을 구분할 수 있는 13개 유전자를 발굴함. 해당 유전자 중 도메인 영역에 위치하는 변이단백질 서열에 대해 알파폴드2를 이용한 구조 예측을 수행함. 결과 FLNC 단백질 도메인의 구조가 레퍼런스 단백질과 변이단백질 간에 상이한 것을 확인함 [초기 대장암 치료 예후와 연관 된 기능 분석] 예후 예측 유전자군에 대한 기능 분석을 통해 TGF-β에 의해 과발현되는 유전자들은 Epithelial–mesenchymal transition와 extracellular matrix structure 에 밀접한 연관성을 가지고 있는 것을 확인함. □ 연구개발성과 활용계획 및 기대 효과 [항암치료 가이드라인] 환자별 종양이질성 확인을 통한 특성 별 항암 치료 전략과 나아가 최근 대두되고 있는 면역항암제 치료 효과 예측 등을 통한 보다 나은 대장암 치료 전략 수립에 필요한 정보 제공 [융합오믹스 분석법] 융합오믹스 분석법 정립을 통해 기관의 단백질 분석 플랫폼을 기반으로 하는 오믹스 빅데이터 연구분석의 정확도 및 신뢰도 확보함. 본 연구를 통해 정립한 분석법을 통해 향 후 환자 간 분자생물학적 다양성이 높은 유방암, 폐암 등의 타 암종에 대한 분석에 활용 가능함 [치료 예후 예측 진단 마커 개발] 유전자 발현 및 단백질 발현을 확인할 수 있는 공통의 치료 예후 예측 진단 후보물질을 발굴하였음으로 분자진단 및 항체진단 등 여러 가지 플랫폼에 적용하여 접근성 높은 치료 예후 예측 진단 플랫폼 개발에 활용 (출처 : 요약문 2p) |