초록 |
본 발명은 게놈 복제 수 변이(copy number variation, CNV)를 검측하기 위한 방법 및 시스템에 관한 것이며, 생물정보학 분야에 관련된 것이다.상기 방법은 시퀀싱 데이터를 획득하는 단계; 상기 시퀀싱 데이터에 따라 시퀀스 라벨을 측정하는 단계; 각 윈도우에 놓이는 시퀀스 라벨의 수를 계산하는 단계; 각 윈도우의 시퀀스 라벨 수에 GC 교정을 수행하고 대조 샘플 세트로 교정된 기대 시퀀스 라벨 수에 따라 교정을 수행하여 교정된 시퀀스 라벨 수를 획득하는 단계; 작은 현저한 차이값을 가지는 경계 지점을 선별하여 CNV 중지점의 후보로 하는 단계; 매 차례 가장 작은 현저한 차이성을 가지는 후보 CNV 중지점을 제거하고, 제거된 후보 CNV 중지점의 왼쪽과 오른쪽의 두 개의 후보 CNV 중지점의 서로 다른 현저한 차이값을 업데이트하고, 모든 후보 CNV 중지점이 종결 역치값보다 작아질 때까지 순환 반복을 수행하여 CNV 중지점을 확정하는 단계를 포함한다.본 발명의 방법 및 시스템은 임상 실행가능성을 가지며, 약 50M의 데이터를 사용하는 상황 하에서 0.5M의 미세-결실/미세-중복 영역을 정확하게 검측할 수 있다. |