기업조회

본문 바로가기 주메뉴 바로가기

특허/실용신안

비음수 행렬 인수분해 및 기저 행렬 업데이트를 이용한 음향 개선 방법 및 시스템

특허 실용신안 개요

기관명, 출원인, 출원번호, 출원일자, 공개번호, 공개일자, 등록번호, 등록일자, 권리구분, 초록, 원본url, 첨부파일 순으로 구성된 표입니다.
기관명 NDSL
출원인 서울대학교산학협력단
출원번호 10-2013-0168578
출원일자 2013-12-31
공개번호 20150709
공개일자 2015-07-24
등록번호 10-1535135-0000
등록일자 2015-07-02
권리구분 KPTN
초록 본 발명은 음향 개선 방법 및 시스템에 관한 것으로서, 보다 구체적으로는 (1) 잡음과 음성이 섞인 음향 신호를 통계적 모델 기반의 음향 개선 기법을 이용하여 복소수 값으로 변환한 제1 신호(pre-enhanced signal)를 도출하는 단계; (2) 비음수 행렬 인수분해(NMF)에 기반하여 상기 제1 신호로부터 얻은 값을 이용하여 신호대 잡음비(SNR) 값을 추정하며, 상기 추정된 신호대 잡음비(SNR) 값을 이용하여 MMSE-LSA 이득함수를 구함으로써, 제2 신호를 도출하는 단계; 및 (3) 상기 단계 (2)에서 도출된 제2 신호를 이용하여, 다음 시간 프레임에서 수행되는 상기 단계 (2)의 비음수 행렬 인수분해에 사용할 기저(basis) 행렬을 업데이트하는 단계를 포함하는 것을 그 구성상의 특징으로 한다. 본 발명에서 제안하고 있는 비음수 행렬 인수분해 및 기저 행렬 업데이트를 이용한 음향 개선 방법 및 시스템에 따르면, 잡음과 음성이 섞인 음향 신호를 통계적 모델 기반의 음향 개선 기법을 이용하여 복소수 값으로 변환한 제1 신호(pre-enhanced signal)를 도출한 후에, 비음수 행렬 인수분해(NMF)에 기반하여 제1 신호로부터 추정된 음성과 노이즈(제1 신호로부터 얻은 값)를 바탕으로 사전 신호대 잡음비(SNR) 값과 사후 신호대 잡음비(SNR) 값을 구하고, MMSE-LSA 이득함수를 이용하여 제2 신호를 도출함으로써, 높은 성능의 음향 향상 기능을 가진다. 또한, 본 발명에 따르면, 제2 신호를 이용하여 다음 시간 프레임에서 수행되는 비음수 행렬 인수분해에 사용할 기저 행렬을 업데이트함으로써, 올바른 잡음 모델을 초깃값으로 유지할 수 있고, 음성 존재 확률 값(SPP) 추정을 통한 업데이트 속도 결정하도록 하여 잡음 환경 변화 속도에 따라 업데이트 비율을 자동으로 계산하여 적용함으로써, 불필요하게 많은 업데이트로 인한 오버피팅(overfitting) 등의 악영향을 끼지는 것을 방지할 수 있다. 뿐만 아니라, 본 발명에 따르면, MMSE-LSA 이득함수 이용함으로써, 종래 위너(Weiner) 필터 형태의 이득함수를 이용하는 것보다 안정적인 성능을 이끌어낼 수 있으며, 음성과 잡음의 크기가 따로 추정되어 구해지므로 종래 Decision Directe(DD)기법을 사용하여 잡음과 음성의 파워를 추정하는 것이 아닌 단순한 스무딩 기술(Smoothing technique)을 사용하여 개별적인 파워를 사용함으로써, 음향 개선 효과를 더욱 향상시킬 수 있다.
원문URL http://click.ndsl.kr/servlet/OpenAPIDetailView?keyValue=03553784&target=KPTN&cn=KOR1020130168578
첨부파일

추가정보

과학기술표준분류, ICT 기술분류, IPC분류체계CODE, 주제어 (키워드) 순으로 구성된 표입니다.
과학기술표준분류
ICT 기술분류
IPC분류체계CODE
주제어 (키워드)