초록 |
핵심기술 콜센터의 녹음/녹취 음성데이터를 비정형 자연어 인식 기술을 이용하여 문자로 변환 기술과 특정 핵심어가 발화된 구간을 자동 검출하는 기술 최종목표 비정형 자연어 발화의 특징 분석 및 인식 성능향상을 위한 방법론을 도출하여 녹음/녹취 데이터 음성 인식을 위한 비정형 자연어 음성 인식 엔진을 개발하고 이를 적용한 시스템을 구축하여 콜센터 부문을 대상으로 사업화를 추진하는 목표 개발내용 및 결과 ◦ 음성인식 핵심 기술 개발 - 비정형 자연어(Spontaneous Speech) 음성 데이터의 모호성을 극복하기 위한 변별력 개선 음향모델 기술 개발 - 비정형 자연어에서의 비문법적 특성을 반영하는 언어모델 적응 기술 개발 - 자연어 음성데이터로부터 특정 핵심어가 발화된 구간을 자동 검출하는 핵심어 추출 기술 개발 - 비정형 자연어발화의 특징 분석을 통한 인식모델 구조 개선 및 기존 문장단위 인식엔진을 콜센터 상담내역 단위에 적용하기 위한 부분 백트래킹 디코딩 기술 개발 ◦ 녹음/녹취데이터 음성인식 시스템 개발 - 녹음/녹취데이터 음성인식을 위한 음향모델, 언어모델 최적화 기술 및 훈련 도구(Tool) 개발 - 음성인식 서버 시스템 개발 및 녹음/녹취시스템 연동 기술 개발 기술개발 배경 ◦ 금융, 공공, 통신 시장을 중심으로 대형 콜센터 및 각종 고객 상담센터를 통해 매일 대량의 상담내용을 담고 있는 음성데이터가 쌓이고 있으나, 현재의 상황은 이런 데이터 중 고객의 클레임 확인 등 일부 용도로만 활용될 뿐 대량의 음성데이터를 검색에 용이한 텍스트로 변환하여 고객의 소리(Voice of Customer)를 반영하는 다양한 요구의 증가에 대응하지 못하고 있음 ◦ 현재 빅데이터 시스템 및 CRM(Customer Relation Management)시스템에서의 분석 대상은 주로 웹, 블로그, SNS(Social Network Service)등 일반적인 텍스트 정보 또는 기업이나 공공기관에서 운영중인 콜센터의 간단한 상담이력 데이터 정도이나, 이를 음성 데이터로 확대함으로써 특정 트렌드나 이슈 대상으로 분석의 정확도를 높일 수 있음 ◦ 콜센터 관련 업무에 관한 규제 및 가이드라인이 발표됨에 따라 인력 증강에 대한 비용을 줄이기 위한 자동화 필요성이 대두됨 - 금융감독원으로부터 통신판매 계약에 대한 QA(Quality Assurance) 비율을 상향 조정하라는 가이드라인이 발표됨에 따라 최소한의 QA 인력 증강으로 통신판매 표준스크립트 준수 여부에 대한 판단을 신속하고 정확하게 처리할 수 있는 자동화 기술의 수요가 크게 증가하고 있음 - 금융위원회 및 관계부처의 개인정보의 불법 유통 활용 차단조치 (2014.01.24.) 및 TM(Tele-Marketing)등 비대면 영업제한 관련 후속조치(2014.02.04.) 발표에 따라 전화, 문자메시지(SMS), 이메일, TM등을 통한 대출 권유․모집 행위에 있어 고객정보의 적법성을 우선적으로 자체 점검하기 위하여 고객 동의구간을 정확하게 찾아낼 수 있는 자동화 기술이 필요함 핵심개발 기술의 의의 ◦ 비정형 자연어 발화를 인식하는 기술은 발성속도의 가변, 불명확한 발음 등의 문제로 인해 기존 음성인식 영역과 달리 어려운 기술 분야라고 할 수 있음. 또한 비문법적으로 말하는 특성으로 인해 범용의 언어모델을 적용하는데 어려움이 있음 ◦ 비정형 자연어 음성인식의 문제를 해결하기 위해 기존의 통계적 생성모델 기법에서 심층신경망을 이용한 음향모델 기술을 신규로 개발하여, 음향모델용 심층신경망 구조 및 학습 프로세스를 최적화하는 방법론을 개발하였음. 또한 비문법적 언어모델을 기존의 언어모� |