텍스트마이닝 기법을 활용한 기술과 산업분류 코드 연계모형 구축
기관명 | NDSL |
---|---|
공개여부 | |
사업명 | |
과제명(한글) | |
과제명(영어) | |
과제고유번호 | |
보고서유형 | report |
발행국가 | |
언어 | |
발행년월 | 11/01/2015 |
과제시작년도 |
주관연구기관 | 동국대학교 |
---|---|
연구책임자 | 이영섭 |
주관부처 | |
사업관리기관 | |
내용 | |
목차 | |
초록 | 한국산업분류(KSCI) 설명집에 대한 텍스트 크롤링 및 전처리 실시 - J열: 출판, 방송통신 및 정보서비스업에 대한 설명집 크롤링 및 전처리 실시 - C열: 제조업에 대한 설명집 크롤링 및 전처리 실시 형태소 분석을 위한 관련 분야 한글 사전 정리 형태소 분석기를 이용한 명사추출 실시 추출된 명사 목록을 이용하여 불용어 처리 등 텍스트 처리 기법을 활용한 정확도 향상 구축된 토픽과 새로 입력되는 설명(Query) 사이의 매칭 알고리즘 개발 - 텍스트 벡터 사이의 코사인 유사도 산출 방법 연구 - 토픽 모형 사후확률을 반영한 코사인 유사도 산출 방법 연구 C열 (제조업)에 대한 토픽 모형 구축 완료 새롭게 입력되는 산업분류 모형에 대해 토픽 모형을 활용한 유사도 매칭 방안 제안 |
원문URL | http://click.ndsl.kr/servlet/OpenAPIDetailView?keyValue=03553784&target=REPORT&cn=TRKO201600000569 |
첨부파일 |
과학기술표준분류 | |
---|---|
ICT 기술분류 | |
주제어 (키워드) |