[산업일보]
국내에서 개발한 ‘비정형 대화체 음성인식 기술’이 국내 주요 기업의 50여 개 콜센터에서 사용하고 있는 것으로 알려졌다.
17일 사학연금회관에서 진행된 ‘AI 플랫폼 및 솔루션 적용방안과 사례 세미나’에서 한국전자통신연구원(이하 ETRI) 음성지능연구그룹 이윤근 그룹장은 ‘대화형 AI 솔루션 현황과 미래전망’에 대해 발표했다.
이윤근 그룹장은 “챗봇과 같은 언어인식에 비해 음성인식 인터페이스는 기술적으로 난해한 편”이라면서 “세계적으로는 음성인식 1세대인 1950년대부터 많은 투자를 해왔고, 국내에서도 1990년대부터 본격적으로 연구를 시작했다”고 소개했다.
이 그룹장이 소개한 자료에 따르면 1990년대 음성인식의 오류율은 100%에 육박했으나, 2000년대에 들어서면서 성능이 급격히 좋아져 오류율은 10%대로 떨어진 것으로 나타난다. 그러나 약 10년간 기술의 정체기를 거쳐 2010년대에 들어서 약 4%대의 오류율을 기록한다.
이윤근 그룹장은 “국내에선 음성인식의 활성화가 스마트폰 보급과 겹쳐 상용화 됐다”고 말했다. 그러나 “미국 등 해외에선 주로 자동응답시스템, 즉 예약 전화 및 전화 자동 교환 분야에서 주로 사용됐다”고 말하며 “단순한 안내에서 대화가 가능한 콜센터에 기술이 적용되기 위해선 ‘자연어’ 인터페이스가 해결돼야 한다”고 강조했다.
‘자연어 대화 인터페이스’란 ‘음, 아’ 와 같은 의미 없는 소리나, 더듬거리는 말투 등 자연스러운 대화 요소가 담긴 인간의 말을 ‘인식’하고 ‘이해’한 후 그에 따른 표현과 반응을 보이는 기술이다. 구글의 레이 커즈와일(Ray Kurzweil)은 “자연어 이해야 말로 인공지능 기술의 핵심”이라고 말하며 ‘비정형 자연어 음성인식’ 기술의 중요성을 강조한 바 있다.
이윤근 그룹장은 ETRI의 기술력이 기반이 된 콜센터·고객센터 녹취데이터 음성인식 서비스 및 음성인식을 이용한 디지털 속기 서비스 사업화 외에도 “대화형 외국어 학습 솔루션을 추진하고 있다”고 소개했다.
외국어 교육에서 원어민과의 대화가 학습에 중요한 부분을 차지하는 것에서 착안한 ‘대화형 외국어 학습 서비스’는 2016년에 울릉군 관내 6개 초·중학교를 대상으로 시범서비스를 했으며, 영어 대화학습 및 토론학습 서비스 사업화를 추진중이다.
이 그룹장은 “주로 미국의 베린트(Verint)사와 뉘앙스(Nuance)사의 녹취데이터 음성인식서비스 기술을 선택했던 국내 50여 개 콜센터에서 ETRI 기술의 성능 우수성을 인정해 사용하고 있다”면서 “국내에서 자체 개발한 영어 음성인식 기술을 미국 시장에 적용·상용화 하는데 성공했다”고 말했다.