[산업일보]
음성은 인간의 가장 자연스러운 의사소통 도구다. 이에 AI(인공지능) 기업들은 누구나 쉽게 AI와 상호작용 할 수 있도록 음성인식 기술의 고도화에 힘쓰고 있다. AI 기술이 급격하게 발전하면서, 음성인식은 단순한 인식률 경쟁을 넘어, 감정과 맥락을 이해하는 ‘음성이해’ 기술로 진화하고 있다.
음성 AI 전문 기업 마고(MAGO)는 ‘SK AI SUMMIT(서밋) 2025’에서 음성이해 AI 에이전트 ‘오디온(audion)’을 제시했다. 3일 개막한 이번 행사는 서울 강남구 코엑스에서 4일까지 이어진다.
오디온은 기업 고객을 대상으로 ‘한국어 음성 파운데이션 모델’을 제공하는 미들웨어(middleware) 플랫폼이다.
마고의 고현웅 CEO는 “음성은 텍스트보다 복잡하고 다양한 정보를 담고 있어, 파이프라인(Pipeline) 구성이 어렵고 데이터 규모도 방대하다”라며 “음성 AI 도입 시 기술적 어려움을 겪는 기업들에 완성형 에이전트를 공급해 문제 해결을 돕는다”라고 말했다.
그는 “화자의 톤, 피치, 음성 특징 등을 통해 대화의 맥락을 파악하고 7가지 감정을 인식할 수 있다”라며 “주변 소음·나이·사투리 분석과 더불어 화자 분리도 지원하다”라고 설명했다.
이어 “글로벌 AI 기업들이 한국 시장 진출 시, 한국어 음성인식의 정확도 향상에 어려움을 겪는다”라며 “상용 AI 모델 성능에 실망한 엔터프라이즈 레벨 기업들이 고객센터나 교육 분야에서 활용 중이다”라고 덧붙였다.