본문 바로가기
  • 유해게시물신고
“AI와의 자연스러운 대화, 핵심은 ‘0.4초’ 초저지연 기술”
임지원 기자|jnews@kidd.co.kr
페이스북 트위터 카카오스토리 네이버블로그 프린트 PDF 다운로드

“AI와의 자연스러운 대화, 핵심은 ‘0.4초’ 초저지연 기술”

아고라, 초저지연 네트워크·음성 알고리즘 기반 디바이스 혁신 사례 발표

기사입력 2025-11-29 10:03:34
페이스북 트위터 카카오스토리 네이버블로그 프린트 PDF 다운로드
[산업일보]
생성형 AI가 음성 기반 인터페이스로 확장되면서, 사람과 AI 간 ‘지연 없는 소통’이 핵심 경쟁력으로 떠올랐다.

아고라(Agora)의 박세빈 매니저는 지나 27일 ‘2025 AIoT 국제컨퍼런스’에서 “대화형 AI에서 가장 큰 장벽은 응답 지연(latency)”이라며 초저지연 기술의 중요성을 강조했다. 이번 컨퍼런스는 ‘2025 AIoT Week Korea’ 행사의 일환으로 서울 강남구 코엑스에서 열렸다.

“AI와의 자연스러운 대화, 핵심은 ‘0.4초’ 초저지연 기술”
아고라(Agora) 박세빈 매니저

박 매니저는 “사용자가 말을 건 뒤 6~7초가 지나서야 응답이 오면 자연스러운 대화가 불가능하다”며, 해외 서버 사용으로 인한 물리적 지연 문제가 여전히 크다고 설명했다. 아고라는 소프트웨어 정의 실시간 네트워크(SD-RTN)를 기반으로 응답 속도를 0.4초 수준으로 줄여 글로벌 서비스에서도 실시간에 가까운 대화 환경을 구현하고 있다고 소개했다.

그는 속도뿐 아니라 음성 품질이 대화 경험을 좌우한다고 강조했다. 아고라는 배경 음성 억제(BGH), 노이즈 필터링, 보이스 액티비티 감지(VAD), 에코 캔슬레이션 등 음성 신호처리 기술을 적용해 소음 환경에서도 사용자 목소리를 정확히 인식하도록 설계했다.

아고라의 ‘보이스 락킹(Voice Locking)’ 기술은 첫 화자의 목소리 패턴을 기억해, 이후 대화부터는 다른 사람의 목소리가 섞여도 인식하지 않도록 하여 보안과 정확도를 높였다. 사용자가 말을 시작하면 즉시 응답을 멈추는 ‘인터럽트(Interrupt)’ 기능도 자연스러운 대화를 위한 핵심 요소로 꼽혔다.

대화형 AI는 교육·컨택센터·헬스케어 등에서 빠르게 확산 중이며, 글로벌 시장 규모는 약 60조 원에 이를 것으로 전망된다. 박 매니저는 중국 AI 인형의 80만 대 판매 사례, 명품 매장·공항의 디지털 휴먼 적용 사례 등을 소개하며 “스마트 디바이스 시장 전반에서 음성 기반 인터페이스가 표준이 되고 있다”고 말했다.

아고라는 STT(Speech-to-Text)와 실시간 통신(RTC)을 통합 제공한다. LLM과 TTS(Text-to-Speech)는 고객사가 원하는 모델을 선택해 결합할 수 있는 유연한 아키텍처를 지원한다.

박 매니저는 “결국 고객사는 ‘얼마나 사람처럼 대화하느냐’를 기준으로 기술을 선택하게 된다”며 “아고라는 어떤 환경에서도 자연스러운 대화형 AI 경험을 구현하는 인프라를 제공하겠다”고 밝혔다.
제품등록 무료 제품 거래 비용 없음!
IoT, 빅데이터 등 국내외 4차산업혁명 기술은 물론, 다양한 산업동향과 참 소리를 전합니다.


0 / 1000
주제와 무관한 악의적인 댓글은 삭제될 수 있습니다.
0 / 1000






산업전시회 일정




다아라 기계장터 제품등록 무료