빅테크 몰리는 ‘음성 AI’… 생성형 AI 다음 승부처 부상 작성일 02-06 48 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">AI 에이전트 시대, 승부처는 ‘음성 인터페이스’</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="51R39jhDe5"> <div contents-hash="e576772af30af77d82cd3f20898af58cba5b724faa569fb8e3e8277845941c23" dmcf-pid="1dvnDt9UnZ" dmcf-ptype="general"> 생성형 인공지능(AI)을 둘러싼 경쟁의 무게중심이 텍스트에서 음성으로 옮겨가고 있다. 사용자의 의도를 가장 자연스럽게 전달할 수 있는 인터페이스로서 음성이 AI 에이전트 구현에 유리하다는 판단이 확산하면서다. 이 흐름 속에서 빅테크와 스타트업을 중심으로 음성 AI 주도권을 둘러싼 경쟁이 본격화하고 있다. </div> <figure class="figure_frm origin_fig" contents-hash="101ccd732ebd0fef40e5ca0ffe87cb787d504ce8edfa8893cf0327c93c5dd0ec" data-idxno="436336" data-type="photo" dmcf-pid="tJTLwF2uRX" dmcf-ptype="figure"> <p class="link_figure"><img alt="음성 인터페이스를 중심으로 AI 경쟁 구도가 재편되고 있다. / 챗GPT 생성" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202602/06/552810-SDi8XcZ/20260206070005206cqxl.png" data-org-width="600" dmcf-mid="Zgw6LT0HM1" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202602/06/552810-SDi8XcZ/20260206070005206cqxl.png" width="658"></p> <figcaption class="txt_caption default_figure"> 음성 인터페이스를 중심으로 AI 경쟁 구도가 재편되고 있다. / 챗GPT 생성 </figcaption> </figure> <p contents-hash="da685b7ec1a8b111328138f2c2cc848f981976473d0a8aaf7e69f0fa5f641b3a" dmcf-pid="Fiyor3V7eH" dmcf-ptype="general">IT업계에 따르면 아마존은 4일(현지시각) 생성형 AI를 결합한 음성 비서 서비스 '알렉사 플러스(Alexa+)'를 미국 전역으로 확대 출시한다고 밝혔다.</p> <p contents-hash="c1a1d6e831d9949a43277e3e572b4e8363d50d4cd56e44776b9f81d5aa4bb2fb" dmcf-pid="3nWgm0fzRG" dmcf-ptype="general">알렉사 플러스는 기존 음성 명령 처리 수준을 넘어 사용자의 맥락을 이해하고 실제 행동을 수행하는 방향으로 진화하고 있다. 쇼핑과 스마트홈 제어에 머물렀던 소비자용 음성 비서가 일정 관리, 서비스 실행, 외부 앱 연동까지 확장되며 '행동하는 AI'로 전환을 시도하는 것이다.</p> <p contents-hash="421372220e3c06d4e5c8329054d92ce3f95519b7cf2bbae8744798724e67f96b" dmcf-pid="0LYasp4qnY" dmcf-ptype="general">이 과정에서 음성 인터페이스를 둘러싼 경쟁은 오픈AI와 구글 등 주요 AI 기업 간 정면 대결로 이어지고 있다. 오픈AI는 챗GPT에 실시간 음성 대화 기능을 결합하며, 음성을 단순 입·출력 수단이 아닌 대화와 추론이 동시에 이뤄지는 인터페이스로 활용하고 있다. 사용자의 음성을 인식해 맥락을 파악하고, 자연스러운 음성으로 응답하는 방식으로 인간과의 상호작용 수준을 끌어올리는 데 초점을 맞추고 있다.</p> <p contents-hash="981611def5cfed40bf2d03e3937a6f29cd316251f910412e9f5f9450c027393d" dmcf-pid="poGNOU8BnW" dmcf-ptype="general">구글 역시 음성 AI를 핵심 경쟁력으로 삼고 있다. 구글은 자사 생성형 AI 모델 '제미나이(Gemini)'를 음성 기반 서비스 전반에 적용하며, 검색·안드로이드·생산성 도구까지 음성 인터페이스를 확장 중이다. 특히 스마트폰과 웨어러블, 차량용 시스템 등 자사 생태계 전반에 음성 AI를 통합해 실생활에서 즉각적으로 행동을 수행하는 AI 구현을 목표로 하고 있다.</p> <p contents-hash="8ed2f61ea28e08b97dde571f3ca36b826ca4a1c4f8021f3006d3fae94fbf64c8" dmcf-pid="UgHjIu6bJy" dmcf-ptype="general">이 같은 흐름은 투자 시장에서도 확인된다. AI 음성 스타트업 일레븐랩스(ElevenLabs)는 최근 시리즈D 투자 라운드에서 5억달러(약 7321억원)를 유치하며 기업가치 110억달러(약 16조원)를 인정받았다. 생성형 AI 전반에 대한 투자 심리가 선별적으로 위축되는 상황에서도 음성 AI 분야에는 여전히 대규모 자금이 유입되고 있음을 보여준다.</p> <p contents-hash="68f34cdeb4b8d7f8179cf2e4a6a3951a1ebb375282ef3d65d6f61402dcad0b77" dmcf-pid="uaXAC7PKLT" dmcf-ptype="general">시장에서는 빅테크와 스타트업 간 역할 분화도 뚜렷해지고 있다. 대형 플랫폼 기업들은 방대한 사용자 기반과 생태계를 바탕으로 범용 음성 AI를 고도화하는 데 집중하는 반면, 스타트업들은 특정 산업이나 업무에 최적화된 음성 모델로 차별화를 꾀하고 있다. 음성 AI가 단일 기술 경쟁을 넘어 활용 시나리오 중심 경쟁으로 이동하고 있다는 분석이다.</p> <p contents-hash="7773abe7ce29d8ed208e9a87caadc1f76dd203268acf8ece3fd45eb52223b279" dmcf-pid="7NZchzQ9iv" dmcf-ptype="general">특히 콜센터, 교육, 커머스, 미디어 콘텐츠 등에서는 음성 AI 도입에 따른 비용 절감과 생산성 향상 효과가 가시화되며 투자자들의 관심이 집중되고 있다. 텍스트 기반 생성형 AI보다 실제 업무에 바로 적용 가능한 영역이 많다는 점도 음성 AI의 강점으로 꼽힌다.</p> <p contents-hash="b15037a1669af0f3d57eda5e522343dd9ae4e835b5d0b2e0e6c8caa6a1e899e4" dmcf-pid="zctDvbRfnS" dmcf-ptype="general">업계에서는 음성 AI가 더 이상 텍스트 생성 AI의 보조 기술에 머물지 않고, AI 에이전트 시대를 여는 핵심 인터페이스로 자리 잡을 것으로 보고 있다. 사용자의 의도를 가장 자연스럽게 전달할 수 있는 수단인 '음성'을 중심으로, 생성형 AI 경쟁의 다음 국면이 열리고 있다는 분석이다.</p> <p contents-hash="150a9b677eeaa9e962dacc81dcad1bfbd6b6cdaab51044550745b367c0b67b48" dmcf-pid="qkFwTKe4Jl" dmcf-ptype="general">영국 시장조사기관 비즈니스 리서치 컴퍼니(The Business Research Company)는 지난달 발표한 보고서에서 "글로벌 음성 AI 시장이 고객 응대 자동화와 기업용 음성 에이전트 수요 확대에 힘입어 본격적인 성장 국면에 접어들었다"며 "음성 AI가 단순 보조 기능을 넘어, 향후 기업 환경에서 주요 AI 인터페이스로 자리 잡을 것"이라고 전망했다.</p> <p contents-hash="70c3511e9539cb54966d83f677ed2367ac8ede01b8bff6a948d67768b9bd675f" dmcf-pid="BE3ry9d8Lh" dmcf-ptype="general">김경아 기자<br>kimka@chosunbiz.com </p> </section> </div> <p class="" data-translation="true">Copyright © IT조선. 무단전재 및 재배포 금지.</p> 관련자료 이전 황민현, 오늘(6일) 팬미팅→‘스터디그룹2’ 출연…올라운더 행보 박차 02-06 다음 [언박싱 연구실] 산소 없어도 OK! '물'로 암세포 터뜨리는 빛의 마법 02-06 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.