‘K-AI’ 차별화…네이버-트웰브랩스, 멀티모달 넘어 국내 톱 ‘옴니’ 작성일 09-03 14 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">글로벌 입증 트웰브랩스 영상이해 기술력 앞세워<br>韓 강점 미디어·엔터 분야 활용 주목</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="zktgFuNfSq"> <figure class="figure_frm origin_fig" contents-hash="36ab3bb3ac9dbe8a293fbf480a63d4a8337eccd0a86e769d9f1062d5b63ade92" dmcf-pid="qEFa37j4Tz" dmcf-ptype="figure"> <p class="link_figure"><img alt="트웰브랩스 이승준(왼쪽부터) 최고기술책임자(CTO), 이재성 최고경영자(CEO)와 김윤 네이버 최고지속가능책임자(CSO)가 지난 6월 미국 실리콘밸리 포시즌 호텔에서 열린 네트워킹 행사에 참여하고 있다. 트웰브랩스 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202509/03/dt/20250903162915433rane.jpg" data-org-width="640" dmcf-mid="7f0jpqc6WB" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202509/03/dt/20250903162915433rane.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 트웰브랩스 이승준(왼쪽부터) 최고기술책임자(CTO), 이재성 최고경영자(CEO)와 김윤 네이버 최고지속가능책임자(CSO)가 지난 6월 미국 실리콘밸리 포시즌 호텔에서 열린 네트워킹 행사에 참여하고 있다. 트웰브랩스 제공 </figcaption> </figure> <p contents-hash="c4814fb75eae236ce95fee2acf36516e623ee2d80542c0d6a4d23921d2824786" dmcf-pid="BD3N0zA8C7" dmcf-ptype="general"><br> 국가대표 인공지능(AI) 자리를 두고 본격적인 경쟁이 시작됐다. 미국과 중국의 양강 구도에서 정예팀 5곳의 차별화한 AI 모델 전략이 관심을 받고 있다. AI가 텍스트뿐 아니라 영상·음성 등 다양한 형태의 입력 데이터를 처리할 수 있는 ‘멀티모달’ 기술을 앞세우는 곳이 많다. 특히 네이버 클라우드는 컨소시엄에 참여한 트웰브랩스의 자체 영상언어모델(VLM) 기반의 ‘옴니 파운데이션 모델’ 개발로 차별화 행보에 나섰다.<br><br> 3일 정보기술(IT) 업계에 따르면 네이버 클라우드는 한국형 모델(K-AI)을 구축하기 위해 단순 데이터 공급을 넘어 옴니 혁신 모델을 구축하는 것을 목표로 한다. 옴니 모델은 멀티모달보다 한 차원 높은 수준으로 AI 학습 초기 단계부터 텍스트와 함께 영상 등 데이터를 동시에 학습한다. 제조업에 특화된 모델이나 피지컬 AI로 쉽게 확장할 수 있다.<br><br> 네이버 클라우드는 경쟁사 대비 진화된 모델 전략을 전면에 내걸었다. 현재 정예팀 5곳 중 NC AI와 SK텔레콤도 멀티모달 기반의 AI 모델을 띄우고 있다. SKT는 주력 멀티모달 모델인 ‘바르코’를 통한 고도화를, NC AI의 경우 컨소시엄 참여사인 크래프톤의 차세대 멀티모달을 활용하는 방안을 계획하고 있다.<br><br> 네이버의 차별화 원동력은 컨소시엄 내 유일한 영상이해 모델을 보유한 트웰브랩스다. 2021년 출범한 회사로 글로벌 빅테크들이 텍스트와 이미지에 주력할 때 ‘영상 AI’라는 블루오션 시장에 주목했다. 오픈(Open) AI와 구글의 범용 거대언어모델(LLM)과 비교해 주요 벤치마크에서 성능 우위를 점하고 있다.<br><br> 트웰브랩스는 단순한 영상 분석을 넘어 ‘멀티모달 AI 아키텍처 설계’ 역량을 보유하고 있다. 자체 영상언어 생성 모델인 ‘페가수스’와 멀티모달 영상이해 모델인 ‘마렝고’는 영상과 텍스트, 음성을 통합적으로 이해하는 세계 유일의 기술을 구현했다. 특히 ‘하나의 비디오 인코더’를 활용한 통합적 영상 인식 기술은 해외 시장에서 독보적 기술력을 인정받았다. CB 인사이트 선정 글로벌 100대 AI 기업에 4년 연속 선정됐다. 엔비디아가 선정한 최초의 한국 AI 스타트업으로 누적 투자액은 1억700만달러에 달한다.<br><br> 올 4월에는 페가수스와 마렝고를 아마존 베드록에 공급했다. 회사 측은 “세계 최초이자 유일한 영상이해 모델을 탑재한 것으로, 업계 중 처음으로 아마존과 메타, 앤트로픽 등 주요 글로벌 AI 기업과 동등한 지위를 확보했다”고 강조했다.<br><br> 네이버는 독자 옴니 모델의 핵심 파트너사인 트웰브랩스의 기술력과 노하우를 활용해 경쟁력을 강화할 계획이다. 영상이해 기술 기반으로 한국의 강점 산업인 미디어·엔터테인먼트 등에서 활용도를 높일 수 있는 방안도 구상하고 있다.<br><br> 임성원 기자 sone@dt.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털타임스. 무단전재 및 재배포 금지.</p> 관련자료 이전 싱글맘 이지현, 헤어 디자이너 ‘예약 마감’ 난리…“노쇼는 절대” 부탁까지 09-03 다음 "韓 AI, 버티컬·로컬 데이터 강점 살려야 생존"[미리보는 AI 월드 2025] 09-03 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.