독자 AI 모델 2차 평가, 멀티모달이 가른다 작성일 01-25 58 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">SKT·LG·업스테이지 정예팀, 이미지·음성 경쟁 본격화<br>텍스트 넘어 음성 대화까지…개발 난이도 급상승</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="G6zsNUHlXg"> <p contents-hash="aeaf67016164ea11cda7fe89993011b362b7c84c6f6b5eed9c7f2cc332b26ca0" dmcf-pid="HPqOjuXSto" dmcf-ptype="general">(서울=연합뉴스) 오지은 기자 = 정부의 독자 인공지능(AI) 파운데이션 개발 프로젝트 2차 평가부터는 멀티모달이 모델 경쟁의 승부처가 될 전망이다.</p> <figure class="figure_frm origin_fig" contents-hash="58fc60c80a21f7206709aa921b17b7f7e2212cc30e4b23292ef31040e2eeb54d" dmcf-pid="XQBIA7ZvGL" dmcf-ptype="figure"> <p class="link_figure"><img alt="SK텔레콤 부스 (서울=연합뉴스) 강민지 기자 = 30일 서울 강남구 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 참석자들이 SK텔레콤 부스를 체험하고 있다. 2025.12.30 mjkang@yna.co.kr" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/25/yonhap/20260125064640559tqcd.jpg" data-org-width="1200" dmcf-mid="YXtAdZlwYa" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/25/yonhap/20260125064640559tqcd.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> SK텔레콤 부스 (서울=연합뉴스) 강민지 기자 = 30일 서울 강남구 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 참석자들이 SK텔레콤 부스를 체험하고 있다. 2025.12.30 mjkang@yna.co.kr </figcaption> </figure> <p contents-hash="d83bb6935e60e6492c5ebcb3d21d65b04910865e7ad12ec88aebfb6560c1d022" dmcf-pid="ZxbCcz5TGn" dmcf-ptype="general">1차 평가에 통과한 SK텔레콤, LG AI연구원, 업스테이지 모두 최종적으로 멀티모달 모델을 만들겠다고 밝혔기 때문이다. </p> <p contents-hash="feb2019a7d33c19ac958dc926ef08292a2dd05ca6eb112be3887fdd3d48b6d61" dmcf-pid="5MKhkq1yZi" dmcf-ptype="general">25일 정보통신기술(ICT) 업계에 따르면 SK텔레콤 정예팀은 2단계 개발부터 AI 모델 A.X K1에 이미지나 음성 등 멀티모달 기능을 단계적으로 적용한다. </p> <p contents-hash="a9c54453220fb1cf833551c2fb8d6bc87e700a226b3b16eb8aba9c7b0290ad7e" dmcf-pid="1R9lEBtWGJ" dmcf-ptype="general">SKT 정예팀에서 멀티모달 연구를 진행 중인 김건희 서울대 컴퓨터공학부·첨단융합학부 교수는 지난 22일 SK텔레콤 뉴스룸에 이러한 내용의 기고문을 올렸다.</p> <p contents-hash="562ff043be414197ce51738003a9b9728da71ef8a45a8d8e134afa53af91834b" dmcf-pid="tUGLPymjZd" dmcf-ptype="general">김 교수는 "초거대 언어모델은 텍스트, 사진, 동영상을 통합적으로 이해하는 멀티모달을 넘어 음성까지 이해하는 옴니모달 모델로 진화 중이다"라고 말했다. </p> <p contents-hash="e9ddee07604062b2efd32771ba66e0bb4e189d33cb6b3a26f42d1afcc660e692" dmcf-pid="FuHoQWsAZe" dmcf-ptype="general">김 교수는 특히 음성 대화를 AI 모델에서 구현하는 데는 기술적 도전 과제가 따른다고 강조했다. </p> <p contents-hash="0edf674999e01aa757b68e06cad6c8b24d1c3acb09b251d4893aa6887ed65299" dmcf-pid="37XgxYOc1R" dmcf-ptype="general">그는 "기존 텍스트 기반 대화가 입력과 응답이 순차적으로 이어지는 턴(turn) 기반 단방향 소통 방식이라면, 음성 대화는 동시대적이고 양방향적인 특성을 가진다"라며 "상대방이 말하는 도중 개입하거나 짧은 백채널(피드백)을 주고받는 실시간 상호작용이 필요하다"라고 설명했다.</p> <p contents-hash="9d374822362fc155defe79546c149179838622af61f5e9c4293a29fdf348f167" dmcf-pid="0zZaMGIkYM" dmcf-ptype="general">아울러 복잡한 표현 방식을 반영해야 하는 어려움도 지적됐다.</p> <p contents-hash="2baeb7481bff41262d9e49117853edea599035a6fc61450171633bee1ace68c2" dmcf-pid="pq5NRHCE5x" dmcf-ptype="general">김 교수는 "초기에는 음성인식(STT)과 음성합성(TTS)을 결합하는 단계적 방식을 썼지만 응답 지연, 호흡, 감정 등 고유 정보 손실 문제가 있었다"라며 "강력한 사전학습된 언어모델을 핵심에 두고 음성을 포함한 다양한 데이터로 미세조정(파인튜닝)하는 방식이 옴니모달 개발의 핵심"이라고 덧붙였다.</p> <p contents-hash="ed7765b8bf4ada7b7f681b44058d3c06d7f19778142af635ef8a9062275f11f2" dmcf-pid="UB1jeXhD1Q" dmcf-ptype="general">SK텔레콤은 향후 옴니모달 모델을 에이닷 서비스에 적용해 통화 요약, 티맵, B tv 등에서 실시간 음성 대화를 지원하는 계획을 세웠다.</p> <p contents-hash="9ea9c51215cfdceac197f595c177f1402842bfc9824ba77a1689d7af47c57290" dmcf-pid="ubtAdZlwHP" dmcf-ptype="general">업스테이지는 앞서 3차 평가부터 언어와 이미지를 통합적으로 이해하는 멀티모달 기능을 확보한다고 밝힌 바 있다.</p> <p contents-hash="d5cbfa277ce6912d4e90e1f89f7f621c7c7009fc616f29b790b6746692cd1b9c" dmcf-pid="7KFcJ5SrH6" dmcf-ptype="general">LG AI연구원은 구체적인 계획을 밝힌 바 없지만 궁극적으로 멀티모달 모델을 수립하는 것을 목표하고 있다고 전해졌다.</p> <p contents-hash="738a022696b8e5d0455e6fd61029b76d155a0e0c7c7be861826cecba5dff3166" dmcf-pid="z93ki1vmZ8" dmcf-ptype="general">한편 정부가 독자 AI 프로젝트 1차 평가에서 네이버와 NC AI를 탈락시키며 1개 팀을 추가 공모하기로 발표하면서 재도전팀이 멀티모달 개발에 도전할지도 관심이 쏠리고 있다.</p> <p contents-hash="1fbca3ba38ec3ddf2516c9937d2f936dd7b18093d0531ee947827db27338fcb3" dmcf-pid="qQBIA7ZvH4" dmcf-ptype="general">현재 스타트업인 모티프테크놀로지스와 트릴리온랩스가 재도전 의사를 밝혔는데 김 교수가 지적했듯이 멀티모달은 대형언어모델(LLM)에 비해 개발 난이도가 높기 때문이다. </p> <p contents-hash="cdb00835ce5faeccf81b332c0cf6cf0eb6b23995706fbb90e286943cd084b4c1" dmcf-pid="BxbCcz5Ttf" dmcf-ptype="general">먼저 모티프테크놀로지스는 "고성능 LLM과 대형멀티모달모델을 모두 파운데이션 모델로 개발한 경험을 갖춘 국내 유일의 스타트업"이라며 멀티모달 개발을 목표로 한다는 의사를 밝힌 바 있다.</p> <p contents-hash="13d16967cf63ad72c9d68eed2ee57635d1cf138ea4337a3329f95c49f9f22d99" dmcf-pid="bMKhkq1yGV" dmcf-ptype="general">built@yna.co.kr</p> <p contents-hash="d8adbd697d87a03d92eb8f61493e42e0cab6fd1b1e1ce3c82b8ca5b767489085" dmcf-pid="9e2SDbFYt9" dmcf-ptype="general">▶제보는 카톡 okjebo</p> </section> </div> <p class="" data-translation="true">Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지</p> 관련자료 이전 홍석천, 4월에 한국 떠난다 “일단 저지르고 맞춰가”(동치미)[핫피플] 01-25 다음 박나래의 '주사 이모' "'그알' 제작진 매주 찾아와 괴롭혀"[전문] 01-25 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.