독파모 2차 평가, 멀티모달이 승부처 작성일 01-25 43 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">SKT, 자사 모델에 멀티모달 기능 단계 적용<br>LG AI연구원·업스테이지도 역량 길러낼 듯</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="xzXZYZlwTo"> <figure class="figure_frm origin_fig" contents-hash="567e9888d9d50e5e33e9156ddb0a61323ddbca26611117559ea4a824a3b2f371" dmcf-pid="yB51H1vmvL" dmcf-ptype="figure"> <p class="link_figure"><img alt="배경훈 부총리 겸 과학기술정보통신부 장관, 임문영 국가인공지능전략위원회 부위원장, 하정우 AI미래기획수석비서관 등이 지난해 12월 서울 강남구 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 기념촬영을 하고 있다. 연합뉴스" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/25/dt/20260125185304627kxkq.png" data-org-width="640" dmcf-mid="p2OIrIAiCl" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/25/dt/20260125185304627kxkq.png" width="658"></p> <figcaption class="txt_caption default_figure"> 배경훈 부총리 겸 과학기술정보통신부 장관, 임문영 국가인공지능전략위원회 부위원장, 하정우 AI미래기획수석비서관 등이 지난해 12월 서울 강남구 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 기념촬영을 하고 있다. 연합뉴스 </figcaption> </figure> <p contents-hash="5beabd99d0e6c1d06aab45c6033520d298a69bfd62d00aa2b18866bfc1a85244" dmcf-pid="Wb1tXtTsSn" dmcf-ptype="general"><br> 정부 주도로 진행되고 있는 독자 인공지능(AI) 파운데이션 개발 프로젝트가 2차 과정에 들어섰다. 이번 평가부터는 멀티모달에서 승부가 날 것이란 전망이 우세하다.</p> <p contents-hash="b14ec907ca19efecf98b215b0fa13671526087e8982a0e95e789e3b8aa307adc" dmcf-pid="YKtFZFyOhi" dmcf-ptype="general">25일 관련 업계에 따르면 SK텔레콤, LG AI연구원, 업스테이지 등 1차 평가서 합격한 정예팀 모두 멀티모달 모델을 만들겠다고 밝혔다.</p> <p contents-hash="919b5d2f14e2f036c266ab87ff568508e430f3554dd98a4873c40f951955b120" dmcf-pid="G9F353WIyJ" dmcf-ptype="general">SKT 정예팀은 자사의 AI 모델인 A.X K1에 이미지, 음성 등 멀티모달 기능을 단계적으로 적용할 계획이다. 이 팀에서 멀티모달 연구를 진행 중인 김건희 서울대 컴퓨터공학부·첨단융합학부 교수는 지난 22일 기고문을 통해 이 같은 소식을 전했다.</p> <p contents-hash="80fe03a52287415af29ae48a35c667bdc3b4e8574ee6df0cb1587e49d3088c73" dmcf-pid="H23010YCSd" dmcf-ptype="general">김 교수는 "초거대 언어모델은 텍스트, 사진, 동영상 등을 통합 이해하는 멀티모달을 넘어 음성까지 이해하는 옴니모달 모델로 진화하고 있다"면서 AI와의 음성 대화 구현에 기술적 도전 과제가 따른다고 밝혔다.</p> <p contents-hash="5af54972594d321898e4635c2ebf897a9e826b960bb3cc911b6d3e70cc3e1916" dmcf-pid="XV0ptpGhhe" dmcf-ptype="general">그는 "기존의 텍스트 기반 대화가 입력과 응답이 순차적으로 이어지는 턴 기반 단방향 소통 방식이라면, 음성 대화는 동시대적이고 양방향적인 특성을 가진다"며 "상대방이 말하는 도중 개입하거나 짧은 피드백을 주고받는 실시간 상호작용이 필요하다"고 설명했다.</p> <p contents-hash="be06bef4bfe488874f28612327b8351fb300ece553102c23541b7d762b26b1ad" dmcf-pid="ZfpUFUHllR" dmcf-ptype="general">아울러 복잡한 표현 방식을 반영해야 하는 어려움도 지적됐다.</p> <p contents-hash="e92957b464ac0ac9fd9ea2cbfdae3ab8a8bc57e44a1e146ccc52b0078f5f914b" dmcf-pid="54Uu3uXSvM" dmcf-ptype="general">김 교수는 "초기에는 음성인식(STT)과 음성합성(TTS)을 결합하는 단계적 방식을 썼지만 응답 지연, 호흡, 감정 등 고유 정보 손실 문제가 있었다"며 "강력한 사전학습된 언어모델을 핵심에 두고 음성을 포함한 다양한 데이터로 파인튜닝(미세조정)하는 방식이 옴니모달 개발의 핵심"이라고 덧붙였다.</p> <p contents-hash="6c0e3fb60713c4a3cc0ae8b5ebe4ed7c6bd897bb8dcf9d314c9cd0839a224f61" dmcf-pid="18u707ZvTx" dmcf-ptype="general">SK텔레콤은 향후 옴니모달 모델을 에이닷 서비스에 적용해 통화 요약, 티맵, B tv 등에서 실시간 음성 대화를 지원하는 계획을 세웠다.</p> <p contents-hash="fe8f528e7dec3a8226171938221c80f96b251c940e0625c5faf8f646783de8f8" dmcf-pid="t67zpz5TTQ" dmcf-ptype="general">LG AI연구원은 구체적인 계획을 밝힌 바 없지만 궁극적으로 멀티모달 모델을 수립하는 것을 목표하고 있다고 전해졌다.</p> <p contents-hash="aa64323b449ba0681a55a7ceb258d1722674300cfa68e8f341234a14c698f28a" dmcf-pid="FPzqUq1yhP" dmcf-ptype="general">업스테이지는 앞서 3차 평가부터 언어와 이미지를 통합적으로 이해하는 멀티모달 기능을 확보한다고 밝힌 바 있다.</p> <p contents-hash="2ef58584c21399ab45b7206642a3fee5bc1821caf79e9a828504378548a1a0d3" dmcf-pid="3QqBuBtWC6" dmcf-ptype="general">한편, 독파모 패자부활전에 참가 의향을 보이는 스타트업들이 이러한 흐름을 따라올 수 있을지 주목된다. 1차 때의 대형언어모델(LLM) 개발 대비 난이도가 상당히 높기 때문이다. 나아가 사업적인 부분까지 따라갈 수 있을지도 주목되고 있다.</p> <p contents-hash="85d6b0fc0a4c6261a446bef61ae05cc2f2bfd7a58d109342feb77835f75078c6" dmcf-pid="0xBb7bFYy8" dmcf-ptype="general">패자부활전에 도전하는 스타트업은 모티프테크놀로지스와 트릴리온랩스이다. 앞서 과학기술정보통신부는 네이버와 NC AI를 탈락시키면서 한 개 팀을 추가 공모하겠다고 전한 바 있다. 탈락한 2개 팀은 재도전하지 않겠다는 의사를 밝혔으며, 카카오·KT 역시 같은 입장을 전했다.</p> <p contents-hash="c60d14a544fa085a0c450e3ed7c40b146b24b9e2d6fa49b0db69c8b453c28480" dmcf-pid="pe92B2pXC4" dmcf-ptype="general">모티프테크놀로지스는 "고성능 LLM과 대형멀티모달모델을 모두 파운데이션 모델로 개발한 경험을 갖춘 국내 유일의 스타트업"이라며 멀티모달 개발을 목표로 한다는 의사를 밝힌 바 있다.</p> <p contents-hash="83ce246f2b48d9f95530eee92e7209efe7b311a3d7b66afe1e321d06eb43ab9f" dmcf-pid="Ud2VbVUZlf" dmcf-ptype="general">트릴리온랩스는 소버린 AI를 지향하는 스타트업으로, 지난해 9월 70B 규모의 LLM '트리(Tri)-70B'를 개발한 경험은 있으나 멀티모달에서는 아직까지 결과물을 공개한 바 없다.</p> <p contents-hash="3cadc6604d93fe34268e3a4afb6e691fdc11b6b576970f4ce65e36b890ea29de" dmcf-pid="uJVfKfu5vV" dmcf-ptype="general">김영욱 기자 wook95@dt.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털타임스. 무단전재 및 재배포 금지.</p> 관련자료 이전 “앵무새·낙제점” KBS 아나운서 합평회, 독설에 눈물 터지고 화장실 行 (‘사당귀’)[종합] 01-25 다음 지석진, 주가 폭락에 방송 도중 욕설.."코스피 5000인데 나만 떨어져"[런닝맨] 01-25 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.