국가대표 AI 레이스 막 오른다…평가 기준은 작성일 01-02 40 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">5일부터 평가 시작…19일 결과 발표 유력<br>글로벌 벤치마크·전문가·활용처 평가 진행</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="uR48tILx5X"> <figure class="figure_frm origin_fig" contents-hash="eb2d6d5edc78d4f1af437886afea16610503dd93dc7989bfff0dcde5a479f764" dmcf-pid="7e86FCoM1H" dmcf-ptype="figure"> <p class="link_figure"><img alt="배경훈 부총리 겸 과학기술정보통신부 장관과 하정우 청와대 AI미래기획수석 등 참석자들이 30일 오후 서울 강남구 코엑스 오디토리움에서 열린 '독자 AI파운데이션 프로젝트' 발표회에서 기념촬영을 하고 있다. 2025.12.30/뉴스1 ⓒ News1 구윤성 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/02/NEWS1/20260102141523043vycw.jpg" data-org-width="1400" dmcf-mid="pNsOJbHlG5" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/02/NEWS1/20260102141523043vycw.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 배경훈 부총리 겸 과학기술정보통신부 장관과 하정우 청와대 AI미래기획수석 등 참석자들이 30일 오후 서울 강남구 코엑스 오디토리움에서 열린 '독자 AI파운데이션 프로젝트' 발표회에서 기념촬영을 하고 있다. 2025.12.30/뉴스1 ⓒ News1 구윤성 기자 </figcaption> </figure> <p contents-hash="f37a029c53e93b60c7aac1db186cf07711d69851955115687a3fdb187549d4fa" dmcf-pid="zd6P3hgRGG" dmcf-ptype="general">(서울=뉴스1) 김민수 기자 = 독자 AI 파운데이션 모델 사업 1차 평가가 다음 주부터 본격 진행된다. 과학기술정보통신부는 벤치마크 기반 정량 평가 외에 전문가 평가와 활용처 평가 등을 병행하겠다는 방침이다.</p> <p contents-hash="5e51746e3845a2d42238678385ab9f7ac385c9810373bc5240125219ca494695" dmcf-pid="qJPQ0lae1Y" dmcf-ptype="general">2일 업계에 따르면 과기정통부는 네이버클라우드·업스테이지·SK텔레콤·NC AI·LG AI연구원이 이끄는 유망 5개 컨소시엄을 대상으로 이달 5일부터 1차 평가를 시작한다. 이번 평가로 1곳이 탈락하게 된다.</p> <p contents-hash="e63f75479d81b7930ab8edafb81e644d5aeac34ee0cce1340c851f7c33b9e689" dmcf-pid="BiQxpSNdHW" dmcf-ptype="general">1차 평가는 13종 글로벌 벤치마크를 공통 지표로 활용한다. 각 컨소시엄은 공모 당시 목표 모델을 제출했고, 정량 평가는 목표 모델 대비 성능 달성 수준을 기준으로 이뤄진다.</p> <p contents-hash="ed17d473120f8a76eb5e2fc45d3f5b8df2bf23389fca2dc537594dbe72af7314" dmcf-pid="bB0phgfzGy" dmcf-ptype="general">정량 벤치마크 결과는 비교적 빠르게 산출되지만, 전문가 및 활용처 평가에는 시간이 더 소요될 것으로 보인다. 특히 활용처 평가는 스타트업 등 실제 산업 현장 관계자들이 평가자로 참여해, 모델의 실사용 가능성과 적용성을 살펴보는 방식으로 진행될 예정이다. 평가단의 구성은 공정성 확보를 위해 비공개로 운영된다. </p> <p contents-hash="ab299405f88e3d1a113f61ba47949566ee38d5ecf2af0341fc2b297610d5fb01" dmcf-pid="KbpUla4qYT" dmcf-ptype="general">업계에 따르면 이번 과제는 각 컨소시엄이 목표 모델의 크기·구조·방향을 스스로 제시하는 방식으로 진행돼 조건이 서로 다르다. 이 때문에 평가 기준 정리가 늦어진 것으로 전해졌다. 한 업계 관계자는 "독창성 등 정성평가 항목도 제시돼 있으나, 구체적인 기준과 반영 비율은 정부 공식 자료가 나오기 전까지 알기 어렵다"고 설명했다. </p> <p contents-hash="d362171b13235e52cdb79eb40fb6e83456e9b0d0eb913cb76cf44c62752e15d1" dmcf-pid="9KUuSN8B5v" dmcf-ptype="general">과제 기획 단계에서는 대국민 평가도 포함돼 있었으나, 전문성 문제 등을 이유로 제외됐다. </p> <p contents-hash="7c4a4f7f2ac08b3d9b09b8b639f2140795520cbb2d49bb8b35c0a4cad5ab0cee" dmcf-pid="29u7vj6bGS" dmcf-ptype="general">일단은 글로벌 벤치마크·전문가 평가·활용처 평가 등으로 방식이 정리됐다. 다만 세부적인 평가 기준은 베일에 가려져 있다. 과기정통부는 그간 팀들과 여러 차례 평가 기준과 절차 관련 논의를 이어온 것으로 알려졌다.</p> <p contents-hash="4fbbd46b6e6a2d7f440b8a9ba566968fafede61313244c5e09074f81a4df90bd" dmcf-pid="V27zTAPKYl" dmcf-ptype="general">현재 5개 컨소시엄은 언어모델 중심, 멀티모달, 산업 특화모델 등 서로 다른 방향으로 모델을 개발하고 있다. 네이버클라우드는 텍스트·이미지·코드 등을 통합 처리하는 '하이퍼클로바X 옴니(OMNI)'를, NC AI는 제조·국방·컬처 등 산업 전환을 겨냥한 멀티모달 모델 'VAETKI'를 각각 공개했다.</p> <p contents-hash="e2efe866c9d845dd878e80f8ed7d6334a3d66f3e1451ba887734f1aa2ca91f0c" dmcf-pid="fVzqycQ9Xh" dmcf-ptype="general">업스테이지는 공공·산업 현장 활용을 목표로 한 오픈소스 기반 '솔라 오픈(Solar Open)'을, SK텔레콤은 5000억 개 이상 파라미터를 갖춘 초대형 모델 'A.X K1'을 내놨다. LG AI연구원은 글로벌 최신 모델을 경쟁 상대로 'K-엑사원(K-EXAONE)'을 제시했다.</p> <p contents-hash="7c61c185c431de14841255e0fc84acace4ed28ebd1d937fe6e7f90eebef8d3de" dmcf-pid="4fqBWkx25C" dmcf-ptype="general">모든 팀에게는 글로벌 주요 파운데이션 모델의 성능 95% 이상을 우리 기술로 구현해야 하는 과제가 주어진 상태다. 학습 가중치가 공개된 기존 모델을 개량해선 안 되고, 밑바닥부터 설계(프롬스크래치)해야 한다.</p> <p contents-hash="0873dd599e61e0ad8421a1ff0d44f312f94d6f0636ff564f4242bc94bd262c79" dmcf-pid="84BbYEMV5I" dmcf-ptype="general">모델 제출 마감은 이달 4일까지며, 전문가 평가가 5일부터 진행된다. 정부는 이달 15일 평가를 마무리하고 19일에 결과를 발표할 예정이다.</p> <figure class="figure_frm origin_fig" contents-hash="bec6a364042288930d93247f3cf9efb16153e82e8642e4cd9bdf9aef84963d5e" dmcf-pid="6lrmeqYC1O" dmcf-ptype="figure"> <p class="link_figure"><img alt="ⓒ News1 김초희 디자이너" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/02/NEWS1/20260102141523344ksrr.jpg" data-org-width="1303" dmcf-mid="UQ2VZmJ6HZ" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/02/NEWS1/20260102141523344ksrr.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> ⓒ News1 김초희 디자이너 </figcaption> </figure> <p contents-hash="62eb09fae42893ef3808c510d20d10dbf5b7b42149bd7b1fd6b35e063348b420" dmcf-pid="PSmsdBGhXs" dmcf-ptype="general">kxmxs4104@news1.kr </p> </section> </div> <p class="" data-translation="true">Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.</p> 관련자료 이전 '그때 그 리니지'가 돌아온다…엔씨, '클래식'으로 새해 승부수 01-02 다음 태백시 '고지대 스포츠훈련장 특구' 4년 연장 지정 01-02 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.