독자 AI 모델, 한국적 평가 거친다…성능 평가 데이터셋 구축사 모집

작성일 07-17

<div id="layerTranslateNotice" style="display:none;"></div>  
        <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
         <section dmcf-sid="9MOivkHEo4">
          <div contents-hash="c105a4ac6513bcfcdc4ba8790ce72a075d2eac7b1372acc9823683ff07bd8274" dmcf-pid="2RInTEXDAf" dmcf-ptype="general">
           <p>정부가 '독자 인공지능 기초 모형(독자 AI 파운데이션 모델)' 사업에 참여할 정예팀이 개발한 AI 모델의 성능을 평가하기 위해 '성능 평가 데이터셋 구축 사업' 수행기관을 다음 달 7일까지 공개 모집한다. </p>
          </div>
          <figure class="figure_frm origin_fig" contents-hash="d38a74d23c7cd19be5586154cba79787eda82e0131413b0b04723221e6a21713" dmcf-pid="VeCLyDZwjV" dmcf-ptype="figure">
           <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/17/akn/20250717141233788yiyu.png" data-org-width="340" dmcf-mid="KjInTEXDk8" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/17/akn/20250717141233788yiyu.png" width="658"></p>
          </figure>
          <div contents-hash="1357f8b9b3bd587d0261430883d03dd4b33acc1ba7464763a1bcd58a310d73b0" dmcf-pid="fdhoWw5ra2" dmcf-ptype="general">
           <p>과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 주최하는 이 사업은 국내 AI 모델에 대한 성능평가에 활용할 데이터셋을 구축하는 것을 목표로 한다.</p>
          </div>
          <p contents-hash="da88717ecd271cb5a991a1c5748407d75720ae7082587122b3ecd6dc5fe9eda3" dmcf-pid="4JlgYr1mg9" dmcf-ptype="general">그간 글로벌 빅테크 기업을 필두로 다양한 생성형 AI 서비스가 등장했으나, 대부분의 성능 평가에서 영어권의 평가 지표가 활용돼 국내의 서비스 이용환경 등을 충분히 반영하지 못한다는 한계가 있었다.</p>
          <p contents-hash="fcf22bf3f339b3b52e83a1da0e106796a8d6af9e0228215ce2fcfa5f7e4c65f6" dmcf-pid="8uibNQDxgK" dmcf-ptype="general">이에 우리나라의 문화, 사회적 가치 등을 반영하고, 국내외 다양한 AI 모델의 성능을 객관적으로 진단하기 위해 총 24억원(총 3개 과제, 과제별 8억원)을 투입해 고품질 성능 평가 데이터셋 구축을 추진한다.</p>
          <p contents-hash="c1b464f75065db4494ff8c95b7077bc5e4382bde0d9cbfe40e23e184f226f7c5" dmcf-pid="67nKjxwMNb" dmcf-ptype="general">올해에는 우선적으로 ▲LLM의 수학 풀이 능력 평가 데이터(수학 분야) ▲한국형 지식을 평가하기 위한 주제별 질의-정답 및 추론 데이터(지식 분야) ▲장문 문맥에서 다양한 과업에 대한 성능평가 데이터(장문이해 분야) 등 3개 분야의 데이터셋을 구축한다. 향후에는 멀티모달, 에이전트 등 생성형 AI 모델의 다양한 영역을 평가하기 위한 데이터셋을 구축해 나갈 계획이다.</p>
          <p contents-hash="77d57525ff33ce3b1abbeab5830adc2a56a6152be8a4ce1258a1dc3044e51a61" dmcf-pid="PzL9AMrRcB" dmcf-ptype="general">참여 희망 기업·기관은 초거대 AI 또는 자연어처리, 멀티모달 AI 등 대규모 데이터셋 기반의 인공지능 개발 역량을 갖춘 기업·기관이 1개 이상 수행기관 컨소시엄에 포함돼야 한다.</p>
          <p contents-hash="c2848f5b25c444cf77f79545104e144265f64f626d921a91a6a903b6d87d4896" dmcf-pid="Qqo2cRmeNq" dmcf-ptype="general">과기정통부 김경만 인공지능기반정책관은 "국민이 체감할 수 있는 고성능 국내 독자 AI 파운데이션 모델을 확보하기 위해서는 그 성능을 평가하는 데이터셋도 국내 사회·문화 환경 등이 반영돼야 한다"라며 "이번 사업을 통해 구축한 성능 평가 데이터셋은 정예팀 뿐만 아니라 향후 국내 AI 개발기관이 활용 할 수 있도록 공개할 계획"이라고 밝혔다.</p>
          <p contents-hash="a1671c0c96bc9be04ea1b7747ad8fd604a63cd0c36c0fe4b3f68244c40946f52" dmcf-pid="xBgVkesdgz" dmcf-ptype="general">김보경 기자 bkly477@asiae.co.kr</p>
         </section> 
        </div> 
        <p class="" data-translation="true">Copyright © 아시아경제. 무단전재 및 재배포 금지.</p>

이전

[단독] '폭군의 셰프' 임윤아, 진짜 셰프 만남...'안성재거덩요' 출격

07-17
다음

이민호 "결혼? 해야죠..기적이 벌어져야 할 것 같은 느낌"[인터뷰②]

07-17

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

독자 AI 모델, 한국적 평가 거친다…성능 평가 데이터셋 구축사 모집

멤버랭킹

관련자료

멤버랭킹