정부, 韓 독자 AI 성능평가 위한 데이터셋 구축 추진 작성일 07-17 3 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">독자 AI 파운데이션 모델 프로젝트 일환<br>국내 사회·문화 등 반영한 성능평가 진행</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="tHCJC541Zx"> <figure class="figure_frm origin_fig" contents-hash="9f42bb3bfd5b8d52b9999f2696c6732251ef9c810ab55330b9b778273f511606" dmcf-pid="FXhih18tXQ" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/17/newsis/20250717120151089zomf.jpg" data-org-width="720" dmcf-mid="1kx3xjWAXM" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/17/newsis/20250717120151089zomf.jpg" width="658"></p> </figure> <p contents-hash="64232f130ba874bb14c3d1703106186d988edd94d7c68ec2929a570ed5c17ee4" dmcf-pid="3Zlnlt6FYP" dmcf-ptype="general">[서울=뉴시스]윤현성 기자 = 과학기술정보통신부는 한국지능정보사회진흥원(NIA)과 독자 인공지능 기초 모형(독자 AI 파운데이션 모델)을 대상으로 한 '성능평가 데이터셋 구축 사업' 수행기관을 7월 17일부터 8월 7일까지 공개 모집한다고 밝혔다. </p> <p contents-hash="2a84f9b41501340a68f5cd60cf467a69ee11f080f5de1a873a8d558611dfa54d" dmcf-pid="05SLSFP3Z6" dmcf-ptype="general">이번 사업은 독자 AI 파운데이션 모델 프로젝트의 일환으로 추진된다. 성능평가 데이터셋을 구축해 독자 AI 파운데이션 모델 사업에 참여할 정예팀이 개발하는 AI 모델의 성능을 평가하는 것이 목표다.</p> <p contents-hash="733eda4c7ceca9598cc93bd43d1ac941ed510b2da5a129fab72f983c76f0afbd" dmcf-pid="p1vov3Q018" dmcf-ptype="general">그간 글로벌 빅테크 기업을 필두로 다양한 생성형 AI 서비스가 등장했으나 대부분의 성능평가에서는 영어권의 평가지표가 활용돼왔다. 이로 인해 국내의 서비스 이용환경 등을 충분히 반영하지 못한다는 한계가 있었다.</p> <p contents-hash="ef561b2f8ceb71b84fa5bb596fd002eeb34572c01e3f1a3f466ce5df9dbbf0dc" dmcf-pid="UtTgT0xpG4" dmcf-ptype="general">이에 우리나라의 문화, 사회적 가치 등을 반영하고, 국내외 다양한 AI 모델의 성능을 객관적으로 진단하기 위해 총 24억원(총 3개 과제, 과제별 8억원)을 투입해 고품질 성능평가 데이터셋 구축을 추진한다. </p> <p contents-hash="95d59a2d1dbedfaf22313ad398b7b7cca6583feadf43e8a93397935668ab7c4c" dmcf-pid="uFyaypMUHf" dmcf-ptype="general">이를 위해 과기정통부는 AI 모델 개발 및 평가 방법 분야의 국내외 산학 전문가 의견 수렴 및 검토를 거쳐 성능평가 데이터셋 구축 분야를 발굴했다. </p> <p contents-hash="0177aca45bd73a834082b22388bd1d87ebbde70421169971495596cb59094885" dmcf-pid="7Zlnlt6FHV" dmcf-ptype="general">올해에는 우선적으로 ▲LLM의 수학 풀이 능력 평가 데이터(수학 분야) ▲한국형 지식을 평가하기 위한 주제별 질의-정답 및 추론 데이터(지식 분야) ▲장문 문맥에서 다양한 과업에 대한 성능평가 데이터(장문이해 분야) 등 3개 분야의 데이터셋을 구축한다. 향후에는 멀티모달, 에이전트 등 생성형 AI 모델의 다양한 영역을 평가하기 위한 데이터셋을 구축해 나갈 계획이다.</p> <p contents-hash="ee336bc99a31e265aa12919d4ca42a5a5010d56c949184a547dd0708e067fef3" dmcf-pid="z5SLSFP3t2" dmcf-ptype="general">사업 참여를 희망하는 기업·기관은 초거대 AI 또는 자연어처리, 멀티모달 AI 등 대규모 데이터셋 기반의 AI 개발 역량을 갖춘 기업·기관이 1개 이상 수행기관 컨소시엄에 포함돼야 한다.</p> <p contents-hash="6fe82b94ba937dea61cd20fe3ff1966ccf3fd790f778da3dc56edcb080dbfd03" dmcf-pid="q1vov3Q0Y9" dmcf-ptype="general">김경만 과기정통부 인공지능기반정책관은 "국민이 체감할 수 있는 고성능 국내 독자 AI 파운데이션 모델을 확보하기 위해서는 그 성능을 평가하는 데이터셋도 국내 사회·문화 환경 등이 반영돼야 한다"며 "이번 사업을 통해 구축한 성능평가 데이터셋은 정예팀 뿐만 아니라 향후 국내 AI 개발기관이 활용 할 수 있도록 공개할 계획이다. 국내 AI 생태계 경쟁력 강화에 기여할 것으로 기대한다"고 말했다.</p> <p contents-hash="cc0f6598317f65d70ccb0d9841bafd184005859eed6141b01433059ca83aca8b" dmcf-pid="BtTgT0xpHK" dmcf-ptype="general"><span>☞공감언론 뉴시스</span> hsyhs@newsis.com </p> </section> </div> <p class="" data-translation="true">Copyright © 뉴시스. 무단전재 및 재배포 금지.</p> 관련자료 이전 "어르신도 쉽게 쓰도록" 키오스크에 편의성 등급제 생긴다 07-17 다음 "스킨십 끊은 지 9년" 개그맨 부부 '이혼 위기'…발길질까지 '깜짝' 07-17 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.