정부, 차세대 AI 리더보드 구축 추진…공정한 AI 성능 평가체계 만든다 작성일 08-03 6 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="7eiNGtQ0Ik"> <figure class="figure_frm origin_fig" contents-hash="20625aa75208077c18bea8bbf7b300cacbeeca59c2200fbc4d87f03beebe6c09" dmcf-pid="zdnjHFxpIc" dmcf-ptype="figure"> <p class="link_figure"><img alt="[사진=게티이미지뱅크 제공]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202508/03/etimesi/20250803170310205urrk.jpg" data-org-width="700" dmcf-mid="UQeoyZ8tDD" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202508/03/etimesi/20250803170310205urrk.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> [사진=게티이미지뱅크 제공] </figcaption> </figure> <p contents-hash="2f97b6fd8d249e361ab2ce4f79be404678bfdd2dd12a88a48319b72f9ac91dac" dmcf-pid="qJLAX3MUDA" dmcf-ptype="general">정부가 인공지능(AI) 모델 성능을 신뢰할 수 있고 공정하게 비교할 수 있는 새로운 리더보드 시스템을 구축한다. 최근 주목 받는 '대형 언어모델(LLM)' 등 다양한 AI 기술이 객관적으로 비교될 수 있는 환경을 만들겠다는 취지다.</p> <p contents-hash="7d5b7743e89a6dd8bd7308af3755850914a77ed6b704793a219fc293a1dc439d" dmcf-pid="BiocZ0RuIj" dmcf-ptype="general">한국지능정보사회진흥원(NIA)은 최근 '차세대 AI 리더보드 기능 구현' 사업에 착수했다. 사업자를 선정하는대로 약 3개월 동안 사업을 진행해서 마무리한다는 방침이다.</p> <p contents-hash="8937a34b7b269ba14057a2ecd6dbda9248e473c1c6280db5782cf493d2d0977f" dmcf-pid="bngk5pe7wN" dmcf-ptype="general">차세대 AI 리더보드 기능 구현 사업은 국내 AI 개발 기업과 연구자들이 만든 AI 모델 성능을 평가하고, 향후 공개 순위를 제공하는 리더보드로 확장될 수 있는 시스템을 새로 만드는 것이다.</p> <p contents-hash="66bcbe10d06ef638413dbec49512f9e91e2c8b71a999eda8c3c38a55d942f25f" dmcf-pid="KLaE1Udzwa" dmcf-ptype="general">생성형 AI가 주어진 질의에 얼마나 정확하고 일관된 응답을 제공하는지를 평가할 수 있는 자동화된 평가 도구와 이를 위한 데이터셋을 함께 구축한다.</p> <p contents-hash="79515ebaf70fe8ca8d34caf056b01f3e2329c17b9d6bf6ee640d94fd5aa2860c" dmcf-pid="9oNDtuJqmg" dmcf-ptype="general">NIA는 △모델 등록부터 평가 결과 확인까지 가능한 웹 기반 플랫폼 △명확한 평가 기준과 점수 산정 방식 △부정확하거나 편향된 답변을 점검할 수 있는 항목 등을 포함한 평가 체계를 마련할 계획이다.</p> <p contents-hash="296c6449e8329d9e58537c2a3db7642e94252a3b0180946b26136861dc12b2b9" dmcf-pid="2gjwF7iBro" dmcf-ptype="general">무엇보다 이번 사업은 AI 성능을 평가할 데이터를 새로 만들고, 그것이 얼마나 정확하고 공정한지 검증하는 작업이 함께 이뤄진다는 점에서 의미가 크다.</p> <p contents-hash="bd6e468d3cae7ec614e0cad1e17ace75559e4d89210f9a27533ece31f730e508" dmcf-pid="V24MOvBWOL" dmcf-ptype="general">예를 들어 AI에게 물어볼 질문(데이터)을 만들고, 정답과 오답을 사람이 검토해 평가 기준을 정비하는 식이다. 평가에 사용되는 데이터가 부정확하거나 편향돼 있으면 모델 성능을 왜곡할 수 있기 때문이다.</p> <p contents-hash="52ebba11d51fcca1fa1acc67b0ab762194d89eee8053edd2fe95a2e75255eb08" dmcf-pid="fV8RITbYOn" dmcf-ptype="general">시스템은 민간 클라우드 환경에서 운영된다. 필요한 서버와 보안 기능도 함께 갖춘다. 예를 들어 평가에 쓰이는 서버는 외부와 격리해 운영하고, 악성 공격을 막는 방화벽이나 바이러스 차단 기능을 기본으로 제공한다.</p> <p contents-hash="f4fcd8e6108119509aa47b3844808f2a8ecfad6b9187015034b9abf341be2d9d" dmcf-pid="4f6eCyKGmi" dmcf-ptype="general">사용자는 웹사이트에 접속해서 자연어 처리 기반의 AI 모델을 등록하고, 사전 정의된 평가 항목에 따라 성능을 측정한 결과를 확인할 수 있다.</p> <p contents-hash="33effcd230e160bfd70e499ecf3c94c050171da93288bd8eef47bfb63525441f" dmcf-pid="84PdhW9HEJ" dmcf-ptype="general">이외에도 관리자 기능으로는 평가 요청 승인, 결과 검토, 통계 제공, 평가 이력 관리 등이 포함된다. 또한 그래픽처리장치(GPU) 사용량에 따라 자원을 할당하고, 평가 중 오류를 기록·분석할 수 있는 기능, 응용 프로그래밍 인터페이스(API) 접근 권한을 통제하는 기능 등도 적용한다.</p> <p contents-hash="e48fc7fc9332944481908ebe866491aba429ee514aef8e115c980392acbce445" dmcf-pid="68QJlY2XDd" dmcf-ptype="general">NIA는 국내에서 개발되는 다양한 AI 모델을 공정하게 비교하고, 수준을 객관적으로 확인할 수 있는 기반을 마련할 방침이다. 앞으로는 AI가 실제로 어느 분야에서 잘 쓰일 수 있을지 분석할 수 있도록 평가 항목을 확대할 예정이다.</p> <p contents-hash="0bb852c4585ef44eb1b20e64018dc2f826b5f4c18e39bda56413642c7097efd5" dmcf-pid="P6xiSGVZme" dmcf-ptype="general">NIA는 “구축될 리더보드 시스템이 국내 AI 생태계가 한 단계 더 도약하는 기반이 될 것으로 기대한다”고 전했다.<br></p> <figure class="figure_frm origin_fig" contents-hash="12f2a13ce8c4a2acbbd165a15cf14710d61961da9ef25a9ccff0d2e433a3de6c" dmcf-pid="QPMnvHf5OR" dmcf-ptype="figure"> <p class="link_figure"><img alt="차세대 AI 리더보드 기능 구현 사업 개요. - [자료= NIA 제공]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202508/03/etimesi/20250803170311456rnst.png" data-org-width="361" dmcf-mid="uKdgW56FOE" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202508/03/etimesi/20250803170311456rnst.png" width="658"></p> <figcaption class="txt_caption default_figure"> 차세대 AI 리더보드 기능 구현 사업 개요. - [자료= NIA 제공] </figcaption> </figure> <p contents-hash="86d853a92c44ad3c9c799830c94766ea2441ebc81d87b87229f674f9776b654a" dmcf-pid="xQRLTX41rM" dmcf-ptype="general">류태웅 기자 bigheroryu@etnews.com</p> </section> </div> <p class="" data-translation="true">Copyright © 전자신문. 무단전재 및 재배포 금지.</p> 관련자료 이전 둘이 이런 사이였어? 박서준이 추성훈 50세 생일에 전한 ‘특별한 선물’ 정체 08-03 다음 '임신' 한민용 앵커, 쌍둥이 출산 앞두고 '뉴스룸' 하차 "무한한 응원을" 08-03 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.