과기정통부, AI 학습데이터 업사이클링…LLM·피지컬AI에 활용 작성일 05-07 35 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">AI허브 데이터 30종 생성형 AI용으로 재가공<br>질문·검증·답변 등 추론 과정 포함<br>이미지·영상 데이터는 VLA 구조로 고도화<br>재가공 데이터, AI허브 통해 공개 예정</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="1LzS7I71s5"> <p contents-hash="78ce10c78294b44650ff864873d38b7154c0ac78e4f97be685271483a98b3691" dmcf-pid="tj9YKvKprZ" dmcf-ptype="general"> [이데일리 신영빈 기자] 과학기술정보통신부는 한국지능정보사회진흥원과 기존 인공지능(AI) 허브 데이터를 최신 생성형 AI 기술 환경에 맞게 재가공하는 ‘AI 학습용데이터 업사이클링’ 사업 공고를 30일부터 시작한다고 7일 밝혔다.</p> <p contents-hash="ba8728d79392036d151f127525dc5d772a44eff59346780d89ed65fd1305da9d" dmcf-pid="FA2G9T9UIX" dmcf-ptype="general">과기정통부는 기존 판별형 AI 중심 라벨링 데이터를 재가공하여 추론 과정과 행동 정보를 포함하는 생성형 AI용 데이터로 전환함으로써 보다 복잡한 문제 해결이 가능하도록 AI 기술 경쟁력 확보를 지원할 계획이다.</p> <figure class="figure_frm origin_fig" contents-hash="2aabe5dfd6b5dc4f41d85b562dfd6962bab85ea9271826570aaf6bc42a94b0f5" dmcf-pid="3cVH2y2urH" dmcf-ptype="figure"> <p class="link_figure"><img alt="과학기술정보통신부. (사진=연합뉴스)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/07/Edaily/20260507120344741fmxr.jpg" data-org-width="600" dmcf-mid="5ME6kVkLs1" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/07/Edaily/20260507120344741fmxr.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 과학기술정보통신부. (사진=연합뉴스) </figcaption> </figure> <div contents-hash="1b9424808ff0e8d8c62f59da6c10a5c2893c77b6aa75ede419ace8735f768611" dmcf-pid="0kfXVWV7sG" dmcf-ptype="general"> 이번 사업은 LLM(대규모 언어 모델)과 피지컬 AI 분야를 중심으로 총 30종의 데이터셋을 재가공(30억원 규모)하며, 학습 데이터를 신규 구축하는 것에 비해 예산 투입 대비 정책 효과를 높일 수 있을 것으로 기대된다. </div> <p contents-hash="6bb77f5e5f1b50ec88d6ceb6f2f05dc9cd2c6ea1cfcf5b6051b2ad30d6d6ca0f" dmcf-pid="pE4ZfYfzOY" dmcf-ptype="general">이번 사업은 2O22년까지 구축된 AI허브 데이터 691종을 생성형 AI용 데이터로의 확장 가능성, 데이터 활용도 등을 기준으로 전수 분석하고, 외부 전문가 검토를 다시 거쳐 최종적으로 30종을 선정했다.</p> <p contents-hash="62a2a280bb68d1aca74a6727f2dc13905c8e171abdac577b3e2c49745b26ba5a" dmcf-pid="UD854G4qIW" dmcf-ptype="general">LLM 데이터 분야에서는 기존 텍스트 데이터를 기반으로 질문-근거 검토-오류 검증-답변 확정에 이르는 추론 과정을 포함하도록 데이터를 재구성한다. 단일 정답 제시에 그치지 않고, 다양한 판단 경로와 자기 검증 과정을 학습할 수 있는 데이터로 확장할 계획이다.</p> <p contents-hash="56f0e32fca30bc00c61ba60b16834424e890aa019fe6c2143dbf91879dc674c5" dmcf-pid="uw618H8BIy" dmcf-ptype="general">특히 동일한 문제에 대해 복수의 추론 경로를 구성하고 근거 기반 판단 및 오류 수정 과정을 포함함으로써, 복잡한 문제 해결이 가능한 추론형 AI 학습 기반을 마련할 예정이다.</p> <p contents-hash="daf73bca451063b766bcb7b0ff058f41df1c64531548d7bbcc082c0d0b84a22d" dmcf-pid="7E4ZfYfzmT" dmcf-ptype="general">피지컬 AI 분야에서는 기존 이미지·영상 데이터를 기반으로 시각 정보(V), 언어명령(L), 행동 및 제어(A)를 통합한 구조로 데이터를 고도화한다.</p> <p contents-hash="fc9440606cf3ba42341bf6876553c67857880631ff3773023fe9db2079eddb07" dmcf-pid="zD854G4qsv" dmcf-ptype="general">객체 인식 수준을 넘어, 시간 흐름에 따른 상황 변화와 객체 간 상호작용을 이해하고 목표 기반 행동을 생성할 수 있는 데이터로 확장할 계획이다. 특히 연속적인 장면 정보와 객체 움직임 데이터를 활용하여 행동 경로와 작업 목표를 정의할 수 있는 형태로 재구성한다.</p> <p contents-hash="b8553410c100f04a8491f182b926be006fe34e82de723f638830cc2703b45a22" dmcf-pid="qw618H8BES" dmcf-ptype="general">업사이클링된 데이터는 향후 ‘AI 허브’를 통해 공개돼 기업, 연구기관, 스타트업 등이 자유롭게 활용할 수 있도록 제공될 예정이다.</p> <p contents-hash="98b9b27e1051ff600423f99aacf50d652510a30fe29575a2d94faae7b7c13cf7" dmcf-pid="BrPt6X6bwl" dmcf-ptype="general">과기정통부는 본 사업을 통해 데이터의 품질과 적합성을 높이는 동시에 다양한 AI 환경에서 활용 가능한 구조로 개선하여, 최신 AI 시대에 대응하는 데이터 인프라를 지속적으로 확충해 나갈 계획이다.</p> <p contents-hash="754b106e34c0ba240089d040b1ce48e51fa07eee024787f2e3d3b550cb86d679" dmcf-pid="bmQFPZPKwh" dmcf-ptype="general">최동원 과기정통부 인공지능인프라정책관은 “이번 업사이클링 사업을 통해 적은 비용으로도 최신 생성형 AI 기술 환경에 맞는 AI 학습용데이터를 확보할 수 있을 것”이라며 “이미 축적된 데이터 자산이 낭비되지 않도록 활용 가치를 끌어올려 나가겠다”고 말했다.</p> <p contents-hash="4a40788fa063d5ac0eacdebff148c8bf986635a99d9860b2ff4bfd7f7a9a62cc" dmcf-pid="Ksx3Q5Q9rC" dmcf-ptype="general">신영빈 (burger@edaily.co.kr) </p> </section> </div> <p class="" data-translation="true">Copyright © 이데일리. 무단전재 및 재배포 금지.</p> 관련자료 이전 통신 품질개선 기준 높이고 5G SA 평가지표 개발…이용자 체감 중심 강화 05-07 다음 84세 어르신도 제미나이로 그림 척척...‘AI 디지털 배움터’ 69곳으로 05-07 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.