엔비디아 '실험실' 된 한국…1000만 페르소나 구현으로 소버린 AI 데이터 구축 지원 작성일 04-29 19 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">통계청, 대법원 등 자료 활용</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="GwiFQbNdoA"> <figure class="figure_frm origin_fig" contents-hash="a274cdd373a5d626a94a3e12193cf16c7039619f4f2386684fe8f668f6bc978d" dmcf-pid="Hc1NWsUZcj" dmcf-ptype="figure"> <p class="link_figure"><img alt="(사진=엔비디아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/29/552809-WkUXVfQ/20260429145556092gvcg.png" data-org-width="875" dmcf-mid="1oYO0YfzA0" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/29/552809-WkUXVfQ/20260429145556092gvcg.png" width="658"></p> <figcaption class="txt_caption default_figure"> (사진=엔비디아) </figcaption> </figure> <p contents-hash="8fe3ef0b3345e74a98211e7eb62b62702187771bf67a849da4c843cb24878e41" dmcf-pid="XktjYOu5gN" dmcf-ptype="general">[더구루=홍성일 기자] 엔비디아가 한국 사회의 특성을 반영한 합성 데이터셋을 구축했다. 이는 한국 고유의 사회·문화적 맥락을 반영한 최초의 대규모 합성 데이터셋으로 향후 인공지능(AI) 연구·산업·정부 정책 등 다양한 분야에서 활용 가능하다. 새로운 데이터셋은 공개 직후 글로벌 인공지능(AI) 개발 플랫폼 허깅페이스(Hugging Face)에서 데이터셋 부문 1위를 기록했을 정도로 많은 이들의 관심을 끌었다. 엔비디아는 데이터셋의 정보를 조합해 한국에서 1000만개 페르소나를 구축할 수 있을 것으로 보고 있다. 예컨대 가상현실에 한국 사회를 그대로 구현한다고 했을 때 전혀 다른 특성을 가진 1000만명의 사람을 구현할 수 있다는 의미다. 엔비디아는 해당 데이터셋을 통해 한국의 주권형 AI(Sovereign AI, 소버린 AI) 구축을 지원한다는 방침이다. </p> <p contents-hash="542d57c048155a6999e23712df6c20443705adaf09f66c1d6ed77419585d1802" dmcf-pid="ZEFAGI71oa" dmcf-ptype="general">29일 업계에 따르면 엔비디아는 한국형 합성 데이터셋 '네모트론-페르소나-코리아(Nemotron-Personas-Korea, 이하 페르소나 코리아)'을 공개했다. 엔비디아는 지난 21일부터 22일까지 진행한 '네모트론 디벨로퍼 데이 서울 2026'에서 데이터셋을 처음 선보였다. 페르소나 코리아는 오픈소스 라이선스로 공개돼, 국내외 개발자들이 자유롭게 활용할 수 있다. </p> <figure class="figure_frm origin_fig" contents-hash="19cc4bca573552c01d5611ac15a556e8212232a9ccccb6d5f9ce0f4987466af4" dmcf-pid="5D3cHCztog" dmcf-ptype="figure"> <p class="link_figure"><img alt="합성 페르소나를 만드는 과정. (사진=엔비디아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/29/552809-WkUXVfQ/20260429145557398mosr.png" data-org-width="875" dmcf-mid="t7rgTr0Hg3" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/29/552809-WkUXVfQ/20260429145557398mosr.png" width="658"></p> <figcaption class="txt_caption default_figure"> 합성 페르소나를 만드는 과정. (사진=엔비디아) </figcaption> </figure> <p contents-hash="8192220cb8c5cb3ee5f5e0a33aa3c010e5a1f9565c0f4a81ff3e26209d3fffff" dmcf-pid="1w0kXhqFoo" dmcf-ptype="general">페르소나 코리아는 대한민국의 인구통계학적, 지리적, 문화적 특성을 정밀하게 반영한 600만 건 규모의 합성 데이터셋으로 통계청, 대법원, 국민건강보험공단, 한국농촌경제연구원, 네이버 클라우드 등에서 확보한 공공, 민간 데이터를 기반으로 만들어졌다. </p> <p contents-hash="a84e4da75e0166c973d272e2ff87372f8f8da33e27e16542ffb5e06bfd3a6041" dmcf-pid="trpEZlB3jL" dmcf-ptype="general">데이터셋은 51개 필드로 구성됐다. 51개 필드에는 10개의 페르소나 필드, 6개 페르소나 속성 필드, 34개 인구통계·지리 컨텍스트 필드, 1개 고유 식별자 등이 있다. 적용범위는 17개 시도, 252개 시군구이며 20만9000여개 고유 성씨와 이름 등이 포함된다. 이외에도 연령 분포, 연령대별 혼인 상태 통계, 가구 종류, 학력 수준, 직업 등 다양한 데이터가 담겼다. </p> <p contents-hash="7cefca145cd27da87eab7f00304394092eb5f2672cb481ebacacdc66d1c7b72b" dmcf-pid="FmUD5Sb0kn" dmcf-ptype="general">엔비디아는 페르소나 코리아를 통해 한국의 소버린AI 모델의 데이터, 모델 편향성을 완화할 수 있을 것이라고 설명했다. 또한 1000만개의 페르소나를 구현해 학습하는 만큼 AI 모델의 응답 다양성도 높일 수 있을 것으로 보고있다. </p> <p contents-hash="2c5c20d06d3933fde548883ed9c71ee6614d3ee165d0e641d476111ddf81819a" dmcf-pid="3suw1vKpoi" dmcf-ptype="general">또한 엔비디아는 페르소나 코리아가 공개된지 5일여만에 허깅페이스 데이터셋 부문 1위를 기록했다며 기술적 완성도와 실용성을 인정받았다고 강조하기도 했다. </p> <p contents-hash="327bb1e68813268997dea9e31846848ded412e145df4b74590d18d438bf026d0" dmcf-pid="0O7rtT9UkJ" dmcf-ptype="general">엔비디아는 "페르소나 코리아는 오프소스로 공개돼 자유롭게 활용할 수 있다"며 "한국형 소버린 AI 발전을 위한 핵심 자산으로서 데이터 다양성 확대, 모델 편향성 완화, 응답 품질 향상에 기여할 것으로 기대한다"고 말했다.</p> </section> </div> <p class="" data-translation="true">Copyright © THE GURU의 모든 콘텐츠(영상·기사·사진)는 저작권법의 보호를 받은바, 무단 전재와 복사, 배포 등을 금합니다.</p> 관련자료 이전 "60초에 하나씩 3D 프린팅"…UNIST, 연속 체적 프린팅 기술 개발 04-29 다음 ‘4명 살리고 떠난 럭비 영웅’ 고 윤태일, 퇴근길 참변에도 산재 불인정…유족 ‘눈물’ 04-29 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.