허깅페이스 공인 리더보드, 상위 21개 모델에 中 16개·韓 비드래프트 5개

작성일 04-30

<div id="layerTranslateNotice" style="display:none;"></div>  
        <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
         <section dmcf-sid="UHc1jvKpvD">
          <figure class="figure_frm origin_fig" contents-hash="8bfb2f514a2fff78d740565416f8374ea5eba93e32784053a7e030bfb0d1e2d6" dmcf-pid="u61MZ9AiTE" dmcf-ptype="figure">
           <p class="link_figure"><img alt="사진 제공= 비드래프트" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/30/dt/20260430103548930yaxr.png" data-org-width="640" dmcf-mid="0puYnOu5yr" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/30/dt/20260430103548930yaxr.png" width="658"></p>
           <figcaption class="txt_caption default_figure">
            사진 제공= 비드래프트
           </figcaption>
          </figure>
          <p contents-hash="90fd4e41c408f3a46a7bb42e20a7a71fdcf8d2c68eafeb0fe56d4bce98785aa2" dmcf-pid="7PtR52cnhk" dmcf-ptype="general"><br> 전 세계 인공지능(AI) 모델의 추론 능력을 평가하는 벤치마크 ‘GPQA 다이아몬드(GPQA Diamond)’에서 허깅페이스가 공인하는 공식 리더보드 상위권이 중국과 한국의 모델로 분석됐다.</p>
          <p contents-hash="8fbe04f8118e028358c809e3843bae8ab280a9f40799782a474dbdac76eaa0f9" dmcf-pid="zQFe1VkLWc" dmcf-ptype="general">27일 기준, 상위 21위를 분석한 결과 중국이 16개, 한국이 5개를 차지했다. 한국 5개는 모두 서울 AI 허브 기업 비드래프트(VIDRAFT)의 진화형 LLM ‘다윈(Darwin)’ 시리즈다.</p>
          <p contents-hash="39f4c48179a3dee0620524c754080bd3187cbb0c2890c49afff94370abd7028a" dmcf-pid="qx3dtfEoCA" dmcf-ptype="general">중국 측은 문샷의 Kimi-K2.6(90.5점, 1위)과 딥시크 V4-Pro(90.1점, 2위)가 1, 2위를 차지했고, 알리바바 6개, 지푸 4개, 텐센트 1개 등 총 16개를 채웠다.</p>
          <p contents-hash="d3664b84d6b20fce58bce2546eb01e36b2d70c15af2da490a4cf25e5da37d594" dmcf-pid="BM0JF4Dgyj" dmcf-ptype="general">Darwin-28B-Opus는 88.89점으로 글로벌 3위에 올라, 알리바바의 총 397B 거대 모델(88.4점)을 28B 사이즈로 추월했다. 21위에는 9B 사이즈의 Darwin-9B-NEG가 84.34점으로 진입해, GPU 한 장으로도 운영 가능한 초소형 모델이 글로벌 톱 클래스 추론 성능을 보였다.</p>
          <p contents-hash="2e2cb7d621da924499b99727c34a8597fd2127a4a3fdcd796eea415f0f41fb22" dmcf-pid="bRpi38waTN" dmcf-ptype="general">비드래프트의 다윈은 14차원의 ‘유전자(Genome)’ 좌표계 위에서, CMA-ES(Covariance Matrix Adaptation Evolution Strategy) 진화 알고리즘을 통해 다중 부모 모델의 가중치를 최적 혼합한다. 어텐션, FFN, 임베딩 등 각 구성 요소별로 최적의 혼합 비율을 자동 탐색하며, 이 과정에서 NIPA 과제의 핵심 이론인 A2AP(Architectural Alignment and Adaptive Pressure)가 모델 병합 시의 구조적 차이를 정렬하고 학습 정체 고원을 돌파하는 역할을 한다.</p>
          <figure class="figure_frm origin_fig" contents-hash="609f93813687e65b7f03654b946dd1d832922f81cbacb0d02cf6c07329eb5c25" dmcf-pid="KeUn06rNSa" dmcf-ptype="figure">
           <p class="link_figure"><img alt="사진 제공= 비드래프트" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/30/dt/20260430103550222ipjc.png" data-org-width="640" dmcf-mid="phaPGBaeyw" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/30/dt/20260430103550222ipjc.png" width="658"></p>
           <figcaption class="txt_caption default_figure">
            사진 제공= 비드래프트
           </figcaption>
          </figure>
          <p contents-hash="cbfb91431ea616501e788cdb5115e79206a98608f9cd67a68249987d0060cb2f" dmcf-pid="9duLpPmjyg" dmcf-ptype="general"><br> 비드래프트는 이 방식으로 만들어진 모델을 기존 ‘파운데이션 모델’과 구분해 ‘Hybrid-Evolved Model’(하이브리드 진화 모델)이라는 새로운 범주로 정의한다. 사전학습된 파운데이션 모델이 ‘원석’이라면, 다윈은 그 원석들을 진화로 결합한 ‘보석’이라는 것이 비드래프트의 설명이다.</p>
          <p contents-hash="2b7864ef7771083a59a45b5fa27b70744cec1f22e8babcdf62c06ff18b27a980" dmcf-pid="2J7oUQsASo" dmcf-ptype="general">비드래프트 김민식 대표는 “한국 스타트업이 1조 파라미터 모델을 만들 자본을 갖추기는 현실적으로 어렵다”며, “다윈은 그 한계를 진화 알고리즘으로 우회한 시도이며, GPQA Top 21에 한국 모델 5개가 모두 다윈으로 들어갔다는 결과는 그 우회가 실제로 작동했음을 입증한다”고 말했다.</p>
          <p contents-hash="4bfcc62a575b0672442c48bac65fe1ad31160f12b8cd63ab2242616abca47716" dmcf-pid="VizguxOchL" dmcf-ptype="general">박양수 기자 yspark@dt.co.kr</p>
         </section> 
        </div> 
        <p class="" data-translation="true">Copyright © 디지털타임스. 무단전재 및 재배포 금지.</p>

이전

코르티스, ‘REDRED’ 작업기 공개

04-30
다음

크래비티, '엠카'서 '어웨이크' 무대 최초 공개…기대 포인트 셋

04-30

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

허깅페이스 공인 리더보드, 상위 21개 모델에 中 16개·韓 비드래프트 5개

멤버랭킹

관련자료

멤버랭킹