머스크 "그록4, 최신 GPT-5보다 훨씬 똑똑"…올트먼 향해 도발

작성일 08-14

<div id="layerTranslateNotice" style="display:none;"></div> 머스크 "코딩도 승리할 것, 올해 연말 전 그록5 공개" 인류마지막시험 벤치마크 대결서 '그록4' 2.4%p 앞서 
 <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
 <section dmcf-sid="0MKn96XDZx">
 <figure class="figure_frm origin_fig" contents-hash="d9ce4a2b13c75c0bf40b23c463d7d457a3c4bbcb3eb9b745c45ad3fdf8dfe2e9" dmcf-pid="pR9L2PZw5Q" dmcf-ptype="figure">
 <img alt="일론 머스크 테슬라 CEO 샘 올트먼 오픈AI CEO ⓒ AFP=뉴스1" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202508/14/NEWS1/20250814062210299ykbr.jpg" data-org-width="1400" dmcf-mid="t9MCoc2XHe" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202508/14/NEWS1/20250814062210299ykbr.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 일론 머스크 테슬라 CEO 샘 올트먼 오픈AI CEO ⓒ AFP=뉴스1
 </figcaption>
 </figure>
 (서울=뉴스1) 김민석 기자 = 일론 머스크 xAI CEO가 자신의 '그록4 헤비'가 오픈AI의 'GPT-5'보다 성능이 더 뛰어나다고 주장했다.
 '인류의 마지막 시험'(Humanity's Last Exam)이란 극난도 AI 벤치마크에서 그록4 헤비가 더 높은 점수를 받았다는 게 근거다. GPT-5 출시 직후 불거진 부정적 이슈를 부채질해 우위를 점하겠다는 의도로 풀이된다.
 <figure class="figure_frm origin_fig" contents-hash="78958c561090c5783b1d5752f8166d99127e915b80de7fd4c37cad8672d0eb41" dmcf-pid="79360qhL18" dmcf-ptype="figure">
 <img alt="일론 머스크 X 갈무리" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202508/14/NEWS1/20250814062211754nwru.jpg" data-org-width="1172" dmcf-mid="Ft1M79TNXR" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202508/14/NEWS1/20250814062211754nwru.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 일론 머스크 X 갈무리
 </figcaption>
 </figure>
 14일 업계에 따르면 머스크는 X(옛 트위터)를 통해 "결론부터 말하자면 그록4 헤비는 2주 전부터 GPT-5보다 더 똑똑했고 지금 훨씬 더 좋아졌다"며 "코딩 분야에서 그록이 단연코 승리할 것"이라고 말했다.
 머스크는 또 "그록5는 올해 연말 이전에 나올 예정"이라며 "엄청나게 좋을 것"이라고 했다.
 머스크의 자신감은 '인류의 마지막 시험'(Humanity's Last Exam·HLE) 벤치마크 결과에서 그록4 헤비가 44.4% 성적을 기록해 GPT-5 프로(42%)를 앞선 데서 나왔다.
 HLE는 100개 이상 학문 분야의 2500개 박사급(PhD-level) 문제로 구성됐다. 로마 비문 번역부터 양자화학까지 단순 암기가 아닌 진정한 추론 능력을 평가한다. 
 극악의 난도로 '구글 제미나이 2.5 프로'도 26.9%에 그쳤다. 대부분 AI 모델은 30% 미만 성과를 보였다.
 <figure class="figure_frm origin_fig" contents-hash="53f3f4b63ab3094584610de0c1a430017ffc1f0e69efee1248f93ffc29aadab3" dmcf-pid="96zeqVWAGK" dmcf-ptype="figure">
 <img alt="일론 머스크 테슬라 CEOⓒ AFP=뉴스1" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202508/14/NEWS1/20250814062213090eycj.jpg" data-org-width="1400" dmcf-mid="3ZF83zCnYM" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202508/14/NEWS1/20250814062213090eycj.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 일론 머스크 테슬라 CEOⓒ AFP=뉴스1
 </figcaption>
 </figure>
 전문가들은 두 모델의 성능 차이를 두고 근본적으로 다른 아키텍처 접근법에서 비롯된 것으로 분석했다.
 그록4 헤비는 여러 AI 에이전트를 병렬로 연계해 문제를 해결한 후 결과를 비교 검증하는 '멀티 에이전트 시스템'을 채택했다. 복잡한 추론 문제에서 높은 정확도를 보이지만 처리 속도가 초당 75토큰으로 상대적으로 느리다.
 GPT-5는 빠른 응답과 깊은 추론을 하나의 통합 시스템에서 구현하는 단일 모델 아키텍처를 적용했다. 초당 150토큰 이상 처리 속도로 그록4보다 빠르지만, 극도로 복잡한 추론 문제에는 상대적으로 약할 수 있다.
 비용효율 측면에선 GPT-5가 우위를 보인다. GPT-5는 일반 이용자도 플러스 요금제(월 20달러·약 2만 7000원)로 이용할 수 있지만, 그록4 헤비는 월 300달러(약 41만 원)를 내야 한다.
 API 요금도 GPT-5가 입력 토큰 100만개당 1.25달러·출력 토큰 100만개당 10달러로 그록4(입력 3달러·출력 15달러) 대비 저렴하다.
 한편 구글 카글(Google Kaggle)이 최근 주최한 AI 체스 토너먼트 결승에서는 오픈AI 'o3'가 '그록4'를 4-0으로 완승했다.
 머스크는 "체스 성능은 큰 의미가 없다"며 "xAI는 체스 학습에는 거의 노력을 기울이지 않았다"고 했다.
 ideaed@news1.kr &lt;용어설명&gt; ■ 인류의 마지막 시험 인류의 마지막 시험(Humanitys Last Exam·HLE)은 세계 최고 수준의 난이도를 가진 인공지능(AI) 벤치마크로 2025년 1월 미국 AI 안전센터(Center for AI Safety· CAIS)와 스케일AI(Scale AI)가 공동 개발했다. ■ AI 에이전트 AI 에이전트는 환경과 상호작용하고 데이터를 수집·분석한 후 사전 설정한 목표를 달성하고자 필요한 작업을 스스로 결정하고 수행하는 자율 지능형 시스템이다. ■ API API는 응용프로그램 인터페이스(Application Programming Interface)로 하나의 소프트웨어 컴포넌트가 다른 소프트웨어 컴포넌트와 상호작용할 수 있도록 설계된 인터페이스다. 즉, 소프트웨어끼리 서로 정보를 주고받고 기능을 사용하게 해주는 중간다리다. 
 </section> 
 </div> 
 Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

머스크 "그록4, 최신 GPT-5보다 훨씬 똑똑"…올트먼 향해 도발

멤버랭킹

관련자료

멤버랭킹