머스크 "그록4, 최신 GPT-5보다 훨씬 똑똑"…올트먼 향해 도발 작성일 08-14 30 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">머스크 "코딩도 승리할 것, 올해 연말 전 그록5 공개"<br>인류마지막시험 벤치마크 대결서 '그록4' 2.4%p 앞서</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="0MKn96XDZx"> <figure class="figure_frm origin_fig" contents-hash="d9ce4a2b13c75c0bf40b23c463d7d457a3c4bbcb3eb9b745c45ad3fdf8dfe2e9" dmcf-pid="pR9L2PZw5Q" dmcf-ptype="figure"> <p class="link_figure"><img alt="일론 머스크 테슬라 CEO 샘 올트먼 오픈AI CEO ⓒ AFP=뉴스1" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202508/14/NEWS1/20250814062210299ykbr.jpg" data-org-width="1400" dmcf-mid="t9MCoc2XHe" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202508/14/NEWS1/20250814062210299ykbr.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 일론 머스크 테슬라 CEO 샘 올트먼 오픈AI CEO ⓒ AFP=뉴스1 </figcaption> </figure> <p contents-hash="cad2566e72101a5c9908c24a81a920d548ef560a99e9e9c0817681fea80ddce5" dmcf-pid="Ue2oVQ5rtP" dmcf-ptype="general">(서울=뉴스1) 김민석 기자 = 일론 머스크 xAI CEO가 자신의 '그록4 헤비'가 오픈AI의 'GPT-5'보다 성능이 더 뛰어나다고 주장했다.</p> <p contents-hash="720348186129f6ba83abb2a8fb6b70d964c1a05d02f621d2e769ca2def239c5d" dmcf-pid="udVgfx1mH6" dmcf-ptype="general">'인류의 마지막 시험'(Humanity's Last Exam)이란 극난도 AI 벤치마크에서 그록4 헤비가 더 높은 점수를 받았다는 게 근거다. GPT-5 출시 직후 불거진 부정적 이슈를 부채질해 우위를 점하겠다는 의도로 풀이된다.</p> <figure class="figure_frm origin_fig" contents-hash="78958c561090c5783b1d5752f8166d99127e915b80de7fd4c37cad8672d0eb41" dmcf-pid="79360qhL18" dmcf-ptype="figure"> <p class="link_figure"><img alt="일론 머스크 X 갈무리" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202508/14/NEWS1/20250814062211754nwru.jpg" data-org-width="1172" dmcf-mid="Ft1M79TNXR" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202508/14/NEWS1/20250814062211754nwru.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 일론 머스크 X 갈무리 </figcaption> </figure> <p contents-hash="3bab2ce481c22ec723931c5c2dc757b9d1ee4cb6edf8ca6ddd761f8d63ea85ce" dmcf-pid="z20PpBlot4" dmcf-ptype="general">14일 업계에 따르면 머스크는 X(옛 트위터)를 통해 "결론부터 말하자면 그록4 헤비는 2주 전부터 GPT-5보다 더 똑똑했고 지금 훨씬 더 좋아졌다"며 "코딩 분야에서 그록이 단연코 승리할 것"이라고 말했다.</p> <p contents-hash="12ae41c2b642cc63a7dc2e1ae2ae5d538936104c2f2f5f61bb66974d3114e7bf" dmcf-pid="qVpQUbSgZf" dmcf-ptype="general">머스크는 또 "그록5는 올해 연말 이전에 나올 예정"이라며 "엄청나게 좋을 것"이라고 했다.</p> <p contents-hash="e3eb43f84063df0386fad8b1018cc33ae33b95486e7880df6d8e4a61402ea109" dmcf-pid="BfUxuKvaXV" dmcf-ptype="general">머스크의 자신감은 '인류의 마지막 시험'(Humanity's Last Exam·HLE) 벤치마크 결과에서 그록4 헤비가 44.4% 성적을 기록해 GPT-5 프로(42%)를 앞선 데서 나왔다.</p> <p contents-hash="f150e8cf26f8da299ad815a36220c83377b698a24762d2640417b6e146069a8e" dmcf-pid="b4uM79TNG2" dmcf-ptype="general">HLE는 100개 이상 학문 분야의 2500개 박사급(PhD-level) 문제로 구성됐다. 로마 비문 번역부터 양자화학까지 단순 암기가 아닌 진정한 추론 능력을 평가한다. </p> <p contents-hash="49bfa157cef30ee0b4177daf179214c7d1aa440d3eb8ea16a5a451be42112e22" dmcf-pid="K87Rz2yjH9" dmcf-ptype="general">극악의 난도로 '구글 제미나이 2.5 프로'도 26.9%에 그쳤다. 대부분 AI 모델은 30% 미만 성과를 보였다.</p> <figure class="figure_frm origin_fig" contents-hash="53f3f4b63ab3094584610de0c1a430017ffc1f0e69efee1248f93ffc29aadab3" dmcf-pid="96zeqVWAGK" dmcf-ptype="figure"> <p class="link_figure"><img alt="일론 머스크 테슬라 CEOⓒ AFP=뉴스1" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202508/14/NEWS1/20250814062213090eycj.jpg" data-org-width="1400" dmcf-mid="3ZF83zCnYM" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202508/14/NEWS1/20250814062213090eycj.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 일론 머스크 테슬라 CEOⓒ AFP=뉴스1 </figcaption> </figure> <p contents-hash="23ac0122abb67fed963d39aed0a80c812d0d185203f22ed29f90f1284afb8b9e" dmcf-pid="2PqdBfYctb" dmcf-ptype="general">전문가들은 두 모델의 성능 차이를 두고 근본적으로 다른 아키텍처 접근법에서 비롯된 것으로 분석했다.</p> <p contents-hash="7b137a25f0368dc7f53455815d2765ecd60eb58b7e879c01691d8c526b4a53a8" dmcf-pid="VQBJb4GktB" dmcf-ptype="general">그록4 헤비는 여러 AI 에이전트를 병렬로 연계해 문제를 해결한 후 결과를 비교 검증하는 '멀티 에이전트 시스템'을 채택했다. 복잡한 추론 문제에서 높은 정확도를 보이지만 처리 속도가 초당 75토큰으로 상대적으로 느리다.</p> <p contents-hash="06c5a39491780c85f482afd354fe16c22370659105885b6fa57f8b97b2bd460e" dmcf-pid="fR9L2PZwGq" dmcf-ptype="general">GPT-5는 빠른 응답과 깊은 추론을 하나의 통합 시스템에서 구현하는 단일 모델 아키텍처를 적용했다. 초당 150토큰 이상 처리 속도로 그록4보다 빠르지만, 극도로 복잡한 추론 문제에는 상대적으로 약할 수 있다.</p> <p contents-hash="e94fd55084370f8bd316dfa80be59fda3bd8d0d0e3859b2388dbaddc87dd4e21" dmcf-pid="4e2oVQ5r1z" dmcf-ptype="general">비용효율 측면에선 GPT-5가 우위를 보인다. GPT-5는 일반 이용자도 플러스 요금제(월 20달러·약 2만 7000원)로 이용할 수 있지만, 그록4 헤비는 월 300달러(약 41만 원)를 내야 한다.</p> <p contents-hash="28c080c2b1fea3e73679e2e1faac9fa2d2a7c2bc24403ebaa9953ec6367e70f9" dmcf-pid="8dVgfx1m57" dmcf-ptype="general">API 요금도 GPT-5가 입력 토큰 100만개당 1.25달러·출력 토큰 100만개당 10달러로 그록4(입력 3달러·출력 15달러) 대비 저렴하다.</p> <p contents-hash="588fe0f450e33c6d999cc2f765e77fe56b1a4482b65c5dd53503f07f0acd433b" dmcf-pid="6Jfa4MtsZu" dmcf-ptype="general">한편 구글 카글(Google Kaggle)이 최근 주최한 AI 체스 토너먼트 결승에서는 오픈AI 'o3'가 '그록4'를 4-0으로 완승했다.</p> <p contents-hash="6c9a152ffff20ca8d3ab0a0c530243d9bedac0d2238d548e1cbdb1c023608225" dmcf-pid="Pi4N8RFO5U" dmcf-ptype="general">머스크는 "체스 성능은 큰 의미가 없다"며 "xAI는 체스 학습에는 거의 노력을 기울이지 않았다"고 했다.</p> <p contents-hash="da71751421a9ae93b9cc5aded05858dd4be98f795533cc8537bb47a41b341edb" dmcf-pid="Qn8j6e3Itp" dmcf-ptype="general">ideaed@news1.kr<br><br><strong><용어설명></strong><br><br>■ 인류의 마지막 시험<br>인류의 마지막 시험(Humanitys Last Exam·HLE)은 세계 최고 수준의 난이도를 가진 인공지능(AI) 벤치마크로 2025년 1월 미국 AI 안전센터(Center for AI Safety· CAIS)와 스케일AI(Scale AI)가 공동 개발했다.<br><br>■ AI 에이전트<br>AI 에이전트는 환경과 상호작용하고 데이터를 수집·분석한 후 사전 설정한 목표를 달성하고자 필요한 작업을 스스로 결정하고 수행하는 자율 지능형 시스템이다.<br><br>■ API<br>API는 응용프로그램 인터페이스(Application Programming Interface)로 하나의 소프트웨어 컴포넌트가 다른 소프트웨어 컴포넌트와 상호작용할 수 있도록 설계된 인터페이스다. 즉, 소프트웨어끼리 서로 정보를 주고받고 기능을 사용하게 해주는 중간다리다.<br><br> </p> </section> </div> <p class="" data-translation="true">Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.</p> 관련자료 이전 장영란, 명품백 재테크 성공 “H사 포인트 쌓고 구매..현재 2천만원” (A급 장영란) 08-14 다음 스파이더맨·어벤져스·스타워즈까지…“이걸 한국 웹툰으로 볼 수 있다고? 08-14 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.