오픈AI, 추론·코딩 모델 통합한 'GPT-5.4' 공개 작성일 03-06 5 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="xoQFSwXSsM"> <figure class="figure_frm origin_fig" contents-hash="3c4ebdc79dd177efa4950ce7ea0469b07a6d5176db49eee6557c5052802ec0d1" dmcf-pid="ytTg6BJ6rx" dmcf-ptype="figure"> <p class="link_figure"><img alt="지난해 2월 방한한 샘 올트먼 오픈AI 대표. 전자신문DB" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202603/06/etimesi/20260306072004560skqv.png" data-org-width="700" dmcf-mid="QyhiVuMVwR" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202603/06/etimesi/20260306072004560skqv.png" width="658"></p> <figcaption class="txt_caption default_figure"> 지난해 2월 방한한 샘 올트먼 오픈AI 대표. 전자신문DB </figcaption> </figure> <p contents-hash="0c154747fe045423fb2f44434acd2a05a749b935a0abfd16114bea436202975b" dmcf-pid="WFyaPbiPmQ" dmcf-ptype="general">오픈AI가 추론이 필요한 지식 업무와 코딩 기능을 통합한 새 AI 모델을 공개했다.</p> <p contents-hash="716f9aca8b29af11eea429d14007cc776682e655a4468f16eedd04250eef9c83" dmcf-pid="Y8zSciOcmP" dmcf-ptype="general">오픈AI는 최상위 AI 모델의 개선판인 'GPT-5.4'와 'GPT-5.4 프로'를 5일(현지시간) 선보였다. 이날 공개된 GPT-5.4 모델은 챗GPT 유로 가입자들에게 즉시 제공되며, 기존 모델인 'GPT-5.2 사고' 모델은 3개월간 유지된 이후 오는 6월 5일 서비스를 종료할 예정이다.</p> <p contents-hash="64d648a289eb081fc86cdbeb92ac91a30f934482e2f7a230550502b76a5e24d9" dmcf-pid="G6qvknIkw6" dmcf-ptype="general">이번 모델은 이전에 영역별로 'GPT-5.2 사고(Thinking)'와 'GPT-5.3-코덱스' 등으로 나뉘어 있던 모델을 하나로 통합한 것이 특징이다. 또한 이용자의 컴퓨터를 직접 조작해 여러 애플리케이션을 넘나들며 복잡한 작업을 수행할 수 있는 '컴퓨터 제어' 에이전트 기능도 자사 범용 모델 가운데 처음으로 탑재했다.</p> <p contents-hash="e6a94b710535959a4cbdd5372c1f86b74b029c1e23234a3732843a8848722e8f" dmcf-pid="HPBTELCED8" dmcf-ptype="general">한 번에 처리할 수 있는 데이터양도 최대 100만 토큰(AI 모델의 입출력 단위)으로 늘려 AI 에이전트가 긴 안목의 계획을 수립하고 실행할 수 있도록 했다.</p> <p contents-hash="574bc0df97b44436e0d2054bfbd21c749e683cf69ce19259f8b41a716d154c5b" dmcf-pid="XQbyDohDI4" dmcf-ptype="general">GPT-5.4 프로 모델은 44개 직종의 지식 업무 수행 능력을 평가하는 “GDPval' 성능지표(벤치마크)에서 82%를 기록했다. 70% 수준이었던 전작을 뛰어넘은 수치다. 정보검색 능력을 측정하는 '브라우즈컴프' 지표에서도 89.3%로 경쟁작인 구글 제미나이3.1 프로(85.9%)와 앤트로픽 클로드 오퍼스 4.6(84%)보다 점수가 높았다.</p> <p contents-hash="340a8b6c725822d3825c49c38dae5cd90da002aade25c3842139f649b4e655f1" dmcf-pid="ZxKWwglwIf" dmcf-ptype="general">코딩 능력을 재는 'SWE-벤치 프로 퍼블릭' 지표에서는 GPT-5.4가 57.7%를 받았는데, 이는 제미나이3.1 프로(54.2%)를 상회하는 점수다.</p> <p contents-hash="327a1cbbfa5896bc3c4294d02bc89f75f6e179c297b709d29fd4b2355b90bf8e" dmcf-pid="5M9YraSrEV" dmcf-ptype="general">다만 오픈AI는 지금껏 코딩 능력 평가 기준으로 삼아왔던 'SWE-벤치 베리파이드' 지표는 공개하지 않았다. 'SWE-벤치 베리파이드'에서는 지금까지 클로드 오퍼스 4.6이 가장 높은 점수를 유지해오고 있다.</p> <p contents-hash="f8a7a1cce0f84ec8b6c860b14bbc8e6bcc113586d8bf9f9fe4ddafccd6e0f82d" dmcf-pid="1R2GmNvmO2" dmcf-ptype="general">강성전 기자 castlekang@etnews.com</p> </section> </div> <p class="" data-translation="true">Copyright © 전자신문. 무단전재 및 재배포 금지.</p> 관련자료 이전 엄마되기 쉽지 않네..'6월 출산' 남보라, 자궁경부암 유발 세포발견에 '수술行' 03-06 다음 김희철도 “몰랐다”…박상민 ‘멀어져 간 사람아’ 데뷔곡 아니었다 (힛-트쏭) 03-06 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.