챗GPT에 ‘구글 제미나이가 무섭나’ 물으니 “덩치 큰 친구가…” 작성일 12-12 22 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">제미나이에 ‘비상등’ 오픈AI…“GPT-5.2 출시”<br>즉답·사고·프로 모드 갖춰…환각 발생률↓</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="XxB4a4WIgJ"> <figure class="figure_frm origin_fig" contents-hash="01bf8ff47dad1190dd998d3913ad5dcc23d1f48d339bb8ad05e9a8fe099dcb48" dmcf-pid="ZMb8N8YCod" dmcf-ptype="figure"> <p class="link_figure"><img alt="샘 올트먼 오픈AI 최고경영자. 뉴시스" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/12/segye/20251212080852459olwf.jpg" data-org-width="1200" dmcf-mid="uAiMDR1ygM" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/12/segye/20251212080852459olwf.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 샘 올트먼 오픈AI 최고경영자. 뉴시스 </figcaption> </figure> <div contents-hash="489cb9b6f1f1093d5652e7b049ae4c8abd1646404d3d439772cfa6b352540d53" dmcf-pid="5RK6j6GhAe" dmcf-ptype="general"> <br> 미국 오픈AI는 11일(현지시간) 즉답(Instant)·사고(Thinking)·프로(Pro) 등 세 가지 모드를 갖춘 새 모델 생성형 인공지능(AI) ‘GPT-5.2’를 출시한다고 밝혔다. 이전 버전을 내놓은 지 불과 한 달 만이다. </div> <p contents-hash="167e26302605a9df495de34b7fb7962f4af642da50579151263eb586a831e518" dmcf-pid="1e9PAPHlAR" dmcf-ptype="general">즉답 모드는 빠른 답변에, 사고 모드는 코딩·수학 문제 해결·긴 문서 분석에, 프로 모드는 고난도 추론과 장시간 작업에 각각 최적화한 구성이다.</p> <p contents-hash="84a76ccdfd2f995b2d255fdfe7adcaf84cc9989ee66d7d612cba784cb3d30fe7" dmcf-pid="td2QcQXSjM" dmcf-ptype="general">회사 측은 추론·코딩 성능을 개선하고 환각(hallucination) 발생률을 낮췄다고도 강조했다.</p> <p contents-hash="f813769b7e9de5ca2fbb5d312e28c87f958b71fbccda5c88fd2fde978640c720" dmcf-pid="FJVxkxZvAx" dmcf-ptype="general">실제 GDPval 직무 수행 평가에서 GPT-5.2의 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 전작 GPT-5(38.8%) 대비 크게 향상됐다.</p> <p contents-hash="f8a02bdbae9eaca5eae2a93c1ba5666cc735db53ef2296e55c52d84f1cd7ba3f" dmcf-pid="3ifMEM5TaQ" dmcf-ptype="general">소프트웨어 엔지니어링 능력을 평가하는 SWE 코딩 벤치마크에서는 80%를 기록해 구글 ‘제미나이3 프로(76.2%)’를 앞섰고, 박사급 추론 능력 측정 벤치마크 HLE에서도 구글 최신 모델보다 높은 성능을 보였다는 설명이다.</p> <p contents-hash="4296d186e61e3f3a4734cf0327aa802533b8fbbfb13c597267233707bc342b10" dmcf-pid="0n4RDR1ygP" dmcf-ptype="general">내부 테스트 기준 오류율도 6.2%로 GPT-5.1 사고 모드 대비 약 30% 감소했다. 긴 글 맥락 파악 능력과 이미지·그래프 이해도, 다단계 업무 처리 역량 역시 향상됐으며, 민감한 대화 안전성과 미성년자 보호 기능도 강화됐다.</p> <p contents-hash="b6c46a80cc653df12b1005000c878a7c26eb21fb3ab3a59bf6c8d905f77b82cf" dmcf-pid="pRK6j6Gha6" dmcf-ptype="general">GPT-5.2는 이날부터 유료 구독자에게 순차 제공되며, GPT-5.1은 3개월 뒤 서비스가 종료된다.</p> <figure class="figure_frm origin_fig" contents-hash="e35dd1bf160a64308333de7a4d26453ff3c8d1586fef0ff57722c051caddef05" dmcf-pid="Ue9PAPHlA8" dmcf-ptype="figure"> <p class="link_figure"><img alt="구글 제미나이의 공세가 ‘무섭나’라는 기자의 질문에 미국 오픈AI의 ‘챗GPT’가 내놓은 답변. 챗GPT 화면 캡처" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/12/segye/20251212080852709agih.jpg" data-org-width="862" dmcf-mid="7R5YBGoMcx" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/12/segye/20251212080852709agih.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 구글 제미나이의 공세가 ‘무섭나’라는 기자의 질문에 미국 오픈AI의 ‘챗GPT’가 내놓은 답변. 챗GPT 화면 캡처 </figcaption> </figure> <div contents-hash="280d2c01841409f2deec6e46adf158eb72bf879aec650d5757f33f53f990efcf" dmcf-pid="ud2QcQXSa4" dmcf-ptype="general"> <br> 오픈AI의 움직임은 겉으로는 새로운 모델 출시지만, 업계에서는 오픈AI가 개발 일정을 당긴 배경에 ‘위기감’이 자리하고 있다고 본다. </div> <p contents-hash="56e3621af530d31957a619d85e855e0d37c1ea4ec0665fe39062f68ee07b8faa" dmcf-pid="7JVxkxZvof" dmcf-ptype="general">불과 2년 전과는 완전히 달라진 장면이다.</p> <p contents-hash="2baf300b27269ec3918c830ff09dcf42cc3ecc70b94cc7e2e01f4b23a4656da8" dmcf-pid="zifMEM5TAV" dmcf-ptype="general">2023년 챗GPT가 전 세계 검색 습관과 IT 질서를 뒤흔들며 등장했을 때 비상등을 켠 쪽은 구글이었다.</p> <p contents-hash="93ab85a3d521ab9402678cddab2a139afebe130ddca7cdf1ca261c6a660ff78d" dmcf-pid="qn4RDR1yc2" dmcf-ptype="general">회사는 ‘코드 레드(Code Red)’를 발령하고 순다르 피차이 CEO가 직접 상황실에 상주했으며, 경영 일선에서 물러났던 래리 페이지와 세르게이 브린까지 호출해 대응책을 논의했다. 오픈AI에서 갈라져 나온 앤트로픽에 4억달러를 투자하는 등 대대적인 재정비에 나선 것도 이 시기였다.</p> <p contents-hash="34c9308a5ad05978ff090fdd15e73e3ea8afa6f3673dc51b4c46da0cfce441e6" dmcf-pid="BL8ewetWo9" dmcf-ptype="general">2년이 흐른 최근에는 정반대의 상황이 펼쳐지고 있다.</p> <p contents-hash="9d1f83bbc3dfb4dc227b2cb8892c3c953c90e96f55b3ca2feb8cecdd700faf98" dmcf-pid="bo6drdFYjK" dmcf-ptype="general">급속히 성장한 구글 제미나이 시리즈, 특히 ‘제미나이3 프로’가 언어 성능과 이미지 생성·편집 도구를 중심으로 빠르게 점유율을 확장하며 오픈AI의 독주 구도를 흔들고 있다.</p> <p contents-hash="8ecc44c3321b2b0c6f5482fe50d1361045307e3f33337b8dd04b7b8b6eab10a7" dmcf-pid="KgPJmJ3GNb" dmcf-ptype="general">시장조사업체 시밀러웹에 따르면 1년 전 87%에 달하던 챗GPT 생성AI 트래픽 점유율은 이달 71.3%로 내려갔고, 같은 기간 제미나이는 5.7%에서 15.1%로 세 배 가까이 뛰어올랐다.</p> <p contents-hash="047ee23ee10407addf903d18033724ec7bcdc2243ef8e6b8573a147963a76c45" dmcf-pid="9aQisi0HgB" dmcf-ptype="general">성능 경쟁에서도 제미나이3 프로는 이용자 기반 벤치마크 ‘LM아레나 리더보드’에서 1위에 올랐고, 박사급 추론 능력을 측정하는 HLE 평가에서도 GPT-5를 크게 앞선 것으로 나타났다.</p> <p contents-hash="8ec459f3a6a1ce2894adc1466a8bd00fa023a021e77e037c61947e2e3009a818" dmcf-pid="2NxnOnpXNq" dmcf-ptype="general">종합하면 오픈AI가 내부적으로 ‘중대 경보’를 울리고 개발 속도를 끌어올린 이유가 여기에 있다는 분석이다.</p> <p contents-hash="2b56b274b78f2f4a9bf3482c3ae3a943bc034c7747dfbafe2efa8acdfe0177ea" dmcf-pid="VjMLILUZNz" dmcf-ptype="general">GPT-5.2 출시는 비상등을 켠 오픈AI의 응답이자, 생성형 AI 시장의 새로운 균형점이 어디로 이동할지를 가늠하게 하는 신호로 받아들여지고 있다.</p> <p contents-hash="23280680b918e3027527fbb0a4bd44833e590b893162f75de441beca3e05e597" dmcf-pid="fARoCou5g7" dmcf-ptype="general">김동환 기자 kimcharr@segye.com</p> </section> </div> <p class="" data-translation="true">Copyright © 세계일보. 무단전재 및 재배포 금지.</p> 관련자료 이전 ‘다음생은 없으니까’ 막판 비하인드 12-12 다음 ‘모범택시3’ 이제훈 부캐 12-12 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.