챗GPT 기본모델 ‘5.5 인스턴트'로 교체…“환각 52.5% 줄여” 작성일 05-06 32 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">플러스·프로 사용자 대상 우선 제공</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="2xzL17LxM7"> <figure class="figure_frm origin_fig" contents-hash="8bb77019d930ec31add5106f9dc50c6855c019fb0ac6b31a42343cc271825d95" data-idxno="234296" data-type="photo" dmcf-pid="VMqotzoMdu" dmcf-ptype="figure"> <p class="link_figure"><img alt="오픈AI 로고 / 이미지 = 오픈AI" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/06/552777-a6ToU27/20260506141032750tveq.jpg" data-org-width="960" dmcf-mid="90vbrSb0Lz" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/06/552777-a6ToU27/20260506141032750tveq.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 오픈AI 로고 / 이미지 = 오픈AI </figcaption> </figure> <p contents-hash="ca50ed208e9def01b72fc84291cc113e0fedcafdd75ac2abed7eabf992a2770f" dmcf-pid="fRBgFqgRRU" dmcf-ptype="general">[시사저널e=송주영 기자] 오픈AI가 지난달 공개한 GPT-5.5를 기반으로 한 GPT-5.5 인스턴트를 기본모델로 교체했다고 5일(현지시각) 밝혔다. 5.5 버전은 환각 현상을 줄여 답변 오류를 줄이고 개인화 기능을 강화했다. 개인비서로의 AI 전략을 강화한 것으로 풀이된다.</p> <p contents-hash="ac8ac70ee75ae03447bcbcdfc075a61bf47c2d551714e5000eab6a5a54c1860f" dmcf-pid="4eba3BaeLp" dmcf-ptype="general">이날 테크크런치 등 IT 전문외신에 따르면 GPT-5.5 인스턴트는 의료, 법률, 금융 등 민감 영역에서 환각 현상을 줄였다고 보도했다. 오픈AI는 GPT-5.3 인스턴트 대비 민감 분야 환각이 52.5% 감소했으며 사용자들이 사실 오류로 신고한 까다로운 대화를 적용한 답변에도 부정확성이 37.3% 줄었다고 밝혔다.</p> <p contents-hash="366938b7ab2fbce6f3da28e0c7e55ccc6f93dedafd60b2c068561a9104b4920d" dmcf-pid="8dKN0bNdi0" dmcf-ptype="general">AIME 2025 벤치마크 점수도 81.2점을 기록해 이전 모델(GPT-5.3)의 65.4점을 앞질렀다. AIME는 미국수학협회(MAA)가 주관하는 수학 경시대회다. 계산 뿐만 아니라 논리적 추론과 창의적 사고를 요구하는 시험이다.</p> <p contents-hash="e17bf036361b1ca01c7f52f3e818d7736b3fb7a5d9e367f7179fc2d2ceff3813" dmcf-pid="6J9jpKjJe3" dmcf-ptype="general">벤치마크 성능도 개선됐다. 멀티모달 추론 벤치마크 MMMU프로도 76점으로 GPT-5.3의 69.2점을 상회했다. 이 점수가 높으면 멀티모달 이해와 추론 능력이 높단 것을 의미한다.</p> <p contents-hash="c12e6f67fbf105eb11e47f9302a6112d1988194916cbcc0612bf289307b65cc3" dmcf-pid="PFlqDhqFnF" dmcf-ptype="general">9투5맥에 따르면 GPT-5.5 인스턴트는 기능 개선을 정확성과 간결함에 맞춰 인터페이스도 개선했다. 오픈AI는 5.5에서 불필요한 이모지 사용을 줄이겠단 방침이다.</p> <p contents-hash="8ccb3c4cb9738f6ac64b659d4a931a4940263922ece49ded6359541cfbc8c045" dmcf-pid="Q3SBwlB3Rt" dmcf-ptype="general">오픈AI는 불필요한 후속 질문도 줄이고 불필요하고 장황한 표현도 줄였다고 밝혔다. 길고 형식적인 답변 대신 핵심을 짚어주는 답변으로 개선했다고 강조했다.</p> <p contents-hash="b8ab21933ca52e090c924e384a743a31d21cc7899f02b09520f509abdd2fb6d3" dmcf-pid="x0vbrSb0i1" dmcf-ptype="general">개인화 기능도 강화했다. GPT-5.5 인스턴트는 검색 도구를 활용해 과거 대화, 업로드한 파일, 연동한 지메일 계정을 참조해 맞춤형 답변을 제공할 수 있게 됐다.</p> <p contents-hash="6611c7997af0136df1c87a1b45395043f999a9479a234c8f85d42f9dd58f5948" dmcf-pid="yNPrb6rNd5" dmcf-ptype="general">이와 함께 오픈AI는 '메모리 소스' 기능도 도입했다. 이 기능은 챗GPT가 답변 개인화에 활용한 맥락 정보를 사용자가 확인할 수 있도록 설계했다. 오래되거나 유효하지 않은 정보는 삭제하거나 수정할 수 있다. 채팅을 타인과 공유하더라도 메모리 소스는 노출되지 않는다.</p> <p contents-hash="635949e489909e1d3d92ff58d61f2567640bd5b17a08b9cc8326f3d3c1eb0be4" dmcf-pid="WjQmKPmjRZ" dmcf-ptype="general">오픈AI는 5.5인스턴트를 적용하면서 GPT-5.3 인스턴트는 유료 사용자를 대상으로 향후 3개월간 서비스를 이어갈 방침이다. 이는 지난해 GPT-4 서비스 중단 당시 불거진 사용자 반발을 의식한 조치로 풀이된다.</p> <p contents-hash="0d5240b071a752a350614942dabbe35f4b7ea40eda60f463da7ca4c640e1c52a" dmcf-pid="YAxs9QsALX" dmcf-ptype="general">당시 GPT-4는 사용자 선택을 자주 긍정해주면서 큰 호응을 얻기도 했다. 지난 GPT-4 서비스 중단 당시 일부 사용자들은 이를 '가장 친한 친구'를 잃는 것으로 표현하기도 했다.</p> <p contents-hash="6fa81e267af0835dc5722d739719148acfe0052467b1e1504f2732d0e2f8e44a" dmcf-pid="GcMO2xOcRH" dmcf-ptype="general">GPT-5.5 인스턴트는 기본 모델 이후 단계적으로 적용될 예정이다. 강화된 개인화 기능은 웹 버전 플러스와 프로 사용자에게 먼저 제공되며 모바일과 무료, 비즈니스, 엔터프라이즈 사용자 대상 배포는 단계적으로 이뤄질 예정이다.</p> <p contents-hash="5bfa76cbad3d44a5aade71b9073bd57627d8f51040a1eec3fb862b46cf131aeb" dmcf-pid="HkRIVMIkMG" dmcf-ptype="general">GPT-5.5 인스턴트는 지난 3월 출시된 GPT-5.3 인스턴트에 이어 두 달 만에 등장한 업데이트다. 오픈AI는 LLM 경쟁 격화 속에 개선 속도를 올리고 있다. 환각 현상 개선으로 의료, 법률, 금융 등 민감 분야 공략도 강화한다.</p> <p contents-hash="aaf1de08ce27e81a0e4f1be527be698942d753375b039ea5dac84efe5e3d9cb2" dmcf-pid="XEeCfRCEnY" dmcf-ptype="general">여기에 AI가 단순한 정보 검색 도구를 넘어 일상의 '개인 비서'로 자리 잡아가는 흐름 속에서 이 시장 공략도 강화했다.</p> <p contents-hash="0abdf4a30cbd310d77bd6111ed9c60177975f22f361d84ff3a95a91a7877dea8" dmcf-pid="ZDdh4ehDdW" dmcf-ptype="general">다만 개인정보에 대한 우려도 있다. 강화된 메모리 기능은 사용자가 같은 정보를 반복하지 않아도 된다는 장점이 있지만 장기간 축적도리 경우 개인·업무 정보가 많은 만큼 보안에 대한 신중한 관리가 필요하단 지적도 나온다.</p> <p contents-hash="b0be70b59b5bb316d85505737e724b1da80341dab2e7ce0b864e411163e89de0" dmcf-pid="5wJl8dlwJy" dmcf-ptype="general">IT업계 관계자는 "AI 비서가 편리해질수록 그 뒤에 쌓이는 데이터도 기하급수적으로 늘어난다"며 "이제는 성능만이 아니라, 어떤 정보를 얼마나 오래·어떻게 보관하는지까지 투명하게 보여주는 게 경쟁력이 될 것"이라고 말했다.</p> </section> </div> <p class="" data-translation="true">Copyright © 시사저널e 무단전재 및 재배포 금지</p> 관련자료 이전 앤스로픽 CEO “中 AI 추격 전 취약점 막아야” 05-06 다음 "거짓말 안 하고 과충전 안 할게요"… 법명 받은 로봇 스님 '가비' 05-06 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.