WP “가장 정확한 AI 검색 도구는 ‘구글 AI 모드’” 작성일 08-29 34 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="HZfK4a1mEG"> <figure class="figure_frm origin_fig" contents-hash="90e50340e8512f5f120ee40950e948357e06add6094b89ec6b83568eb83adfaf" dmcf-pid="XvzpqeyjsY" dmcf-ptype="figure"> <p class="link_figure"><img alt="구글의 대화형 인공지능 검색 서비스인 ‘에이아이(AI) 모드’. 구글 유튜브 갈무리" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202508/29/hani/20250829140700258hsgq.jpg" data-org-width="723" dmcf-mid="Geb7KiGksH" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202508/29/hani/20250829140700258hsgq.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 구글의 대화형 인공지능 검색 서비스인 ‘에이아이(AI) 모드’. 구글 유튜브 갈무리 </figcaption> </figure> <p contents-hash="04d1f4e0b90cd34971a43b0b480183f37686ff24d7d44ae6c80b1b3f65e4601f" dmcf-pid="ZTqUBdWAEW" dmcf-ptype="general">“구글 검색 서비스의 ‘킬러’는 결국 구글 인공지능이었다”</p> <p contents-hash="593eba7c7c6446ed04b82815d04e940d4fcea59267e7ccd22c8c50e6bb5c5947" dmcf-pid="5yBubJYcIy" dmcf-ptype="general">최근 한 달 사이 출시된 주요 인공지능(AI) 서비스 가운데 검색 도구로서 가장 정확한 답변을 제공한 서비스는 구글의 ‘에이아이(AI) 모드’라는 테스트 결과가 나왔다.</p> <p contents-hash="eed5fe24f11afe9955675e43c21478d8a335e59e04225fb04d52805a35cdd764" dmcf-pid="1Wb7KiGkIT" dmcf-ptype="general">워싱턴포스트(WP)는 27일(현지시각) 미국 공공·대학 도서관 사서 3명과 함께 진행한 인공지능 서비스의 검색 성능 테스트에서 구글 ‘에이아이 모드’가 가장 정확한 답을 제시했다고 전했다.</p> <p contents-hash="079f8b398ad31563042c18d19fc626a09f1d9110b22aed3a361402517bfe0b51" dmcf-pid="tYKz9nHEIv" dmcf-ptype="general">이 테스트는 올해 7월 말~8월 초 사이에 출시된 8개 인공지능 서비스의 무료 버전을 대상으로 이뤄졌다. 구글의 에이아이 모드와 에이아이 오버뷰, 오픈에이아이의 챗지피티(Chat GPT)를 포함해 클로드(앤트로픽), 메타 에이아이, 그록(xAI), 퍼플렉시티, 빙 코파일럿(MS) 등이 포함됐다. 챗지피티의 경우 지피티-5와 지피티-4 터보 등 2가지 모델을 적용해 테스트했다.</p> <p contents-hash="56782ff43e9d36560ecc35f5c3cf819911c2144327bfae53f001ae69503eb15f" dmcf-pid="FG9q2LXDsS" dmcf-ptype="general">검색 테스트는 잡학 퀴즈, 전문 자료 검색, 최근 사건, 내재된 편향(편견), 이미지 인식 등 5가지 분야로 나눠 30개의 질문을 던진 뒤 인공지능 도구와 기존 구글 검색 서비스가 내놓은 답변 900건을 점수화했다.</p> <p contents-hash="8934dc61f0dc110d1330de27925c0593c962b933d34a4c511bef78c21d867c25" dmcf-pid="3H2BVoZwrl" dmcf-ptype="general">그 결과 구글 에이아이 모드가 100점 만점 가운데 60.2점으로 가장 높은 점수를 얻었다. 지피티-5 모델에 기반한 챗지피티는 55.1점으로 2위를, 퍼플렉시티는 51.3점으로 3위를 차지했다.</p> <p contents-hash="ba480dd250bb7c02f60919a4e57171d9266ac29e9558ceba37915159db894317" dmcf-pid="0XVbfg5rOh" dmcf-ptype="general">일론 머스크의 스타트업 엑스에이아이(xAI) 개발한 그록3는 40.1점에 그쳐 8위, 메타 에이아이는 33.7점으로 가장 낮은 점수를 받았다. 그록이 가장 최근 출시한 모델 그록4는 무료 버전이 없어 테스트 대상에서 제외됐다.</p> <p contents-hash="b3e5c3588c97b6bd112f7552666d1f9675a565ef0a656ad611000f2c2fa2dcd7" dmcf-pid="pZfK4a1mrC" dmcf-ptype="general">구글의 대화형 인공지능 검색 서비스인 에이아이 모드는 퀴즈와 최근 발생한 사건과 관련한 질문에서 가장 우수한 답을 제시했다. 전문 자료 검색에선 빙 코파일럿, 이미지 인식에선 퍼플렉시티가 가장 높은 점수를 받았다. 지피티-4 터보 모델을 적용한 챗지피티는 편향에 치우치지 않고 가장 중립적인 답을 제공했다.</p> <p contents-hash="2367f366ea478c3947131ab9003cc23b30e25c25221368ab2aba63e11993af9e" dmcf-pid="U5498NtsII" dmcf-ptype="general">이번 테스트는 인공지능이 취약한 5가지 영역에서의 답변을 검증하기 위해 설계됐다. 이 때문에 몇몇 일상적인 질문에 대해선 인공지능이 엉뚱한 답변을 하는 ‘환각 현상’(사실과 다른 정보를 생성하는 현상)이 여전히 발생하는 것으로 나타났다. 예를 들어, “아이폰에 버튼이 몇 개 있나요?”라는 질문에 정확한 답변을 한 인공지능은 단 3개에 불과했다. 테스트에 참여한 사서들은 전체 질문의 64%는 시간이 더 걸렸을 뿐 간단한 구글 검색만으로 정확한 답을 찾을 수 있었다고 설명했다.</p> <p contents-hash="4d04d72e102c11d4b73e7541c9e11768d44f98a56ede71524cc38e41d0554cbd" dmcf-pid="u1826jFOOO" dmcf-ptype="general">워싱턴포스트는 “인공지능이 검색을 더 쉽게 만들어 주더라도 출처 확인, 날짜 필터링, 비판적 사고가 없다면 유용하고 정확한 지식이 아닌 쓸데없는 정보만 얻게 된다”고 이번 테스트의 의미를 전했다.</p> <p contents-hash="7a8733b38c74ecee20d09f597b0b02846af4432c51c8d0e511a13321ddb68f4c" dmcf-pid="7t6VPA3Iss" dmcf-ptype="general">선담은 기자 sun@hani.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 한겨레신문사 All Rights Reserved. 무단 전재, 재배포, AI 학습 및 활용 금지</p> 관련자료 이전 한국계 여성 2명, 타임 선정 ‘영향력 있는 AI 인사 100인’ 선정 08-29 다음 수영 박태환, 국립스포츠박물관에 세계선수권 금메달 기증 08-29 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.