週 단위 출시 경쟁… 1등 ‘AI 모델’ 수시로 바뀐다 작성일 12-17 22 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">점점 치열해지는 AI 기술 싸움</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="G6LB5LUZt2"> <figure class="figure_frm origin_fig" contents-hash="0ab1586ea32a2c82e90c78159ad8f9834bee2ac9cd7f995ccbb7b84426cdce21" dmcf-pid="HPob1ou519" dmcf-ptype="figure"> <p class="link_figure"><img alt="제미나이 생성 이미지/제미나이" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/17/chosun/20251217003300739boki.jpg" data-org-width="1024" dmcf-mid="WGAfpAb0Gf" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/17/chosun/20251217003300739boki.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 제미나이 생성 이미지/제미나이 </figcaption> </figure> <p contents-hash="fbf4607264ba6bd188f057ad36c82cf34450b8f884d35ea7a9323c2ddfac3925" dmcf-pid="XQgKtg711K" dmcf-ptype="general">AI 모델 경쟁이 점입가경이다. 2022년 11월 오픈AI가 GPT 3.5를 출시한 이후 반년~1년 단위로 새 모델을 내놓던 AI 기업들이 이제는 1~2개월 단위, 주 단위로 AI 모델을 업그레이드하고 있다.</p> <figure class="figure_frm origin_fig" contents-hash="fb11eb39217b3f25869f63fd76bfc8ed9218b2a20d54abaece7d9724612e40f6" dmcf-pid="Zxa9Fazt5b" dmcf-ptype="figure"> <p class="link_figure"><img alt="그래픽=양인성" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/17/chosun/20251217003302085wfuc.jpg" data-org-width="2000" dmcf-mid="YrrxBr4qtV" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/17/chosun/20251217003302085wfuc.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 그래픽=양인성 </figcaption> </figure> <p contents-hash="bfb79f4fadacde208579b51f453f6350276f235c33a8ff509b46e140e974dbd0" dmcf-pid="502Gs2vmHB" dmcf-ptype="general"><strong>◇매주 ‘1등 AI’ 바뀌어</strong></p> <p contents-hash="fef9d9c34f9ee86be127568eaa935d0b65e6e06df24a36ebe24f53a1e53eb29d" dmcf-pid="1pVHOVTs5q" dmcf-ptype="general">2023~2024년까지만 해도 한 기업에서 AI 모델을 업데이트하는 데 최소 반년이 걸렸다. 오픈AI는 첫 출시 5개월 뒤인 2023년 3월이 돼서야 추론 능력이 비약적으로 상승한 GPT-4를 내놨고, 2024년 5월 GPT-4o, 2024년 12월 추론과 코딩에 특화한 o1을 출시했다.</p> <p contents-hash="6a9802a57efec8c7e03bf8821a3ab5482da99e50227abe9dd7d14e3b5027a5a8" dmcf-pid="tUfXIfyOZz" dmcf-ptype="general">구글은 2023년 12월 ‘제미나이 1.0′을 출시했고, 이듬해 ‘제미나이 1.5′ 프로를 내놨다. ‘제미나이 2.0′은 1.0 출시 후 1년도 더 지나서 나왔다. 앤트로픽의 클로드, xAI는 약 반년 정도의 간격을 두고 AI 모델을 업그레이드해 왔다.</p> <p contents-hash="7de59dcd9093e1f5003d23c0187dbe68d858975248accd28959f36576c132b91" dmcf-pid="Fu4ZC4WIG7" dmcf-ptype="general">그러나 올해 들어 새 모델 출시 주기가 대폭 단축됐다. 오픈AI는 올해 4월, 8월, 10월, 12월에 각각 AI 모델 업그레이드 소식을 전했다. 제미나이도 지난 2월 ‘제미나이 2.0′을 공개한 데 이어 4월 ‘제미나이 2.5 플래시’를 발표했고, 11월엔 ‘제미나이 3.0′ 시리즈를 내놨다. ‘나노 바나나’로 알려진 이미지 생성·편집 기능도 두 차례 내놨다. 앤트로픽의 클로드, xAI의 그록도 올해 주요 업데이트를 수차례 했다.</p> <p contents-hash="b75d3b1fa7da28ee5da10476fc65f4506803e153bacb8699763386ab287e13ef" dmcf-pid="3785h8YC1u" dmcf-ptype="general">이러다 보니 ‘1등 AI’의 순서가 계속 바뀌고 있다. 오픈AI의 최신 GPT가 1등을 하다, 구글의 제미나이가 출시되면 1위를 탈환하고, 다시 앤트로픽의 클로드나 xAI의 그록이 넘어서고, 이를 또다시 오픈AI의 GPT가 이기는 형국이다. xAI가 지난 2월 발표한 ‘그록-3′은 수학·박사급 과학 능력 등을 평가하는 각종 벤치마크에서 세계 1위를 달성했다. 지난 11월 앤트로픽이 출시한 ‘클로드 4.5 오퍼스’는 코딩 분야 1위 성적을 기록하는 등 출시할 때마다 오픈AI의 GPT, 제미나이 등보다 코딩 분야에서 앞서는 성능을 보였다.</p> <p contents-hash="83debc86037a8f2874b7977be88527518df207e4827261bc79607aecf17d61cf" dmcf-pid="0z61l6Gh1U" dmcf-ptype="general"><strong>◇쪼개기 출시·벤치마크 마케팅 회의론도</strong></p> <p contents-hash="43951f2be31ee7b61821e32f18efd0a1d06c03d02313f98280fbe87ce336da1b" dmcf-pid="pqPtSPHl1p" dmcf-ptype="general">AI 모델 개발 경쟁이 치열해질수록 피로감과 회의론도 커지고 있다. 새로운 모델을 선보이기 위한 ‘쪼개기 출시’도 만연하다는 지적이다. 오픈AI는 획기적으로 개선된 GPT를 내놓을 뿐 아니라 경량화한 ‘터보’, 정식 출시 전 일종의 베타 테스트 모델인 ‘프리뷰’ 같은 모델을 자주 내놓고 있다. 구글도 제미나이의 경량화 버전인 ‘플래시’를 내놓는 등 완전히 새로운 혁신보다는 파라미터(매개변수)를 일부 조정한 뒤 새로운 것처럼 포장하는 경우도 잦다는 평가다. 오픈AI가 GPT-5를 내놨을 때 “범용 인공지능(AGI)을 기대했는데, AGI가 아니다”라는 실망스러운 평가가 나오기도 했다.</p> <p contents-hash="3a7f3f109a675ccce4b7fd4210002d81fa47c6e24e7ba1b222f65971e317c9e5" dmcf-pid="UBQFvQXSG0" dmcf-ptype="general">AI 모델을 평가하는 데 활용되는 ‘AI 벤치마크’가 과연 얼마나 객관적으로 AI 성능을 평가할 수 있느냐는 회의감도 나온다. 이용자들의 체감 성능은 측정하지 않고, 점점 추론·수학·과학 등 AI 성능 테스트에만 특화한 모델을 만들어 내 “우리가 1등”이라고 주장한다. 수능시험 성적 올리는 데 최적화된 AI 모델을 만들어내는 식인데, AI 테스트 자체가 모델 개발의 목적이 되어버린 것이다. AI 기업들은 이를 통해 투자 유치나 홍보 수단으로 활용한다. 지난 8월 과학 저널 네이처는 “많은 AI 벤치마크가 실제 능력보다는 특정 테스트에 최적화된 성능을 보여준다”고 했다. 비즈니스 인사이더는 지난 12일 “벤치마크 평가에서 최고 성능 AI 모델조차 정확도가 69%에 그친다”고 밝혔다.</p> </section> </div> <p class="" data-translation="true">Copyright © 조선일보. 무단전재 및 재배포 금지.</p> 관련자료 이전 女단식 첫 10회 우승 안세영, 3년 연속 올해의 선수상 12-17 다음 61호·80호 'TOP10 막차' 탑승… 명명식 진행→1:1 세미 파이널 돌입 ('싱어게인') 12-17 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.