“엔비디아 잡는다” 구글 8세대 TPU 공개...추론 중요성 커지며 학습·추론용 따로 출시

작성일 04-22

<div id="layerTranslateNotice" style="display:none;"></div>  
        <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
         <section dmcf-sid="GfRsvPWIGh">
          <figure class="figure_frm origin_fig" contents-hash="92a5736fb852700d513827c344fe9c8306b7fe8499479c5a221338b278e0935c" dmcf-pid="H4eOTQYCXC" dmcf-ptype="figure">
           <p class="link_figure"><img alt="구글이 공개한 8세대 텐서처리장치(TPU)중 학습용 칩 8t(왼쪽)와 추론용 칩8i/구글 클라우드" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/22/chosun/20260422210636314zjem.jpg" data-org-width="5000" dmcf-mid="W0qnAUEo5S" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/22/chosun/20260422210636314zjem.jpg" width="658"></p>
           <figcaption class="txt_caption default_figure">
            구글이 공개한 8세대 텐서처리장치(TPU)중 학습용 칩 8t(왼쪽)와 추론용 칩8i/구글 클라우드
           </figcaption>
          </figure>
          <p contents-hash="ca0a343d2d846356485b66ff8c180b125d40bcc4269e7f387ee82f1fb7ae2bfd" dmcf-pid="X8dIyxGhXI" dmcf-ptype="general">구글이 새로운 자체 인공지능(AI) 칩 ‘8세대 텐서처리장치(TPU)’를 공개했다. 이번에는 AI 학습 전용과 추론 전용으로 분리해 처음으로 TPU 2개를 한꺼번에 내놨다. AI 에이전트(비서) 시대 본격화로 여러 단계로 작업을 나눠 복잡한 업무를 수행하는 ‘추론’ 작업이 중요해지자, 효율 극대화를 위한 맞춤형 칩 전략이다. 작년 11월 출시한 7세대 TPU로 AI 모델인 ‘제미나이3′ 성능을 크게 개선한 뒤 자신감을 얻은 구글이 5개월 만에 새로운 버전을 내놓으며 글로벌 AI 칩 시장을 장악한 엔비디아 독주를 끝내겠다는 의지다. 구글은 또 마이크로소프트(MS)나 아마존과 달리 자체 AI 모델(제미나이)을 가진 유일한 하이퍼스케일러(초대형 클라우드 인프라 회사)로서 자체 칩부터 모델·서비스·보안까지 ‘AI 풀스택(모든 역량을 갖춤)’을 통해 기업들의 AI 에이전트 환경을 구축해 가겠다고 밝혔다.</p>
          <p contents-hash="4ea8079138eb03daaae5bbabb996d1cba774615b067ff39de15c560e36062073" dmcf-pid="Z6JCWMHl1O" dmcf-ptype="general">◇AI 에이전트 시대, 추론 칩 중요</p>
          <p contents-hash="f4362009b74ec67f534d25d6542993ad3669ae0055592f012dad411fbcf58b78" dmcf-pid="5PihYRXS5s" dmcf-ptype="general">22일(현지 시각) 구글 클라우드는 미국 라스베이거스에서 열리는 연례 콘퍼런스 ‘넥스트 2026′ 사전 행사에서 8세대 TPU인 AI 학습용 8t와 추론용 8i를 공개했다. AI 학습은 모델이 데이터에서 패턴을 배우는 과정이고, 추론은 배운 내용을 바탕으로 시험 문제를 푸는 과정이다. 구글이 이번 TPU를 학습용과 추론용 두 종류로 출시한 이유는 AI 반도체를 활용하는 목적에 따라 칩의 요구 사항이 완전히 달라졌기 때문이다. AI 에이전트 시대가 본격화되며 AI 기능을 고도화하는 ‘학습’ 보다 실제 업무에 AI를 투입해 복잡한 업무를 단계적으로 해결하도록 하는 ‘추론’ 업무의 중요성이 커진 것이다. 학습을 잘하려면 연산 처리량 자체를 높이는 것이 중요하지만, 추론을 잘하려면 지연이 적고 동시에 많은 일을 처리하는 것이 필요하다. 최근 반도체 업체들은 이러한 차이점에 주목하며 각각의 작업에 효율성을 극대화한 칩을 설계 중인데, 구글이 한발 앞서 TPU를 두 종류로 내며 치고 나가고 있다.</p>
          <p contents-hash="0285ae81c828cb97e9f029a147db33421ad187cfbc9e9ddfe716ba656617a48c" dmcf-pid="1XpRotNd5m" dmcf-ptype="general">◇8세대 자체 AI 칩 TPU 공개</p>
          <p contents-hash="36ab3c3728bbcb41ce36b5cbfaab30e127beb0f8b9d1d28155c00111537a741d" dmcf-pid="tZUegFjJZr" dmcf-ptype="general">구글이 내놓은 AI 학습용 8t는 수조 개의 숫자를 빛과 같은 속도로 계산하고 주고받을 수 있도록 설계된 칩이다. 구글 클라우드는 전 세대 대비 연산 성능이 3배 증가했다고 밝혔다. AI 추론용 8i는 지연 시간이 낮아 AI 에이전트가 여러 작업을 한꺼번에 처리하는 데 특화돼 있다. 속도가 AI 에이전트의 지능 수준을 가른다. 구글클라우드는 “전 세대보다 성능이 80% 향상됐고, 특히 ‘온칩 집단 연산’ 지연은 최대 5배 감소했다”고 했다. 하나의 칩은 수만 명 직원이 일하는 거대 공장과 같은데, 특정 작업을 위해서는 직원들이 한곳에 모여 회의하거나, 결과물을 합치고, 역할에 맞는 데이터를 나눠 가지는 과정을 거친다. 온칩 집단 연산은 이 과정을 칩 내부 초고속 전용 통로를 통해 즉각적으로 처리하는 기술이다. 덕분에 AI 에이전트가 더 복잡한 문제를 더 적은 에너지를 쓰면서 더 빠른 속도로 해결할 수 있게 된다.</p>
          <p contents-hash="0b94f36ab6e38d974d8531c9eb330a3eaf8d1af3c671cb04afeca72e5c630fd2" dmcf-pid="F5uda3Ai5w" dmcf-ptype="general">구글은 2015년 자체 AI 칩인 1세대 TPU(v1)를 공개한 뒤 2~3년에 한 번꼴로 새 TPU를 내놨다. 2022년 말 오픈 AI의 챗GPT가 공개된 후에는 매년 신제품을 냈다. 구글 클라우드는 이번에 공개한 8세대 TPU를 연내 정식 출시할 계획이다. 현재 AI 인프라 투자 경쟁이 불붙으며 시장 1위 엔비디아의 그래픽 처리 장치(GPU) 공급이 부족한 상황인데, 구글은 기술 개발의 속도를 끌어올려 공급 부족의 ‘구멍’을 메우고, 엔비디아 제국에 균열을 내겠다는 목표다.</p>
          <p contents-hash="f8359acd1aab5724d729b99fca6c0cb1c4d3a3790adca55c8b1fe35624764557" dmcf-pid="317JN0cnGD" dmcf-ptype="general">구글은 이와 함께 TPU·GPU·중앙처리장치(CPU)를 함께 묶은 통합 인프라로 AI 에이전트 시대를 주도하겠다는 구상이다. 구글은 “AI 에이전트 시대를 위한 칩 두 개와 시스템 하나”라며 “기업이 단순 챗봇을 넘어, 스스로 인지·추론·행동하는 자율형 AI 에이전트를 업무 전반에 배치하는 단계로 나아가고 있다”고 했다.</p>
          <p contents-hash="09a8b34796b91b539439ae352d2d5bfc237fac5e8c25cf9ba309028dcf1cd4f0" dmcf-pid="0tzijpkLGE" dmcf-ptype="general">구글 클라우드는 또 넥스트 2026에서 AI 에이전트를 구축·관리·보안 통제까지 한 번에 하는 ‘제미나이 엔터프라이즈 에이전트 플랫폼’, 다른 플랫폼과 결합해 사이버 방어 능력을 높인 플랫폼 등 다양한 제품을 소개했다.</p>
          <p contents-hash="88aa0e7e23a40500b032f3c63b74562015bb6af19f30a70a229c8c3a1972b918" dmcf-pid="pFqnAUEoZk" dmcf-ptype="general">◇자체 AI 칩 시장 경쟁은 본격화</p>
          <p contents-hash="90ba644cac8c2d0234294b5d713da5df1df5b37df8aab16e99ae917ce4a97834" dmcf-pid="U3BLcuDg5c" dmcf-ptype="general">AI 칩 시장 경쟁은 한층 더 치열해질 것으로 예상된다. 빅테크들은 고성능 엔비디아 AI 가속기와 함께 자사가 제작한 AI 칩을 동시에 써 각각의 작업에서 최고의 효율을 얻는 ‘칩 다양화’ 전략을 설파하고 있다.</p>
          <p contents-hash="e0f1885d7b8e00177899ae288f2817d469b9ce4e7f3d4d799ab2d14044aecca5" dmcf-pid="u0bok7waHA" dmcf-ptype="general">올해 초 마이크로소프트(MS)는 ‘마이아 200’이란 자체 AI 칩을 내놨는데, 이 칩의 세일즈 포인트를 엔비디아 칩과 함께 쓰는 칩으로 잡았다. 제시카 호크 애저 마케팅 담당 부사장은 “고객들이 원하는 AI 업무나 가격, 성능이 모두 다르다”며 “엔비디아·AMD의 AI 칩과 함께 자체 칩을 활용해 고객에게 최적의 가격 대비 성능을 제공하려는 전략”이라고 했다. 메타도 MTIA 300 등 자체 AI 칩 4종을 동시에 공개했고, 엔비디아는 최근 인수한 ‘그록’의 언어처리장치(LPU)를 GPU와 함께 추론 작업에 활용하기로 했다. 테크 업계 관계자는 “앞으로 AI 작업에 맞춘 다양한 특화 칩을 선택해 극한의 효율을 추구하는 경향이 두드러질 것”이라고 했다.</p>
         </section> 
        </div> 
        <p class="" data-translation="true">Copyright © 조선일보. 무단전재 및 재배포 금지.</p>

이전

‘이혼’ 서인영 “1억 꽃장식 협찬...거의 숨듯이 결혼”

04-22
다음

기안84, 폐지 줍는 어르신 위해 1억원 기부 “뿌듯해”

04-22

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

“엔비디아 잡는다” 구글 8세대 TPU 공개...추론 중요성 커지며 학습·추론용 따로 출시

멤버랭킹

관련자료

멤버랭킹