엔비디아, 'CUP+GPU'에 '추론칩' 장착해 AI 시장 재편 작성일 03-17 30 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="Kl73IrXSD9"> <figure class="figure_frm origin_fig" contents-hash="fc0b594e5802bbcc3a6fccf9ed93d12a714b91b43e83518e64089c8c31d8aaa1" dmcf-pid="9Sz0CmZvwK" dmcf-ptype="figure"> <p class="link_figure"><img alt="엔비디아 그로크(Groq) 3 LPX 랙. 〈사진=엔비디아 뉴스룸〉" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202603/17/etimesi/20260317153004186rtjg.jpg" data-org-width="700" dmcf-mid="bzNnb7MVw2" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202603/17/etimesi/20260317153004186rtjg.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 엔비디아 그로크(Groq) 3 LPX 랙. 〈사진=엔비디아 뉴스룸〉 </figcaption> </figure> <p contents-hash="9bff724728a9d835ddfab8f3c7a9f2d01c368d4b878e59b883a43a76f71ba554" dmcf-pid="2vqphs5TDb" dmcf-ptype="general">엔비디아가 새로운 무기인 추론 전용칩을 공개하며 에이전틱 인공지능(AI) 시대 선도를 향한 의지를 드러냈다. 중앙처리장치(CPU)와 그래픽처리장치(GPU), 추론 칩을 하나로 묶는 통합 생태계 전략을 앞세워 AI 시장 재편도 예고했다.</p> <p contents-hash="f95f3352cece54e6cc071436b81d615a3d53ca0ef4ec124dacaaf9df6d3ded08" dmcf-pid="VTBUlO1yIB" dmcf-ptype="general">엔비디아는 16일(현지시간) 미국 캘리포니아주 산호세에서 열린 '엔비디아 연례 개발자 컨퍼런스(GTC) 2026'에서 7개 신규 칩과 5개 랙으로 구성된 슈퍼컴퓨터(CPU+GPU) 라인업을 발표했다.</p> <p contents-hash="9f1c506c45d2689f08f85c8a53ed23a8a1f44352f36cc0897ccd489faa2b910d" dmcf-pid="fybuSItWDq" dmcf-ptype="general">가장 주목 받은 것은 엔비디아가 지난해 인수한 그로크(Groq)와 공동 개발한 새로운 언어처리장치(LPU) '그로크 3 LPU(랙 타입은 LPX)'다. 삼성전자 파운드리가 생산을 맡은 이 칩은 추론에 특화됐다.</p> <p contents-hash="575d180d31c0c32cda860382e9544aa5b82412589502530d0585ae33f1ee5cf9" dmcf-pid="4WK7vCFYrz" dmcf-ptype="general">기존 AI가 데이터 학습과 패턴에 따른 확률 기반 답변을 한다면, 추론은 사람과 같이 판단을 근거로 여러 단계에 걸쳐 결론을 이끌어낸다. 에이전틱 AI 시대에 추론이 중요해지는 것도 이 때문이다. 여기엔 복잡한 작업 수행을 위한 인프라, 컴퓨팅 파워가 필수다. 엔비디아가 그로크 3을 발표한 이유다.</p> <p contents-hash="21eb5364a54c9931ff1ae210a3e3974de23246432f99f7c6f3b74b5450ffc515" dmcf-pid="8Y9zTh3Gs7" dmcf-ptype="general">LPU는 추론 비용을 획기적으로 낮추는 데 특화됐다. 기업은 이용자가 질문을 던질 때마다 막대한 컴퓨팅 자원을 소모하는데, 추론 비용을 낮추지 못하면 이용자가 많아질수록 적자가 커진다. 추론 작업이 기업 수익성과 직결된다는 의미로 그로크 3 같은 칩의 중요성도 높아질 전망이다.</p> <p contents-hash="01118eff5d1cefcb275ad44070b1b02b9161ee4ec489bdcc222e2002b4edc669" dmcf-pid="6VjLKzRfDu" dmcf-ptype="general">엔비디아는 그로크 3을 이날 세부 스펙을 발표한 '베라(CPU) 루빈(GPU)' 플랫폼에 결합, 통합 생태계를 완성할 계획이다. 기존에 없던 이종 칩간 결합으로 AI 분야 새로운 기술의 등장을 알렸다.</p> <p contents-hash="5a756603f086f00800ee86cc4bf97930f567d4c20056688cc530498d15d9ace2" dmcf-pid="PfAo9qe4IU" dmcf-ptype="general">GPU '루빈(Rubin)'은 주로 훈련(Training)을 맡는다. CPU 베라(Vera)는 스크립팅이나 코드 실행, 멀티 에이전트 상호작용과 같은 에이전트 작업을 처리한다. 거대언어모델에서 실시간 실행(추론)은 대역폭이 높은 그로크의 추론 칩이 속도를 극대화한다.</p> <p contents-hash="5eaa00b5bdb224a5b2f228cef14ab36bd6254e8bb8d3c9b6c1831cb4ef108259" dmcf-pid="Q4cg2Bd8wp" dmcf-ptype="general">엔비디아는 그로크(Groq) 3 LPU와 베라 루빈 플랫폼을 연내 출시할 계획이다.</p> <p contents-hash="e8e4e2723d48282d975d8ed1e4ee1accc1728ed134fe365b80d58890e2158baa" dmcf-pid="x8kaVbJ6w0" dmcf-ptype="general">젠슨 황 엔비디아 최고경영자(CEO)는 기조연설에서 “베라 루빈과 그로크 3 LPX 랙을 결합하면 메가와트 당 추론처리량은 최대 35배 향상되며, 운영사(조 단위 매개변수 기업)에게 최대 10배 더 큰 수익 기회를 제공한다”고 설명했다.</p> <p contents-hash="8e43cb683c1ba574e0f169f9afddb57c1358b3bf1298df6c291e3ece25f556ac" dmcf-pid="yl73IrXSE3" dmcf-ptype="general">그는 오는 2027년까지 AI 칩을 포함한 엔비디아 하드웨어 매출이 1조달러(약 1400조원)에 이를 것이라고 전망했다. 실제 고객사의 컴퓨팅 수요는 이보다 더 클 것으로 예상했다.</p> <p contents-hash="f55ed511dfb5b9eb21c36a77dde8b7259033b206b0635a2a5a18ecac69ca2223" dmcf-pid="WSz0CmZvrF" dmcf-ptype="general">전 세계가 AI 전환점을 맞으면서 GTC 2026은 주요 기술기업들의 각축장이 됐다. 엔비디아 루빈 GPU 기반 고대역폭메모리(HBM4)를 공급하는 삼성전자는 완성된 베라 루빈 플랫폼을 부스에 전시하며 기술력을 과시했다. 젠슨 황 CEO가 삼성전자 부스를 직접 방문해 양사 동맹 관계도 다졌다.</p> <p contents-hash="4d008a3fa163133c7d82cebccf03af49295adf22e6c4c6abdd6d181bf0fd203c" dmcf-pid="Yvqphs5TIt" dmcf-ptype="general">SK하이닉스는 최태원 회장, 곽노정 CEO가 직접 행사장을 찾았다. 엔비디아를 포함 글로벌 빅테크들과 AI 기술발전 및 중장기 협력 방안을 논의할 예정이다.</p> <p contents-hash="145b9bfb01bbeb636e4ae39367f7eea9ec3d1d49fe5d96324dfbaffb0c84ec99" dmcf-pid="GTBUlO1yr1" dmcf-ptype="general">이형두 기자 dudu@etnews.com</p> </section> </div> <p class="" data-translation="true">Copyright © 전자신문. 무단전재 및 재배포 금지.</p> 관련자료 이전 크래프톤 루도 로보틱스, '억대 연봉' 제시하며 실리콘밸리 인재 채용 03-17 다음 비주류 게이머 행사에서 최대 AI 축제로... 구름 인파 몰고다니는 젠슨 황 03-17 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.