삼성·SK 안방 찾은 엔비디아…“블랙웰·NVFP4 최격차, 네모트론서 시작됐다” 작성일 04-21 40 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">[인더스트리 AI] 서울서 1200억 파라미터 ‘네모트론 3’ 로드맵 공개</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="GwPuvbOcW4"> <figure class="figure_frm origin_fig" contents-hash="3970459d0c96b825cbe8c2d156e918e68b55e82611fa190c0d2e39c0392cd132" dmcf-pid="HrQ7TKIkWf" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/21/552796-pzfp7fF/20260421143537814ytli.jpg" data-org-width="640" dmcf-mid="yb1reC6byP" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/21/552796-pzfp7fF/20260421143537814ytli.jpg" width="658"></p> </figure> <p contents-hash="c14fff0b4b183deb4268e336e5c1093849ecc0c12e62654335ab5d1fc66f9698" dmcf-pid="Xmxzy9CEWV" dmcf-ptype="general">[디지털데일리 김문기기자] <strong>“AI는 이제 단순한 대화 상대를 넘어 스스로 사고하고 행동하는 자율형 에이전트로 진화하고 있다. 이제 우리 각자는 자율형 에이전트 팀을 거느린 연구소의 CEO가 되어, AI가 우리를 대신해 복잡한 문제들을 해결하는 시대를 맞이하게 될 것이다.”</strong></p> <p contents-hash="cec2b1227aa6e9b14bce1115a3372877142a5a758e6c456e132a0bb49984754b" dmcf-pid="ZEa63RXSS2" dmcf-ptype="general">브라이언 카탄자로(Bryan Catanzaro) 엔비디아 응용 연구 부문 부사장은 21일 서울 디캠프 마포에서 개최된 엔비디아 ‘네모트론 디벨로퍼 데이즈 서울 2026’ 기조연설에서 자율형 AI 에이전트가 가져올 컴퓨팅 패러다임의 변화를 이같이 정의했다. 카탄자로 부사장은 특히 한국을 “놀라운 AI 모멘텀을 가진 국가”로 평가하며, 엔비디아의 최신 오픈 모델인 ‘네모트론(Nemotron) 3’ 시리즈를 통한 생태계 협력 의지를 피력했다.</p> <p contents-hash="8c18ac945cfd74413744e70b19b4ecfd35a30a4e6b3b9d910c7cc5cfddf68713" dmcf-pid="5DNP0eZvv9" dmcf-ptype="general"><strong>◆ "효율이 곧 지능"... 하드웨어와 AI 모델의 수직 계열화</strong></p> <p contents-hash="dd994eab0f500215c483aab502508f4aabd75219d460dfbc07466406733b57bc" dmcf-pid="1wjQpd5TyK" dmcf-ptype="general">카탄자로 부사장은 엔비디아가 직접 LLM인 네모트론을 개발하는 이유로 하드웨어 인프라와의 ‘공동 설계(Co-design)’를 꼽았다.</p> <p contents-hash="96cc4f60ef32c14ed7b3c5ef52d397d8e082af043847a2c137f2a63e58ef6e03" dmcf-pid="trAxUJ1ySb" dmcf-ptype="general">그는 “컴퓨터 자원은 한정되어 있지만 지능에 대한 수요는 무한하다”며 “효율성을 높이는 것이 곧 더 높은 지능을 얻는 길”이라고 역설했다. 이는 엔비디아가 단순히 칩을 파는 제조사를 넘어, 소프트웨어와 하드웨어를 수직 계열화해 성능을 극대화하는 전략을 취하고 있음을 보여준다.</p> <p contents-hash="0d434543deecf8d3a519fb002be8bf2da067feec52ca50a52af82d821c239213" dmcf-pid="FmcMuitWyB" dmcf-ptype="general">실제로 엔비디아는 네모트론 학습 과정을 통해 차세대 GPU 설계에 직접적인 인사이트를 반영하고 있다. 카탄자로 부사장은 블랙웰(Blackwell) 아키텍처에 적용된 NVFP4(4.75비트) 수치 형식을 언급하며, 네모트론 3 슈퍼와 울트라는 이미 이 정밀도를 사용해 사전 학습됐다고 밝혔다.</p> <p contents-hash="da181d3ec1130f5e56262869608a46ca520920462bf36e767c78433b6213568e" dmcf-pid="3skR7nFYTq" dmcf-ptype="general">그는 “단순히 4비트가 아니라 4.75비트를 사용하는 이 미세한 차이가 인프라의 효율성을 극대화한다”며, 이를 통해 모델의 정확도는 유지하면서도 에너지 소비는 최소화해 더 많은 지능을 확보할 수 있다고 설명했다. 가속 컴퓨팅은 이제 칩 하나가 아니라 데이터셋부터 아웃포크의 간결함까지 아우르는 엔드 투 엔드 문제 해결 과정이라는 설명이다.</p> <p contents-hash="3502d873645eabaf4ed1cced1fdfabbf5692867ef8269420bce3711067faf820" dmcf-pid="0OEezL3Gvz" dmcf-ptype="general">이날 핵심은 엔비디아의 최신 모델 라인업인 ‘네모트론 3’ 시리즈의 세부 사양과 로드맵이다. 우선 네모트론 3 슈퍼(Super)는 1200억 개의 파라미터를 보유한 하이브리드 Moe(Mixture of Experts) 아키텍처 모델로, 멀티 토큰 예측 기술을 통해 단계별로 약 3개의 토큰을 동시에 예측한다.</p> <p contents-hash="fb57e771d2e711017c50e90f593a1217a4e8030a7e5afc20071162f5409d9384" dmcf-pid="pIDdqo0HS7" dmcf-ptype="general">카탄자로 부사장은 “추론 효율을 극대화한 이 모델은 이미 GPT-4o보다 빠르고 똑똑한 성능을 입증했다”며, 하이브리드 Moe 아키텍처와 맨바 2(Mamba 2) SSM 레이어의 결합이 메모리 활용도를 획기적으로 높였다고 자신했다.</p> <p contents-hash="8cb32f254287c170f3eee5904bb54fa27a61cd39554ca73467eb9388c582277e" dmcf-pid="UmcMuitWSu" dmcf-ptype="general">현재 사후 학습 단계에 있는 네모트론 3 울트라(Ultra)도 조만간 출시될 예정이다.</p> <div contents-hash="67e300f7054656b00fcf66b3765668c6bddb553663695e04f21ad8a8c1d3a442" dmcf-pid="uskR7nFYvU" dmcf-ptype="general"> 카탄자로 부사장은 “매일 울트라 모델의 진척도를 확인하며 흥분을 감추지 못하고 있다”며 조만간 시장에 공개될 것임을 암시했다. 특히 300억 개의 파라미터 모델인 네모트론 3 나노(Nano)는 특화된 학습 커리큘럼인 ‘네모트론 카스케이드’를 통해 6710억 파라미터급 모델인 딥시크(DeepSeek) V3에 상응하는 수학 및 코딩 성능을 달성했다. </div> <figure class="figure_frm origin_fig" contents-hash="730abfab59881387e5677c1e5ab24f186117352769d6c0dc5d3d11fb541ea2d3" dmcf-pid="7OEezL3Gyp" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/21/552796-pzfp7fF/20260421143539354xkiw.jpg" data-org-width="640" dmcf-mid="W0a2Z6yOS6" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/21/552796-pzfp7fF/20260421143539354xkiw.jpg" width="658"></p> </figure> <p contents-hash="272800bca9eae24f3f924ba62baeeedbac37f4f312b09c79c602687f638d9f1e" dmcf-pid="zIDdqo0HT0" dmcf-ptype="general"><strong>◆ "슬라이드는 잊어라"... '빌드 어 클로'로 입증한 로컬 AI의 저력</strong></p> <p contents-hash="19a84a6c9879b2a971d4983a4a6e855ccb4ceeda7f37615667d9e04e8941c7a0" dmcf-pid="qCwJBgpXv3" dmcf-ptype="general">엔비디아는 이번 행사에서 단순 슬라이드 발표를 지양하고 개발자가 직접 에이전트를 구축하는 ‘빌드 어 클로(Build-a-Claw)’ 프로그램을 전면에 내세웠다.</p> <p contents-hash="028aad644b9447142e14693d7dd6358bea1f03d815520daa2d947a508217830b" dmcf-pid="BhribaUZSF" dmcf-ptype="general">카탄자로 부사장은 “슬라이드 중심의 발표보다 직접 구축하는 경험이 개발자에게 더 깊은 인사이트를 제공한다”며 “프라이버시를 보호하고 데이터 소유권을 유지할 수 있는 로컬 실행 환경이야말로 차세대 주역이 될 것”이라고 강조했다.</p> <p contents-hash="0a09861e74e8338ecd1ab7727677b6ae04b6ee335c48976f02680c984fec805a" dmcf-pid="blmnKNu5yt" dmcf-ptype="general">이를 위해 엔비디아는 1200억 개 파라미터 모델을 API 비용 없이 구동할 수 있는 개인용 AI 슈퍼컴퓨터 DGX 스파크(Spark)를 솔루션으로 제시했다.</p> <div contents-hash="0ddb88fc5bafbe05ff4e8cd728dd25f11f02b503e491b7ac30e04c3e30131ca8" dmcf-pid="KSsL9j71W1" dmcf-ptype="general"> DGX 스파크는 클라우드 구독 서비스에 비해 장기적으로 비용 효율적이며, 파인튜닝과 실험, 빌드를 위한 최적의 개발 플랫폼이라고 강조했다. 그는 인프라의 효율성이 곧 지능으로 직결된다는 점을 재차 언급하며, 엔비디아가 제공하는 풀스택 플랫폼이 DGX 스파크부터 RTX 노트북까지 모든 환경에서 유기적으로 구동 가능하다고 강조했다. </div> <figure class="figure_frm origin_fig" contents-hash="2987786dbde73983d619d6199aacbd88b93e7ad7d28a4e24ff5ea88f5dd82025" dmcf-pid="9p5InvMVW5" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/21/552796-pzfp7fF/20260421143539602kriq.jpg" data-org-width="640" dmcf-mid="YORBYVlwS8" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/21/552796-pzfp7fF/20260421143539602kriq.jpg" width="658"></p> </figure> <p contents-hash="bcb60c3d7dea89279640942e178064180be42bd59d7f713e8118dff3118ba3ea" dmcf-pid="2U1CLTRflZ" dmcf-ptype="general"><strong>◆ 한국 맞춤형 데이터셋 '네모트론 페르소나 코리아' 전격 공개</strong></p> <p contents-hash="1a62eba6a790388c506946847d17f5c94740ef0622d635c66f7c913d312d05bd" dmcf-pid="Vuthoye4WX" dmcf-ptype="general">한국 개발자들을 위한 맞춤형 데이터셋인 ‘네모트론 페르소나 코리아’도 공개됐다. 한국의 인구 통계와 언어, 문화적 특성을 반영한 700만 개의 합성 페르소나 데이터셋으로, 실제 데이터 분포를 따르되 개인정보 노출 위험을 줄인 것이 특징이다.</p> <p contents-hash="dfba002adc0dc6f7d2621b0af5a34b4b7e26091c847cc6792cc8bf915db9fa55" dmcf-pid="f7FlgWd8CH" dmcf-ptype="general">카탄자로 부사장은 “한국의 개발자들이 한국 시장에 특화된 유용한 AI 모델을 개발할 수 있도록 이 데이터셋을 무상 라이선스로 제공한다”며 한국 생태계에 대한 전폭적인 지지를 약속했다.</p> <p contents-hash="dd6f59b6f5823c83736b71181cd0a83e79871612ff5d5bc9aa6e4c7798a01e3a" dmcf-pid="4z3SaYJ6lG" dmcf-ptype="general">그는 데이터의 질이 인공지능의 성패를 가른다는 점을 강조하며, 엔비디아가 축적한 최신 사전 학습 데이터셋이 기존 대비 학습 효율을 4배나 끌어올렸다고 밝혔다. 이는 하드웨어의 성능 향상 없이 오로지 데이터 최적화만으로 이뤄낸 성과라는 것.</p> <p contents-hash="cf356c6a933c44ce531547863c02300f40f7038a715f5a3dbae004c9eccc50e1" dmcf-pid="8q0vNGiPTY" dmcf-ptype="general">마지막으로 카탄자로 부사장은 네이버, SK텔레콤, LG, 업스테이지, 크래프톤, 트릴리온 등 한국의 주요 AI 랩들을 일일이 거론하며 “한국에서 일어나고 있는 혁신적인 업무와 폭발적인 모멘텀이 내가 오늘 서울에 온 이유”라고 설명했다.</p> <p contents-hash="65b096696de864ab4e5064bf376369bee565d07577c750e6916714e47b010313" dmcf-pid="6BpTjHnQCW" dmcf-ptype="general">그는 엔비디아의 전략이 단순히 칩을 파는 것을 넘어, 전 세계적으로 견고하고 다양한 AI 생태계가 구축되도록 지원하는 데 노력하고 있다고 말했다. 있음을 분명히 했다.</p> <p contents-hash="631484d32ac9ff5d187e435c5297d3ee1b4349e104e0ed5bd5152de1e72e6d5e" dmcf-pid="PbUyAXLxyy" dmcf-ptype="general">한편, 엔비디아는 이번 서울 행사를 기점으로 '자율형 AI 에이전트'의 글로벌 확산을 본격화하고, 로컬 AI 환경에서의 기술 우위를 지속해 나가겠다는 복안이다.</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털데일리. All rights reserved. 무단 전재 및 재배포 금지.</p> 관련자료 이전 ‘글로벌 K-POP 신인’ 알디원, 100일 만에 이룬 쾌거 04-21 다음 ‘패럴림픽 영웅’ 이제혁, KT 위즈파크 마운드 위 ‘희망의 직구’ 꽂는다 04-21 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.