[기자수첩] 범용 재고 또 쌓였나? 이젠 CPU로 옮겨붙는 '칩 팔이'

작성일 04-30

<div id="layerTranslateNotice" style="display:none;"></div> 코어 숫자놀음에 가려진 물리적 파산 병렬로 늘려도 ‘기다림’만 증폭 구조 CPU 찍어 줄세울 바에 GPU 경제적 
 <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
 <section dmcf-sid="UniRC6rNXj">
 <figure class="figure_frm origin_fig" contents-hash="f1092960a981c7025cbc122c1ca3cb9c49e9576d1a61c0817b0118a3aaf51a9c" data-idxno="457935" data-type="photo" dmcf-pid="uMx8w9AiXN" dmcf-ptype="figure">
 <img alt="클린룸 장비를 착용한 작업자가 중앙처리장치(CPU)를 손끝으로 집어 든 장면이다. 금색 접점 배열과 중앙 다이가 선명하게 드러나 있으며, 수천 개의 핀이 규칙적으로 배치된 구조가 특징이다. / 여성경제신문DB" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/30/552814-8XPEppr/20260430214645373pwaw.jpg" data-org-width="1080" dmcf-mid="3dSI7w3Gtk" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/30/552814-8XPEppr/20260430214645373pwaw.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 클린룸 장비를 착용한 작업자가 중앙처리장치(CPU)를 손끝으로 집어 든 장면이다. 금색 접점 배열과 중앙 다이가 선명하게 드러나 있으며, 수천 개의 핀이 규칙적으로 배치된 구조가 특징이다. / 여성경제신문DB
 </figcaption>
 </figure>
 지난 몇 년간 인공지능(AI) 혁명의 주역이 GPU였다는 사실은 부정할 수 없다. 하지만 2026년 현재, 엔비디아의 독주에 배가 아픈 구세력들과 재고 처리가 급한 전통 칩 제조사들이 '에이전틱 AI'라는 새로운 마케팅 용어를 들고나와 시장을 교란하고 있다. 이른바 "차세대 AI의 병목은 CPU"라는 해괴한 논리다.
 업계 일각에서는 AI 에이전트가 스스로 판단하고 도구를 호출하는 '순차적 로직' 때문에 CPU의 역할이 중요해졌다고 주장한다. 고전이 된 조지아공대와 Intel(인텔)의 논문을 인용하며 GPU가 CPU를 기다리느라 굶고 있다는 'GPU 기아(Starvation)' 현상을 마케팅의 수단으로 삼는다.
 하지만 이는 본질을 완전히 왜곡한 것이다. 현재 CPU가 병목인 진짜 이유는 연산 유닛(Core ALU)이 부족해서가 아니라, 데이터가 머무는 장소와 흐르는 길목이 아키텍처의 체급을 감당하지 못하기 때문이다.
 즉 CPU 코어 개수를 128개, 256개로 늘려봤자, 에이전틱 AI의 핵심 기억 장치인 KV 캐시(Key-Value Cache) 대부분은 CPU 근처에도 가지 못하고 저 멀리 떨어진 HBM이나 DRAM에 유배되어 있다. 또 CPU가 '판단과 조율'의 주역이라는 수사는 화려하지만, 실상은 비참하다.
 에이전트가 복잡한 추론을 이어갈수록 GB 단위로 불어나는 KV 캐시를 담기에 CPU 내부의 SRAM(L1~L3 캐시)은 너무나도 비좁다. 결국 늘어난 CPU 코어들이 하는 일이라곤, 느려터진 메모리 버스를 타고 데이터를 한 조각씩 데려오는 '데이터 셔틀' 역할뿐이다.
 코어가 늘어날수록 메모리 대역폭을 점유하기 위한 내부 간섭만 심화될 뿐, 에이전트의 사고 속도가 빨라지는 것은 아니다. 일부 제조사들이 말하는 CPU 부활론은 결국 "우리 재고 칩도 쓸모가 있으니 제발 사달라"는 비굴한 호객 행위에 불과한 이유다.
 인텔이 내세우는 '후면 전력 공급(BSPDN)' 기술 역시 기술적 기만에 가깝다. 전력선을 뒷면으로 돌려 발열을 줄이고 공간을 확보한다는 논리는 그럴듯하지만, 이는 근본적인 지능의 병목인 '메모리 벽'을 허무는 솔루션이 아니다.
 또한 단순히 칩의 물리적 구조를 비틀어 AI 가속기와 HBM을 수직으로 쌓겠다는 것은, 근본적인 설계 혁신 없이 '적층형 아파트'를 지어 밀도를 높이겠다는 임기응변일 뿐이다. 데이터가 이동해야 하는 물리적 경로의 비결정성을 제거하지 않는 한, 이러한 공정 개선은 결국 한계에 부딪힐 수밖에 없다.
 인텔의 본질 회피 옛 버릇 또 나와 주가와 선동으로 지능 만들겠다는 '빈 카운팅' 고질병 삼성DS와 유사
 인텔 띄우기에는 주가와 도널드 트럼프 정부의 지분 투자 논리까지 동원됐다. 주식 시장은 반등에 환호하지만, 이를 기술적 발견이나 성취라고 보기 어려운 이유다. 아마존, 구글, 마이크로소프트가 커스텀 CPU를 만드는 진짜 이유는 범용 CPU의 비효율 때문이다.
 공통 워크로드에 맞춰진 범용 설계는 데이터 흐름과 연산 경로를 불필요하게 우회시키고, 결국 지연과 낭비를 구조적으로 발생시킨다. 팹리스의 진짜 속내는 자신들의 데이터 구조와 실행 패턴에 맞게 연산 경로를 재설계해 불필요한 분기와 이동을 제거하려는 것이다.
 <div contents-hash="db7eb84953bd43a5a6e6646107fea64ba835ce5e68d5ab68c13c5432bc0eb88a" dmcf-pid="8NanTRCEYx" dmcf-ptype="general">
 결과적으로 범용 CPU는 더 이상 중심이 아니라 '호환을 위한 잔존물'로 밀려나는 국면에 들어섰다. 당장은 재고를 밀어내기 위한 '칩 팔이'가 먼저고, 논리는 뒤에 붙는다. CPU가 병목이라는 주장도, 에이전틱 AI 서사도 그 순서를 거꾸로 포장한 결과다.
 </div>
 <figure class="figure_frm origin_fig" contents-hash="497c4fd7afbea16287d8d2aad718087080125a3668dd17e560faf6742a792564" data-idxno="457936" data-type="photo" dmcf-pid="6jNLyehDGQ" dmcf-ptype="figure">
 <img alt="인텔(Intel) CPU 패키지와 다이 모습이다. 외형은 단순한 금속 패키지처럼 보이지만, 내부에서는 코어·캐시·인터커넥트가 복잡하게 얽혀 있고, 외부 디램(DRAM)과의 왕복이 필수다. 이 구조 때문에 연산 능력보다 데이터 이동 경로가 성능을 좌우하며, 코어를 늘려도 병목이 사라지지 않는 한계가 그대로 드러난다. / 해설=이상헌 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/30/552814-8XPEppr/20260430214646708ljxg.jpg" data-org-width="1080" dmcf-mid="0bIr0c5T5c" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/30/552814-8XPEppr/20260430214646708ljxg.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 인텔(Intel) CPU 패키지와 다이 모습이다. 외형은 단순한 금속 패키지처럼 보이지만, 내부에서는 코어·캐시·인터커넥트가 복잡하게 얽혀 있고, 외부 디램(DRAM)과의 왕복이 필수다. 이 구조 때문에 연산 능력보다 데이터 이동 경로가 성능을 좌우하며, 코어를 늘려도 병목이 사라지지 않는 한계가 그대로 드러난다. / 해설=이상헌 기자
 </figcaption>
 </figure>
 CPU는 복잡한 분기와 제어를 수행하기 위해 코어 하나당 큰 SRAM과 복잡한 회로를 함께 가진다. 그 결과 코어 하나의 면적이 커져 수십 개 수준에 머문다. 이에 한편에서는 혁신을 위한 노력도 있다. Arm(암)이 최근 AGI CPU를 출시하며 제시한 방식은 '코어를 랙 단위의 클러스터로 묶는다'는 점에서 기존 한계를 우회하려는 시도다.
 다만 이 구조 역시 데이터가 머무는 위치와 이동 경로를 근본적으로 바꾸지 않는 이상, '코어 집적' 이상의 의미를 갖기 어렵다. 랙 단위로 연산을 늘려도 KV 캐시가 여전히 외부 메모리에 분산돼 있다면 무용지물이다. 병렬 처리량은 늘어나지만 지연과 데이터 왕복 비용은 그대로 남는 구조이기 때문이다.
 문제는 이런 수준의 설계 고민조차 Intel(인텔)에서는 뚜렷하게 보이지 않는다는 점이다. 후면 전력 공급 같은 공정 개선에 집중하는 동안, 데이터 이동과 메모리 구조를 재설계하려는 시도는 제한적이다. 기술 혁신보다는 주가 띄우기용 홍보에 매진하며 범용 D램 판매 성과를 뒤에 숨기는 삼성전자 DS부문의 빈 카운팅(Bean Counting)과 흡사하다.
 정리하면 이번 'CPU 부활' 서사는 기술의 진보라기보다는 재고의 출구를 찾기 위한 전략에 가깝다. HBM에 낸드를 결합하는 HBF 구상에 엔비디아가 거리를 두고, 이재명 정부의 리벨리온·퓨리오사AI NPU 띄우기도 과기부가 SK텔레콤, LG CNS, 삼성SDS 데이터센터 현장을 점검할 만큼 열기가 식자 방향을 CPU로 바꾼 양상이다. 
 병목의 본질은 코어 수가 아니라 데이터가 머무는 위치와 이동 경로에 있음에도 병렬 처리량이라는 숫자로 시장의 시선을 흐린다. 랙 단위 확장이든 후면 전력 공급이든, 메모리 벽을 건드리지 않는 한 모두 같은 한계 안에서 맴도는 변주일 뿐이다.
 <div contents-hash="36603cdc37cc3acc8e23e3c50f2276985bb30664ada12316a7626af5d9acea69" dmcf-pid="YqzpJ1x2HV" dmcf-ptype="general">
 결국 이런 비과학적 '중심 이동' 서사가 반복되는 이유는 분명하다. 병목의 본질은 코어 수가 아니라 데이터가 머무는 위치와 이동 경로에 있음에도, 병렬 처리량이라는 숫자로 시선을 흐려야 당장의 칩이 팔리기 때문이다. 랙 단위 확장이든 후면 전력 공급이든, 메모리 벽을 건드리지 않는 한 모두 같은 한계 안에서 맴도는 변주일 뿐이다.
 </div>
 <figure class="figure_frm origin_fig" contents-hash="c53a68a0857acfe77b216af77ca3c3249de9b67db5e485d3ff01f6850643d0cc" data-idxno="457937" data-type="photo" dmcf-pid="GBqUitMV12" dmcf-ptype="figure">
 <img alt="연산은 위에서 끝나고, 아래는 전부 기다림이다. CPU 메모리 계층 구조를 위에서 아래로 단계별로 정리한 인포그래픽이다. 최상단에는 가장 빠르고 용량이 작은 CPU 레지스터, 그 아래로 L1·L2·L3 캐시가 배치돼 연산과 직접 맞닿은 초근접 영역을 형성한다. 중간 구간에는 DDR·HBM 등 외부에 위치한 서브 메모리가 자리하며, 용량은 크지만 지연이 발생하는 구조가 강조된다. 최하단에는 SSD·HDD 같은 보조 저장 장치가 배치돼 가장 큰 용량과 가장 높은 지연을 나타낸다. / 해설 = 이상헌 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/30/552814-8XPEppr/20260430214648172gucq.png" data-org-width="1024" dmcf-mid="pbnehPmjtA" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/30/552814-8XPEppr/20260430214648172gucq.png" width="658">
 <figcaption class="txt_caption default_figure">
 연산은 위에서 끝나고, 아래는 전부 기다림이다. CPU 메모리 계층 구조를 위에서 아래로 단계별로 정리한 인포그래픽이다. 최상단에는 가장 빠르고 용량이 작은 CPU 레지스터, 그 아래로 L1·L2·L3 캐시가 배치돼 연산과 직접 맞닿은 초근접 영역을 형성한다. 중간 구간에는 DDR·HBM 등 외부에 위치한 서브 메모리가 자리하며, 용량은 크지만 지연이 발생하는 구조가 강조된다. 최하단에는 SSD·HDD 같은 보조 저장 장치가 배치돼 가장 큰 용량과 가장 높은 지연을 나타낸다. / 해설 = 이상헌 기자
 </figcaption>
 </figure>
 ☞아키텍처의 물리적 위상(Physical Topology of Logic) = 인공지능의 논리 구조(사고 흐름)와 물리적 배치(데이터·전류 흐름)가 얼마나 일치하는지를 설명하는 개념이다. 기존 범용 중앙처리장치(CPU)와 그래픽처리장치(GPU) 구조에서는 연산 경로와 데이터 저장 위치가 분리돼 있어, 핵심 기억인 키-값 캐시(KV 캐시)가 고대역폭 메모리(HBM)나 디램(DRAM) 같은 외부 영역으로 밀려난다. 이 구조에서는 연산 유닛이 데이터를 끊임없이 가져오는 '셔틀' 역할에 머물며 코어 수를 늘려도 대기와 지연만 커지는 병목이 반복된다.
 반면 위상 일치형 설계는 사고 흐름(Logic Flow)이 곧 전류 흐름(Current Flow)이 되도록, 연산이 일어나는 위치와 데이터가 존재하는 위치를 동일 공간으로 수렴시키는 접근이다. 즉 로짓이 생성되는 계산 과정이 온칩 SRAM같은 초근접 영역에서 닫히도록 만들어 데이터 이동 자체를 제거하는 구조다. 이러한 설계 철학은 그록의 LPU, 세레브라스의 웨이퍼 스케일 엔진, 구글의 TPU 8i 등에서 확인되며, 공통적으로 연산과 메모리의 분리를 최소화해 지연을 구조적으로 제거하는 방향으로 구현되고 있다.
 여성경제신문 이상헌 기자 liberty@seoulmedia.co.kr
 *여성경제신문 기사는 기자 혹은 외부 필자가 작성 후 AI를 이용해 교정교열하고 문장을 다듬었음을 밝힙니다. 기사에 포함된 이미지 중 AI로 생성한 이미지는 사진 캡션에 밝혀두었습니다.
 </section> 
 </div>

이전

삼성전자 "보급형 미니 LED TV로 볼륨존 공략"

04-30
다음

신들린 박새영 선방 앞세운 삼척시청, 정규리그 21경기 무패 SK슈글즈 잡고 챔프전 첫 승

04-30

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

[기자수첩] 범용 재고 또 쌓였나? 이젠 CPU로 옮겨붙는 '칩 팔이'

멤버랭킹

관련자료

멤버랭킹