에버퓨어 “GPU 60%가 스토리지 병목으로 낭비…AI 데이터 플랫폼이 해법”

작성일 05-15

<div id="layerTranslateNotice" style="display:none;"></div>  <strong class="summary_view" data-translation="true">[AI WAVE 2026] AI 프로젝트 실패 70~85%, 원인은 인프라</strong> 
        <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
         <section dmcf-sid="Vt8XAEmjTs">
          <figure class="figure_frm origin_fig" contents-hash="df891f9f76f62c37c870aefe16ea7d46b344aa0e9074bd6cd52d0f9aa6d15727" dmcf-pid="fF6ZcDsAlm" dmcf-ptype="figure">
           <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/15/552796-pzfp7fF/20260515062220072sfsl.jpg" data-org-width="640" dmcf-mid="2C0mQRiPhO" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/15/552796-pzfp7fF/20260515062220072sfsl.jpg" width="658"></p>
          </figure>
          <p contents-hash="ff371a45fdb896602f68afafb62cea420462bb7dd0909df50b309af5d175c882" dmcf-pid="43P5kwOcyr" dmcf-ptype="general">[디지털데일리 이안나기자] AI 프로젝트가 잇따라 실패하는 이유로 모델 성능이나 GPU 부족이 먼저 거론되지만 정작 핵심 원인은 데이터 인프라에 있다는 주장이 나왔다. AI 학습과 추론에 쓸 수 있는 데이터를 준비하는 데 전체 시간의 80%가 소비되고 GPU 사용량의 60%가 스토리지 성능 병목으로 낭비되고 있다는 것이다. 에버퓨어는 이 문제를 정면으로 겨냥한 AI 데이터 플랫폼을 앞세워 엔터프라이즈 AI 시장 공략을 본격화하고 있다.</p>
          <p contents-hash="63b63b477646147c31a4cc13c23226bb566d0daa899fc3bdfc486e734a899e5c" dmcf-pid="80Q1ErIkvw" dmcf-ptype="general">14일 디지털데일리가 개최한 'AI 웨이브 2026(AI WAVE 2026)' 콘퍼런스에서 김영석 에버퓨어코리아 상무는 '엔터프라이즈 데이터 클라우드로 구현하는 에이전틱 AI'를 주제로 발표했다. 그는 AI가 기존 워크로드와 근본적으로 다른 이유를 먼저 짚었다.</p>
          <p contents-hash="6c153f7eda4d62d0c6baaa5eafb4a3d88014b1125ba7e3859cb604dc3e729276" dmcf-pid="6pxtDmCEWD" dmcf-ptype="general">시스템이 사일로로 분리돼 있고 서비스레벨협약(SLA)을 보장하기 어려우며 보안·거버넌스는 나중에 덧붙이는 식으로 운영되는 현실이다. 김 상무는 “AI는 단순히 또 다른 워크로드가 아니다”라며 “중요 서비스와 동일한 등급의 SLA, 99.9999% 가용성, 자동화된 거버넌스가 처음부터 갖춰져야 한다”고 강조했다. AI 프로젝트 70~85%가 인프라 제약으로 실패한다는 수치도 함께 제시됐다.</p>
          <p contents-hash="d457eea2940a091e2bc7c0f9cd822500d8f74d0d6df662cadb10611470f83438" dmcf-pid="PUMFwshDlE" dmcf-ptype="general">병목은 생각보다 가까운 곳에 있다. AI 학습·추론 과정에서 읽기 성능은 이미 충분한 수준에 올라왔지만 학습 중간에 결과물을 저장하는 체크포인트가 새로운 문제로 떠오르고 있다. 쓰기 성능이 따라주지 못하는 탓이다. 라마 3 기준으로 체크포인트 한 번에 약 5.9테라바이트의 쓰기가 발생하고 이 규모는 페타바이트까지 불어날 수 있다. 김 상무는 “스토리지가 얼마나 빠르게 데이터를 받아낼 수 있느냐가 AI 프로젝트 성패를 가르는 변수”라고 짚었다.</p>
          <p contents-hash="b9d88cc3d820271e9d3d0f0cfcc22fecb271699a1d6d111dd84d36635785a4da" dmcf-pid="QuR3rOlwWk" dmcf-ptype="general">에버퓨어는 이 문제를 단계별로 풀어가는 기술들을 이날 소개했다. GPU가 데이터를 가져올 때 중간 파일시스템을 거치지 않고 메모리에 바로 접근하게 해주는 'S3 오버 RDMA(S3 Over RDMA)'가 대표적이다. GPU가 데이터 변환에 쓰던 연산을 줄여 실제 학습과 추론에 집중할 수 있게 하는 방식으로, 64개 노드 기준 데모에서 이 기술을 켜자 GPU·CPU 사용률이 즉각 떨어지는 장면이 시연됐다.</p>
          <p contents-hash="cb06203d075f2bcf6ca4e5a8e33a28f6fe0f4ac429181f042b3cefbef00e14f4" dmcf-pid="x7e0mISrTc" dmcf-ptype="general">데이터를 준비하는 과정도 병목이다. '레피드 파일 툴(Rapid File Tool)'은 수십억개 파일 메타데이터를 빠르게 처리하는 도구로, 실제 고객사에서 10억개 파일 삭제 작업을 일반 리눅스 명령어로 돌리면 4개월이 걸릴 것으로 예측됐는데 이 툴로는 1시간 만에 끝났다.</p>
          <p contents-hash="2d736f04bc0e4102956c206fef432006ae83d03199ba09c8241a2d97bc8100f3" dmcf-pid="yagBSyHlvA" dmcf-ptype="general">김 상무는 “그만큼 메타데이터 처리에 뛰어난 기술력을 보유하고 있다”고 말했다. 데이터를 물리적으로 옮기지 않고 처리 성능만 달리 적용해 스토리지 계층을 나누는 '제로무브 티어링(ZMT)'도 같은 맥락이다. 데이터 이동에 드는 시간과 부하를 없애 AI 학습·추론 속도를 높이는 구조다.</p>
          <p contents-hash="9c083a5f740ed7afc460ab398ba2191ef834e5aad59615f391eaad9f5a2c0872" dmcf-pid="WNabvWXSWj" dmcf-ptype="general">학습만큼 추론 속도도 관건이다. AI가 질문을 받고 첫 답변을 내놓기까지 걸리는 시간, 이른바 TTFT(Time to First Token)가 길어질수록 실사용 환경에서 체감 품질이 떨어진다. 에버퓨어의 KV 캐시 가속기(KVA)는 이 구간을 단축하는 기술이다. 기존에는 GPU 노드마다 캐시를 따로 관리했는데 이를 스토리지 플랫폼으로 통합해 공유하는 방식으로 10만 개 이상 토큰 처리에서 최대 20배 이상 속도를 높인다.</p>
          <p contents-hash="3bbe010c167cc30c29abbd9e276ef6f0f10f7e730cff88c130f8898f5a66d1aa" dmcf-pid="YjNKTYZvWN" dmcf-ptype="general">여기에 구글이 지난 3월 발표한 추론 최적화 기술 '터보퀀트'를 접목하면 효과가 더 커진다. 김 상무는 "두 기술을 함께 적용하면 AI 응답 속도를 최대 10배 높이고 KV 캐시 용량은 3배 이상 줄일 수 있다"고 말했다. 터보퀀트 접목 버전은 이달 중 고객에게 출시될 예정이다.</p>
          <p contents-hash="a89304eb972cb20a803f5065faf43d094f1371feabd2fc795c54a297b6312cb7" dmcf-pid="GAj9yG5TSa" dmcf-ptype="general">비용 구조도 AI 프로젝트의 현실에 맞게 설계했다. '에버그린//원 포 AI(Evergreen//One for AI)'는 저장 용량이 아닌 대역폭(GB/s) 기준으로 요금을 매기는 구독형 서비스다. AI 프로젝트는 초기에 필요한 용량을 가늠하기 어렵지만 성능만큼은 처음부터 보장돼야 한다는 특성을 반영한 것이다.</p>
          <p contents-hash="0a0973881b004e2b6aa8f108c2f21d491bf20d6d671e9bc18cabfcfa68fef86f" dmcf-pid="HcA2WH1yhg" dmcf-ptype="general">SLA를 충족하지 못하면 추가 리소스를 무상 제공하거나 크레딧으로 보상한다는 조건도 내걸었다. 에버퓨어 전체 매출의 절반이 이 구독형 서비스에서 나온다. 김 상무는 "용량은 작게 시작할 수 있어도 성능은 타협할 수 없는 게 AI 프로젝트"라고 말했다.</p>
         </section> 
        </div> 
        <p class="" data-translation="true">Copyright © 디지털데일리. All rights reserved. 무단 전재 및 재배포 금지.</p>

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

에버퓨어 “GPU 60%가 스토리지 병목으로 낭비…AI 데이터 플랫폼이 해법”

멤버랭킹

관련자료

멤버랭킹