스냅드래곤 8 엘리트 5세대 NPU 성능은?…'실리콘 고문' 해봤더니 작성일 04-22 30 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="7IMMMVlwID"> <figure class="figure_frm origin_fig" contents-hash="c6b7ef9326eb37e8059664810c2d94495d506cf64cac00864b58ed7e26feb59b" dmcf-pid="zCRRRfSrwE" dmcf-ptype="figure"> <p class="link_figure"><img alt="스냅드래곤 8 엘리트 5세대(Gen 5)가 탑재된 스마트폰에서 MLC LLM 기반의 'MLC Chat' 앱을 가동한 모습." class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/22/etimesi/20260422170238769evov.png" data-org-width="603" dmcf-mid="uMtttWd8Iw" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/22/etimesi/20260422170238769evov.png" width="658"></p> <figcaption class="txt_caption default_figure"> 스냅드래곤 8 엘리트 5세대(Gen 5)가 탑재된 스마트폰에서 MLC LLM 기반의 'MLC Chat' 앱을 가동한 모습. </figcaption> </figure> <p contents-hash="1d27a881803dae73524f2463af3d297d34b015a4743f1c9c635b152a92dfb294" dmcf-pid="qheee4vmEk" dmcf-ptype="general">스냅드래곤 8 엘리트 5세대(Gen 5) 특징 중 하나는 신경망처리장치(NPU) 성능이다. 이전 세대 대비 성능이 37~39% 향상됐다. NPU는 딥러닝이나 머신러닝 등 AI 연산을 효율적으로 처리하기 위해 설계된 반도체 가속기다. CPU보다 AI 연산을 빨리 처리하면서 전력 소모는 훨씬 적다.</p> <p contents-hash="a6dd288c88dba1b5f68d3ee878f6fc2c178ecfc60faf77f8ffb79fbfef309ef2" dmcf-pid="Blddd8TsOc" dmcf-ptype="general">퀄컴 최신 칩 AP를 네트워크 접속을 차단한 상태에서 거대언어모델(LLM)을 가동, 실질적인 체감 NPU 성능이 어느 정도인지 확인하는 작업을 거쳤다. LLM은 70억~80억개의 파라미터를 지닌 모델이다. 2020년 최초 등장 당시 이 덩치를 감당하기 위해서는 최소한 RTX3090 수준 그래픽카드나 A100같은 서버 전용 그래픽카드가 필수였다.</p> <p contents-hash="689b7fa314b8d176e97bd2fc981458ff90d8815a7c0d5b1ced4dd08f3105d402" dmcf-pid="bSJJJ6yOrA" dmcf-ptype="general">실측을 위해 오픈소스 머신러닝컴플리케이션(MLC) LLM 기반의 'MLC Chat' 앱을 활용했다. 테스트 모델은 현재 온디바이스 AI의 표준 격인 메타의 '라마 3(Llama-3)-8B'다. 이 모델은 4비트 양자화(INT4) 과정을 거쳐 스마트폰 NPU의 한계를 시험하기에 적합하다. 외부 변수를 통제하기 위해 '비행기 모드'와 화면 밝기 50% 고정 상태에서 고강도 추론 연산을 지속하며 변화를 관찰했다.</p> <p contents-hash="29383ede1a19a49e58a4722dc5eaae73e72916e80ed0ae58516c1e7bb157806d" dmcf-pid="KviiiPWImj" dmcf-ptype="general">최초 테스트에서 인사나 날씨 등 간단한 질문을 몇개 던지자 프리필(Prefill)은 68tok/s, 디코드(Decode)는 25.1tok/s를 기록했다. 이어 소설 및 대본 창작이나 경제 현안 분석 등 고난도 작업을 요구했음에도 20tok/s 수준이 유지됐다.</p> <p contents-hash="108b658e94c97bf42e6219a6c22eaa7e0aadcc59e148ef4ea5c8ac1c809da6c3" dmcf-pid="9TnnnQYCON" dmcf-ptype="general">장시간 질문을 이어가자 잠시 15tok/s 속도로 하락하기도 했다. 다만 기기에서 발열이 느껴지지 않았고 앱 재기동 시 즉시 25tok/s 속도로 돌아왔다는 점을 고려할 때, 이는 NPU 성능보다는 사용된 LLM 모델의 최적화 이슈가 원인으로 추정된다. 실사용 단계에서 성능 지속성을 입증한 셈이다.</p> <p contents-hash="9958bc48f8e0fa7f478c5a160ea059422650234cf57804267f131da814be7e1d" dmcf-pid="2yLLLxGhma" dmcf-ptype="general">프리필은 질문을 받고 문맥을 파악하는 입력 처리 속도, 디코드는 추론 및 답변(토큰)을 생성하는 속도를 의미한다. 디코드 20tok/s 이상의 속도는 사람의 평균 읽기 속도보다 3~4배 빨라 이용자가 쾌적함을 느끼는 수준이다. 앞선 세대 AP들이 최고 14~15tok/s 수준이었던 것을 고려하면 성능 향상이 뚜렷하다.</p> <p contents-hash="7e7247900f0cf92362a45026da6672dc4bd20465a7b67ea1d2825d534bb17ce8" dmcf-pid="VWoooMHlOg" dmcf-ptype="general">디바이스 내 AI 연산 능력은 일상적인 질의 응답은 물론 고도화된 콘텐츠 제작 및 개인 맞춤형 추천까지 폭넓은 작업을 지원한다. 파일 개요(File Overview), 나이트그래피(Nightography) 비디오, 포토 어시스트(Photo Assist), 나우 너지(Now Nudge) 등 갤럭시 AI 생태계에서 활용 폭을 넓혀준다.</p> <p contents-hash="f872bd2b9ceafb127e4e7bb2cad0bd544a250bed2634221cfe4f54236c241c23" dmcf-pid="f1kkkL3Gmo" dmcf-ptype="general">특히 고성능 카메라와 영상 코덱(APV)을 갖춘 갤럭시 S26 울트라에서 AI는 콘텐츠 제작에 기여하는 바가 크다. 저조도 사진 촬영에서 노이즈 감소 기능을 수행하고 장면을 분석해 피사체와 배경을 구분 처리한다.</p> <p contents-hash="1f3b5f9f1b2b759d6206da2dccfc1c5c782646c6ff138375ba3495eeff8b506f" dmcf-pid="4tEEEo0HIL" dmcf-ptype="general">퀄컴 관계자는 “스냅드래곤 8 엘리트 Gen5는 단순한 칩셋 업그레이드가 아니라 스마트폰 역할 자체를 재정의하는 플랫폼”이라고 설명했다.</p> <p contents-hash="43fd0f2875ba030a351d69646f38796569beaec17c9f28fb37fad008e2d85c50" dmcf-pid="8FDDDgpXDn" dmcf-ptype="general">이형두 기자 dudu@etnews.com</p> </section> </div> <p class="" data-translation="true">Copyright © 전자신문. 무단전재 및 재배포 금지.</p> 관련자료 이전 “아직도 폰이 안 꺼졌네”…전력관리·성능 다 잡은 스냅드래곤 8 엘리트 5세대 04-22 다음 외신도 삼성 노조 리스크 걱정하는데… 사측 대처법은 ‘수비 강화’ 04-22 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.