AI '확산 모델' 한계 넘었다…추론 속도 100배 작성일 07-20 10 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="taU53nhLR3"> <figure class="figure_frm origin_fig" contents-hash="79cf59c7a4cc5314f24c7d2a335224b48e60eb85609d225458223cc8c9afa139" dmcf-pid="FNu10LlodF" dmcf-ptype="figure"> <p class="link_figure"><img alt="왼쪽부터 KAIST 안성진 교수, 윤재식 박사과정, 조현서 석사과정, 백두진 석사과정. 요슈아 벤지오 캐나다 몬트리올대 교수. KAIST 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/20/dongascience/20250720120210346frxh.png" data-org-width="680" dmcf-mid="5mPxdyBWMp" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/20/dongascience/20250720120210346frxh.png" width="658"></p> <figcaption class="txt_caption default_figure"> 왼쪽부터 KAIST 안성진 교수, 윤재식 박사과정, 조현서 석사과정, 백두진 석사과정. 요슈아 벤지오 캐나다 몬트리올대 교수. KAIST 제공 </figcaption> </figure> <p contents-hash="fac94f8644b1e632d6278e83895721dbcc4c8e24aeb6ae4addc0269b5bf42507" dmcf-pid="3AzFUgvant" dmcf-ptype="general">국내 연구진이 인공지능(AI) 확산 모델의 ‘추론-시간 확장성’을 비약적으로 개선한 신기술을 개발했다. AI가 추론 과정에서 사용 가능한 계산 자원에 따라 성능을 유연하게 조절해 문제 해결에 소모되는 시간을 100배 단축했다. 향후 지능형 로봇이나 실시간 생성형 AI 등 고성능 추론이 필요한 다양한 분야에 활용될 것으로 기대된다.</p> <p contents-hash="49abb87e4f5d6ba5c78f75b14bbd62c4d9c4b00cb7dba6648b9edd9c3b4ba5cc" dmcf-pid="0cq3uaTNd1" dmcf-ptype="general">KAIST는 안성진 전산학부 교수 연구팀이 요수아 벤지오 캐나다 몬트리올대 교수팀과 공동 연구를 통해 AI 확산 모델의 추론-시간 확장성을 획기적으로 개선한 신기술을 개발했다고 20일 밝혔다. 연구 결과는 13일부터 19일까지 캐나다 밴쿠버에서 열린 국제기계학습학회(ICML 2025)에서 전체 채택 논문 중 상위 2.6%인 '스포트라이트 논문'으로 발표됐다.</p> <p contents-hash="8ea0c87d721a641e53f6e9635583c6f2b1f990669dfe627d6f570f0225556e01" dmcf-pid="pkB07Nyji5" dmcf-ptype="general">확산 모델은 이미지 생성 등 다양한 생성형 AI에 활용되며 주목받고 있지만 실시간 활용에 필수적인 ‘추론-시간 확장성(inference-time scalability)’은 미흡하다는 평가를 받는다. 추론-시간 확장성은 AI가 추론 과정에서 주어진 계산 자원의 양에 따라 성능을 유연하게 조절할 수 있는 능력을 의미한다.</p> <p contents-hash="06649f3330d38511b5b4f5d9d1ff05c427e39a30a6afbd434fe8f52d98f4565a" dmcf-pid="UEbpzjWAJZ" dmcf-ptype="general">연구팀은 이러한 한계를 극복하기 위해 몬테카를로 트리 탐색(Monte Carlo Tree Search)을 기반으로 확산 모델의 새로운 추론 방법을 제안했다. 몬테카를로 트리 탐색은 선택지를 트리 구조로 구성한 뒤 시뮬레이션을 반복해 최적 경로를 찾아내는 방식으로 바둑 AI 등 복잡한 결정 문제에서 활용되는 탐색 알고리즘이다.</p> <p contents-hash="ca40d66351cde8cdbd1fc19657cc13f624b926aaaee483e48d0dea0788f39e97" dmcf-pid="uDKUqAYcJX" dmcf-ptype="general">이번에 개발된 몬테카를로 트리 탐색 기반 기술은 확산 과정에서 발생 가능한 생성 경로를 트리 구조로 탐색해 제한된 자원 하에서도 고품질 출력을 효과적으로 도출할 수 있도록 설계됐다. 이를 통해 기존 방법이 단 한 번도 성공하지 못한 ‘초대형 미로 찾기’ 문제를 100%의 성공률로 해결했다. 초대형 미로 찾기 문제는 AI가 수천 개의 갈림길로 이뤄진 대규모 미로에서 출구를 찾아야 하는 고난도 탐색 과제로 기존 확산 모델로는 해결이 어려웠다.</p> <figure class="figure_frm origin_fig" contents-hash="447219f22ec99d79879fd9111c0d93c8a25e84c739d377113fe1e89f663bacfd" dmcf-pid="7w9uBcGkRH" dmcf-ptype="figure"> <p class="link_figure"><img alt="인공지능(AI) 확산 모델의 추론-시간 확장 실현 개요. KAIST 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/20/dongascience/20250720120211718afcc.png" data-org-width="680" dmcf-mid="1WgenG9He0" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/20/dongascience/20250720120211718afcc.png" width="658"></p> <figcaption class="txt_caption default_figure"> 인공지능(AI) 확산 모델의 추론-시간 확장 실현 개요. KAIST 제공 </figcaption> </figure> <p contents-hash="b8767e7d993ba66232d74d85cc122af03c036e5f1cb21401d887160a9e63f255" dmcf-pid="zr27bkHEiG" dmcf-ptype="general">연구팀은 후속 연구를 통해 기존 방식의 단점으로 지적된 속도 문제도 대폭 개선했다. 개발된 트리 탐색 구조를 병렬화하는 방식으로 자원 환경을 최적화해 기존 방식 대비 최대 100배 빠른 속도로 동등하거나 더 높은 품질의 결과를 얻는 데 성공했다. 기술이 고정된 자원 환경뿐 아니라 실시간성이 요구되는 다양한 분야에서도 적용 가능하다는 점을 입증한 것이다.</p> <p contents-hash="e1aa4f67bf9dfe894851391d0f790a8811330846cdc70d0d054b53d64e0b4b11" dmcf-pid="qmVzKEXDRY" dmcf-ptype="general">안성진 교수는 “이번 연구는 고비용 계산이 필요했던 기존 확산 모델의 근본적 한계를 넘어선 기술”이라며 “지능형 로봇, 실시간 생성형 AI, 시뮬레이션 기반 의사결정 등 다양한 영역에서 핵심 기술로 활용될 수 있을 것”이라고 밝혔다.</p> <p contents-hash="36a9d01a0be034da55b5d9109526f64583e16042d841abc69ea24cf473324055" dmcf-pid="Bsfq9DZwnW" dmcf-ptype="general"><참고 자료></p> <p contents-hash="6a8adc5e260b21462a806fcbb651745e4aa3d1aa59fece7e33a3265963a5fca3" dmcf-pid="bO4B2w5rLy" dmcf-ptype="general">- doi.org/10.48550/arXiv.2502.07202, <br> - doi.org/10.48550/arXiv.2506.09498</p> <p contents-hash="ccf745fdc3fbe75a232e90184f23622451478753422bde279b9b101899ee0328" dmcf-pid="KI8bVr1mRT" dmcf-ptype="general">[박정연 기자 hesse@donga.com]</p> </section> </div> <p class="" data-translation="true">Copyright © 동아사이언스. 무단전재 및 재배포 금지.</p> 관련자료 이전 엔시티 드림, 신곡 'BTTF''칠러' 퍼포먼스로 그려낸 시간 여행 07-20 다음 한국과학창의재단, AI 시대 ‘수학교육’ 혁신 모색 07-20 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.