모델 구조 달라도 OK…KAIST, AI 적응 지식 이전 기술 개발 작성일 01-27 60 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="0oDsZwoMmS"> <figure class="figure_frm origin_fig" contents-hash="e4bd8eb3756ac417c6f72c391fb86431741d1765c3fa31e16bbc732b7ae398e2" dmcf-pid="pgwO5rgRwl" dmcf-ptype="figure"> <p class="link_figure"><img alt="김현우 전산학부 교수 연구팀이 고려대학교 연구팀과 공동연구를 통해 27일 구조와 크기가 다른 인공지능 모델 사이에서도 학습된 지식을 효과적으로 이전할 수 있는 새로운 기술을 개발했다고 밝혔다. 사진은 크기 등에 관계 없이 재사용 가능한 적응지식 전이 기법인 'TransMiter' 모델 구조, KAIST 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/27/daejonilbo/20260127183906737svlb.jpg" data-org-width="643" dmcf-mid="1oApf5SrEi" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/27/daejonilbo/20260127183906737svlb.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 김현우 전산학부 교수 연구팀이 고려대학교 연구팀과 공동연구를 통해 27일 구조와 크기가 다른 인공지능 모델 사이에서도 학습된 지식을 효과적으로 이전할 수 있는 새로운 기술을 개발했다고 밝혔다. 사진은 크기 등에 관계 없이 재사용 가능한 적응지식 전이 기법인 'TransMiter' 모델 구조, KAIST 제공 </figcaption> </figure> <p contents-hash="c595f6e0488bb377cac3a9e561de1b657a382df0e44e98e071e7c5b1cfec229d" dmcf-pid="UarI1maeEh" dmcf-ptype="general">새로운 인공지능(AI) 모델이 등장할 때마다 이미 잘 학습된 지식을 처음부터 다시 가르쳐야 하는 비효율을 해결할 기술이 국내에서 개발됐다.</p> <p contents-hash="e46d4fa6ae67fe389e1a640694db72c2e859a12c165276dbdf206d01abd6ca19" dmcf-pid="uNmCtsNdEC" dmcf-ptype="general">서로 다른 AI 모델 사이에서도 학습 경험을 그대로 옮겨 쓸 수 있는 '지식 이식' 기술로, 향후 AI를 업데이트하는 방식 자체를 바꿀 수 있을 것으로 기대된다.</p> <p contents-hash="d731782f5463cd0e6f6d3d3beb283b3783d289883a3785a106a77ebe8478cbfd" dmcf-pid="7jshFOjJwI" dmcf-ptype="general">KAIST는 27일 김현우 전산학부 교수 연구팀이 고려대학교 연구팀과 공동연구를 통해 구조와 크기가 다른 인공지능 모델 사이에서도 학습된 지식을 효과적으로 이전할 수 있는 새로운 기술을 개발했다고 밝혔다.</p> <p contents-hash="f2dd90f9b92c7b55b635d47c22cfef9e2d34ab495330b99efa9c3b94463152a2" dmcf-pid="zAOl3IAirO" dmcf-ptype="general">지금까지 인공지능은 성능이 더 좋은 새 모델이 나올 때마다 특정 분야에 맞게 다시 학습을 거쳐야 했다. 스마트폰을 바꿀 때마다 연락처와 사진을 처음부터 다시 옮기는 것처럼, 시간과 비용이 반복적으로 들어가는 구조였다. 특히 최근 각광받는 시각-언어 모델(Vision-Language Model·VLM)의 경우, 이미지와 텍스트를 동시에 다루는 만큼 이러한 부담이 더욱 컸다.</p> <p contents-hash="e0f633b8a69c4dc5bb21e139155f1db638468ca8cd5d81677f17d07659010de4" dmcf-pid="qcIS0CcnDs" dmcf-ptype="general">연구팀은 이런 문제를 해결하기 위해, 기존 모델이 특정 작업에 적응하며 쌓은 '학습 요령'을 다른 모델로 그대로 전달하는 방식의 전이 가능한 적응 기법을 제안했다.</p> <p contents-hash="7cc613ece1f95aaf54ebb1f6c93105a5c7e0240abc70e8e9e3644ef912930920" dmcf-pid="BkCvphkLOm" dmcf-ptype="general">'TransMiter'라고 불리는 이 기술은 인공지능의 내부 구조를 직접 건드리지 않는다. 대신 한 AI가 질문에 대해 어떤 답을 내놓았는지, 즉 결과를 기준으로 학습된 지식을 정리해 다른 AI에 전달한다. 서로 구조가 전혀 다른 모델이라도 같은 문제에 대한 답변 패턴을 공유함으로써, 기존 AI가 익힌 노하우를 새 AI가 곧바로 활용할 수 있도록 한 것이다.</p> <p contents-hash="5c63a17aa7c7cc12f29b15ca7c2a95035bbf44effc964660bbcac567d501afc9" dmcf-pid="bEhTUlEowr" dmcf-ptype="general">이 방식 덕분에 새로운 AI 모델을 도입하더라도 복잡한 후학습(post-training)을 다시 거칠 필요가 없고, 메모리 사용량이나 연산 비용도 크게 늘어나지 않는다. 연구진은 이를 통해 그동안 재사용이 어렵다고 여겨졌던 AI의 '적응 지식'을 모델 종류와 관계없이 이전할 수 있음을 실험적으로 입증했다.</p> <p contents-hash="3c6536672af552bf0fa10944cfc32768af0df5a75cd445d3fbcdd16b5928ed13" dmcf-pid="KLEmXDLxmw" dmcf-ptype="general">이번 연구가 향후 거대언어모델이나 멀티모달 AI를 특정 분야에 맞게 빠르게 업데이트하는 이른바 '지식 패치(patch)' 기술로 확장될 수 있다는 점에서도 의미가 크다. 필요할 때마다 모델 전체를 다시 학습시키는 대신, 필요한 지식만 덧붙이는 방식이 가능해질 수 있기 때문이다.</p> <p contents-hash="e746e44a35a6d701e77b7e59c5748b50561d9ee005be0b6889f4672becd18c13" dmcf-pid="9oDsZwoMID" dmcf-ptype="general">김현우 교수는 "이번 연구를 확장하면, 빠르게 발전하는 초거대언어모델이 등장할 때마다 반복적으로 수행해야 했던 후학습(post-training)의 비용을 크게 줄일 수 있다"며, "특정 분야의 전문 지식을 손쉽게 추가하는 '모델 패치'가 가능해질 것"이라고 설명했다.</p> <p contents-hash="869722d94917799ae48b9ecb98690f00fc04ce3ad1147c8d0f85b321b8734518" dmcf-pid="2gwO5rgRsE" dmcf-ptype="general">한편 이번 연구에는 송태훈 KAIST 전산학부 석사과정 학생, 이상혁 박사후연구원과 박지환 고려대학교 박사과정 학생이 공동 저자로 참여했으며, 연구 결과는 인공지능 분야 최고 권위의 국제 학술대회인 AAAI 2026에 구두 발표 논문으로 채택돼 지난 1월 25일 공개됐다. 연구는 국방기술진흥연구소와 정보통신기획평가원(IITP)의 지원을 받아 수행됐다.</p> </section> </div> <p class="" data-translation="true">Copyright © 대전일보. 무단전재 및 재배포 금지.</p> 관련자료 이전 "PBS 폐지? 통합평가는 매년"…과학기술계, '단기 성과' 족쇄에 장기 연구 실종 위기 01-27 다음 “양자 컴퓨팅으로 보안 혁신”... 광자 기반 기술로 양자 기술 상용화 앞당긴다 01-27 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.