서로 다른 AI 모델 간 ‘지식 이식’…추가 학습 필요 없어

작성일 01-27

<div id="layerTranslateNotice" style="display:none;"></div> KAIST, 학습된 지식 AI 모델끼리 공유 ‘트랜스미터’ 개발 반복적 학습 비용 줄여, 전문지식 손쉽게 추가 가능 
 <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
 <section dmcf-sid="xxxQe7ZvT1">
 <figure class="figure_frm origin_fig" contents-hash="c0561f150d54c14237c4ae7d3a8995bfc100ba19f6b3a1f505232871982736f9" dmcf-pid="yyyTGkiPC5" dmcf-ptype="figure">
 <img alt="서로 다른 AI 모델 간 지식 이식 모습으로, AI가 그린 일러스트." class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/27/dt/20260127165543670xdzs.jpg" data-org-width="640" dmcf-mid="PJ03uSDgyF" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/27/dt/20260127165543670xdzs.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 서로 다른 AI 모델 간 지식 이식 모습으로, AI가 그린 일러스트.
 </figcaption>
 </figure>
 새 스마트폰으로 교체할 때마다 기존에 저장돼 있는 연락처와 사진을 옮겨야 한다면 얼마나 불편할까. 지금의 인공지능(AI) 모델들이 이와 비슷한 상황에 놓여 있다.
 성능이 더 좋은 새로운 챗GPT 같은 AI 모델이 나올 때마다 특정 분야의 지식을 확보하기 위해 데이터와 비용을 추가로 들여 다시 학습시켜야 하기 때문이다.
 국내 연구진이 AI 모델 간 이런 비효율을 해결할 수 있는 ‘지식 이식’ 기술을 개발했다. AI 모델이 바뀌어도 기존 지식을 다시 학습시키지 않고 전달만 하면 성능 좋은 AI 모델로 빠르게 활용할 수 있게 된다.
 KAIST는 김현우 전산학부 교수 연구팀이 고려대 연구팀과 함께 서로 다른 AI 모델 간에도 학습된 지식을 그대로 전달할 수 있는 ‘트랜스미터’(TransMiter)를 개발했다고 27일 밝혔다.
 최근 AI 분야에서 사진과 글을 함께 이해하는 시각-언어모델(VLM)은 대규모 이미지와 언어 데이터로 사전 학습해 소량의 데이터만으로도 새로운 분야에 비교적 빠르게 적응한다.
 하지만, 새로운 AI 모델이 등장할 때마다 이런 적응 과정을 반복해야 하는 비효율성 문제가 지속적으로 지적돼 왔다. 기존 적응 모듈들은 모델 구조가 달라지면 그대로 활용하기 어렵거나, 추가 학습이나 여러 모델을 동시에 사용해야 하기 때문에 메모리와 연산 비용이 크게 증가하는 한계를 안고 있었다.
 연구팀은 모델 구조나 크기에 상관없이 학습된 지식을 재사용할 수 있는 ‘전이 가능한 적응 기법’을 개발했다. 이 기술은 특정 AI가 학습을 통해 쌓은 적응 경험을 다른 AI 모델로 직접 전달하는 방식이다.
 가령, 서로 생김새가 다른 AI 모델이라도 같은 질문에 내놓은 답변을 기준으로 정리해 주면, 특정 AI가 익힌 노하우를 다른 AI도 공유해 활용할 수 있는 것이다. 비유하자면 경력 직원이 자신이 쌓은 경험과 노하우를 신입 직원에게 그대로 전달해 새로운 학습 과정 없이 빠르게 업무에 적응할 수 있게 하는 방식이다.
 그동안 AI 모델 구조나 크기가 다르면 재사용이 거의 불가능한 것으로 여겨졌던 AI의 적응 지식을 모델 종류에 상관없이 정밀하게 전수할 수 있음을 입증한 연구라고 연구팀은 설명했다.
 김현우 KAIST 교수는 “이번 연구를 확장하면 빠르게 발전하는 초거대 언어 모델이 등장할 때마다 반복적으로 수행해야 했던 후학습(post-training) 비용을 크게 줄일 수 있고, 특정 분야 전문 지식을 손쉽게 추가하는 ‘모델 패치’가 가능해질 것”이라고 말했다.
 연구결과는 지난 25일 AI분야 국제 학술대회 ‘AAAI 2026’에서 발표됐다.
 <figure class="figure_frm origin_fig" contents-hash="56f7dd94c467a9e4ba5ee6563382ff57197010e9639a720a6699916dde7a16c2" dmcf-pid="022941vmTh" dmcf-ptype="figure">
 <img alt="김현우(왼쪽부터) KAIST 교수, 이상혁 박사후연구원, 송태훈 석사과정 학생, 박지환 고려대 박사과정생. KAIST 제공." class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/27/dt/20260127165544947cbvx.jpg" data-org-width="604" dmcf-mid="QnAjEQb0Ct" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/27/dt/20260127165544947cbvx.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 김현우(왼쪽부터) KAIST 교수, 이상혁 박사후연구원, 송태훈 석사과정 학생, 박지환 고려대 박사과정생. KAIST 제공.
 </figcaption>
 </figure>
 이준기 기자 bongchu@dt.co.kr
 </section> 
 </div> 
 Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이전

'月결제한도 100만원'…웹보드 규제 풀렸다

01-27
다음

탁구 주천희, 종합선수권 2관왕…한국거래소, 남자단체전 우승

01-27

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

서로 다른 AI 모델 간 ‘지식 이식’…추가 학습 필요 없어

멤버랭킹

관련자료

멤버랭킹