숭실대 권민혜 교수 연구팀, 자율주행차 ‘오프라인-투-온라인 강화학습’ 기반 기술 개발 작성일 09-03 30 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="u8stuVmehl"> <figure class="figure_frm origin_fig" contents-hash="18c21a3b6444292a1c2fc36f43d8cc0ab83dfd4a31bd9ddd2f6268287eae5c8c" dmcf-pid="7xhpB6Cnyh" dmcf-ptype="figure"> <p class="link_figure"><img alt="권민혜 숭실대 교수" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202509/03/dt/20250903092548796lkav.jpg" data-org-width="331" dmcf-mid="UzPksy6FhS" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202509/03/dt/20250903092548796lkav.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 권민혜 숭실대 교수 </figcaption> </figure> <p contents-hash="7d7dff3773818f3bfae6c6d1e492b0302a61acf1d8329a1abf21357c1a25c8f5" dmcf-pid="zMlUbPhLvC" dmcf-ptype="general"><br> 숭실대학교는 전자정보공학부 권민혜 교수 연구팀이 자율주행차 학습 과정에 ‘오프라인-투-온라인 강화학습(Offline-to-online Reinforcement Learning)’ 방식을 적용한 새로운 인공지능 기술을 개발했다고 3일 밝혔다.<br><br> 이번 성과를 통해 자율주행차가 실제 도로 주행에서 무한히 많은 데이터를 수집하지 않아도, 소량의 추가 데이터만으로 성능을 보정하고 보다 안전하게 진화할 수 있을 전망이다.<br><br> 기존 자율주행 인공지능은 고속도로, 톨게이트, 차선 합류 구간 등 특정 상황에 맞춰 설계되는 경우가 많아 새로운 환경에 직면하면 성능이 급격히 저하되는 한계가 있었다. 연구팀은 이러한 문제를 해결하기 위해 통합 의사결정 모델을 제안했다. 이 모델은 단일 정책(policy)으로 다양한 주행 환경을 학습할 수 있어, 주행 상황이 달라져도 안정적이고 유연한 대응이 가능하다.<br><br> 또한, 연구팀은 강화학습 기반 자율주행 AI가 방대한 도로 주행 데이터를 필요로 해 비용 부담과 안전사고 위험이 따른다는 한계에 주목했다. 이를 보완하기 위해 일부 기업들이 오프라인 학습(offline Reinforcement Learning) 방식을 활용하고 있었지만, 데이터의 제약으로 성능 향상에는 한계가 있었다.<br><br> 권 교수 연구팀은 이러한 한계를 극복하기 위해 오프라인-투-온라인 강화학습 방식을 도입했다. 차량은 기존에 축적된 데이터로 기본 주행 능력을 학습한 뒤, 실제 주행에서 확보한 소량의 추가 데이터만으로도 성능을 즉시 보정할 수 있어, 이에 따라 대규모 데이터를 새로 수집하지 않고도 정교하고 안전한 주행이 가능해졌다.<br><br> 특히, 연구팀은 ▲Q함수 재초기화 ▲Q적응 ▲정책 분산 재초기화라는 세 가지 핵심 기술을 적용해, 온라인 보정 단계에서 흔히 발생하는 불안정한 성능 저하를 막고 안정적인 성능 향상을 달성해냈다. 시뮬레이션 결과, 연구팀이 개발한 기술은 기존 강화학습 방식에 비해 주행 안전성과 효율성 모두 향상됐으며, 데이터 품질이 낮아도 안정적인 성능을 유지해 상용 자율주행차에도 바로 적용할 수 있는 가능성을 보여줬다.<br><br> 권민혜 교수는 “이번 연구는 자율주행차가 단 한 번에 완벽해지지 않아도, 실제 운행 중 확보한 소량의 데이터만으로 지속적인 보정과 발전이 가능하다는 점에서 의미가 크다”며 “피지컬AI 시대에 필수적인 ‘학습 비용 절감’과 ‘안전성 강화’라는 두 가지 목표를 동시에 충족시킬 수 있을 것”이라고 강조했다.<br><br> 한편, 이번 연구는 「Scenario-Free Autonomous Driving With Multi-Task Offline-to-Online Reinforcement Learning」라는 제목으로 상위 2%의 국제 저명 학술지 ‘IEEE Transactions on Intelligent Transportation Systems’ 9월호에 게재됐다.<br><br> 전미진 기자 junmijin83@dt.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털타임스. 무단전재 및 재배포 금지.</p> 관련자료 이전 카카오, ‘AI 네이티브’ 인재 확보…‘AI 플랫폼 기업’ 전환 가속화 09-03 다음 PBA 1~3차 투어 우승자 전원 64강 진출… 조재호도 생존 09-03 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.