애피어, AI ‘거짓 답변’ 막는 정량 평가 기술 발표...엔터프라이즈 신뢰성 강화

작성일 03-12

<div id="layerTranslateNotice" style="display:none;"></div>  
        <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
         <section dmcf-sid="HOps9F8BSR">
          <figure class="figure_frm origin_fig" contents-hash="5d165d7ce7cbb6bd37d191a6f1afa5701a5be4f600f6aa7d22753b97a59121b1" dmcf-pid="XIUO236blM" dmcf-ptype="figure">
           <p class="link_figure"><img alt="애피어가 에이전틱 AI 시스템의 신뢰성을 높이기 위한 새로운 연구성과를 발표했다. 이번 연구는 다양한 리스크 조건에서 거대언어모델(LLM)의 의사결정을 정량적으로 평가하는 프레임워크를 제시하며, 기업 환경에서 보다 신뢰할 수 있는 AI 도입 방향을 다뤘다. &lt;사진=미드저니&gt;" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202603/12/mk/20260312082401720jonp.png" data-org-width="700" dmcf-mid="GPE4hAyOSe" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202603/12/mk/20260312082401720jonp.png" width="658"></p>
           <figcaption class="txt_caption default_figure">
            애피어가 에이전틱 AI 시스템의 신뢰성을 높이기 위한 새로운 연구성과를 발표했다. 이번 연구는 다양한 리스크 조건에서 거대언어모델(LLM)의 의사결정을 정량적으로 평가하는 프레임워크를 제시하며, 기업 환경에서 보다 신뢰할 수 있는 AI 도입 방향을 다뤘다. &lt;사진=미드저니&gt;
           </figcaption>
          </figure>
          <div contents-hash="1d9d42f06bbc677e33211523193045e20698a64517102fbb8e2ac0e72c5ec7b5" dmcf-pid="ZCuIV0PKyx" dmcf-ptype="general">
           글로벌 에이전틱 인공지능(AI) 비즈니스 솔루션 전문기업 애피어가 에이전틱 AI 시스템의 신뢰성을 높이는 새로운 연구결과를 발표했다. 이번 연구는 기업들이 AI를 실무에 도입할 때 가장 큰 걸림돌로 꼽는 AI 환각(잘못된 답변)과 의사결정 불안정성 문제를 정량적인 수치로 해결할 수 있는 방법론을 제시했다.
          </div>
          <p contents-hash="f75007f8891dc5c50d50f267775f70bbf4608fa77b864c4c64d3e9b1cac4e1ca" dmcf-pid="5h7CfpQ9TQ" dmcf-ptype="general">12일 애피어에 따르면 애피어 AI 리서치팀은 최신 논문 ‘답할 것인가, 거절할 것인가, 추측할 것인가? 언어모델의 리스크 인지 의사결정(Answer, Refuse, or Guess? Investigating Risk-Aware Decision Making in Language Models)’을 통해 다양한 위험 상황에서 AI 언어모델이 어떻게 의사결정을 내리는지 체계적으로 측정할 수 있는 평가 프레임워크를 제시했다. 이는 기존의 단순 정답률 평가 방식에서 나아가 AI가 답변에 따른 보상과 오답에 따른 페널티를 수치화해 계산하고 ‘답변하기’, ‘거절하기’, ‘추측하기’ 중 가장 이득이 되는 선택을 스스로 내리게 만드는 방식이다.</p>
          <p contents-hash="fe06f4a2b8b30c6d7e2da7e75cff9c59a5979c74f5c33e3313b2ce4a1d0af486" dmcf-pid="1lzh4Ux2yP" dmcf-ptype="general">특히 기업 환경에선 AI의 사소한 오답이 막대한 금전적 손실이나 브랜드 이미지 타격으로 이어질 수 있다. 애피어는 이를 막기 위해 의사결정 과정을 과업 실행, 확신도 추정, 기대 가치 추론의 세 단계로 나누는 ‘스킬 분해(Skill Decomposition)’ 접근법을 제안했다. 이같은 구조화된 추론 과정을 거치면 모델은 자신이 잘 모르는 분야에 대해 무리하게 답하는 대신, 리스크를 계산해 답변을 거절하는 등 훨씬 합리적이고 안정적인 판단을 내릴 수 있게 된다.</p>
          <p contents-hash="0b5ace041d9946dd47ae3d59326a55cfada2273acac622170f3ad615fbc4a5e4" dmcf-pid="t2j9sglwC6" dmcf-ptype="general">치한 위 애피어 최고경영자(CEO) 겸 공동창업자는 “에이전틱 AI가 기업의 핵심 업무에 도입되기 위해서는 AI를 더 똑똑하게 만드는 것뿐만이 아니라, 자율적 의사결정의 신뢰도를 높이는 게 중요하다”면서 “거대언어모델(LLM)의 리스크 인지 능력을 수치화된 방법론으로 구현한 이번 연구는 신뢰할 수 있는 엔터프라이즈 AI의 기반을 강화하고, 에이전틱 AI가 실제 비즈니스 가치와 투자수익률(ROI)로 연결되도록 지원할 것”이라고 말했다.</p>
          <p contents-hash="007e262131c64fc4252db16b308bf15cde0f4d58b2901f4af2f9b773cfb8407e" dmcf-pid="FVA2OaSrS8" dmcf-ptype="general">한편 이 연구 성과는 현재 애피어의 애드(Ad) 클라우드, 개인화 클라우드, 데이터 클라우드 등 주요 에이전틱 AI 기반 플랫폼에 통합돼 기업들이 보다 신뢰 가능하고 안정적인 방식으로 자율형 워크플로우를 고도화할 수 있도록 지원하고 있다. 애피어는 앞으로도 독자적인 데이터 자산과 연구 역량을 바탕으로 기업들이 신뢰할 수 있는 AI 기반 운영 체계를 구축할 수 있도록 지원할 계획이다.</p>
         </section> 
        </div> 
        <p class="" data-translation="true">Copyright © 매일경제 &amp; mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지</p>

이전

위메이드맥스, 개발 체제 재편… 핵심 프로젝트 중심 경쟁력 강화

03-12
다음

포스텍, 전기음성 매트릭스 활용한 양자점의 표면유기분자 정밀 분석

03-12

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

애피어, AI ‘거짓 답변’ 막는 정량 평가 기술 발표...엔터프라이즈 신뢰성 강화

멤버랭킹

관련자료

멤버랭킹