똑똑한 AI, 실수하는 이유는 '구조'…테크기업들이 주목한 '에이전트 하네스' 작성일 04-13 44 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="xButio3G0s"> <figure class="figure_frm origin_fig" contents-hash="983d5f38e8f1d7f84511acf7602cd3020bb49f22b5d0f08defa12f89ba9001d3" dmcf-pid="ywcoZtae7m" dmcf-ptype="figure"> <p class="link_figure"><img alt="왼쪽부터 앤스로픽, 랭체인 로고. 앤스로픽, 랭체인 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/13/dongascience/20260413134145818zqug.jpg" data-org-width="680" dmcf-mid="Q2vOb2CEFO" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/13/dongascience/20260413134145818zqug.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 왼쪽부터 앤스로픽, 랭체인 로고. 앤스로픽, 랭체인 제공 </figcaption> </figure> <p contents-hash="ef941249d275bfcdab0210e922f433be0933f15168f037b7888e39ded043a299" dmcf-pid="Wrkg5FNdFr" dmcf-ptype="general">인공지능(AI)이 아무리 똑똑해져도 긴 작업을 끝까지 완수하려면 작업 순서를 짜주고 도구 사용 권한을 주고 중간에 실수를 잡아주는 구조가 필요하다. 2026년 들어 테크 기업들은 어떤 모델을 쓰느냐보다 모델을 어떤 구조 안에서 돌리느냐가 성패를 가른다는 사실에 주목하기 시작했다. AI 모델을 둘러싼 실행 환경과 제어 구조를 '에이전트 하네스'라 부른다.</p> <p contents-hash="12f7dada10e1e373ada5e5f100fa560c2e401276a64ddda3ad750f7f1eb1c96b" dmcf-pid="YmEa13jJFw" dmcf-ptype="general">앤스로픽, 랭체인 등 주요 AI 기업이 올해 3~4월 잇따라 하네스 설계와 관련된 글을 발표하면서 '하네스 엔지니어링'이 업계의 핵심 화두로 떠올랐다. 앤스로픽은 AI 모델 '클로드'를 개발한 미국 AI 기업, 랭체인은 AI 에이전트 개발 도구를 만드는 소프트웨어 기업이다. AI 에이전트는 사람의 개입 없이 스스로 판단하고 도구를 활용해 작업을 수행하는 AI 시스템을 말한다. </p> <p contents-hash="502cd90e030612d1a03f9bd649961479dbcb21080bce2aefa5f4638a9c4ab87a" dmcf-pid="GsDNt0AiUD" dmcf-ptype="general">'에이전트 하네스'는 AI 모델 바깥의 모든 실행 환경과 제어 구조를 가리킨다. 하네스는 원래 말의 몸에 씌우는 마구를 뜻한다. 말이 아무리 힘이 세도 마구 없이는 마차를 끌 수 없는 것처럼 AI 모델도 하네스 없이는 복잡한 작업을 완수하기 어렵다. 하네스로 AI에게 작업 순서를 지정하고 외부 도구나 파일시스템에 접근할 권한을 부여해 중간에 발생하는 실수를 감지 후 되돌리는 소프트웨어 구조다.</p> <p contents-hash="23bd3516736fb3be82f4048ca5cd22ac12233d4b838efc6d21acafd2009bb63e" dmcf-pid="HqU1JLFY3E" dmcf-ptype="general">랭체인의 비벡 트리베디는 지난달 10일(현지시간) 자사 블로그를 통해 "AI 모델이 아닌 나머지 전부가 하네스"라고 정의했다. AI에게 내리는 지시문부터 파일을 저장하는 공간, 외부 도구를 연결하는 방식까지 모델을 둘러싼 모든 소프트웨어 구조가 하네스에 해당한다는 뜻이다. 트리베디는 같은 AI 모델로 하네스만 바꿔 코딩 성능 평가에서 순위를 30위권 밖에서 5위권으로 끌어올렸다고 밝혔다.</p> <p contents-hash="82055f922be6e2fd497b099931f1f80abc2df1c130742df8c540875e8052cc45" dmcf-pid="XButio3Gpk" dmcf-ptype="general">앤스로픽도 구체적 비교 결과를 제시했다. 지난달 24일 공개한 블로그 글에서 프리트비 라자세카란 앤스로픽 연구원은 동일한 프롬프트로 AI 단독 작업과 하네스를 갖춘 AI의 결과물을 비교했다. AI 혼자 20분 만에 만든 2D 게임 제작 도구는 겉보기엔 그럴듯했지만 핵심 기능인 게임이 작동하지 않았다. 하네스를 적용한 AI는 기획·제작·검증 에이전트 세 개를 조합해 6시간에 걸쳐 실제로 플레이할 수 있는 앱을 완성했다.</p> <p contents-hash="af03a61a775328696ffc1278bfcbc7c7d2c73149597f0b203b431b4196da49a2" dmcf-pid="Zb7Fng0Huc" dmcf-ptype="general">앤스로픽은 8일(현지시간) 하네스 설계를 한 단계 발전시킨 '매니지드 에이전트' 서비스를 공개했다. 랜스 마틴 앤스로픽 기술연구원 등은 같은 날 자사 블로그를 통해 하네스 설계를 한 단계 발전시킨 '매니지드 에이전트' 서비스를 소개했다. </p> <p contents-hash="91aeca9764bbe64872f41c544413697a40dbdade1d6e7ce15c4aa5fa4afdf3d6" dmcf-pid="5Kz3LapXFA" dmcf-ptype="general">핵심은 AI 모델과 실행 환경의 분리다. 앤스로픽은 AI 모델을 생각하는 '두뇌', 코드를 실행하고 파일을 저장하는 작업 환경을 실제로 손발을 움직이는 '손'에 비유했다. 기존에는 두뇌와 손이 하나로 묶여 있어 작업 환경이 멈추면 AI 전체가 중단됐다. </p> <p contents-hash="823015c0cbba3ba0a93f8ceca72877b04c48c51349800c081fc6590e22649417" dmcf-pid="19q0oNUZ0j" dmcf-ptype="general">AI 모델과 작업 환경을 분리하자 한쪽에 문제가 생겨도 다른 쪽이 독립적으로 복구할 수 있게 됐다. 사용자가 첫 응답을 받기까지 걸리는 시간도 최대 90% 이상 단축됐다. AI 에이전트가 수 시간에 걸쳐 복잡한 작업을 자율적으로 수행하려면 필수인 중간에 멈추지 않는 안정성을 마련한 셈이다.</p> <p contents-hash="47bbb534aff46c2fffa3fe5f0a5c278420dac407fcffcf1acec478e30c684adb" dmcf-pid="t2Bpgju5uN" dmcf-ptype="general">새 모델이 나올 때마다 하네스를 재점검해야 한다는 과제도 남아 있다. 하네스는 현재 모델이 못하는 것을 전제로 설계되기 때문에 모델이 발전하면 기존 보완 기능이 쓸모없어질 수 있기 때문이다. 라자세카란 연구원은 "새 모델이 나올 때마다 하네스를 재점검해 불필요한 부분을 걷어내고 새로운 가능성을 추가하는 것이 좋을 것"이라고 밝혔다.</p> <p contents-hash="134b1cde7299035650d0d0761c1788b9275ac52a65384937da9fecf031280069" dmcf-pid="FVbUaA710a" dmcf-ptype="general">트리베디는 "모델이 좋아질수록 하네스 일부는 모델에 흡수되겠지만 잘 구성된 환경과 검증 루프는 모델의 기본 지능과 무관하게 효율을 높인다"며 "하네스 엔지니어링은 계속 유효할 것"이라고 밝혔다. AI가 스스로 더 많은 일을 해내더라도 작업 환경을 잘 설계하면 성능이 추가로 올라간다는 전망이다.</p> <p contents-hash="dea55b0037b314c51fc48e0ba0542366a89f0857018b4c91a59cc50108fef0f3" dmcf-pid="3fKuNcztzg" dmcf-ptype="general">[임정우 기자 jjwl@donga.com]</p> </section> </div> <p class="" data-translation="true">Copyright © 동아사이언스. 무단전재 및 재배포 금지.</p> 관련자료 이전 '방과후 태리쌤', 따뜻한 온기 전한다..팝업 수익금 일부 기부 04-13 다음 크래프톤도 가세한 UGC…게임 '수명 연장' 핵심 카드로 부상 04-13 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.