"생산성 높인다더니 업무시간 더 늘었다"…AI 코딩 툴, 그래도 찾는 이유는? 작성일 07-14 24 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">숙련 개발자 작업 시간 19% 증가…심리적 피로 감소·편의성 증가 호평</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="8rzHm3SgJl"> <p contents-hash="487e62e11d88afc80fa2a63bacc7b73182c3d2b929022a65cdf260713057d833" dmcf-pid="6mqXs0vaLh" dmcf-ptype="general">(지디넷코리아=남혁우 기자)인공지능(AI) 코딩 도구가 소프트웨어(SW) 개발을 더 빠르게 만들어 줄 것이란 기대와 달리 오히려 개발 속도를 늦출 수 있다는 연구 결과가 나왔다.</p> <p contents-hash="e48dc269f59a00959f53de18013c1a65d6f4710a494af5e07fbc07bd88966a30" dmcf-pid="PsBZOpTNMC" dmcf-ptype="general">비영리 연구단체 모델 평가 및 위협 연구(METR)는 'AI가 숙련된 오픈소스 개발자의 생산성에 미치는 영향'을 실험한 결과를 14일 공개했다.</p> <p contents-hash="f750c43927952f4bb953c1c771eafda24ab8369b5729250be88ac4dbbab86d31" dmcf-pid="QOb5IUyjnI" dmcf-ptype="general">이번 연구는 실제 오픈소스 프로젝트에 다년간 기여한 고숙련 개발자 16명을 대상으로 진행됐다. 이들은 평균 수천 건 이상의 커밋을 기록했고 기여한 프로젝트의 총 별점이 2만 개를 넘는 등 실력을 입증받은 인물들이었다.</p> <figure class="figure_frm origin_fig" contents-hash="589b10d7652a260ab8b19aa3d88224080f3e59a62d2a8d0c20e929838ab6fc37" dmcf-pid="xIK1CuWAJO" dmcf-ptype="figure"> <p class="link_figure"><img alt="숙련된 개발자들이 AI개발 도구를 사용한 결과 오히려 생산성이 하락했다(이미지=METR)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/14/ZDNetKorea/20250714102535620vyna.png" data-org-width="638" dmcf-mid="4PZIgyEQdS" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/14/ZDNetKorea/20250714102535620vyna.png" width="658"></p> <figcaption class="txt_caption default_figure"> 숙련된 개발자들이 AI개발 도구를 사용한 결과 오히려 생산성이 하락했다(이미지=METR) </figcaption> </figure> <p contents-hash="aebb44769078ce6d4cb42dda9e39bba279f96fe5129f1d833339969379f7c0ff" dmcf-pid="yVmLfcMURs" dmcf-ptype="general">METR은 이들에게 총 246건의 실제 개발 작업을 맡기고 인공지능 보조 도구를 사용했을 때와 사용하지 않았을 때의 작업 속도를 비교했다.</p> <p contents-hash="268664c163929c9bfe13c84e7b1918c3227179541da2904e42486ca49817453b" dmcf-pid="Wfso4kRuim" dmcf-ptype="general">실험에 활용된 AI 도구는 대표적으로 '커서 프로'라는 AI 통합 개발 환경과 앤트로픽의 대형 언어모델인 클로드 3.5와 3.7이었다. 모두 GPT-4와 함께 최상위 수준으로 평가받는 코딩 특화 모델들이다.</p> <p contents-hash="d4d93d24e6bb0902377087a5be1291c0155b77f4e03dfb593fba60e9a5d20ddf" dmcf-pid="YBkebg8ter" dmcf-ptype="general">비교 결과 개발자 대부분은 작업 전에 AI 도구를 통해 24% 정도 업무 속도가 빨라질 것으로 기대했다. 작업을 마친 뒤에도 개발자들은 체감상 "작업이 약 20% 빨라졌다"고 응답했다.</p> <p contents-hash="0221476b159f81dc3b820f739b4c8f513d08d5f6fb7381bb4e5a71f76f4292f5" dmcf-pid="GbEdKa6FMw" dmcf-ptype="general">하지만 결과는 예상 밖이었다. AI 코딩 도구를 활용했을 때 개발자들의 작업 시간은 평균 19% 증가했다. AI가 작업을 도와준 것이 아니라 오히려 방해가 됐지만, 개발자들은 스스로 생산성이 높아졌다고 느낀 것이다.</p> <p contents-hash="41d353fe64d844fbf838816f65e296f37d8eff1efa094919ab745b4f0caf5eca" dmcf-pid="HKDJ9NP3RD" dmcf-ptype="general">기대했던 성능 향상이 나타나지 않은 이유에 대해 연구진은 AI 도구 사용이 개발 과정에 여러 추가 부담을 유발했기 때문이라고 분석했다.</p> <p contents-hash="b364b0b8c0f2b605bfdfacd371dd28aca056b3d6678a4ee2d4e1aa9b0714bc66" dmcf-pid="X9wi2jQ0ME" dmcf-ptype="general">실험에 사용된 작업은 단순한 코드 작성이 아니라, 실제 개발 현장에서 자주 발생하는 과제들로 구성됐다. 예를 들어 기존 코드의 버그 수정, 새로운 기능 추가, 코드 리팩터링 등 현실적인 난이도와 맥락을 요구하는 작업이 중심이었다. 각 작업은 평균적으로 2시간 정도 소요됐다.</p> <p contents-hash="434a0b7d936ecb7c43a0cd5802e511272dd68f4fcc73f46256b57aebf4b4ae56" dmcf-pid="Z2rnVAxpMk" dmcf-ptype="general">개발자들은 AI에게 문제를 설명하기 위한 프롬프트를 작성해야 했고 AI가 응답할 때까지 기다려야 했다. 이어 나온 AI의 코드 출력을 검토하고, 수동으로 정제하거나 코드베이스에 맞게 수정하는 과정이 필요했다.</p> <p contents-hash="b146dc0142c6e445ae9c64d80bcb25cb31a5c60f83f950e5125fdf235d23ab23" dmcf-pid="5VmLfcMUdc" dmcf-ptype="general">이처럼 프롬프트 작성, 응답 대기, 결과 정제 등 'AI를 다루기 위한 시간'이 전체 작업의 약 9%를 차지했다. 특히 AI가 제안한 코드 중 실제로 채택된 비율은 평균 44%에 불과했다. 절반 이상은 아예 쓰이지 않았거나 전면 수정이 필요했다는 의미다.</p> <p contents-hash="6d3a6334fd570b7ed307ece6103708678a9439e8a9a6cd58ad259eea60748b24" dmcf-pid="1fso4kRuLA" dmcf-ptype="general">AI가 코드의 전반적인 방향을 제시하는 데는 유용했지만, 세부 구현에서는 코드베이스 특유의 문맥을 제대로 반영하지 못한 점도 문제로 지적됐다. 실제 코드 프로젝트는 변수명, 함수 구조, 네이밍 규칙 등 수많은 고유한 규칙과 패턴을 따르는데, AI는 이러한 세세한 부분을 파악하는 데 한계가 있어 사용자가 직접 수정해야 하는 부분이 많아지는 결과로 이어졌다.</p> <p contents-hash="c21109eefdd5fd667752046284a33178cb05078c9bed50cd4f52c2a64c1ee452" dmcf-pid="t4Og8Ee7dj" dmcf-ptype="general">하지만 AI가 전적으로 무용한 것은 아니다. 개발자들은 AI를 사용할 때 '작업이 덜 힘들게 느껴졌다', '심리적인 피로도가 낮았다'는 평가를 내렸다. </p> <p contents-hash="d5935b96f5dba556379b69e3ecf0adc0f35c7cfec2cca839cedc7bbb01410a7a" dmcf-pid="F8Ia6DdzeN" dmcf-ptype="general">연구 결과를 본 뒤에도 대부분의 개발자들은 "앞으로도 AI 도구를 계속 사용할 것"이라고 밝혔다. </p> <p contents-hash="3b8e6dd0a8822f5248c8b9459570785a8ed35212628d8afd1c5eb4351d48dd8c" dmcf-pid="36CNPwJqMa" dmcf-ptype="general">반복적이고 단순한 구현 작업을 스스로 하는 것보다 AI가 어느 정도 초안을 만들어주고 그 결과를 수정하는 편이 더 낫다고 느꼈다는 설명이다. <span>작업 시간이 늘었음에도 생산성이 높아졌다고 느낀 이유 역시 이러한 심리적 요인과 체감 부담 완화가 영향을 준 것으로 분석된다.</span></p> <p contents-hash="fb82d7dc317e8b1bec48d9e81811f9dbabe53ce6c1ce906a8cce31bac333547f" dmcf-pid="0PhjQriBig" dmcf-ptype="general">METR은 이번 연구를 통해 AI 도구가 벤치마크 테스트에서는 뛰어난 성과를 내더라도 실제 현장의 복잡한 개발 환경에서는 그 효과가 제한적일 수 있음을 강조했다. 특히 경험 많은 개발자들이 이미 익숙한 코드베이스에서 작업할 경우 오히려 비효율이 발생할 수 있다는 점을 지적했다.</p> <p contents-hash="fd9715250d64e33b8b4bb67a1d32f806516676149620929954bf93922f1215eb" dmcf-pid="pQlAxmnbJo" dmcf-ptype="general">연구진은 "AI는 몇 분 안에 끝나는 짧은 작업에는 탁월하지만, 몇 시간씩 걸리는 복잡한 개발 과제에서는 여전히 신뢰하기 어렵다"고 밝혔다. 이어 "앞으로는 초급 개발자나 미숙련자가 AI를 활용할 경우 어떤 성과가 나오는지에 대한 후속 연구도 진행할 계획"이라고 말했다.</p> <p contents-hash="4b4e301b6618db34e432dad8563746bb5511e9821175903f0c269edc89132ecc" dmcf-pid="UxScMsLKnL" dmcf-ptype="general">남혁우 기자(firstblood@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p> 관련자료 이전 출연연구기관 혁신서 빠진 항우연·천문연…패싱 논란(종합) 07-14 다음 현대모비스, 학교스포츠클럽 양궁대회 개최…"정식 종목 채택 목표" 07-14 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.