美 언론, AI 학습용 웹 아카이브 수집에 제동

작성일 05-01

<div id="layerTranslateNotice" style="display:none;"></div>  
        <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
         <section dmcf-sid="9b14u9Aiix">
          <p contents-hash="47f8da42a37f6cd5c8b4412746fcd471f32a596ffe225912bdf388b340f5f927" dmcf-pid="2Kt872cnMQ" dmcf-ptype="general">CNN, NBC, USA투데이 등 미국 주요 언론사가 AI 챗봇 학습에 활용되는 웹 아카이브의 콘텐츠 저장 행위에 제동을 걸고 나섰다. 이들 언론은 수십개의 웹사이트에서 콘텐츠를 삭제해 달라는 요청과 함께 AI 학습을 포함한 무단 사용을 금지할 것을 비영리 단체 '커먼 크롤(Common Crawl)'에 촉구했다.</p>
          <div contents-hash="5d4d629c10979584a5cd06864b1dfd3662512efe1601cb8bedebf62b1467bdeb" dmcf-pid="V9F6zVkLRP" dmcf-ptype="general">
           블룸버그 통신은 신문과 잡지를 대표하는 뉴스/미디어 연합(News/Media Alliance)이 29일 커먼 크롤 측에 서한을 보내 이같이 요청했다고 1일(이하 현지시각) 보도했다.
          </div>
          <figure class="figure_frm origin_fig" contents-hash="3dd7fafc201f51b21d884783bbe6b935eaeb3e9ad49c5bc23c500c7d9d630699" data-idxno="442231" data-type="photo" dmcf-pid="f23PqfEoL6" dmcf-ptype="figure">
           <p class="link_figure"><img alt="CNN, NBC, USA투데이 등 미국 주요 언론사가 AI 챗봇 학습에 활용되는 웹 아카이브의 콘텐츠 저장 행위에 제동을 걸고 나섰다. / 제미나이 생성 " class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/01/552810-SDi8XcZ/20260501142308648alld.png" data-org-width="1280" dmcf-mid="K8iIjr0HiM" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/01/552810-SDi8XcZ/20260501142308648alld.png" width="658"></p>
           <figcaption class="txt_caption default_figure">
            CNN, NBC, USA투데이 등 미국 주요 언론사가 AI 챗봇 학습에 활용되는 웹 아카이브의 콘텐츠 저장 행위에 제동을 걸고 나섰다. / 제미나이 생성 
           </figcaption>
          </figure>
          <p contents-hash="a6b7b831e76c4c423d843bbcc07b2594a8c1f37f3076816787dab4c288aae32b" dmcf-pid="4V0QB4Dge8" dmcf-ptype="general">뉴스/미디어 연합은 서한에서 "거대 IT 기업을 포함한 AI 개발자들이 커먼 크롤의 콘텐츠를 상업적 AI 도구 및 제품 개발에 사용하고 있다"며 "이를 통해 회원사들에 상당한 피해를 주고 있다"고 주장했다. 커먼 크롤 측은 해당 서한에 대한 답변을 거부했다.</p>
          <p contents-hash="7ce15d2d857aff08c31643b3f4a7bcc6670dab9564ee5bdd0307e8d718f3436c" dmcf-pid="867e2QsAR4" dmcf-ptype="general">다니엘 코피 뉴스/미디어 연합 회장 겸 CEO는 인터뷰에서 약 3년 전 AI 학습에 커먼 크롤의 데이터가 광범위하게 사용되고 있다는 사실을 인지했다고 밝혔다. 코피 회장은 "허가 없는 콘텐츠 사용을 저작권 위반으로 간주한다"고 말했다.</p>
          <p contents-hash="41e180af3e38c55e6315c87acacf7178a93bf9b84bd2e6d20c075fb3855513c1" dmcf-pid="6PzdVxOcRf" dmcf-ptype="general">2007년 설립된 커먼 크롤은 봇을 이용해 웹상의 데이터를 수집하고 누구나 접근할 수 있는 디지털 아카이브를 구축해 왔다. 오픈AI, 구글, 메타 등은 이 데이터를 이용해 챗GPT 같은 챗봇을 개발했으며 커먼 크롤은 오픈AI와 앤트로픽 등으로부터 기부금을 받기도 했다.</p>
          <p contents-hash="2f619910cdc90918266e1285da5128373acbc704b9677a173e44bba0bef0226e" dmcf-pid="PQqJfMIkLV" dmcf-ptype="general">언론사들은 AI가 콘텐츠를 무단 사용해 웹 트래픽과 광고 수익을 앗아갈 것을 우려하고 있다. 뉴욕타임스(NYT)는 커먼 크롤 데이터가 AI 학습에 기여했다는 점을 지적하며 마이크로소프트(MS)와 오픈AI를 상대로 저작권 침해 소송을 제기했다.</p>
          <p contents-hash="cb54a4b8ba137486c9c2be734b1c9d006a051b7ed0c2f645fff17201b33aea21" dmcf-pid="QxBi4RCEL2" dmcf-ptype="general">반면 악셀 스프링어, 콩데 나스트, 허스트 등 일부 기업은 AI 도구에 콘텐츠를 사용하는 대가로 수익성 있는 라이선스 계약을 체결하기도 했다. 언론계 내에서도 AI 기업과의 협력 방식에 대해 입장이 갈린 것이다.</p>
          <p contents-hash="44aa491c72b627367baa487f9af560b727241ced143039c8c0948db95b661901" dmcf-pid="xMbn8ehDi9" dmcf-ptype="general">커먼 크롤은 웹 수집 대상에서 제외를 요청할 수 있는 거부 등록제를 운영 중이다. 다만 이는 실효성 논란이 제기된다. 지난해 11월 아틀란틱 잡지는 커먼 크롤이 삭제 요청을 무시하거나 유료 결제벽을 우회한다는 의혹을 제기했으나 커먼 크롤은 이를 부인했다.</p>
          <p contents-hash="fb3e7d5572735815be4ca0a0d8bba636033e1118a1da062e409b46ae5abc7876" dmcf-pid="yWr5lG4qLK" dmcf-ptype="general">이광영 기자<br>gwang0e@chosunbiz.com</p>
         </section> 
        </div> 
        <p class="" data-translation="true">Copyright © IT조선. 무단전재 및 재배포 금지.</p>

이전

"웃통 까고 1시간 동안…" 여자교도소 수감 전청조, 여자에게 들이대기도

05-01
다음

아이유-변우석, 혼례식 현장 공개! '대군쀼' 로맨스 2막 시작

05-01

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

美 언론, AI 학습용 웹 아카이브 수집에 제동

멤버랭킹

관련자료

멤버랭킹