딥시크, AI 효율 높이는 새 설계 공개...내달 또 세상 놀래키나 작성일 01-02 47 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="fSdV73hD1x"> <figure class="figure_frm origin_fig" contents-hash="b1ca5f938ea668c62a7bb2d01e63215f8fcb2c643c2c681ee51922aae6c83398" dmcf-pid="4vJfz0lwHQ" dmcf-ptype="figure"> <p class="link_figure"><img alt="딥시크 로고. /로이터 연합뉴스" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/02/chosun/20260102182508595flid.jpg" data-org-width="1200" dmcf-mid="VZEiPV1yGM" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/02/chosun/20260102182508595flid.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 딥시크 로고. /로이터 연합뉴스 </figcaption> </figure> <p contents-hash="01482d0c92ed85a54647095355936b3a824ec5d9c17db351bf1a32ab440b9e31" dmcf-pid="8Ti4qpSr5P" dmcf-ptype="general">중국 인공지능(AI) 스타트업 딥시크가 AI 개발 효율성을 높일 수 있는 새로운 연구를 공개했다. 량원펑 딥시크 최고경영자(CEO)가 연구에 참여했다. 올해 초 저비용 고성능 AI 모델로 세상을 놀라게 했던 딥시크가 다시 한번 효율성을 높이는 새로운 AI 설계를 공개한 것이다. 테크 업계에서는 내달 딥시크가 출시할 새로운 AI 모델이 또 한 번 혁신을 일으킬지 주목하고 있다.</p> <p contents-hash="80ce54aff35ba71bd11639294f0024acfdcd99f5f70245ab3b173991b37de778" dmcf-pid="6yn8BUvmG6" dmcf-ptype="general">장원펑 CEO 등 딥시크 직원 19명으로 구성된 연구팀은 지난달 31일(현지 시각) ‘매니폴드 제한 하이퍼커넥션(mHC)’이라는 제목의 논문을 사전 출판 사이트 아카이브(arxiv)에 공개했다. 딥시크는 이처럼 논문을 통해 주요 모델의 출시를 예고해왔다. 장원펑 CEO가 논문 저자로 이름을 올렸다는 점에서, 이번 연구가 차기 모델에 반영될 가능성이 적지 않다는 분석이다.</p> <p contents-hash="93083e7b725219eb5b2f587fe44974798c7ec3223c9e58bfcf62e454e19c496a" dmcf-pid="Pm6ztHwat8" dmcf-ptype="general">AI의 학습은 정보를 여러 층(레이어) 사이로 전달하는 과정이다. 기존에는 정보가 왜곡되지 않도록 한 줄로 정보를 전달하는 방식을 사용했다. 차선 1개만을 이용해 학습을 시킨 것이다. 2024년 바이트댄스는 학습 성능을 높이기 위해 정보 전달 통로를 넓히고 여러 개로 늘린 ‘하이퍼커넥션’ 방식을 제안했다. 성능은 높아졌지만, 차선이 너무 많아지면서 학습이 멈추거나 망가지는 현상이 발생했다. 딥시크 연구진이 공개한 mHC 방식은 차선을 4배로 늘렸음에도, 모든 차선에 속도 제한을 걸고 교차로의 차량 수를 일정하게 유지하는 방식이다.</p> <p contents-hash="a1ae010d0474e683a855eb94ae38f44cbbfccb5cfdfc4e12efd42f9dd7cf75fa" dmcf-pid="QsPqFXrNZ4" dmcf-ptype="general">딥시크는 mHC 방식을 사용한 결과, 일반 방식이나 HC 방식보다 각종 벤치마크에서 높은 성적을 냈다고 밝혔다. 연결 통로를 4배로 늘렸지만 실제 학습 시간은 6.7% 늘어나는 데 그쳤다. 딥시크는 여러 개의 작은 계산 과정을 하나로 묶어 그래픽처리장치(GPU)가 쉬지 않고 일하게 했고, 필요할 때만 다시 계산하는 방식을 써 메모리 병목을 줄였기 때문이라고 밝혔다.</p> <p contents-hash="1e5d86c471d70ead0f0513cadb77c4785ce400d9f607a31229fb3b7037190249" dmcf-pid="xOQB3Zmj1f" dmcf-ptype="general">중국 AI 업계는 소프트웨어 기술과 최적화로 AI 성능을 높이기 위해 분투하고 있다. 미국의 제재로 첨단 GPU를 확보하기 어렵기 때문이다. 테크 업계에서는 딥시크가 2월 중순 출시할 것으로 예상되는 차세대 AI 모델 R2의 성능과 효율에 주목하고 있다. ‘딥시크 쇼크’를 일으킨 R1 모델 역시 지난해 1월 춘절 직전에 공개됐다.</p> </section> </div> <p class="" data-translation="true">Copyright © 조선일보. 무단전재 및 재배포 금지.</p> 관련자료 이전 애플, XR 헤드셋 ‘비전 프로’ 생산·마케팅 축소...‘스마트 안경’으로 선회하나 01-02 다음 "답답한 생각이 많았었다" 안세영의 솔직 고백…좌절을 원동력으로 바꿨다, 8월 아픔 딛고 최강자 군림 01-02 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.