[AI픽] 업스테이지, 중국 AI 도용 논란에 정면 반박 작성일 01-02 26 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">"솔라 오픈, 프롬 스크래치로 개발"<br>GLM 파생 의혹에 학습 로그 공개 검증</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="tcbDuTAi1g"> <figure class="figure_frm origin_fig" contents-hash="7692bd9947a6a63b93b45bb2e3b49d2c5317203d2316468d3a1f20dc9f4d7be8" dmcf-pid="FkKw7ycnZo" dmcf-ptype="figure"> <p class="link_figure"><img alt="김성훈 대표 공개 검증 [유튜브 캡처. 재판매 및 DB 금지]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/02/yonhap/20260102160245242ioxo.jpg" data-org-width="500" dmcf-mid="5LKw7ycnGN" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/02/yonhap/20260102160245242ioxo.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 김성훈 대표 공개 검증 [유튜브 캡처. 재판매 및 DB 금지] </figcaption> </figure> <p contents-hash="6099abdadc657d85c6276fee21603eaf388d67234a5c759a6705ab6f9fcda54e" dmcf-pid="3E9rzWkLGL" dmcf-ptype="general">(서울=연합뉴스) 오지은 기자 = 독자 인공지능(AI) 파운데이션 모델 정예팀 중 한 곳인 업스테이지가 중국 모델을 도용했다는 논란이 일자 즉각 사실이 아니라고 반박했다. </p> <p contents-hash="8244847322c9d75cb78ad5d954857c8440c3323378941fe196f138d2f482db25" dmcf-pid="01j3L25Ttn" dmcf-ptype="general">2일 정보통신기술(ICT) 업계에 따르면 고석현 사이오닉AI 최고경영자(CEO)는 지난 1일 소셜미디어(SNS)에 업스테이지의 AI 모델 '솔라 오픈'이 중국 기업 지푸AI의 'GLM-4.5-에어'에서 파생됐다는 게시글을 올렸다. </p> <p contents-hash="675db3dfe67f6505676f42f245da6bb69ec8ad5fc5aa498aa24b6759038a7833" dmcf-pid="ptA0oV1yYi" dmcf-ptype="general">고 대표는 해당 게시글에서 "국민 세금이 투입된 프로젝트에서 중국 모델을 복사해 미세 조정한 결과물로 추정되는 모델이 제출된 건 상당히 큰 유감이다"라고 밝혔다. </p> <p contents-hash="1e24e6e9402ef1308d8b801218b8f0e6604051b715f8ecda99ce3a26332e36f9" dmcf-pid="UFcpgftWZJ" dmcf-ptype="general">고 대표가 올린 보고서는 솔라 오픈과 GLM-4.5-에어의 가중치 구조를 분석했다. </p> <p contents-hash="55d58e2fc77e46e85aa5ae5084fc52aca929be6568148147bfe34e5fa82f6619" dmcf-pid="u3kUa4FYtd" dmcf-ptype="general">리포트는 두 모델을 구성하는 매개변수(파라미터) 유사도를 측정했고, 일부 레이어에서 결정적인 유사도를 발견했다. </p> <p contents-hash="ec4b2049220d8d301753ebc0afc9452e9155e41bbd95e4dba4ef3e5323a09217" dmcf-pid="70EuN83G1e" dmcf-ptype="general">고 대표는 이후 다른 게시글에서 "비교 대상 두 모델의 토큰 임베딩이 사실상 동일한 분포를 가지고 있다고 확인했다"면서도 "이 역시 GLM-4.5-에어와 솔라 오픈이 모델 구조와 학습코드가 거의 동일하기 때문에 동일한 분포를 가진 것으로 판단한다"라고 말했다. </p> <p contents-hash="89e174dcbdf62a98d14cad83d6738d8182d27204200175cdee04f4082014dda0" dmcf-pid="zpD7j60HXR" dmcf-ptype="general">그러면서 "솔라 오픈이 GLM-4.5-에어 모델의 학습코드 대부분을 그대로 가져와서 사용한 건 사실로 판단된다"라며 "물론 AI 연구과정에서 이러한 접근 자체가 드문 일은 아니지만 이런 경우라면 처음부터 출처를 공개하는 게 보통이다"라고 썼다. </p> <figure class="figure_frm origin_fig" contents-hash="e5730a8bdb454dde9719b701c2260dd7a5ea4189f16328e1a8460cf9aa229967" dmcf-pid="qUwzAPpXZM" dmcf-ptype="figure"> <p class="link_figure"><img alt="업스테이지 부스 (서울=연합뉴스) 강민지 기자 = 30일 서울 강남구 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 참석자들이 업스테이지 부스를 둘러보고 있다. 2025.12.30 mjkang@yna.co.kr" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/02/yonhap/20260102160245432hnnx.jpg" data-org-width="1200" dmcf-mid="1VC2rdB3Ha" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/02/yonhap/20260102160245432hnnx.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 업스테이지 부스 (서울=연합뉴스) 강민지 기자 = 30일 서울 강남구 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 참석자들이 업스테이지 부스를 둘러보고 있다. 2025.12.30 mjkang@yna.co.kr </figcaption> </figure> <p contents-hash="8329bc0a2ad598188387e309bb8bfc3e477b84c74990f52b391da46af08d78ea" dmcf-pid="BurqcQUZ5x" dmcf-ptype="general">업스테이지는 즉각 이러한 도용 의혹에 반박했다. </p> <p contents-hash="66e0a9adf72c169ce57747e25b07a61367c94672fbd75fe215cbb225cefad71a" dmcf-pid="bHo5dBGhXQ" dmcf-ptype="general">김성훈 업스테이지 대표는 "솔라 오픈이 중국 모델을 복사해 미세 조장한 결과물이라는 주장은 사실과 다르다"라며 "프롬 스크래치 방식으로 학습됐다"고 해명했다. 프롬 스크래치는 AI 모델 맨 첫 단계부터 모두 직접 구축하는 방식을 말한다.</p> <p contents-hash="277b35bc12dd609367d26ee00c51d168e7e8607019054bebcd7a04629fab627e" dmcf-pid="KXg1JbHltP" dmcf-ptype="general">이어 김 대표는 2일 오후 모델 개발 과정을 공개 검증을 진행했다. </p> <p contents-hash="f57859690ebf95a70cad0cea6aa064980c01869c5bb7fc95536cbc58b349323b" dmcf-pid="9ZatiKXSG6" dmcf-ptype="general">김 대표는 솔라 오픈 학습에 사용한 체크포인트와 WandB(실험 기록)를 공개했다. </p> <p contents-hash="2bbb52e1086094a2849338e457f6e6006e9c5914437576b58b2f0e7b697289a3" dmcf-pid="25NFn9ZvH8" dmcf-ptype="general">김 대표는 공개 검증에서 "프롬스크래치 여부를 판단할 수 있는 여부는 로스인데 로스(Loss)가 높다는 건 처음에 학습이 안 됐다는 것을 의미한다"라며 "솔라 오픈은 초기 높은 로스로부터 학습됐다"라고 말했다.</p> <p contents-hash="1e1792404f51759195f9d482a00da45420fc62e0959c99af84858ca631936d1d" dmcf-pid="V1j3L25TY4" dmcf-ptype="general">이어 김 대표는 "MMLU는 AI 모델의 성능을 나타내는 지표인데 초기 낮은 수치에서 출발해서 학습이 진행될수록 성능이 올라갔다"라고 강조했다.</p> <p contents-hash="dd2e98b1130b4ab08dd4f48af18e04afc4e028cc9ab1c667d6e3f966ae300b26" dmcf-pid="ftA0oV1yXf" dmcf-ptype="general">레이어의 연결고리를 뜻하는 레이어놈(LayerNorm)이 GLM-4.5-에어의 레이어가 유사하다는 주장에 대해 김 대표는 "솔라, GLM, 파이(Pi)의 유사도를 측정했을 때도 높은 값이 나온다"라며 "(사이오닉 AI가 제시한 지표가 아닌) 다른 지표로 보면 솔라와 GLM-4.5-에어는 유사성이 낮다"라고 반박했다. </p> <p contents-hash="feed4e6ebc7f0a568fa2083570b475d421952427522e78e71ed3338a404a9e64" dmcf-pid="4FcpgftWGV" dmcf-ptype="general">또 모델 구조가 유사하다는 주장에 대해서는 "대형언어모델(LLM) 서빙 툴과 생태계 호환성을 확보하려면 구조가 어느 정도 비슷해질 수밖에 없다"라며 "사용성과 호환성을 고려한 설계와 LLM 오픈소스 생태계 교류의 결과다"라고 설명했다.</p> <p contents-hash="39a47af3a2d45b4cb3a98c87fec0b4921dd0f3f1e019a0a52673ff5f8544576d" dmcf-pid="83kUa4FYY2" dmcf-ptype="general">그러면서 "솔라는 밀집 레이어가 없고 GLM은 덴스 레이어가 있어 모델 구조가 다르다"라고 부연했다.</p> <p contents-hash="fbc488c98e3dd8b9a10fe1762c14945b348984fad9baae431d7a421e3e006951" dmcf-pid="60EuN83GZ9" dmcf-ptype="general">김 대표는 "솔라 오픈은 레이어놈을 포함해 모델 전체가 새로운 모델이다"라며 "솔라 오픈은 다른 모델의 파생이 아닌 프롬 스크래치로 만든 모델이다"라며 재차 강조했다. </p> <p contents-hash="c736b743c55949c2356483ecf05e4afa9765b0f0c42c38370777b1d7f58030df" dmcf-pid="PVv8IL2uYK" dmcf-ptype="general">built@yna.co.kr</p> <p contents-hash="7e7048d575db26eefa9ab29a6665741e792bd119f82bdc54841cf9067b209dd3" dmcf-pid="x4yPhgfzHB" dmcf-ptype="general">▶제보는 카톡 okjebo</p> </section> </div> <p class="" data-translation="true">Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지</p> 관련자료 이전 “마지막 키스? 어제” 하희라♥최수종에 김영옥도 “별종”(옥문아) 01-02 다음 한국 관측망이 포착한 ‘나홀로 행성’…거리·질량 측정한 첫 사례 01-02 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.