AI 혁신과 특허 데이터 작성일 07-18 5 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">[2025 우수특허대상] 기고</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="VtXZYqiBiq"> <figure class="figure_frm origin_fig" contents-hash="89b465b1f24a34b3c47cc874d1ce6d4b05f87f7b5d16f35684639fbe7d8d8638" dmcf-pid="fFZ5GBnbJz" dmcf-ptype="figure"> <p class="link_figure"><img alt="현성훈 한국특허정보원 원장" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/18/hankooki/20250718014150320gzbb.jpg" data-org-width="413" dmcf-mid="23EDATqydB" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/18/hankooki/20250718014150320gzbb.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 현성훈 한국특허정보원 원장 </figcaption> </figure> <p contents-hash="c61c4f245f0682d84b1d61797165615719fc40ea22880800e3cb6515ed451ae4" dmcf-pid="4351HbLKn7" dmcf-ptype="general">챗GPT의 등장으로 인공지능(AI)은 더 이상 선택이 아닌 필수가 됐다. 구글, 메타 등 글로벌 기업들이 막대한 투자를 이어가며 주도권 경쟁을 벌이고 있는데, 과연 AI의 진정한 경쟁력은 어디에서 비롯될까? 정답은 바로 데이터에 있다. 아무리 정교한 알고리즘이라도 저품질 데이터로는 신뢰할 만한 결과를 얻기 어렵기 때문이다.</p> <p contents-hash="530c194565747319dfc08d20efa207b5312cf7f1d57f1353ccfcac091b9ea028" dmcf-pid="801tXKo9Lu" dmcf-ptype="general">거짓 정보를 사실처럼 만들어내는 ‘할루시네이션(hallucination)’ 문제는 주로 학습데이터의 품질에서 비롯된다. 학습데이터가 부정확하고 편향되어 있거나, 언어 간 문맥 차이를 제대로 반영하지 못할 때 이러한 현상이 발생한다. 특히 국방, 의료, 행정 등 정확성이 핵심인 분야에서는 이런 오류가 치명적인 결과를 초래할 수 있기 때문에 충분한 양의 고품질 데이터 확보가 필수적이다.</p> <p contents-hash="a300c9bafe7fc2f4b521f39642d2e06e91d69214478b608e8cc25f6d77ae6d4c" dmcf-pid="61OIrXVZeU" dmcf-ptype="general">이러한 요구에 부합하는 데이터 자산이 바로 특허 문서다. 기술 문헌이면서 동시에 법률 문서이기 때문에 국제 표준화된 형식으로 여러 필수 항목을 기재해야 한다. 특허청의 사후 심사를 거치므로 데이터로서의 품질과 완결성도 높다. 또한 텍스트, 도면, 표, 화학식 등을 포함하는 멀티모달 데이터로 구성돼 다양한 형태의 AI 학습이 가능하다. 전 세계적으로 매년 약 350만 건의 새 특허가 공개 돼 데이터 규모가 방대할 뿐만 아니라, 각국의 산업구조와 언어 특성까지 반영하고 있다는 점에서 유용하다.</p> <p contents-hash="556d9ff9f2a3742f473b2457153e19125e92e6e719b64d483363b69d73bcc602" dmcf-pid="PtICmZf5np" dmcf-ptype="general">이러한 장점은 통계로도 확인된다. 미국 특허청(USPTO)이 2023년 발표한 보고서에 따르면, 특허 문서를 학습한 AI 모델의 기술 분류 정확도는 기존 50%에서 68%로, 관련 기술 탐지율은 21%에서 79%로 크게 향상되었다. 이는 특허 데이터가 AI 성능 개선에 매우 효과적인 학습 자원임을 보여주는 사례다.</p> <p contents-hash="812e3a98cce2b640304255fe677032c2a46737e41a6972d83715a58c6143dce4" dmcf-pid="QFChs541M0" dmcf-ptype="general">AI가 국가 핵심 인프라로 인식됨에 따라 주요 국가들은 데이터 주권과 기술 자율성에 기반한 ‘소버린 AI (Sovereign AI)’의 중요성을 깨닫고 대응에 나서고 있다. 최근 우리 정부도 소버린 AI 개발 방침을 정하고, 강력한 추진 의지를 밝혔다. 성공적인 소버린 AI 구축을 위해서는 신뢰할 수 있는 고품질 데이터 확보와 개방성을 갖춘 공공 AI 생태계 조성이 선행되어야 한다. 이런 맥락에서 특허 데이터의 중요성이 새삼 주목받고 있다.</p> <p contents-hash="22c3a101f3505714f6726cc3a240d8167fdd59e5143db87b2a43e294fddc4efa" dmcf-pid="x3hlO18td3" dmcf-ptype="general">한국특허정보원은 이미 2018년부터 특허 데이터를 정제·가공해 AI 학습에 활용하고, 민간에 학습데이터를 제공해 왔다. 이러한 경험을 바탕으로 현재 특허청과 함께 ‘산업재산정보 AI 분석 플랫폼’을 구축 중이다. 이 플랫폼은 특허 등 산업재산권 데이터를 다른 경제‧산업 데이터와 연계해 기술 트렌드 분석, R&D 전략 수립, 기술안보 강화에 활용될 예정이다. 특히 글로벌 기술동향을 실시간으로 분석해 정부와 기업의 데이터 기반 의사결정을 지원함으로써, ‘K-소버린 AI’의 한 축을 담당하고자 한다.</p> <p contents-hash="478d67aac90bbcb38bf6ff7a2b16d4a11cf4321f51f557b1d6592ee59598e8fa" dmcf-pid="ya482LloLF" dmcf-ptype="general">전 세계가 AI 데이터 주권을 둘러싼 경쟁에 본격 돌입한 지금, 우리에게 머뭇거릴 시간이 없다. 특허 데이터는 이제 미래 기술을 예측하고 혁신의 방향을 제시하는 핵심 자산이다. 이를 AI와 효과적으로 결합하여 활용한다면, 우리나라의 ‘AI 3대 강국’ 목표 실현에 크게 기여할 수 있을 것이다. 데이터 기반 AI 혁신, 그 중심에 특허가 있다.</p> </section> </div> <p class="" data-translation="true">Copyright © 한국일보. 무단전재 및 재배포 금지.</p> 관련자료 이전 '짜증' 아내 "공주 대접 받아야 마땅"…시어머니도 부려 먹는 '당당함' 07-18 다음 김정난, 연이은 슬픔 .. "생일 스킵하려 했는데" 팬들 생선 쏟아져 감동 07-18 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.