AI 시대 달라진 '백업데이터 활용법'…"데이터레이크 역할까지 뚝딱" 작성일 02-04 20 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="8Rj5pPaelq"> <figure class="figure_frm origin_fig" contents-hash="9043050e8984d65ef23d1d19eb522558d793440ca9e07fcdcc04c313e718df46" dmcf-pid="6eA1UQNdyz" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202602/04/552796-pzfp7fF/20260204154224800bnnh.jpg" data-org-width="640" dmcf-mid="4ZzaEYu5TB" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202602/04/552796-pzfp7fF/20260204154224800bnnh.jpg" width="658"></p> </figure> <p contents-hash="19db98b4522bbc708862dcbd3530922f9fae1fc3a0e53f40da36b8701cacea0f" dmcf-pid="PdctuxjJS7" dmcf-ptype="general">[디지털데일리 김보민기자] 글로벌 데이터 보안 전문기업 코헤시티가 AI 시대에 발맞춰 백업데이터를 데이터레이크처럼 활용할 수 있는 방안을 제시했다.</p> <p contents-hash="259acda26027cca9c92c23674966ee6352f77d1698fce06e24cdfaa82f87f238" dmcf-pid="QJkF7MAiTu" dmcf-ptype="general">장유진 코헤시티코리아 상무는 4일 <디지털데일리>와 공동 주최한 금융 오찬 세미나에서 "그간 백업데이터는 재해복구(DR) 상황에만 쓰이고 평상시에는 사용될 일이 없었다"며 "(투입하는) 비용 대비 효율이 낮다는 인식이 있는 이유"라고 밝혔다.</p> <p contents-hash="8ecb3aa94438d055e56494537caacdf6c0058e43fddf452a6d41a16edb571169" dmcf-pid="xiE3zRcnSU" dmcf-ptype="general">코헤시티는 이러한 고민을 해결하기 위해 클라우드와 온프레미스 환경에서 운용 가능한 엔터프라이즈 AI 어시스턴트 '코헤시티 가이아(Cohesity Gaia)'를 선보였다. 코헤시티 가이아는 자연어 검색으로 비정형 데이터에서 가치를 추출하고 이를 비즈니스 인사이트로 전환하도록 지원할 수 있다. 10년 이상 장기 보관한 데이터나 연구 보관 데이터를 검색 및 분석하기도 한다.</p> <p contents-hash="4c6f3c593ab75c1862f915bb957f32a7619135978a97d02492b7d99d275095d7" dmcf-pid="yZzaEYu5hp" dmcf-ptype="general">장 상무는 "보통 회사에서 'AI를 한번 도입해보자'라는 미션이 주어지면 보통 챗봇 기반 검색이나 요약 솔루션을 떠올린다"며 "하지만 막상 데이터를 모아서 AI 프로젝트를 진행하려고 하면 생각보다 많은 비용이 들고 데이터 수집 과정에서 보안 사고가 발생할 가능성을 마주하게 된다"고 말했다. 연봉 정보 등 특정 열람 권한이 없는 이들에게 데이터가 노출될 가능성이 생긴다는 취지다.</p> <p contents-hash="8d7e770d226a60652db80a23bc99dd3ccaa34438e9a671b2b1d503501aca9906" dmcf-pid="W5qNDG71v0" dmcf-ptype="general">장 상무는 "그 자체만으로 심각한 보안 사고가 될 수 있는 만큼 데이터 거버넌스가 제대로 지켜지고 있는지가 가장 중요하다"며 "코헤시티 데이터 플랫폼 기반으로 운영되는 '가이아'는 일반적인 AI 프로젝트 대비 전처리 과정을 줄여 이미 운영 중인 백업 시스템을 그대로 활용할 수 있다"고 소개했다.</p> <p contents-hash="4689193f5ab710225cebade968dd868fe11793d302ca9c39bbc9fd1d6b57f251" dmcf-pid="Y1BjwHztT3" dmcf-ptype="general">백업데이터에 챗GPT와 같은 생성형 AI 기능을 연계해 사용할 수 있다는 의미다. 현재 다수 AI 프로젝트는 데이터를 업데이트하기 위해 시스템통합(SI) 인력이 지속적으로 수작업을 하는 경우가 많다. 장 상무는 "일반적인 데이터 뱅크 구축은 물론 데이터를 추출, 변환, 적재하는 과정 없이 AI 프로젝트에서 가장 중요한 데이터 품질을 유지하면서 보안 사고 없이 이를 활용할 수 있다"며 "데이터 최신화(모더나이제이션)도 자동으로 이뤄진다"고 소개했다.</p> <p contents-hash="184a9ca532314825eca55b0729a263307d5d5e93faad79833bbc651f9846f600" dmcf-pid="G39ks5b0WF" dmcf-ptype="general">기업 환경에 맞게 활용할 수도 있다. 장 상무는 "일반적인 생성형 AI처럼 요약 기능도 제공하지만 사내 데이터를 기반으로 이메일 작성 등 폐쇄망 환경에서도 주요 작업을 수행할 수 있다"며 "자연어로 질문하면 백업데이터를 기반으로 검색증강생성(RAG)와 대형언어모델(LLM) 엔진이 결합돼 원하는 결과를 도출한다"고 부연했다.</p> <p contents-hash="999ad100b08b497b6a0652b2ee0b20eae9c977a8db860f1b33d642094019d747" dmcf-pid="H02EO1KpTt" dmcf-ptype="general">현재 전 세계 데이터 중 80%는 비정형으로 분류되고 있다. 이와 관련해 장 상무는 "엑셀, 파워포인트(PPT), 텍스트, HTML 등 다양한 데이터를 분석 대상으로 삼을 수 있고 이를 위해 먼저 1차 백업이 이뤄진다"며 "이후 백업 데이터를 기반으로 데이터셋을 만들고 부서 및 권한별로 데이터를 구분해 활용할 수 있다"고 밝혔다.</p> <p contents-hash="33f3b0c2cf349ee5766c386d6df506d513ea4e924e82cd5f5eb166fdfa9da12c" dmcf-pid="XpVDIt9Ul1" dmcf-ptype="general">그러면서 "이렇게 정의된 데이터셋을 벡터DB로 구성하고 자연어 기반 질의를 통해 결과를 얻는 구조"라며 "사내 파일 서버 데이터를 부서나 역할별로 구분해 활용할 수도 있다"고 덧붙였다. 권한은 RBAC(Role-based Access Control)을 기반으로 제어된다. RBAC은 사용자별 접근 가능한 데이터셋을 제한해 민감정보 노출을 방지하는 기술이다.</p> <p contents-hash="8bb0c9471a63f438b339a277adafd51a8ca2a5175038a10cb7f10cbd52783bc4" dmcf-pid="ZUfwCF2uv5" dmcf-ptype="general">장 상무는 "백업데이터 자체가 웜(WORM) 기반으로 보호되기 때문에 데이터 수집 과정에서도 문제가 없다"며 "기존 AI 프로젝트나 코파일럿 환경에 API 형태로 연동하는 것도 가능하다"고 말했다.</p> <p contents-hash="96a72715d9da246e75fd7df2dafe75625da92414a6a6f7743f73a696cb30f409" dmcf-pid="5u4rh3V7SZ" dmcf-ptype="general">환각(할루시네이션) 우려도 줄일 수 있다. 장 상무는 "백업데이터를 기반으로 질의하기 때문에 환각을 최소화할 수 있다"며 "실제 약관 PDF를 기반으로 수수료 등 조건을 요약하거나, 데이터셋을 기반으로 시각화도 가능하다"고 설명했다.</p> <p contents-hash="5521eb11148ab8f9b0e467554a64fcafd5c65d69f3b0f25e05f5233d7cc0114a" dmcf-pid="178ml0fzlX" dmcf-ptype="general">백업 자체가 데이터레이크 역할을 하는 셈이다. 장 상무는 "수년 전 백업데이터라도 출처를 명확히 제시하기 때문에 감사나 검증 용도로 활용할 수 있다"며 "별도 데이터레이크나 복제본 없이 기존 백업데이터를 활용하기에 원본 추적이 가능하다"고 말했다.</p> <p contents-hash="5a40338f47342be19c705e4313bb72496fcace966aba410bd9be6e6ca959ac69" dmcf-pid="tz6sSp4qSH" dmcf-ptype="general">코헤시티는 엔비디아와의 협업 및 투자를 통해 생성형 AI 기술 활용법을 고도화하고 있다. 앞서 젠슨 황 엔비디아 최고경영자(CEO)는 "기업이 개발할 새로운 도구와 애플리케이션에 연료를 공급하도록 돕기 위해 코헤시티와 협력하고 투자하고 있다"고 밝혔다.</p> <p contents-hash="28ecb23c264a0832dc6cab3ac17acdfafd15bdd782995e8521bb415e77fcde6c" dmcf-pid="FqPOvU8BWG" dmcf-ptype="general">한편 코헤시티는 퍼블릭클라우드 환경에서 활용 가능한 'GAIA 서비스형소프트웨어(SaaS)'와 구축형 환경에 특화된 'GAIA 온프레미스'를 강화할 방침이다. 가이아 온프레미스의 경우 올해 3월부터 한국어 지원이 시작된다.</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털데일리. All rights reserved. 무단 전재 및 재배포 금지.</p> 관련자료 이전 클라씨, K팝 히트메이커 엘캐피탄 손잡고 컴백 02-04 다음 최우식이 '6시 내고향'에 왜 나와? 도끼 들고 장작 패기까지 02-04 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.