
[산업일보]
AI(인공지능)·디지털 시대가 심화되면서, ‘데이터’를 차지하기 위한 경쟁도 치열해지고 있다.
1998년 발매 이후 지금까지 꾸준한 사랑을 받는 실시간 전략 게임(RTS) ‘스타크래프트(StarCraft)’ 시리즈는 다양한 전략으로 적을 제압하는 게임이다.
전략을 세우고 실행하려면 기지를 확장하고 유닛을 모아야 하는데, 이 때문에 가장 처음 생각해야 하는 전략이 ‘자원 수집’이다.
흔히 ‘빌드’라고 불리는 전략들을 살펴보면 대개 ‘미네랄’ 자원을 수집하다가, 일꾼 유닛을 몇기 생산했을 때 또는 게임 시작 후 몇 초가 지났을 때 ‘베스핀가스’ 자원을 수집해야 한다. 이 타이밍이 늦으면 전략에 필요한 유닛·건물을 보유하지 못해 게임에서 승리할 가능성이 낮아진다는 것이다.
스타크래프트에서처럼, 각국은 다른 나라보다 우수한 AI 기술·서비스를 확보하기 위해 노력하고 있다. 한국처럼 ‘국가전략기술’으로 지정하고, 정부 주도로 AI 산업 육성에 나서기도 한다.
AI의 우수성을 가르는 기준은 여러 가지가 있지만, 여러 전문가는 결국 ‘데이터’를 강조한다. AI를 학습시키고 고품질의 결과를 생성하게 하려면 ‘대량의, 좋은’ 데이터가 필요하다는 것이다.
AI 기업들은 다양한 환경에서 양질의 데이터를 수집하는데 집중하고 있다. AI의 정확성과 신뢰도를 높여, 서비스의 경쟁력 향상으로 직결되기 때문이다.

자율주행 기술을 개발하는 기업은 실제 도로에서 발생할 수 있는 다양한 변수와 특이 상황을 포함한 방대한 데이터를 축적하고 있다. 한국자동차 연구원은 지난 7월 개최된 ‘2024 자율주행·모빌리티산업전(AME 2024)’에서 자율주행 데이터를 수집하는 ‘ViLS’ 플랫폼을 선보이기도 했다.
의료 분야에서는 여러 치료 기록·영상데이터 등을 모아 ‘AI 진단 모델’을 개발 중이며, 금융 업계에서는 고객의 소비 패턴·신용 점수·거래 이력과 같은 데이터를 분석해 맞춤형 금융 상품을 설계하거나 사기 탐지 모델을 개선하기도 한다.

제조업에서는 예지보전·프로세스 및 품질 최적화·프로세스 자율 및 자동화 제어 영역에서 데이터 수요가 증가하고 있다. ‘(주)엣지크로스(EdgeCross)’는 이러한 추세에 발맞춰, 10월 열린 ‘한국전자전 2024(KES 2024)에서 오래된 산업용 기계장비의 데이터를 수집할 수 있는 AIoT 디바이스 기반 머신 DX(Digital Transformation) 솔루션을 소개했다.
이러한 데이터는 ‘디지털 시대의 석유’가 될 전망이다. 풍부한 데이터 생산 능력을 갖춘 기업은 남들보다 유리한 고지에서 AI 개발을 진행할 수 있다. 데이터 자산화에 필요한 시간과 노력을 줄일 수 있기 때문이다.
또는, ‘남들이 가지지 못한’ 데이터를 독점하는 서비스를 내놓을 수도 있다. 가령, 20년 넘게 산업 기계·소재·부품·장비의 중고거래를 중개한 데이터를 기반으로 ‘산업 중고거래 특화 AI’ 서비스를 선보이는 식이다.
아니면 AI 기업에 데이터를 제공하고 대가만 얻을 수도 있다. 요즘 기사 하단부를 살펴보면, ‘AI 학습 및 활용 금지’라는 문구가 적혀있는 매체들이 늘어나고 있다. 데이터 제공에 따른 대가, 데이터의 ‘재산권’을 적극적으로 주장하고 있는 것이다.
과학기술정보통신부와 한국데이터산업진흥원이 2023년 하반기에 실시하고 올해 발표한 ‘2023 데이터 산업 현황조사’ 보고서에 따르면, 2023년 한국 데이터산업 시장규모는 25조 9천693억 원으로 전년보다 13.4% 성장했다.

부문별로는 ‘데이터 판매 및 제공 서비스업’이 13조 3천352억 원으로 전체 시장의 49.1%를 차지했다. ‘데이터 구축 및 컨설팅 서비스업’은 9조 3천268억 원으로 34.3%, ‘데이터 처리 및 관리 솔루션 개발·공급업’은 4조 4천894억 원으로 16.5%였다.
보고서는 지난 5개년 연평균 성장률이 12.7%로, 데이터산업 시장이 지속적으로 성장한다면 2028년 49조 원 규모를 넘어설 것이라고 전망했다.
석유처럼, 데이터의 ‘고갈’을 경고하는 목소리도 나온다. 정확히는, AI가 학습하고 기반으로 삼을 양질의 데이터가 모자란다는 것이다.
소프트웨어정책연구소(SPRi)가 발표한 ‘AI인프라에서 AI서비스로 : SW기업의 AI도입 모델과 신서비스 모델의 탐색’보고서는 AI의 원료에 해당하는 데이터 확보를 위해, 당장의 수익화보다 데이터 확보 목적의 서비스를 제공하거나 공공 데이터를 활용하는 등의 방법을 모색해야 한다고 밝혔다.
보고서의 설명처럼, AI 기업들은 경품이 걸린 ‘데이터 수집 이벤트’를 열거나 AI 학습 데이터를 AI로 생성하는 ‘합성 데이터’ 기술에 주목하고 있다. 심지어, 미국의 한 자율주행 AI 개발기업은 게임 ‘GTA5’를 통해 AI를 훈련하고 있다고 전하기도 했다.
AI시대, 데이터의 가치는 점차 중요해질 것이다. 우리 기업이 가지고 있는, 또는 생산 가능한 데이터가 무엇이며 어떻게 활용할 것인지에 대한 전략적 고민이 요구된다. 기업이 보유 중인 데이터의 가치를 제대로 인식하고 차별화된 경쟁력을 확보하는 것이 무엇보다 중요한 때다.