[산업일보]
한국저작권위원회(이하 위원회)가 ‘2024 메타버스 엑스포(METAVERSE EXPO 2024)’에서 ‘인공지능 원천데이터’ 무료 공유 사업을 소개했다.
위원회가 제공하는 인공지능(AI) 원천데이터는 AI 학습에 필요한 데이터로, 수집 비용 및 저작권 걱정 없이 산업계에서 활용할 수 있다. 위원회가 2012년부터 운영 중인 ‘공유마당’ 웹사이트에서 확인 가능하다.
위원회는 2022년부터 작년까지 ▲자율주행 인공지능 원천데이터 ▲방송 음성 기반 말뭉치 원천데이터 1 ▲방송 음성 기반 말뭉치 원천데이터 2 ▲상황별 한국어-영어 대화문 데이터 ▲일상생활 및 전문용어 수어 영상 데이터 ▲인공지능을 위한 한국형 저작물 이미지▲유해 화학물질 영상 데이터 ▲생활용품 이미지 데이터, 총 8개 원천데이터 700만 8천 783건을 공유했다.
올해 하반기에는 태권도 품새 데이터 3종·조선의 5대 궁궐 및 종묘 건축물 이미지 데이터·한국적 웹툰 이미지 데이터·한국전통 민화 데이터 4종을 구축하고 공개할 예정이다.
위원회의 조혜인 선임은 “AI를 활용하는 산업계에서 한국형 데이터가 모자라, AI가 중국·일본 풍 결과물을 생성하거나 오류가 발생하는 등 AI 학습에 애로사항이 있다는 의견을 전했다”라며 “올바른 학습데이터 조성을 위해 4개 주제를 선정하고 구축 작업을 지원하고 있다”라고 설명했다.
그는 “위원회는 앞으로도 공유마당에서 기존에 제공 중인 이미지, 영상, 음악, 어문, 폰트 등과 함께 무료 인공지능 원천데이터 보급 활성화에 힘쓸 것”이라며 “원천데이터를 공급하는 다른 국가·공공기관들과도 연계해 중복 주제의 데이터 구축은 피하고, 양질의 데이터가 국민들께 제공될 수 있게 노력하겠다”라고 말했다.
한편, 메타버스 엑스포는 삼성동 코엑스(COEX) A홀에서 28일까지 개최된다.