본문 바로가기
“AI 학습 데이터 부족? 무료 AI 원천데이터 활용하세요”
김대은 기자|kde125@kidd.co.kr
페이스북 트위터 카카오스토리 네이버블로그 프린트 PDF 다운로드

“AI 학습 데이터 부족? 무료 AI 원천데이터 활용하세요”

한국저작권위원회, METAVERSE EXPO에서 AI 원천데이터 무료 공유사업 소개 나서

기사입력 2024-06-28 15:45:47
페이스북 트위터 카카오스토리 네이버블로그 프린트 PDF 다운로드
“AI 학습 데이터 부족? 무료 AI 원천데이터 활용하세요”
한국저작권위원회 부스 전경

[산업일보]
한국저작권위원회(이하 위원회)가 ‘2024 메타버스 엑스포(METAVERSE EXPO 2024)’에서 ‘인공지능 원천데이터’ 무료 공유 사업을 소개했다.

위원회가 제공하는 인공지능(AI) 원천데이터는 AI 학습에 필요한 데이터로, 수집 비용 및 저작권 걱정 없이 산업계에서 활용할 수 있다. 위원회가 2012년부터 운영 중인 ‘공유마당’ 웹사이트에서 확인 가능하다.

위원회는 2022년부터 작년까지 ▲자율주행 인공지능 원천데이터 ▲방송 음성 기반 말뭉치 원천데이터 1 ▲방송 음성 기반 말뭉치 원천데이터 2 ▲상황별 한국어-영어 대화문 데이터 ▲일상생활 및 전문용어 수어 영상 데이터 ▲인공지능을 위한 한국형 저작물 이미지▲유해 화학물질 영상 데이터 ▲생활용품 이미지 데이터, 총 8개 원천데이터 700만 8천 783건을 공유했다.
“AI 학습 데이터 부족? 무료 AI 원천데이터 활용하세요”
인공지능 원천데이터 신청 화면(공유마당 캡처)

올해 하반기에는 태권도 품새 데이터 3종·조선의 5대 궁궐 및 종묘 건축물 이미지 데이터·한국적 웹툰 이미지 데이터·한국전통 민화 데이터 4종을 구축하고 공개할 예정이다.

위원회의 조혜인 선임은 “AI를 활용하는 산업계에서 한국형 데이터가 모자라, AI가 중국·일본 풍 결과물을 생성하거나 오류가 발생하는 등 AI 학습에 애로사항이 있다는 의견을 전했다”라며 “올바른 학습데이터 조성을 위해 4개 주제를 선정하고 구축 작업을 지원하고 있다”라고 설명했다.

그는 “위원회는 앞으로도 공유마당에서 기존에 제공 중인 이미지, 영상, 음악, 어문, 폰트 등과 함께 무료 인공지능 원천데이터 보급 활성화에 힘쓸 것”이라며 “원천데이터를 공급하는 다른 국가·공공기관들과도 연계해 중복 주제의 데이터 구축은 피하고, 양질의 데이터가 국민들께 제공될 수 있게 노력하겠다”라고 말했다.

한편, 메타버스 엑스포는 삼성동 코엑스(COEX) A홀에서 28일까지 개최된다.
다아라 온라인 전시관 GO


0 / 1000
주제와 무관한 악의적인 댓글은 삭제될 수 있습니다.
0 / 1000






산업전시회 일정