본문 바로가기
  • 유해게시물신고
지긋지긋한 ‘가짜 뉴스’, AI 통해 차단하자
최수린 기자|sr.choi@kidd.co.kr
페이스북 트위터 카카오스토리 네이버블로그 프린트 PDF 다운로드

지긋지긋한 ‘가짜 뉴스’, AI 통해 차단하자

AI 판별 정확성 높이기 위한 데이터 셋 구축 필요

기사입력 2018-12-29 09:30:12
페이스북 트위터 카카오스토리 네이버블로그 프린트 PDF 다운로드
지긋지긋한 ‘가짜 뉴스’, AI 통해 차단하자

[산업일보]
가짜 뉴스 하나에 전 세계가 들썩인다. 의견을 공개적으로 피력할 수 있는 플랫폼이 증가하면서 누구나 목소리를 낼 수 있는 시대가 도래했다. 범람하는 뉴스의 홍수 속에서 스스로 진짜와 가짜를 구별하는 것은 거의 불가능해졌다.

선동, 혐오 등 사람들의 눈길을 끌기 위한 자극적인 제목과 내용을 담고 쏟아져 나오는 가짜 뉴스들로부터 세상을 보호하기 위해 정부와 개인이 발 벗고 나서고 있다.

하지만 가짜 뉴스와 허위 정보를 초반에 차단하고 삭제하는 등의 근본적인 해결은 단지 정부의 개입이나 법에 의한 처벌로는 한계가 있어, 관련 기술 개발을 통해 이뤄져야 한다는 주장이 제기되고 있다.

한국인터넷진흥원(이하 KISA)의 보고서 ‘페이크 뉴스 또는 허위정보 판별 연구현황’에 따르면 기존 가짜 뉴스에 대한 연구는 스놉스닷컴(snopes.com)이나 폴리팩트(PoliFact)등과 같은 사이트를 기준으로 이미 사실 확인이 이뤄진 내용과 얼마나 부합 또는 충돌하는가를 갖고 뉴스 소스의 신뢰성을 규정하는 방식으로 행해져 왔다.

테크프론티어의 한상기 대표는 “팩트 체크 사이트를 기준으로 판정하는 방식은 사람에 의한 체크이며 미디어 기간의 역사를 평가하는 것으로, 현재 당면한 내용을 평가하는 데는 부족한 면이 있으며 이미 확신이 이뤄진 이후에 평가가 이뤄질 가능성이 높다”라고 한계를 짚었다.

페이스북의 설립자인 마크 저커버그는 가짜 뉴스 해결에 향후 인공지능(AI) 기술이 접목될 것으로 전망하며 기존의 연구 방법과 달리 기술적으로 해결하고자 하는 의지를 표명한 바 있다.

한상기 대표는 “AI를 통한 가짜 뉴스 문제 해결에 대한 연구는 이미 세계 곳곳에서 진행 중이나, 가장 큰 문제는 현저히 부족한 ‘데이터 셋’”이라고 언급했다.

실제로 하나의 뉴스에 대해 진실 또는 거짓을 판별할 때 AI 시스템을 활용해 정확성을 높이려면 사전에 학습된 AI가 필요한데, 이때 ‘근거 진실(그라운드 트루스)’에 해당하는 학습 데이터가 현저히 부족한 상황이다.

보고서에 따르면 그동안 연구에서 사용하는 ‘버즈피드 뉴스’, ‘LIAR’, ‘페이스북혹스’ 등의 주요 데이터 셋은 대부분의 데이터 규모나 확보된 데이터의 내용이 부족한 상황으로, 그 중‘CREDBANK’가 6천만 트윗을 벡터로 정리한 최대 규모의 데이터에 해당한다.

한 대표는 “‘미디어 바이어스 팩트체크’같은 기구에서 연구를 위한 ‘근거 진실’ 데이터를 제공하는데, 2천5백 개 이상의 미디어 소스 데이터라고 해도 머신러닝을 위한 데이터로는 아직 부족한 실정”이라며 “국내에서도 가짜 뉴스 판별을 위한 기술 연구를 위해서는 의미 있는 데이터 셋 구축이 기본이며, 사회적 병폐인 가짜 뉴스를 차단하기 위해 이에 대한 투자와 지원이 마련돼야 한다”라고 덧붙였다.

최수린 기자 sr.choi@kidd.co.kr



0 / 1000
주제와 무관한 악의적인 댓글은 삭제될 수 있습니다.
0 / 1000




제품등록 무료 제품 거래 비용 없음!



산업전시회 일정




다아라 기계장터 제품등록 무료