[산업일보]
머신러닝은 인공지능의 한 분야로, 사람이 학습하는 것처럼 컴퓨터에 데이터를 넣어 학습하게 함으로써 새로운 지식을 얻어내는 기술이다. 축적된 데이터를 토대로 상관관계와 특성을 찾아내 결론을 내린다.
19일 양재 엘타워에서도 머신러닝과 큐레이션에 대한 내용을 테마로 한 ‘스마트 러닝 인사이트 포럼 2019’이 개최돼 다양한 정보가 공유됐다.
‘머신러닝을 이용한 맞춤형 콘텐츠 추천시스템’이라는 주제로 발표를 진행한 가천대 황보택근 부총장은 “인공지능을 활용한 추천시스템을 구축하는 데 있어 많은 데이터가 필요하다”며 “큐레이션 시스템에는 개인 맞춤형과 비 맞춤형의 2가지 형태가 있는데, 맞춤형의 경우 홈페이지에 등록된 회원들 중심으로 그들의 히스토리를 수집해 그 자료를 바탕으로 콘텐츠를 추천한다”고 말했다.
황보택근 부총장은 “비 맞춤형의 경우 기존 회원이 아닌 새로운 고객이 홈페이지에 접속했을 때 적용되는 방법이다”며 “이런 경우 기존 데이터가 없기 때문에 현재 인기 있는 콘텐츠를 추천해주거나, 검색 패턴을 파악해 콘텐츠를 선별한다. 그러나 맞춤형에 비해 정확도가 떨어진다”고 덧붙였다.
머신러닝은 크게 지도 학습, 비지도 학습, 강화 학습 3가지로 나눌 수 있다. 지도 학습의 경우 답이 있는 문제들을 컴퓨터에 학습시키는 방법이다. 비지도 학습은 답이 없는 문제를 학습시키는데, 이 경우 데이터들이 무엇을 의미하는 지에 대한 답은 없다. 그러면 인공지능은 그 자료들을 군집화해 이 군집이 다른 군집과 다를 것이라고 유추한다. 강화학습은 자기 스스로 학습하는 단계로, 알파고의 예를 들 수 있다.
황보 부총장은 “과거 이세돌과 알파고의 대결이 화제가 됐었다. 그 때의 알파고는 기존 바둑 데이터들을 학습해 바둑을 두는 것이었다면 현재의 알파고(알파고 제로)는 자기 스스로 바둑을 두는 강화학습이 적용됐다”며 “이 학습을 통해 알파고 제로는 어떻게 했을 때, 게임에서 이기고 지는지를 파악해 2~3일 만에 바둑 실력이 늘었다”고 설명했다.
그는 “머신러닝을 통한 큐레이션 서비스는 사용자에 대한 프로파일과 히스토리를 확보해 소비자에게 컨텐츠를 추천하고, 그 후의 피드백을 수집해 추천의 정확도를 높여가고 있다”며 “이와 더불어 일반적인 데이터에서 범위가 좁은 특정한 데이터를 확보하기 위해 노력하고 있다”고 밝히며, “온라인으로 비즈니스를 하는 회사들은 추천시스템이 필요하다”고 강조했다.