[산업일보]
기계학습(머신러닝·Machine Learning)의 가장 기본적인 순서는 데이터를 정제하고 정리하는 과정을 통해 추상화하고, 이렇게 추상화된 모형을 기반으로 훈련과 테스트를 통해 일반화된 알고리즘을 도출하는 과정이다.
기계학습을 활용해 패턴을 일치하게 하면 동영상이나 사진에서 객체를 인식하는 데 활용할 수 있고, 이미지, 음성, 음악 인식 분야 등에 활용될 때, 자동 통역도 할 수 있다.
마이크로소프트(MS) 사는 통합 의사소통 솔루션 스카이프에 기계학습을 활용한 자동 통역기능을 추가했고, 영국에서는 런던 지하철 역사와 지하철 철로에 있는 센서에서 데이터를 기계학습을 돌려서 부품 교체 수명이나 열차 안 온도 등을 예측하는 데 활용했다.
기계학습은 최근 오픈 소스 프로젝트로 빠르게 성장하고 있다. 대표적인 오픈 소스 프로젝트는 아파치의 ‘마홋(Mahout)’과 ‘스파크 M(SparkMllib)’, ‘사이킷-런(Scikit-Learn)’이 있으며, 이를 바탕으로 한 파생 프로젝트가 지속적으로 확장되는 중이다.
이전까지 기계학습은 복잡성과 비용 때문에 증권 등 일부 시스템에나 활용됐지만, 최근 들어 클라우드 기반의 빅데이터 환경이 활발하게 진행이 되면서 자연스럽게 빅데이터의 예측 엔진 부문으로 주목받고 있다.
한편, 기계학습에 관한 기사는 이미 언론에서 다양하게 언급됐다. <미디어잇>의 지난해 1월 22일 자 “빅데이터에 날개를...‘머신러닝’ 시대가 온다”,