본문 바로가기

[기계학습③] 더존비즈온, 기계학습방법론 활용 분개 추천 모형개발

기계학습 알고리즘으로 분류 속도 높여

[기계학습③] 더존비즈온, 기계학습방법론 활용 분개 추천 모형개발

[산업일보]
응용소프트웨어 개발과 공급업체인 더존비즈온은 스마트한 회계 업무를 위한 빅데이터 기반 분석 작업을 시작해 기계학습방법론을 활용한 분개 추천 모형을 개발했다.

인터넷과 정보통신(IT)의 발달로 회계 업무의 환경이 예전과 다르게 변화했기 때문이다. 과거에는 거래명세 장부를 수기로 기록하고, 전표를 보관했으나, 현재 대부분의 기업 상거래 내용이 디지털화돼 막대한 데이터의 효과적인 관리 방법이 필요해졌다.

더존비즈온은 자료 수집, 영수증의 일자별 정리, 입력 등의 작은 업무까지 손이 가는 절차에서 비롯되는 직원의 스트레스 수준이 높은 편으로 나타났다고 전했다. 이에 따른 세무 회계 업무의 특성상 자료 수집, 전표 입력 등의 회계 외적인 업무에 시간이 오래 걸리는 문제에 대한 대책이 시급했다.

그 1단계로, Data Cleansing을 진행해 회사설정계정과 출입금 구분에 따른 특이 계정을 삭제하고, 분개계정코드를 수정했다. 2단계 자질 추출로는 은행 전표 특수 단어를 바로잡고, 두 음절 분해(Bi-gram), 형태소를 분석 및 활용했다. 이어 3단계로는 모형 개발 셋과 검증 셋 구성 그리고 자질 기반 모형 개발을 함으로써 ‘기계학습모형개발’을 시행했다.

여기서 나온 SVW모형은 지도 학습에 사용되는 기계학습 알고리즘 중 하나로 주어진 자료에 이 자료를 분리하는 초평면 중에서 자료들과 가장 거리가 먼 초평면을 찾는 방법으로 분류 문제에서 가장 좋은 성능이다. 또한, ME모형은 SVM과 유사하게 지도 학습에 사용되는 기계학습 알고리즘 중 하나로 성능은 SVM보다 유사하거나 약간 낮으나, 특정 계정 코드가 1등으로 추천될 확률값을 구할 때 적용하기 좋다.

마지막 4단계는 적용모형과 기준값 설정으로 최종 모형을 선택과 추천 기준값을 선택함으로써 슈퍼북 추천 모듈 개발에 적용했다.

이렇게 기업의 모든 상거래의 전표 데이터를 자동 수집하고, 정형 데이터로 변환하면서 자료 수집에 많은 투자를 하지 않아도 되고, 매임카드를 자동으로 불러와 분개 단계까지 완료돼 정리시간 단축 효과가 나타나기 시작했다. 아울러 더존비즈온 측은 수임처에 직접 방문해 클라우드 방식의 장점을 설명하고, 슈퍼북 실행 화면을 직접 시연하거나, 편리한 진행 상황 파악의 장점을 부각해 고객 신뢰감이 상승했다고 전했다.

빅데이터를 활용한 미래 가치 비즈니스 개발로 더비즈온은 국세청 홈택스, 여신금융협회, 13개 카드사와 20개 은행사 등 다양한 정보 제공업체의 자료 수집을 할 수 있었다. 또한, 데이터마이닝을 분석에 도입해 비정형 데이터 처리, 형태소 분석, 텍스트마이닝 등 자연어 처리, 이미지 처리 및 인공지능(AI), 기계학습 방법론을 적용할 수 있었다. 이뿐만 아니라 MongoDB를 활용함으로써 기업표준데이터를 저장해 은행거래 등의 텍스트 데이터 활용에 유리했고, 클라우드 환경에서의 빅데이터 활용 솔루션 제공과 프로그램이 유지 보수( Maintenance)됐다.

더존비즈온 측은 클라우드 환경에서의 빅데이터 활용 솔루션 제공과 프로그램이 유지 보수되고, 보안 관리에 유리할 것으로 예상했다.
김현지 기자 press1@kidd.co.kr

반갑습니다. 산업1부 김현지 기자입니다. 산업 관련 빅데이터(Big Data), 3D프린터, 스마트기계, 기계학습(Machine Learning), 인공지능(AI), 웨어러블 기기, 가상현실(VR) 분야 등과 함께, ‘산업인 24시’, ‘동영상 뉴스’, ‘동영상 인터뷰’ 를 통해 여러분을 찾아뵙겠습니다.

이 기자의 다른기사 보기 >
ad광고추천제품

0 / 1000

추천제품

1/9

가상화폐 시세

loader
Bitcoin logo icon

비트코인

%
Ethereum logo icon

이더리움

%
Ripple logo icon

리플

%
Provided by Bithumb logo icon