[그래픽뉴스] 초거대 AI 시대, GPT-4…다중 감각을 인지하는 형태될까
거대 AI 연구, 단순한 텍스트부터 이미지, 음성, 비디오, 3D로 확장
[산업일보]
오픈에이아이(OpenAI)에서 초거대 인공지능(AI) 모델인 GPT(Generative Pre-Trained Transformer) 3.5 기반으로 챗지피티(ChatGPT)를 공개하면서 화제가 되고 있다. AI의 발전속도와 적용잠재력 때문이다. 기존 챗봇 방식과 달리 상호작용을 통해 사람의 질문에 자연스럽게 답하고 주제에 따른 문장 작성도 가능한 차별성을 보여주었다.
구글, 메타AI, 딥마인드 등 다양한 기업에서도 초거대 AI 모델을 내놓고 있다. 최근에는 기존 언어 중심의 모델에서 외부 검색 등을 활용한 모델들도 등장하고 있다.
정보통신기획평가원(IITP)의 주간기술동향-‘초거대 AI 모델 연구 동향’ 보고서(이하 보고서)는 ‘기존 언어 모델은 수천억 개의 파라미터를 활용해 토큰의 분포, 의미 등을 모델링했다면, 최근에는 외부 지식의 접근을 통해 필요한 지식을 활용하거나 기존의 지식으로 부족한 부분을 채울 수 있는 초거대 언어 모델들이 등장하고 있다’라고 했다.
이 같은 초거대 언어 모델 중 하나가 올해 초 마이크로소프트에서 발표한 검색엔진 빙(Bing)을 들 수 있다. 빙은 오픈AI의 새 대형 언어모델 프로메테우스(Prometheus)에서 실행된다. 스포츠 점수, 주가, 날씨 등 간단한 정보에 대해 더 연관성 높은 검색 결과를 제공한다. 신규 사이드바를 통해 보다 포괄적인 답을 얻을 수도 있어서 구글이 높은 점유율을 보이고 있는 검색시장에 도전장을 내밀고 있다.
올해 1월 말 ‘2023년 소프트웨어인 신년 인사회’에 참석한 네이버 연구소 하정우 소장은 신년 다짐을 밝히는 순서에서 초거대 AI를 언급하며, “올해가 생성 AI 비즈니스를 제대로 여는 첫해가 될 것이라고 많은 사람들이 예상하고 있다”라고 했다. 또한 마이크로소프트의 행보를 언급하며 앞으로 시장 경쟁의 가속화를 시사했다.
초거대 AI 시장이 열리는 가운데 관련 연구도 텍스트, 이미지, 음성, 비디오, 3D 등 멀티모발 형태로 확장하는 모습이다. 보고서는 로봇 팔의 경우 단순한 언어적 지시어를 보다 풍성한 하위 지시어 세트로 분할하고 행동 계획을 수립하는 방식으로 발전하고 있다고 소개했다.
또한 올해 공개가 예고되고 있는 오픈AI의 GPT-4에 대해서 ‘기존 GPT-3가 밀집 모델(dense model)이었다면, GPT-4는 희소 모델(sparse model)로 접근 방식을 바꿨다고 한다. 결국, 인간의 두뇌와 유사한 희소성을 가진 뉴런 형태, 다중 감각을 인지하는 형태의 접근이 향후 초거대 AI의 접근 방식으로 여겨진다’라고 보고서는 전했다.