데이비스 에릭 하트먼 SKT 랩장(왼쪽)과 정희원 국립국어원 실장이 업무협약을 체결하고 기념 촬영을 하는 모습. /사진제공=네이버

SK텔레콤은 국립국어원과 함께 한국어에 최적화된 차세대 인공지능(AI) 언어 모델을 개발한다고 7일 밝혔다.

차세대 AI 한국어 모델은 사람의 능력 수준으로 평가되는 GPT-3와 유사한 성능을 발휘하는 한국어 범용 언어 모델(GLM)을 목표한다. 언어 관련 문제풀이, 글짓기, 번역 및 주어진 문장에 따라 간단한 코딩을 수행할 수 있는 GPT-3의 기능을 한국어에서도 구현할 수 있게 된다. 일상이나 고객센터 대화뿐 아니라 시사·문학·역사·게임 등 다양한 영역의 언어 활동에 적용될 수 있고 새로운 산업 분야에서 활용도 기대된다.

국립국어원의 언어 정보를 기반으로 SK텔레콤이 개발하는 GLM은 1500억개의 매개변수를 가진 거대 언어 모델로 개발될 예정이다. 최신 언어 모델인 GPT-3가 1750억개의 매개변수를 가지고 있어 이전 버전인 GPT-2보다 100배 이상 크다. 연내 GLM을 개발해 내부 서비스를 통한 검증을 거쳐 상용화하고 다양한 서비스에 적용할 계획이다. 한국어 언어 모델 성능 평가 방법 개발 및 한국어 데이터 품질 평가 연구도 함께 추진한다.

데이비스 에릭 하트먼 SK텔레콤 랭기지슈퍼인텔리전스랩장은 “SKT는 한국어에 최적화된 인공지능 언어모델을 선제적으로 개발해 한국어의 정보화에 이바지하고 있다”며 “이번 국립국어원과 협력을 계기로 한국어의 과학화·세계화에도 기여할 계획”이라고 밝혔다.

정희원 국립국어원 어문연구실장은 “앞으로도 인공지능 개발에 필요한 언어 정보자원을 지속적으로 발굴해 관련 산업계와 학계에서 유용하게 활용될 수 있도록 시스템을 구축해 나가겠다”고 말했다.