서울 강서구 마곡 LG사이언스파크. /사진=뉴스1
서울 강서구 마곡 LG사이언스파크. /사진=뉴스1

LG CNS가 5일 서울 강서구 마곡 LG사이언스파크에서 열린 ‘AI 테크톡 포 NLU’행사자리에서 ‘코쿼드 2.0’출시한다고 밝혔다. 국내 최초로 인공지능(AI) 자연어 이해를 위한 한국어 표준데이터 10만개를 무료로 개방한다고 밝혔다. 코쿼드 2.0은 누구나 홈페이지에서 다운로드할 수 있다.
언어AI를 개발하기 위해서는 AI 학습용 표준 데이터가 필요하다. 그러나 국내애서는 표준데이터가 없어 영문을 번역하거나 AI개발기업이 자체적으로 데이터를 구축할 수밖에 없었다.

LG CNS가 이날 공개한 AI 학습용 한국어 표준데이터는 총 10만개다. 앞서 LG CNS는 지난해 12월 총 7만개의 단어가 탑재된 ‘코쿼드 1.0’을 제작해 AI업계에 공개한 바 있다.


이번에 공개한 코쿼드 2.0은 표준데이터가 3만개 늘어났다. 또 장문의 답변이 가능하며 표나 리스트에 담긴 정보도 읽어 답변할 수 있다.

현신균 LG CNS 최고기술책임자(CTO) 부사장은 “응용분야가 무궁무진한 AI 언어 개발 분야에서 내부적으로 쌓은 데이터를 AI업계 전체에 개방해 국내 AI연구자들간 상생을 위한 생태계 조성에 기여코자 한다”고 밝혔다.