한국 생성형 AI ‘코난 LLM’, 美 리포트에 기재… 모델 라인업도 정비
2024.07.31
- 28일 ‘에코시스템 그래프’에 코난 LLM 이름 올려.. 고품질·대규모 데이터 특화 모델로 소개
- ▲온디바이스(OND) ▲프로페셔널(PRO) ▲엔터프라이즈(ENT)로 라인업도 정비… 기업 선택폭 확대
<이미지. 美 스탠퍼드대 에코시스템 그래프에 기재된 코난테크놀로지 ‘코난 LLM’ 설명>
[출처 = 스탠퍼드대 에코시스템 그래프]
인공지능 소프트웨어 전문기업 코난테크놀로지(대표 김영섬 www.konantech.com)가 자체 개발한 대형언어모델 ‘코난 LLM’이 美 스탠퍼드대 ‘에코시스템 그래프’에 이름을 올리고, 비즈니스 라인업도 새롭게 재정비했다.
에코시스템 그래프는 스탠퍼드대 기초모델연구센터(CRFM)가 세계 AI 모델, 데이터 셋, 응용프로그램의 사회적 영향력을 분석하는 프로젝트다. 28일 코난 LLM이 에코시스템 그래프에 추가됐다. 등록된 정보에 따르면 ‘코난 LLM은 코난테크놀로지에서 자체 개발한 대규모 언어 모델입니다. 초대형 AI 학습에 최적화된 이 모델은 고품질의 대규모 데이터와 자연어 처리 분야에서 20년 이상 쌓아온 전문성을 활용합니다’라고 소개됐다.
코난테크놀로지는 자체 데이터와 컴퓨팅 인프라를 기반으로 지난해 8월 코난 LLM 파운데이션 모델을출시했다. 한국의 토종 생성형 AI다. 통상 AI 모델은 한국에서 생산된 데이터를 얼마나 갖고 학습했는지에 따라 한국어 성능이 결정된다. 코난 LLM의 전체 학습 토큰 수는 47B 모델 기준 1조 5천 111억개(15,111억), 한국어 토큰수는 5천 111억개에 달한다. 2007년부터 시작한 온라인 미디어 심화 분석 펄스케이(pulseK)를 통해 확보한 데이터가 현재 250억 건 규모다. 한국어 토큰의 규모 뿐만 아니라 한국의 문화, 정서, 라이프스타일 등이 담긴 데이터로 학습한 만큼 한국어 답변 품질도 뛰어나다.
지난 6월에는 사실상 국내 첫 대형언어모델의 공공 현장 도입 사례로 꼽히는 한국남부발전㈜의 사내 생성형AI 구축사업도 착수했다. 생성형 AI 실증을 위해 치뤄진 기술평가에서 코난 LLM은 보고서 생성부터 번역, 요약, 자료 분석, 코딩까지 뛰어난 문서 생산성을 입증 받았다. 또한 생성형 AI 파운데이션 모델을 사내 구축 함으로써 정보 유출 및 보안 우려를 원천 차단한다는 점에서 기업 니즈에 부합했다.
한편, 코난테크놀로지는 최근 STT, TTS, LLM 기능을 갤럭시 S24에 동시 탑재해 실시간 외국어 대화를 구현했다. 퀄컴의 스냅드래곤 등 저전력의 AI칩에서 작동된 만큼 △스마트폰 △카메라 △센서 △드론 △웨어러블 등 여러 디바이스에도 적용이 가능하다.
온디바이스 AI를 선보이며 기업용 코난 LLM 모델 라인업도 재정비했다. 기존의 파라미터 기준 분류에서 ▲OND(On-Device) ▲PRO(Professional, 단위업무 규모용) ▲ENT(Enterprise, 전사업무 규모용)로 구분했다. 생성형 AI 도입을 고민하는 기업에게 원하는 업무의 규모나 용도 및 예산에 맞춰 선택 폭을 넓히겠단 방침이다. 현재 코난 LLM은 14B와 47B 그리고 온디바이스용 4B와 7B 모델이 개발되어 있다.
김영섬 대표이사는 “현지 데이터와 컴퓨팅 인프라, 자체 엔진이 가진 특성을 승부처로 삼아 기업의 인공지능 비즈니스를 돕고, 매출 확대에도 속도를 내겠다”고 전했다. 코난테크놀로지는 1999년 설립 이후 자체개발 AI 원천 기술을 기반으로 텍스트, 음성, 비디오 분야에서 2,500여 고객사와 3,000여 건의 프로젝트를 수행하고 있다. SK텔레콤의 K-AI 얼라이언스이기도 하다.
이전글
軍 인사업무도 생성형 AI로… 코난테크놀로지, 국방부 LLM 적용방안 연구
2024.08.05
다음글
코난테크놀로지, 국내 첫 대형언어모델 공공 도입…남부발전과 41억대 계약
2024.06.26