코난보이스, 새로운 음성모델 공개… 최신 AI 기술 탑재
2024.04.23
- 다국어 음성합성 위해 국제 심볼 사용, Flow 기반 최신 기법 적용해 음성합성 품질 높여
<이미지. 인공지능 성우 ‘코난보이스’가 최신 음성기술을 탑재했다.> (제공=코난테크놀로지)
코난테크놀로지(대표 김영섬 www.konantech.com)가 인공지능 성우 ‘코난보이스’에 최신 음성기술을 적용, 음성 AI 기술력을 한 단계 높였다.
코난보이스는 사용자의 목소리를 다양한 언어로 변환할 수 있는 새로운 음성합성 모델을 22일 공개했다. 발음기호를 언어마다 다르게 사용하는 대신 국제음성기호(IPA) 기반의 공통 발음기호를 사용하여 한 사람의 목소리로 여러 언어의 음성 합성이 가능한 모델이다. 성우 고유의 억양과 음성 특성은 유지한 채 여러 외국어를 원어민에 가까운 수준으로 충실하게 합성해주며, 별도의 원어민 성우 섭외나 추가 녹음 없이도 여러 언어를 구사할 수 있는 것이 장점이다. 기존의 텍스트 기반 음성합성에서 진일보한 시도인 동시에, 다국어 음성합성에 대한 고객들의 꾸준한 니즈를 반영했다. 현재 한국어 및 영어를 제공하고 있으며 추후 일본어, 중국어 등으로 늘려갈 계획이다.
또한 최신 음성모델의 알고리즘은 기존 대비 크기가 콤팩트해졌으며 효율적으로 음성을 생성하여 화자의 표현력을 손실 없이 구현할 수 있게 되었다. Flow 기반의 최신 기법을 적용하여 트랜스포머 신경망 모델 대비 연속성이 보강된 원활한 입출력 흐름으로 더 자연스러운 음성을 생성할 수 있게 됐다.
서비스도 업데이트됐다. 1080p FHD 해상도가 추가돼 고화질 영상 제작을 지원하고, 자막 서비스가 신설돼 영상 품질과 제작 편의성을 높였다. 서영주 음성그룹 연구소 상무는 “코난보이스 사용자들이 더욱 다양하고 풍부한 콘텐츠를 쉽게 만들 수 있도록 앞으로도 최신 인공지능 음성기술 개발과 고도화에 박차를 가하겠다”고 소감을 전했다.
코난보이스는 인공지능 음성합성 제작 서비스로, 경쟁사 대비 33배 빠른 속도 및 고품질의 음성이 특징이다. 239명의 AI 음성, 3D캐릭터 자동제작, 커스터마이징 배경화면 등 다양한 작업을 지원한다.(끝)
○ 인공지능 3D 콘텐츠 제작 서비스 ‘코난보이스’ 바로가기 https://konanvoice.konantech.com/
이전글
코난테크놀로지, 국가기록원 시청각기록물 재해복구시스템 구축
2024.05.31
다음글
2024.04.22