Text to Speech
다국어 신경망 음성합성 기술
고품질 학습 데이터를 기반으로 한 VITS 기반 다국어 음성합성 기술
고품질 학습 데이터를 기반으로 한 VITS 기반 다국어 음성합성 기술
자사는 고품질 학습데이터를 기반으로 한 VITS 기반 다국어 음성합성 기술을 보유하고 있습니다. 현재 영어, 중국어, 한국어, 일본어, 베트남어, 태국어 총 6개 언어의 음성합성이 가능하며, 각 언어별로 젊은 여성 및 남성 화자의 음성을 지원합니다. 향후 학습데이터 확보를 통해 다양한 연령대와 스타일, 그리고 추가 언어 지원도 개발할 예정입니다.
자사의 DMTTS 음성합성 기술은 VITS 기반의 End-to-End 신경망 기술을 사용하였기 때문에 보다 자연스럽고 고품질의 음성을 생성할 수 있다는 장점이 있습니다. 또한 각 언어별로 최적화된 텍스트 정규화(Text Normalization) 및 G2P(Grapheme-to-Phoneme) 처리를 통해 숫자, 단위, 약어, 특수문자 등을 정확하게 발음할 수 있습니다.
자사는 고품질 학습데이터를 기반으로 한 신경망 음성합성 기술을 보유하고 있습니다. 현재 젊은 여성과 남성의 음성합성만 가능하며, 향후 학
습데이터 확보를 통해 다양한 연령대와 스타일 음성합성 기술도 개발할 예정입니다.
자사의 음성합성 기술은 신경망 기반의 기술을 사용하였기 때문에 보다 자연스러운 음성을 생성할 수 있다는 장점이 있습니다.
응용서비스 및 분야