-
미디어젠(주) - 감성 및 발화 스타일별 음성합성 데이터 AI 허브
7가지 대표 감정(기쁨, 슬픔, 분노, 불안, 상처, 당황, 중립)과 5가지 발화스타일, 3가지 발성캐릭터, 12가지 감정X발화스타일 조합으로 분류된 음성데이터 셋으로 50명의 전문 성우를 섭외하여 총 1,067시간의 녹음 데이터 구축 -
미디어젠(주) - 다화자 음성합성 데이터 AI 허브
자체적으로 수집한 원시데이터를 기반으로 최대한의 음소 범위와 다양한 화자가 포함될 수 있도록 3,400명 이상의 일반인 화자가 25개의 대본으로 2,000~2,400개의 문장을 녹음하여 총 10,152시간의 음성 데이터를 확보