㈜솔트룩스 - 방송 콘텐츠 대화체 음성인식 데이터

자연스러우며 실제 잡음 환경이 결합된 다양한 형태의 발성, 발음을 확보하기 위해 실제 환경에서 대화하는 TV, 라디오의 고품질 방송 콘텐츠를 음성데이터를 wav 파일 형식으로 수집, 정제하여 발화자 말바뀜과 억양구 단위 경계정보를 추가하여 전사하고, 화자, 개인정보 및 차별화 혐오발언을 비식별화와 라벨링한 데이터를 json과 wav 파일을 한 쌍으로 10,000시간, 2인 이상 대화 22개 카테고리의 다양성을 고려하여 학습데이터를 구축하고, 레퍼런스가 검증되고 한글 음성에 적합하게 커스트마이징 한 ESPnet의 컨포머를 적용하여 학습모델을 개발

리소스

항목
CKAN dataset id f447d219-9ed6-4c97-bce4-ed58f5c7feff
상태 active
url https://aihub.or.kr/aihubdata/data/view.do?dataSetSn=463
버전 2023-12-12
라이선스 cc-zero
pricing 무료
담당자 2
담당자 연락처 음성인식
업데이트일 2,023-12-12
유/무료 무료
이용방법 다운로드
제공 기관 수행기관(주관) : ㈜솔트룩스
최초 제공일 2,022-05-27
파일 크기 900,767,567,847
최초 수집 일시 2022-09-18T08:18:38…
최근 수집 일시 2024-02-28T10:58:29…

  • ㈜솔트룩스 - 방송콘텐츠 대화체 음성인식 데이터 AI 허브

    방송콘텐츠 상에서 한국인 대화체의 음성인식(STT) 기술 및 문맥을 이해하는 언어처리 기술 개발을 위한 인공지능 학습용 데이터로서 8개 카테고리, 대화체 음성인식, 문장별 의도 인공지능 학습용으로 정제된 7,000시간의 음성 데이터
  • ㈜솔트룩스 - 주요 영역별 회의 음성인식 데이터 AI 허브

    실제 환경, 시사토론, 독서모임, 온라인회의, 방송에서의 자연스러운 환경과 잡음이 결합된 회의 형태의 발성, 발음을 확보하기 위해 실제 환경에서 대화하는 TV, 라디오의 고품질 방송 콘텐츠, 의회 녹취록, UCC 음성 및 주제를 정한 직접 녹음 음성데이터를 wav 파일 형식으로 수집, 정제하여 발화자 말바뀜과 억양구 단위 경제정보를...

한줄평을 쓰려면 로그인하세요.

전체 데이터셋 보기