-
엠티데이타 - 중·노년층 한국어 방언 데이터 (충청도, 전라도, 제주도) AI 허브
충청도, 전라도, 제주도 지역의 50대 이상 발화자가 발화한 따라말하기(정형), 질문답하기(비정형), 2인대화(비정형) 의 방언 발화 음성 데이터 -
미디어젠㈜ - 한국어 아동 음성 데이터 AI 허브
고품질 한국어 아동 음성 데이터 구축 및 개방으로 아동 교육 분야 지능화 혁신을 추구 -
서울대병원 - 음성질환 판별을 위한 음성 데이터 AI 허브
후두 음성 질환 진단 및 분류를 위한 정상 및 병적 음성에 대한 데이터셋으로, 보건복지부 가이드라인에 의거하여 원시 음성 데이터(WAV)를 멜-스펙트럼 수치 행렬 데이터(CSV)로 변환하여 제공되는 1,102건의 정상 및 병적 음성 데이터 셋 -
주식회사 케이티알파 - 숫자가 포함된 패턴 발화 데이터 AI 허브
본 데이터는 한자어, 고유어, 외래어 등의 숫자 읽기 다양성을 반영하여 84개의 카테고리로 구성된 10,000시간 이상의 음성데이터로 구성하였음. (스크립트 데이터 포함) -
미디어젠㈜ - 학습용 아동 영어 음성 데이터 AI 허브
고품질 영어 아동 음성 데이터 구축 및 개방으로 아동 교육 분야 지능화 혁신을 추구 -
㈜디엠티랩스 - 방송콘텐츠 한국어-유럽어 번역 말뭉치 AI 허브
방송 콘텐츠 분야의 유럽어 통·번역 성능 향상을 통해 한국 문화 확산 및 콘텐츠 산업 활성화를 위한 한국어 방송 콘텐츠의 인공지능 학습용 유럽어 통·번역 말뭉치 데이터 상황별 신조어, 약어, 은어, 관용적 의미와 어투까지 효과적으로 전달할 수 있는 인공신경망기계번역(Neural Machine Translation; NMT)용... -
전남대학교병원 - 정신건강진단 및 예측을 위한 멀티모달 데이터 AI 허브
환자군과 건강대조군을 대상으로 임상 의료데이터, 수면데이터, 음성, 라이프로그 데이터 획득을 통해 최신 인공지능 학습기술 적용이 가능한 데이터 구축 -
㈜티맥스티베로 - 지능형 스마트 축사 (젖소) 데이터 AI 허브
최적의 축사 관리가 가능하도록 환경정보, 사양관리정보, 생체정보, 영상, 음성 정보의 복합적인 데이터를 구축하여 핵심 자료로 제공하며, 젖소의 사양, 질병, 번식 연구에 활용하기 위한 인공지능 알고리즘 개발 모델 구축 -
한림대학교 산학협력단 - 구음장애 음성인식 데이터 AI 허브
병원(한림대 강남성심병원, 동탄성심병원 등), 청각 센터(한림대 청각학과 졸업생 네트워크 활용)에서 최소 1,200명(총 5,000 시간 이상 5,250시간 이하)의 원시데이터를 확보하여 다양한 나이, 지역, 성별, 질환으로부터 정제된 발화 데이터 추출 및 질환 분류 인공지능 데이터셋 구축 -
㈜디엠티랩스 - 방송콘텐츠 한국어-유럽어 통·번역 음성 데이터 AI 허브
방송 콘텐츠 분야의 유럽어 통·번역 성능 향상을 통해 한국 문화 확산 및 콘텐츠 산업 활성화를 위한 한국어 방송 콘텐츠의 인공지능 학습용 유럽어 통·번역 말뭉치 데이터 상황별 신조어, 약어, 은어, 관용적 의미와 어투까지 효과적으로 전달할 수 있는 인공신경망기계번역(Neural Machine Translation; NMT)용... -
동아대학교의료원 - 부산지역 노인 및 주요 퇴행성 뇌질환자의 음성정보 AI 허브
발화를 통하여 퇴행성 뇌질환을 파악할 수 있는 사투리가 심한 부산지역 고령층의 인공지능 데이터 구축 -
㈜코테크시스템 - 극한 소음 음성인식 데이터 AI 허브
음성인식 성능개선을 위해 다양한 극한 소음환경에서 발성된 음성데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋 구축 -
비디 - 명령어 인식을 위한 소음 환경 데이터 AI 허브
여러 화자가 발화하는 소음환경 또는 차량 내 소음환경에서 중심이 되는 화자의 명령어 음성 인식 및 성능 개선을 위한 인공지능 학습용 명령어 발화 데이터 -
㈜티맥스티베로 - 지능형 스마트 축사 데이터(육계, 산란계) AI 허브
스마트축사 통합 데이터(육계, 산란계) 과제의 학습 데이터를 구축하여 최적의 농가 관리가 가능하도록 환경정보, 사양관리정보, 생체정보, 영상, 음성 정보의 복합적인 데이터를 구축 -
미디어젠㈜ - 화자 인식용 음성 데이터 AI 허브
화자의 여러 발화 패턴으로부터 발화자를 구분할 수 있는 화자인식 인공지능을 훈련하기 위한 데이터셋 -
㈜데이터드리븐 - 학생 청소년 핵심역량분석 교육 데이터 AI 허브
실제 교육 현장에서 학생을 관찰한 텍스트데이터를 정규화하여, 정규화된 결과를 교육적 역량으로 치환하고 이를 기준으로 수업기록을 교육 전문가를 통한 어노테이션을 진행하여, 교육 텍스트에서 정량적 역량 점수를 예측할 수 있는 인공지능 학습용 데이터셋 -
엠티데이타 - 중·노년층 한국어 방언 데이터(강원도,경상도) AI 허브
강원도, 경상도 지역의 50대 이상 발화자가 발화한 따라말하기(정형), 질문답하기(비정형), 2인대화(비정형) 의 방언 발화 음성 데이터 -
주식회사 투비원솔루션즈 - 음악 유사성 판별 데이터 AI 허브
장르별 음원 데이터로 이루어진 음악 간의 유사성을 설명 가능 하도록 판별하기 위한 인공지능 학습용 데이터 -
미디어젠㈜ - 다화자 가창 데이터 AI 허브
저작권 포함 미디/가사파일 구매하여 발라드/R&B, 락/팝, 트로트 장르를 대상으로 1,500곡을 18명의 가수에게 분배되어 총 4,500개의 음성 데이터를 구축. -
㈜코테크시스템 - 소음 환경 음성인식 데이터 AI 허브
음성인식기술 성능개선을 위한 학습데이터 구축을 위해 주변 소음이 자연스럽게 혼합된 음성데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋을 구축