-
심심이㈜ - 지식검색 대화 AI 허브
인간과 자연스럽게 전문적인 지식과 관련된 대화 인터페이스를 위한 인공지능 학습용 대화 데이터 한 화자(질문자)에게는 특정 주제에 대해 ‘궁금한 것처럼 자연스럽게 대화하라’는 임무를, 다른 화자(전문가)에게는 ‘전문가인 것처럼 자연스럽게 대화하라’는 임무를 부여한 후 전문가가 인터넷 검색을 통해 답변한 대화 데이터 -
심심이㈜ - 페르소나 대화 AI 허브
실제 인간과 같이 자연스럽고, 본인의 일관된 페르소나에 기반하여 발화하는 연속 대화 인터페이스를 위한 인공지능 학습용 대화 데이터 한 사람의 성별, 연령, 직업, 성격, 취향 등을 표현하는 짧은 문장 5개로 구성된 페르소나를 구축한 후 임의의 페르소나를 각 화자(생성자)에게 부여해 ‘이 사람인 것처럼 자연스럽게 대화’하는 방식으로... -
KDX한국데이터거래소 - AI 학습용 대용량 데이터 - 시간 표현 탐지 텍스트 데이터 셋 유통 빅데이터 유료
시간 표현 탐지 텍스트 데이터 셋 실제 방영된 방송 콘텐츠를 구매함으로써 인위적으로 설정한 영상이 아닌 실제 상황을 사업에 활용 연령대별, 성별 음성 분량 가능한 데이터 셋 제공 지적재산권과 초상권 이슈를 해결한 데이터 셋 제공 -
㈜딥로딩 - 연령대별 특징적 발화(은어·속어 등) 음성 데이터 AI 허브
문맥 이해 및 인식 성능개선을 위해 다양한 연령대별 특징적 발화(은어·속어 등) 음성 데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋 구축 이때 학습 데이터셋은 녹음한 음성 파일이며, 전사데이터는 txt 기반의 데이터 셋 목록 및 메타 정보로 구성됨. -
엠티데이타 - 중·노년층 한국어 방언 데이터 (충청도, 전라도, 제주도) AI 허브
충청도, 전라도, 제주도 지역의 50대 이상 발화자가 발화한 따라말하기(정형), 질문답하기(비정형), 2인대화(비정형) 의 방언 발화 음성 데이터 -
㈜엠티 - 국도 CCTV 영상을 통한 비정상주행 판별 데이터 AI 허브
강원도, 경상도 지역의 50대 이상 발화자가 발화한 따라말하기(정형), 질문답하기(비정형), 2인대화(비정형) 의 방언 발화 음성 데이터 -
KDX한국데이터거래소 - 뉴스 미디어 KDX 데이터 유통 빅데이터 유료
매경미디어그룹 MBN 방송 텍스트 데이터를 AI 머신러닝에 활용 할 수 있게 제공 매일경제신문 및 MBN 뉴스를 형태소 분리 가공하여 상품 기준으로 제공 합니다. -
KDX한국데이터거래소 - 키워드별 기사 KDX 데이터 유통 빅데이터 유료
매경미디어그룹 MBN 방송 텍스트 데이터를 AI 머신러닝에 활용 할 수 있게 제공 매일경제신문 및 MBN 뉴스를 형태소 분리 가공하여 주제어 기준으로 제공 합니다. -
KDX한국데이터거래소 - AI 학습용 대용량 데이터 - 연령대별 특징적 발화 음성 데이터 셋 유통 빅데이터 유료
연령대별 특징적 발화 음성 데이터 셋 실제 방영된 방송 콘텐츠를 구매함으로써 인위적으로 설정한 영상이 아닌 실제 상황을 사업에 활용 연령대별, 성별 음성 분량 가능한 데이터 셋 제공 지적재산권과 초상권 이슈를 해결한 데이터 셋 제공 -
무하유 - 채용면접 인터뷰 데이터 AI 허브
실제 채용면접과 유사한 환경의 질문과 답변의 음성을 제작하여 텍스트로 변환한후 내용 요약, 채용면접에서 표현되는 답변의 감정과 의도를 라벨링하여 원격 면접의 서비스를 고도화 -
고양시 - 어린이 음성 맥락 인식률 향상을 위한 방송 음성 및 자연어 처리 학습용 데이터 AI 허브
어린이 교육용 방송 영상(EBS, KBS)으로부터 수집한 어린이 교육 방송 영상을 활용하여, 어린이 음성/맥락 인식률 향상을 위한 방송 음성 및 자연어 처리 학승용 데이터셋을 구축 -
나무기술(주) - 난청 검사 음성 데이터 AI 허브
어음청력검사 이음절(12EA), 일음절(50EA) 1SET의 데이터셋 정상인 및 난청인의 어음청력검사 결과 ※ 난청인 : 기도청력 500Hz, 1,000Hz, 2,000Hz, 4,000Hz 구간 dB값 40이상 -
미디어젠㈜ - 한국어 아동 음성 데이터 AI 허브
고품질 한국어 아동 음성 데이터 구축 및 개방으로 아동 교육 분야 지능화 혁신을 추구 -
미디어젠 - 감정이 태깅된 자유대화 (청소년) AI 허브
별도로 개발된 APP을 통해 2 사람이 다양한 주제에 대해 실시간 음성 통화를 하며, 해당 통화 내역을 텍스트로 전사함 각각의 음성은 감정 상태, 감정 유형, 감정 정도, 감정 대상 등으로 세분화된 감정 태깅을 수행함 -
미디어젠 - 감정이 태깅된 자유대화 (성인) AI 허브
별도로 개발된 APP을 통해 2 사람이 다양한 주제에 대해 실시간 음성 통화를 하며, 해당 통화 내역을 텍스트로 전사함 각각의 음성은 감정 상태, 감정 유형, 감정 정도, 감정 대상 등으로 세분화된 감정 태깅을 수행함 -
서울대병원 - 음성질환 판별을 위한 음성 데이터 AI 허브
후두 음성 질환 진단 및 분류를 위한 정상 및 병적 음성에 대한 데이터셋으로, 보건복지부 가이드라인에 의거하여 원시 음성 데이터(WAV)를 멜-스펙트럼 수치 행렬 데이터(CSV)로 변환하여 제공되는 1,102건의 정상 및 병적 음성 데이터 셋 -
주식회사 케이티알파 - 숫자가 포함된 패턴 발화 데이터 AI 허브
본 데이터는 한자어, 고유어, 외래어 등의 숫자 읽기 다양성을 반영하여 84개의 카테고리로 구성된 10,000시간 이상의 음성데이터로 구성하였음. (스크립트 데이터 포함) -
미디어젠㈜ - 학습용 아동 영어 음성 데이터 AI 허브
고품질 영어 아동 음성 데이터 구축 및 개방으로 아동 교육 분야 지능화 혁신을 추구 -
㈜나라지식정보 - 일반상식 문장 생성 데이터 AI 허브
■ 문장을 자동으로 생성하고 상황에 맞는 대답을 할 수 있는 지능형 어플리케이션 개발을 위한 문장 생성 학습용 데이터셋 ■ ‘한국어 일반 상식 문장 데이터 구축’ 과제 중 15-1 데이터(일반상식 문장 교정 데이터)에서 추출한 개념 정보(동사·명사, 체언, 용언)를 재구성하여 일반 상식에 부합하는 자연스러운 한국어 문장을 생성한... -
㈜디엠티랩스 - 방송콘텐츠 한국어-유럽어 번역 말뭉치 AI 허브
방송 콘텐츠 분야의 유럽어 통·번역 성능 향상을 통해 한국 문화 확산 및 콘텐츠 산업 활성화를 위한 한국어 방송 콘텐츠의 인공지능 학습용 유럽어 통·번역 말뭉치 데이터 상황별 신조어, 약어, 은어, 관용적 의미와 어투까지 효과적으로 전달할 수 있는 인공신경망기계번역(Neural Machine Translation; NMT)용...