-
㈜딥로딩 - 연령대별 특징적 발화(은어·속어 등) 음성 데이터 AI 허브
문맥 이해 및 인식 성능개선을 위해 다양한 연령대별 특징적 발화(은어·속어 등) 음성 데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋 구축 이때 학습 데이터셋은 녹음한 음성 파일이며, 전사데이터는 txt 기반의 데이터 셋 목록 및 메타 정보로 구성됨. -
엠티데이타 - 중·노년층 한국어 방언 데이터 (충청도, 전라도, 제주도) AI 허브
충청도, 전라도, 제주도 지역의 50대 이상 발화자가 발화한 따라말하기(정형), 질문답하기(비정형), 2인대화(비정형) 의 방언 발화 음성 데이터 -
무하유 - 채용면접 인터뷰 데이터 AI 허브
실제 채용면접과 유사한 환경의 질문과 답변의 음성을 제작하여 텍스트로 변환한후 내용 요약, 채용면접에서 표현되는 답변의 감정과 의도를 라벨링하여 원격 면접의 서비스를 고도화 -
고양시 - 어린이 음성 맥락 인식률 향상을 위한 방송 음성 및 자연어 처리 학습용 데이터 AI 허브
어린이 교육용 방송 영상(EBS, KBS)으로부터 수집한 어린이 교육 방송 영상을 활용하여, 어린이 음성/맥락 인식률 향상을 위한 방송 음성 및 자연어 처리 학승용 데이터셋을 구축 -
나무기술(주) - 난청 검사 음성 데이터 AI 허브
어음청력검사 이음절(12EA), 일음절(50EA) 1SET의 데이터셋 정상인 및 난청인의 어음청력검사 결과 ※ 난청인 : 기도청력 500Hz, 1,000Hz, 2,000Hz, 4,000Hz 구간 dB값 40이상 -
미디어젠 - 감정이 태깅된 자유대화 (청소년) AI 허브
별도로 개발된 APP을 통해 2 사람이 다양한 주제에 대해 실시간 음성 통화를 하며, 해당 통화 내역을 텍스트로 전사함 각각의 음성은 감정 상태, 감정 유형, 감정 정도, 감정 대상 등으로 세분화된 감정 태깅을 수행함 -
미디어젠 - 감정이 태깅된 자유대화 (성인) AI 허브
별도로 개발된 APP을 통해 2 사람이 다양한 주제에 대해 실시간 음성 통화를 하며, 해당 통화 내역을 텍스트로 전사함 각각의 음성은 감정 상태, 감정 유형, 감정 정도, 감정 대상 등으로 세분화된 감정 태깅을 수행함 -
㈜나라지식정보 - 일반상식 문장 생성 데이터 AI 허브
■ 문장을 자동으로 생성하고 상황에 맞는 대답을 할 수 있는 지능형 어플리케이션 개발을 위한 문장 생성 학습용 데이터셋 ■ ‘한국어 일반 상식 문장 데이터 구축’ 과제 중 15-1 데이터(일반상식 문장 교정 데이터)에서 추출한 개념 정보(동사·명사, 체언, 용언)를 재구성하여 일반 상식에 부합하는 자연스러운 한국어 문장을 생성한... -
㈜디엠티랩스 - 방송콘텐츠 한국어-유럽어 번역 말뭉치 AI 허브
방송 콘텐츠 분야의 유럽어 통·번역 성능 향상을 통해 한국 문화 확산 및 콘텐츠 산업 활성화를 위한 한국어 방송 콘텐츠의 인공지능 학습용 유럽어 통·번역 말뭉치 데이터 상황별 신조어, 약어, 은어, 관용적 의미와 어투까지 효과적으로 전달할 수 있는 인공신경망기계번역(Neural Machine Translation; NMT)용... -
㈜코테크시스템 - 극한 소음 환경 소리 데이터 AI 허브
극한 소음환경의 특정 소리 구분을 위해 극한 소음환경에서 녹음 된 소리데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋 구축 -
㈜타임소프트 - 뉴스 대본 및 앵커 음성 데이터 AI 허브
언론에 보도된 뉴스기사, 각 분야(정치, 경제, 사회, 문화, 국제, 지역, 스포츠, IT과학)별 전직,현직 아나운서, 아나운서 교육생들이 뉴스를 보도하는 음성 데이터 1,132시간 -
㈜나라지식정보 - 일반상식 문장 교정 데이터 AI 허브
■ 국어를 사용하는 사람들이 매일매일의 생활에서 듣고 보고 사용하는 기초적이고 핵심적인 문장으로 구성된 데이터로 이를 통해 AI 모델이 사람의 생활에서 납득 가능한 논리적 추정을 할 수 있을 것으로 기대함 ■ 데이터 구축 목적에 부합하는가는 AI 모델이 일상생활에서 두루 쓰이는 용어 및 문장을 이해하고 이로부터 기대되는 감정과 상황... -
㈜디엠티랩스 - 방송콘텐츠 한국어-유럽어 통·번역 음성 데이터 AI 허브
방송 콘텐츠 분야의 유럽어 통·번역 성능 향상을 통해 한국 문화 확산 및 콘텐츠 산업 활성화를 위한 한국어 방송 콘텐츠의 인공지능 학습용 유럽어 통·번역 말뭉치 데이터 상황별 신조어, 약어, 은어, 관용적 의미와 어투까지 효과적으로 전달할 수 있는 인공신경망기계번역(Neural Machine Translation; NMT)용... -
㈜코테크시스템 - 극한 소음 음성인식 데이터 AI 허브
음성인식 성능개선을 위해 다양한 극한 소음환경에서 발성된 음성데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋 구축 -
엠티데이타 - 중·노년층 한국어 방언 데이터(강원도,경상도) AI 허브
강원도, 경상도 지역의 50대 이상 발화자가 발화한 따라말하기(정형), 질문답하기(비정형), 2인대화(비정형) 의 방언 발화 음성 데이터 -
주식회사 투비원솔루션즈 - 음악 유사성 판별 데이터 AI 허브
장르별 음원 데이터로 이루어진 음악 간의 유사성을 설명 가능 하도록 판별하기 위한 인공지능 학습용 데이터 -
심심이㈜ - 공감형 대화 AI 허브
인간과 같이 공감할 수 있는 능력을 갖고 자연스러운 공감 대화 인터페이스를 위한 인공지능 학습용 대화 데이터 한 화자(감정화자)에게는 주어진 ‘감정과 상황에 처해진 것처럼 대화’하라는 임무를, 다른 화자(공감화자)에게는 ‘상대방에게 적절하게 공감’하라는 임무를 부여한 후 생성한 대화 데이터