-
심심이㈜ - 지식검색 대화 AI 허브
인간과 자연스럽게 전문적인 지식과 관련된 대화 인터페이스를 위한 인공지능 학습용 대화 데이터 한 화자(질문자)에게는 특정 주제에 대해 ‘궁금한 것처럼 자연스럽게 대화하라’는 임무를, 다른 화자(전문가)에게는 ‘전문가인 것처럼 자연스럽게 대화하라’는 임무를 부여한 후 전문가가 인터넷 검색을 통해 답변한 대화 데이터 -
심심이㈜ - 페르소나 대화 AI 허브
실제 인간과 같이 자연스럽고, 본인의 일관된 페르소나에 기반하여 발화하는 연속 대화 인터페이스를 위한 인공지능 학습용 대화 데이터 한 사람의 성별, 연령, 직업, 성격, 취향 등을 표현하는 짧은 문장 5개로 구성된 페르소나를 구축한 후 임의의 페르소나를 각 화자(생성자)에게 부여해 ‘이 사람인 것처럼 자연스럽게 대화’하는 방식으로... -
㈜딥로딩 - 연령대별 특징적 발화(은어·속어 등) 음성 데이터 AI 허브
문맥 이해 및 인식 성능개선을 위해 다양한 연령대별 특징적 발화(은어·속어 등) 음성 데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋 구축 이때 학습 데이터셋은 녹음한 음성 파일이며, 전사데이터는 txt 기반의 데이터 셋 목록 및 메타 정보로 구성됨. -
엠티데이타 - 중·노년층 한국어 방언 데이터 (충청도, 전라도, 제주도) AI 허브
충청도, 전라도, 제주도 지역의 50대 이상 발화자가 발화한 따라말하기(정형), 질문답하기(비정형), 2인대화(비정형) 의 방언 발화 음성 데이터 -
㈜엠티 - 국도 CCTV 영상을 통한 비정상주행 판별 데이터 AI 허브
강원도, 경상도 지역의 50대 이상 발화자가 발화한 따라말하기(정형), 질문답하기(비정형), 2인대화(비정형) 의 방언 발화 음성 데이터 -
무하유 - 채용면접 인터뷰 데이터 AI 허브
실제 채용면접과 유사한 환경의 질문과 답변의 음성을 제작하여 텍스트로 변환한후 내용 요약, 채용면접에서 표현되는 답변의 감정과 의도를 라벨링하여 원격 면접의 서비스를 고도화 -
고양시 - 어린이 음성 맥락 인식률 향상을 위한 방송 음성 및 자연어 처리 학습용 데이터 AI 허브
어린이 교육용 방송 영상(EBS, KBS)으로부터 수집한 어린이 교육 방송 영상을 활용하여, 어린이 음성/맥락 인식률 향상을 위한 방송 음성 및 자연어 처리 학승용 데이터셋을 구축 -
나무기술(주) - 난청 검사 음성 데이터 AI 허브
어음청력검사 이음절(12EA), 일음절(50EA) 1SET의 데이터셋 정상인 및 난청인의 어음청력검사 결과 ※ 난청인 : 기도청력 500Hz, 1,000Hz, 2,000Hz, 4,000Hz 구간 dB값 40이상 -
미디어젠㈜ - 한국어 아동 음성 데이터 AI 허브
고품질 한국어 아동 음성 데이터 구축 및 개방으로 아동 교육 분야 지능화 혁신을 추구 -
미디어젠 - 감정이 태깅된 자유대화 (청소년) AI 허브
별도로 개발된 APP을 통해 2 사람이 다양한 주제에 대해 실시간 음성 통화를 하며, 해당 통화 내역을 텍스트로 전사함 각각의 음성은 감정 상태, 감정 유형, 감정 정도, 감정 대상 등으로 세분화된 감정 태깅을 수행함 -
미디어젠 - 감정이 태깅된 자유대화 (성인) AI 허브
별도로 개발된 APP을 통해 2 사람이 다양한 주제에 대해 실시간 음성 통화를 하며, 해당 통화 내역을 텍스트로 전사함 각각의 음성은 감정 상태, 감정 유형, 감정 정도, 감정 대상 등으로 세분화된 감정 태깅을 수행함 -
서울대병원 - 음성질환 판별을 위한 음성 데이터 AI 허브
후두 음성 질환 진단 및 분류를 위한 정상 및 병적 음성에 대한 데이터셋으로, 보건복지부 가이드라인에 의거하여 원시 음성 데이터(WAV)를 멜-스펙트럼 수치 행렬 데이터(CSV)로 변환하여 제공되는 1,102건의 정상 및 병적 음성 데이터 셋 -
주식회사 케이티알파 - 숫자가 포함된 패턴 발화 데이터 AI 허브
본 데이터는 한자어, 고유어, 외래어 등의 숫자 읽기 다양성을 반영하여 84개의 카테고리로 구성된 10,000시간 이상의 음성데이터로 구성하였음. (스크립트 데이터 포함) -
미디어젠㈜ - 학습용 아동 영어 음성 데이터 AI 허브
고품질 영어 아동 음성 데이터 구축 및 개방으로 아동 교육 분야 지능화 혁신을 추구 -
㈜나라지식정보 - 일반상식 문장 생성 데이터 AI 허브
■ 문장을 자동으로 생성하고 상황에 맞는 대답을 할 수 있는 지능형 어플리케이션 개발을 위한 문장 생성 학습용 데이터셋 ■ ‘한국어 일반 상식 문장 데이터 구축’ 과제 중 15-1 데이터(일반상식 문장 교정 데이터)에서 추출한 개념 정보(동사·명사, 체언, 용언)를 재구성하여 일반 상식에 부합하는 자연스러운 한국어 문장을 생성한... -
㈜디엠티랩스 - 방송콘텐츠 한국어-유럽어 번역 말뭉치 AI 허브
방송 콘텐츠 분야의 유럽어 통·번역 성능 향상을 통해 한국 문화 확산 및 콘텐츠 산업 활성화를 위한 한국어 방송 콘텐츠의 인공지능 학습용 유럽어 통·번역 말뭉치 데이터 상황별 신조어, 약어, 은어, 관용적 의미와 어투까지 효과적으로 전달할 수 있는 인공신경망기계번역(Neural Machine Translation; NMT)용... -
㈜코테크시스템 - 극한 소음 환경 소리 데이터 AI 허브
극한 소음환경의 특정 소리 구분을 위해 극한 소음환경에서 녹음 된 소리데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋 구축 -
㈜타임소프트 - 뉴스 대본 및 앵커 음성 데이터 AI 허브
언론에 보도된 뉴스기사, 각 분야(정치, 경제, 사회, 문화, 국제, 지역, 스포츠, IT과학)별 전직,현직 아나운서, 아나운서 교육생들이 뉴스를 보도하는 음성 데이터 1,132시간 -
전남대학교병원 - 정신건강진단 및 예측을 위한 멀티모달 데이터 AI 허브
환자군과 건강대조군을 대상으로 임상 의료데이터, 수면데이터, 음성, 라이프로그 데이터 획득을 통해 최신 인공지능 학습기술 적용이 가능한 데이터 구축 -
㈜티맥스티베로 - 지능형 스마트 축사 (젖소) 데이터 AI 허브
최적의 축사 관리가 가능하도록 환경정보, 사양관리정보, 생체정보, 영상, 음성 정보의 복합적인 데이터를 구축하여 핵심 자료로 제공하며, 젖소의 사양, 질병, 번식 연구에 활용하기 위한 인공지능 알고리즘 개발 모델 구축