-
심심이㈜ - 지식검색 대화 AI 허브
인간과 자연스럽게 전문적인 지식과 관련된 대화 인터페이스를 위한 인공지능 학습용 대화 데이터 한 화자(질문자)에게는 특정 주제에 대해 ‘궁금한 것처럼 자연스럽게 대화하라’는 임무를, 다른 화자(전문가)에게는 ‘전문가인 것처럼 자연스럽게 대화하라’는 임무를 부여한 후 전문가가 인터넷 검색을 통해 답변한 대화 데이터 -
스마트쿱㈜ - 심볼(로고) 생성 데이터 AI 허브
ㅇ텍스트 기반 로고 생성 인공지능 모델 성능 향상을 위한 데이터를 구축하여 텍스트 입력에 디자인 컨셉을 더해 텍스트를 로고화 해주는 인공지능 로고 디자인 개발에 활용할 수 있도록 함 ㅇ텍스트 입력을 통하여 브랜드 이미지를 연상할 수 있는 로고 자동 생성 인공지능 모델링을 활용해 자동 심볼(로고) 생성 솔루션 및 디자인 산업 분야에 활용 -
KDX한국데이터거래소 - MBN 뉴스 분석(NLP) 유통 빅데이터 유료
MBN 뉴스를 분석 자연어처리, 형태소 분석, 개체명 분석, 특성 추출등의 수행한 결과물과 인용문 추출, 인용구에 대한 형태소 분석, 개체명 분석, 특성 추출 등의 수행한 결과물을 AI 머신러닝 및 빅데이터 분석용으로 무료로 제공 -
KDX한국데이터거래소 - 뉴스 미디어 KDX 데이터 유통 빅데이터 유료
매경미디어그룹 MBN 방송 텍스트 데이터를 AI 머신러닝에 활용 할 수 있게 제공 매일경제신문 및 MBN 뉴스를 형태소 분리 가공하여 상품 기준으로 제공 합니다. -
KDX한국데이터거래소 - 키워드별 기사 KDX 데이터 유통 빅데이터 유료
매경미디어그룹 MBN 방송 텍스트 데이터를 AI 머신러닝에 활용 할 수 있게 제공 매일경제신문 및 MBN 뉴스를 형태소 분리 가공하여 주제어 기준으로 제공 합니다. -
KDX한국데이터거래소 - NLP 뉴스 분석(매일경제) 유통 빅데이터 유료
매일경제 1995 ~ 2019년 뉴스를 분석 자연어처리, 형태소 분석, 개체명 분석, 특성 추출등의 수행한 결과물과 인용문 추출, 인용구에 대한 형태소 분석, 개체명 분석, 특성 추출 등의 수행한 결과물을 AI 머신러닝 및 빅데이터 분석용으로 제 -
주식회사 바이브컴퍼니 - 숫자연산 기계독해 데이터 AI 허브
본 데이터는 경제 및 스포츠 분야의 뉴스 기사 지문(324,026건)에 숫자의 가감산, 비율연산, 날짜의 가감산과 추출, 양자 혹은 다자 대상의 수량적 비교 등의 숫자연산이 포함된 질의와 이에 대응하는 응답(414,940쌍)을 라벨링한 인공지능 학습용 데이터임 -
글나무 주식회사 - 관광 음식메뉴판 데이터 AI 허브
관광 음식메뉴판의 OCR 인식 및 기계 번역 품질 향상을 위해, 메뉴판 이미지로부터 추출한 ‘음식 메뉴명’의 지식정보 및 번역문으로 구성한 라벨링 데이터와 전국 음식점의 메뉴판 이미지로 구성한 AI 학습용 데이터셋 -
이화여자대학교 산학협력단 - 다양한 문화콘텐츠 스토리 데이터 AI 허브
스토리 작품의 서사단위를 유닛으로 하여 줄거리를 작성하고 설정, 모티프, 인물, 서사단계, 감정, 장소 등의 스토리 창작 요소를 라벨링 -
고양시 - 어린이 음성 맥락 인식률 향상을 위한 방송 음성 및 자연어 처리 학습용 데이터 AI 허브
어린이 교육용 방송 영상(EBS, KBS)으로부터 수집한 어린이 교육 방송 영상을 활용하여, 어린이 음성/맥락 인식률 향상을 위한 방송 음성 및 자연어 처리 학승용 데이터셋을 구축 -
미디어젠㈜ - 한국어 아동 음성 데이터 AI 허브
고품질 한국어 아동 음성 데이터 구축 및 개방으로 아동 교육 분야 지능화 혁신을 추구 -
㈜포티투마루 - 자연어 기반 질의(NL2SQL) 검색 생성 데이터 AI 허브
데이터베이스에 대해 데이터를 검색하는 자연어 질문과 그와 의미가 동일한 SQL 질의의 쌍으로 구성된 데이터셋으로, 공공기관 데이터 플랫폼에서 수집한 데이터베이스를 활용하여 다양한 분야의 자연어 질문을 SQL 질의로 변환할 수 있는 NL2SQL 모델 개발을 위한 데이터셋을 제공 -
㈜와이즈넛 - SNS 데이터 고도화 AI 허브
2020년 한국어 SNS데이터와 2021년 주제별 텍스트 일상 대화 데이터의 유형을 최소 1개에서 최대 3개로 멀티라벨링 하여 한국어 일상대화 AI 모델의 품질 향상을 위한 학습용 데이터 셋 제공 -
주식회사 에프에스 - 시간 표현 탐지 데이터 AI 허브
본 과제는 텍스트 자료에서 시간표현, 사건, 시간 관계를 탐지하는 인공지능 모델의 학습용 데이터 셋 구축을 목적으로 함. - 뉴스, 대화, 역사, 스포츠 등 시간 정보가 존재하는 문서에서 사건의 발생 시각을 탐지, AI가 자동으로 이에 관한 지식을 추출하여 지능형 질의응답 서비스 등을 가능하게 하는 학습데이터 -
㈜ 트위그팜 - 전문분야 영-한·중-한 번역 말뭉치 (식품) AI 허브
• 신경망 기반 기계 번역기 학습 데이터로 활용하기 위한 영한, 중한 말뭉치 • 식품 전문 분야 번역기의 성능 향상을 위한 학습용 데이터 -
㈜포티투마루 - 행정 문서 대상 기계독해 데이터 AI 허브
행정문서를 활용하여 기계독해 모델 생성을 위한 지문-질문-답변으로 구성된 인공지능 학습 데이터 -
주식회사 케이티알파 - 숫자가 포함된 패턴 발화 데이터 AI 허브
본 데이터는 한자어, 고유어, 외래어 등의 숫자 읽기 다양성을 반영하여 84개의 카테고리로 구성된 10,000시간 이상의 음성데이터로 구성하였음. (스크립트 데이터 포함) -
미디어젠㈜ - 학습용 아동 영어 음성 데이터 AI 허브
고품질 영어 아동 음성 데이터 구축 및 개방으로 아동 교육 분야 지능화 혁신을 추구 -
㈜나라지식정보 - 일반상식 문장 생성 데이터 AI 허브
■ 문장을 자동으로 생성하고 상황에 맞는 대답을 할 수 있는 지능형 어플리케이션 개발을 위한 문장 생성 학습용 데이터셋 ■ ‘한국어 일반 상식 문장 데이터 구축’ 과제 중 15-1 데이터(일반상식 문장 교정 데이터)에서 추출한 개념 정보(동사·명사, 체언, 용언)를 재구성하여 일반 상식에 부합하는 자연스러운 한국어 문장을 생성한... -
㈜디엠티랩스 - 방송콘텐츠 한국어-유럽어 번역 말뭉치 AI 허브
방송 콘텐츠 분야의 유럽어 통·번역 성능 향상을 통해 한국 문화 확산 및 콘텐츠 산업 활성화를 위한 한국어 방송 콘텐츠의 인공지능 학습용 유럽어 통·번역 말뭉치 데이터 상황별 신조어, 약어, 은어, 관용적 의미와 어투까지 효과적으로 전달할 수 있는 인공신경망기계번역(Neural Machine Translation; NMT)용...