-
셀바스에이아이 - 웰니스 대화 스크립트 데이터셋 AI 허브
강남 세브란스에서 전달받은 상담데이터 1만 6천건에서 초진이고 환자 본인이 직접 내원한 경우인 4200건 추출 추출된 상담 데이터를 기준으로 문장별 분리 및 대화 의도 분류 분류별로 유저-챗봇 대화스크립트 생성 -
㈜ 아크릴 - 한국어 감정 정보가 포함된 연속적 대화 데이터셋 AI 허브
웹 크롤링 등의 방법으로 대화를 수집하고, 적정 길이와 turn 수 및 주제를 가진 대화를 선정하였으며 감정 레이블링 수행 챗봇이 말하기 부적절한 용어(지나치게 전문적인 용어, 비속어 등)을 가능한 범위에서 필터링 하였음 -
마인즈랩 - 일반상식 AI 허브
한국어 위키백과 내 주요 문서 15만 개에 포함된 지식을 추출하여 객체(entity), 속성(attribute), 값(value)을 갖는 트리플 형식의 데이터 75만 개를 구축한 지식베이스 제공. -
레드타이 - 호텔 챗봇 발화데이터 문화 빅데이터 유료
O 데이터 소개 - 클라우드 방식의 RedTieButler 호텔 컨시어지 챗봇 서비스를 통해 발생하는 고객 발화(대화) 데이터를 정제, 가공한 기초 데이터 O 활용분야 - 발화(대화) 데이터를 활용해 신규 챗봇 데이터셋 구축에 기초 데이터 활용 - 고객 분석 활용 O 데이터 출처 - 레드타이 -
레드타이 - 호텔 챗봇 발화데이터 텍스트 추출 데이터 문화 빅데이터 유료
O 데이터 소개 - 클라우드 방식의 RedTieButler 호텔 컨시어지 챗봇 서비스를 통해 발생하는 고객 발화(대화) 데이터에서 단어 추출 및 단어빈도 데이터 O 활용분야 - 발화(대화) 데이터를 활용해 신규 챗봇 데이터셋 구축에 기초 데이터 활용 - 고객 분석 활용 O 데이터 출처 - 레드타이