한국환경산업기술원 환경산업기술원 챗봇 대화세트 구성
리소스
항목 | 값 |
---|---|
CKAN dataset id | d59711b7-0a9a-418b-abc0-8729752aff09 |
상태 | active |
url | https://www.data.go.kr/data/15089190/fileData.do |
버전 | 2021-09-19 |
라이선스 | cc-zero |
pricing | 무료 |
갱신주기 | 수시 (1회성 데이터) |
이용조건 | 로그인 없이 다운로드 |
차기 등록 예정일 | |
카테고리 | 환경 - 환경일반 |
최초 수집 일시 | 2021-12-30T11:28:49… |
최근 수집 일시 | 2023-12-12T19:44:43… |
-
한국환경산업기술원 한국환경산업기술원 챗봇 카테고리 분류 정보 공공데이터포털
본 데이터는 환경산업기술원에서 구축 중인 챗봇의 질문답변 세트(21.9.19 기준)의 기준이 되는 항목 분류코드를 정리한 내용입니다. -
한국과학기술정보연구원 - 한국어 대화 AI 허브
소상공인 및 공공 민원 10개 분야에 대한 50만 건 이상의 대화를 제공하는 자연어 데이터 제공 -
한국전자기술연구원 - 한국어 대화 데이터셋 AI 허브
주제에 맞는 동영상 (해외 포함)을 참조하여 한국어 및 황에 적절하도록 각색하여 구축 응급상황 데이터: 748개의 멀티턴 대화셋, 단발성으로 4,975 문장 존재, 대화셋 당 3 ~ 12개의 대화 턴으로 구성 오피스 데이터: 10,202개의 멀티턴 대화셋, 대화쌍으로 46,414 셋이 존재, 대화셋 당 1~31개의 대화 턴으로 구성 -
미디어젠 - 한국어 멀티세션 대화 AI 허브
시간 간격이 있는 여러 개의 세션에서 두 명의 참여자가 부여받은 페르소나와 대화 토픽을 바탕으로 자유로운 일상 대화 텍스트를 수집한 뒤 참여자 정보, 대화 주제, 대화방 정보, 시간 간격, 페르소나 정보, 대화 및 요약에 대한 라벨링을 통해 데이터셋을 구성 데이터의 5%는 주제와 관련된 질문-대답이 추가된 전문대화로...