미디어젠 - 한국어 멀티세션 대화

시간 간격이 있는 여러 개의 세션에서 두 명의 참여자가 부여받은 페르소나와 대화 토픽을 바탕으로 자유로운 일상 대화 텍스트를 수집한 뒤 참여자 정보, 대화 주제, 대화방 정보, 시간 간격, 페르소나 정보, 대화 및 요약에 대한 라벨링을 통해 데이터셋을 구성 데이터의 5%는 주제와 관련된 질문-대답이 추가된 전문대화로 구성됨(2세션으로만 구축)

리소스

항목
CKAN dataset id e43f94f4-45fc-4718-9eb0-eebe1bb81547
상태 active
url https://aihub.or.kr/aihubdata/data/view.do?dataSetSn=71630
버전 2024-01-17
라이선스 cc-zero
pricing 무료
담당자 2
담당자 연락처 답변 생성 적정성(SSC < MSC)
업데이트일 2,024-01-17
유/무료 무료
이용방법 다운로드
제공 기관 수행기관(주관) : 미디어젠
최초 제공일 2,023-07-28
파일 크기 534,464,628
최초 수집 일시 2023-08-05T01:23:28…
최근 수집 일시 2024-02-28T10:58:09…

한줄평을 쓰려면 로그인하세요.

전체 데이터셋 보기