㈜메트릭스리서치 - 주제별 텍스트 일상 대화 데이터

식음료, 주거와 생활, 교통, 교육, 가족 등 20여개 주제에 대한 자유로운 일상대화 텍스트를 수집한 후, 각 대화의 주제와 참여 화자정보, 화행이 나타나는 문장에 대한 라벨링을 통해, 한국어 일상대화의 주제, 화행 등 정보를 담은 데이터셋을 구성

리소스

항목
CKAN dataset id a192420f-e2c8-454a-92f7-67ed51fb1a72
상태 active
url https://aihub.or.kr/aihubdata/data/view.do?dataSetSn=543
버전 2023-10-12
라이선스 cc-zero
pricing 무료
담당자 이영미
담당자 연락처 02-6244-0706
업데이트일 2,023-10-12
유/무료 무료
이용방법 다운로드
제공 기관 수행기관(주관) : ㈜메트릭스리서치
최초 제공일 2,022-06-09
파일 크기 269,196,017
최초 수집 일시 2022-09-18T08:17:29…
최근 수집 일시 2024-02-28T10:56:48…

  • 미디어젠 - 한국어 멀티세션 대화 AI 허브

    시간 간격이 있는 여러 개의 세션에서 두 명의 참여자가 부여받은 페르소나와 대화 토픽을 바탕으로 자유로운 일상 대화 텍스트를 수집한 뒤 참여자 정보, 대화 주제, 대화방 정보, 시간 간격, 페르소나 정보, 대화 및 요약에 대한 라벨링을 통해 데이터셋을 구성 데이터의 5%는 주제와 관련된 질문-대답이 추가된 전문대화로...
  • 미디어젠 - 감정이 태깅된 자유대화 (성인) AI 허브

    별도로 개발된 APP을 통해 2 사람이 다양한 주제에 대해 실시간 음성 통화를 하며, 해당 통화 내역을 텍스트로 전사함 각각의 음성은 감정 상태, 감정 유형, 감정 정도, 감정 대상 등으로 세분화된 감정 태깅을 수행함
  • 미디어젠 - 감정이 태깅된 자유대화 (청소년) AI 허브

    별도로 개발된 APP을 통해 2 사람이 다양한 주제에 대해 실시간 음성 통화를 하며, 해당 통화 내역을 텍스트로 전사함 각각의 음성은 감정 상태, 감정 유형, 감정 정도, 감정 대상 등으로 세분화된 감정 태깅을 수행함
  • ㈜와이즈넛 - SNS 데이터 고도화 AI 허브

    2020년 한국어 SNS데이터와 2021년 주제별 텍스트 일상 대화 데이터의 유형을 최소 1개에서 최대 3개로 멀티라벨링 하여 한국어 일상대화 AI 모델의 품질 향상을 위한 학습용 데이터 셋 제공

한줄평을 쓰려면 로그인하세요.

전체 데이터셋 보기