Sample.csv
샘플 데이터
항목 | 값 |
---|---|
파일명 | Sample.csv |
파일 포맷 | CSV |
설명 | 샘플 데이터 |
데이터셋 설명 | ㅇ 2020년 4월~5월 기간 동안 전국의 SKT 고객과의 상담을 통해 분석된 고객의 감정 상태를 데이터화 ※이스라엘 Nemesysco사의 계층형 음성분석(LVA) 기술이 적용된 감정 분석 시스템을 활용 (동 사는 음성 흐름의 유형과 비정상을 감지하여 주요 감정상태를 분류하는 관련 글로벌 특허 다수 보유)<자체 분석 예시 : 5월 지역별/시기별 스트레스 변화와 코로나 발생 연관관계 분석> - 5월 지역별/시기별 스트레스 지수 Trend와 코로나 발생간의 매우 의미있는 연관성이 도출되었고, 특히, 사회적 Issue에 민감도가 높은 20~30세대의 스트레스 발생에 영향이 있는 것으로 확인됨 [5월 1주차] - 사회적 거리두기, 확진자 급감이 되던 시기로 전국적으로 낮은 스트레스 지수를 보임 - 고성 산불이 발생되었던 강원도가 전국 지역 중 다소 높은 경향이 있음 [5월 2주차] - 이태원 클럽발 코로나 이슈 발생 시기로 직접 영향 지역(수도권)과 대유형 경험(대구/경북) 지역, 간접 영향 지역 등이 1주차 대비 스트레스 지수가 급격히 높아짐 [5월 3주차] - 신규 확진자 발생 완화 및 긴급재난지원금 본격 지급/사용 시기로 전국적으로 스트레스가 2주차 대비 완화 - 제주도는 1주 → 2주 → 3주차 점진적 스트레스 증가 ( 4주차부터 점진 회복 ) [5월 4주차] - 수도권 코로나 이슈 재발생 시기로 2주차와 유사한 지역을 중심으로 급격히 스트레스 지수 증가ㅇ 주요 감정 및 수준 설명 - Stress : 범위 0~30 / 정상값 0 - Upset : 범위 0~30 / 정상값 0 |
url | 파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요) |
원본 페이지 | https://www.findatamall.or.kr/market/dataProdDetail?gdsSn=379&gdsSeCd=GENERAL&gdsVer=1 |
버전 | 2023-04-14 |
파일 크기 | 1 KB |
행 수 | 17 100건 이하의 작은 데이터 |
컬럼 수 | 14 |
텍스트 인코딩 | cp949 |
컬럼 구분자 | , 콤마 (COMMA) |
import pandas as pd
df = pd.read_csv('Sample.csv', on_bad_lines='skip', delimiter=',', encoding='cp949', encoding_errors='ignore')
컬럼 | 타입 | 샘플 |
---|---|---|
상담일 | string | 2020-05-04 |
시도명 | string | 강원 |
성별 | string | M |
연령대 | string | 20~29 |
Stress 평균 | float64 | 3.1 |
Stress 평균 대비 수준 | string | 83% |
Stress 편차 | float64 | 3.1 |
Stress 중위수 | int64 | 2 |
Stress 최대값 | int64 | 13 |
upset 평균 | float64 | 0.8 |
upset 평균 대비 수준 | string | 77% |
upset 편차 | float64 | 2.3 |
upset 중위수 | int64 | 0 |
upset 최대값 | int64 | 16 |
항목 | 값 |
---|---|
생성일시 | 2024-03-03T07:47:38.001609 |
아이디 | 1868f778-28be-403b-8a18-e98d93d042d7 |
key | https://www.findatamall.or.kr/file/sampleDown?gdsSn=379&gdsVer=1 |
메타데이터 수정일시 | 2024-03-03T07:47:37.992463 |
데이터셋 아이디 | c48b58d2-ae87-40ab-b2d1-5daf2d749449 |
상태 | active |
url | https://www.findatamall.or.kr/file/sampleDown?gdsSn=379&gdsVer=1 |