(sample)DM_MUCL_TWTR_ASKWRD_ANALS_RESULT.csv
Sample
테이블 미리보기 준비 중...
항목 | 값 |
---|---|
파일명 | (sample)DM_MUCL_TWTR_ASKWRD_ANALS_RESULT.csv |
파일 포맷 | csv |
설명 | Sample |
데이터셋 설명 | ㅇ 공지사항 - 본 데이터는 트위터 API의 수집 이슈(수집불가)로 인하여 2023년 5월부터 데이터 갱신이 되지 않습니다. ㅇ 데이터 소개 - 2021년도 포털 공연 정보에 있는 뮤지컬 인기순을 선별하여 트위터에서 뮤지컬명에 대한 트윗글을 기반으로 연관어를 랭킹으로 추출한 데이터입니다. - 연관어 추출 기준은 후기데이터에서 '뮤지컬명(검색키워드)'의 거리간 유의미를 판단하여 같이 중요하게 나오는 단어를 랭킹으로 추출하였습니다. ㅇ 활용 분야 - 인기 뮤지컬에 대한 소비자들의 관람 후기에 대한 연관어 분석 - 연관어 분석 결과를 통해 워드클라우드(시각화) 활용 ㅇ 데이터 출처 - [데이터] 트위터 데이터 기반으로 데이터마케티코리아 자체 제공 ※뮤지컬명 리스트는 2021년도 기준이며 업데이트 되지 않습니다. |
url | 파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요) |
원본 페이지 | https://www.bigdata-culture.kr/bigdata/user/data_market/detail.do?id=741d68f0-1e55-11eb-a4e6-a9a03a61580b |
버전 | 2023-07-25 |
파일 크기 | 7 KB |
행 수 | 91 보통 |
컬럼 수 | 7 |
텍스트 인코딩 | UTF-8-SIG |
컬럼 구분자 | , 콤마 (COMMA) |
import pandas as pd
df = pd.read_csv('(sample)DM_MUCL_TWTR_ASKWRD_ANALS_RESULT.csv', on_bad_lines='skip', delimiter=',', encoding='UTF-8-SIG', encoding_errors='ignore')
컬럼 | 타입 | 샘플 |
---|---|---|
SEQ_NO | int64 | 2506 |
SRCHWRD_NM | string | 뮤지컬귀환 |
UPPER_CTGRY_NM | string | 문화공연 |
LWPRT_CTGRY_NM | string | 뮤지컬 |
ALL_KWRD_RANK_CO | int64 | 16 |
ASKWRD_NM | string | 미팅 |
ANALS_YM | int64 | 202007 |
항목 | 값 |
---|---|
생성일시 | 2023-09-24T16:04:31.058174 |
아이디 | 8de232cb-f933-46c1-9c02-bd02167ef111 |
메타데이터 수정일시 | 2023-09-24T17:40:12.142536 |
MIME 타입 | text/csv |
데이터셋 아이디 | 24cf4649-144c-4545-978f-828116baa1a0 |
상태 | active |
url | https://kr.object.gov-ncloudstorage.com/sampledata/DM_admin/%28sample%29DM_MUCL_TWTR_ASKWRD_ANALS_RESULT.csv |