TC_SN_SCNTY_TPBUZ_TXTMNG_20211110165110_sample.csv
샘플 데이터
테이블 미리보기 준비 중...
컬럼 정보 준비 중...
항목 | 값 |
---|---|
파일명 | TC_SN_SCNTY_TPBUZ_TXTMNG_20211110165110_sample.csv |
파일 포맷 | CSV |
설명 | 샘플 데이터 |
데이터셋 설명 | 주요 포털 및 SNS커뮤니티에서 생활서비스업 관련 검색어로 수집된 비정형 텍스트 데이터 및 정제 메타 데이터 (검색어 : 미용실, 독서실, 스포츠클럽, 세탁소, 피부관리실 등) 데이터 구간 : 2010년 1월 ~ 2021년 10월 -수집인덱스 : 순번 -기준년월 : 원본 텍스트의 생성년월(-년 -월) -수집채널명 : 수집채널명(네이버뉴스, 네이버카페, 네이버블로그 등) -수집URL : 원본 텍스트의 URL -제목 : 원본 텍스트의 제목 -내용 : 원본 텍스트의 내용(본문) -※ 웹문서 데이터는 메타정보로, 사용자가 데이터 원본에 접근할 수 있도록 데이터 출처 등을 작성한 것입니다. |
url | 파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요) |
원본 페이지 | https://bigdata-region.kr/#/dataset/17d039bb-8711-4042-987d-0cbcedbd3070 |
버전 | 2022-04-06 |
파일 크기 | 1 KB |
행 수 | 30 보통 |
컬럼 수 | 7 |
텍스트 인코딩 | cp949 |
컬럼 구분자 | , 콤마 (COMMA) |
import pandas as pd
df = pd.read_csv('TC_SN_SCNTY_TPBUZ_TXTMNG_20211110165110_sample.csv', on_bad_lines='skip', delimiter=',', encoding='cp949', encoding_errors='ignore')
컬럼 | 타입 | 샘플 |
---|---|---|
분석인덱스 | int64 | None |
수집년월 | string | None |
키워드명 | string | None |
단어빈도 | int64 | None |
단어중요도 | float64 | None |
연결정도중심성 | float64 | None |
매개중심성 | float64 | None |
항목 | 값 |
---|---|
column_info_url | https://ggdata.kr:6443/schemafiles/IMC/17d039bb-8711-4042-987d-0cbcedbd3070/TC_SN_SCNTY_TPBUZ_TXTMNG_20211110165110_schema.csv |
생성일시 | 2023-09-28T17:45:06.690701 |
아이디 | bbe023a2-2414-4591-9240-b6b7fc313085 |
key | sample_4a98196c-f8e6-418f-92de-5319121fac10 |
메타데이터 수정일시 | 2023-09-28T17:45:06.660576 |
MIME 타입 | text/csv |
데이터셋 아이디 | 019020e9-702c-4f4d-b58f-772cc04987c2 |
상태 | active |
url | https://ggdata.kr:6443/samplefiles/IMC/17d039bb-8711-4042-987d-0cbcedbd3070/TC_SN_SCNTY_TPBUZ_TXTMNG_20211110165110_sample.csv |