TC_SN_SUWON_TXTMINNG_CI_20210106103420_sample.csv

테이블 미리보기 준비 중...

컬럼 정보 준비 중...

항목	값
파일명	TC_SN_SUWON_TXTMINNG_CI_20210106103420_sample.csv
파일 포맷	CSV
설명	샘플 데이터
데이터셋 설명	수원시로 수집된 데이터에서 추출된 키워드의 텍스트마이닝 지표 단어빈도(TF) : 한 문서 내에서 빈번하게 등장하는지를 나타내는 값으로, 빈도 값이 높을 수록 문서 내에서 중요한 단어로 판단할 수 있음. 단어중요도(TF-IDF) : 단어빈도(TF)와 문서빈도의 역수(IDF)를 곱한 값으로, 특정 단어가 문서내에서 얼마나 중요한지(희소가치)를 나타냄. 단어중요도값이 높은 단어는 문서 내에서 핵심적인 메시지를 담고 있을 확률이 높음. 단어연결중심성(Degree Centrality) : 특정 단어가 다른 단어와 직접적으로 얼마나 연결(동시출현)되어 있는 지를 나타내는 것으로, 단어연결중심성값이 높을 수록 문서내 다른 단어들과 연결이 많은 것을 뜻함. 단어매개중심성(Betweenness Centrality) : 특정 단어가 다른 단어와 관계를 구축하는데 있어 중개 역할을 얼마나 수행하는 지를 측정한 것으로, 단어매개중심성값이 높을 수록 문서내 속한 단어와 단어 사이를 연결(매개)할 확률이 높은 것을 뜻함. - 데이터 구간 : 2010년 1월 ~ 2020년 12월 분석인덱스 : 순번 수집년월 : 텍스트 데이터가 속한 기간(년-월) 키워드명 : 텍스트 데이터에서 추출된 키워드 단어빈도 : 텍스트 데이터에서 추출된 키워드의 빈도값 단어중요도 : 텍스트 데이터에서 추출된 키워드의 TF-IDF값 단어연결중심성 : 텍스트 데이터에서 추출된 키워드의 연결중심성값 단어매개중심성 : 텍스트 데이터에서 추출된 키워드의 매개중심성값
url	파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요)
원본 페이지	https://bigdata-region.kr/#/dataset/9ac907cb-1f48-454c-9282-752d0d324c25
버전	2020-12-08
파일 크기	1 KB
행 수	30 보통
컬럼 수	7
텍스트 인코딩	cp949
컬럼 구분자	, 콤마 (COMMA)

import pandas as pd

df = pd.read_csv('TC_SN_SUWON_TXTMINNG_CI_20210106103420_sample.csv', on_bad_lines='skip', delimiter=',', encoding='cp949', encoding_errors='ignore')

컬럼	타입	샘플
분석인덱스	int64	None
수집년월	string	None
키워드명	string	None
단어빈도	int64	None
단어중요도	float64	None
단어연결중심성	float64	None
단어매개중심성	float64	None

전체 화면 보기

항목	값
column_info_url	https://ggdata.kr:6443/schemafiles/IMC/9ac907cb-1f48-454c-9282-752d0d324c25/TC_SN_SUWON_TXTMINNG_CI_20210106103420_schema.csv
생성일시	2023-09-28T17:40:51.888129
아이디	e2535e9c-1c41-4eea-b7f1-0f10b9ae33af
key	sample_e3799014-78eb-407d-b78d-cec3b87b3f76
메타데이터 수정일시	2023-09-28T17:40:51.820324
MIME 타입	text/csv
데이터셋 아이디	9751e6d9-dc2e-41fa-9993-56d7f6f75fe5
상태	active
url	https://ggdata.kr:6443/samplefiles/IMC/9ac907cb-1f48-454c-9282-752d0d324c25/TC_SN_SUWON_TXTMINNG_CI_20210106103420_sample.csv

TC_SN_SUWON_TXTMINNG_CI_20210106103420_sample.csv

테이블 미리보기

컬럼 정보(원본 포털 제공)

리소스 정보

pandas 샘플 코드

컬럼 정보

프로파일 리포트

추가 정보 (관리자)