TC_SN_RETL_TPBUZ_WEB_DOC_20211110152812_sample.csv

샘플 데이터

테이블 미리보기 준비 중...

전체 화면 보기

컬럼 정보 준비 중...

전체 화면 보기

항목
파일명 TC_SN_RETL_TPBUZ_WEB_DOC_20211110152812_sample.csv
파일 포맷 CSV
설명 샘플 데이터
데이터셋 설명

주요 포털 및 SNS커뮤니티에서 소매점업 관련 검색어로 수집된 비정형 텍스트 데이터 및 정제 메타 데이터

(검색어 : 편의점, 서점, 슈퍼마켓, 가구점, 반찬가게, 문구점 등)

- 데이터 구간 : 2010년 1월 ~ 2021년 10월

  • 수집인덱스 : 순번

  • 기준년월 : 원본 텍스트의 생성년월(-년 -월)

  • 수집채널명 : 수집채널명(네이버뉴스, 네이버카페, 네이버블로그 등)

  • 수집URL : 원본 텍스트의 URL

  • 제목 : 원본 텍스트의 제목

  • 내용 : 원본 텍스트의 내용(본문)

※ 웹문서 데이터는 메타정보로, 사용자가 데이터 원본에 접근할 수 있도록 데이터 출처 등을 작성한 것입니다.

url 파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요)
원본 페이지 https://bigdata-region.kr/#/dataset/304f582a-f49d-4822-9bbc-126e367bcaec
버전 2022-04-06
파일 크기8 KB
행 수 30 보통
컬럼 수6
텍스트 인코딩cp949
컬럼 구분자 , 콤마 (COMMA)

import pandas as pd

df = pd.read_csv('TC_SN_RETL_TPBUZ_WEB_DOC_20211110152812_sample.csv', on_bad_lines='skip', delimiter=',', encoding='cp949', encoding_errors='ignore')

컬럼 타입 샘플
수집인덱스 int64 None
기준년월 string None
수집채널명 string None
수집URL string None
제목 string None
내용 string None

항목
column_info_url https://ggdata.kr:6443/schemafiles/IMC/304f582a-f49d-4822-9bbc-126e367bcaec/TC_SN_RETL_TPBUZ_WEB_DOC_20211110152812_schema.csv
생성일시 2023-09-28T17:45:07.822293
아이디 9a50472a-20c9-4d0e-bac2-d453e0d6c062
key sample_ca834a05-e03c-459f-97b3-2fbacdee434d
메타데이터 수정일시 2023-09-28T17:45:07.745566
MIME 타입 text/csv
데이터셋 아이디 57ad1747-b5a9-4ee8-89d6-a5f82835a252
상태 active
url https://ggdata.kr:6443/samplefiles/IMC/304f582a-f49d-4822-9bbc-126e367bcaec/TC_SN_RETL_TPBUZ_WEB_DOC_20211110152812_sample.csv