인물별 기사 KDX데이터.csv
샘플 데이터
테이블 미리보기 준비 중...
항목 | 값 |
---|---|
파일명 | 인물별 기사 KDX데이터.csv |
파일 포맷 | CSV |
설명 | 샘플 데이터 |
데이터셋 설명 | 매경미디어그룹 MBN 방송 텍스트 데이터를 AI 머신러닝에 활용 할 수 있게 제공 매일경제신문 및 MBN 뉴스를 형태소 분리 가공하여 인물 기준으로 제공 합니다. |
url | 파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요) |
원본 페이지 | https://kdx.kr/data/view/31059 |
버전 | 2021-11-11 |
파일 크기 | 650 KB |
행 수 | 1,524 큼 |
컬럼 수 | 25 |
텍스트 인코딩 | utf-8 |
컬럼 구분자 | , 콤마 (COMMA) |
import pandas as pd
df = pd.read_csv('인물별 기사 KDX데이터.csv', on_bad_lines='skip', delimiter=',', encoding='utf-8', encoding_errors='ignore')
컬럼 | 타입 | 샘플 |
---|---|---|
MBN_MDA_SP_CD | string | MBN |
MBN_ART_ESSN_NO | string | 1030271 |
MDA_CGR_NM | string | 김동환 |
STD_YEAR | string | 20120722 |
ART_SJ_CN | string | 지붕 위에 오른 성화…런던올림픽 화제 |
ART_CN | string | 【 앵커멘트 】 |
ATCH_IMG_NM | string | 하나, 100m, 제2 |
JRNL_NM | string | 런던올림픽 소식, 뮌헨올림픽, 런던올림픽 |
WRT_DATE | string | 40주년, 1972년, 1992년 |
ART_POSA | string | 2시간 25분 2초 |
ART_NOUN | string | 발 |
ART_TAG | float64 | nan |
ART_PRS_NM | string | 아리랑 고개 |
ART_RNK_NM | float64 | nan |
ART_INST_NM | float64 | nan |
ART_AREA_NM | float64 | nan |
ART_GD_NM | float64 | nan |
ART_QY | float64 | nan |
ART_EVT | float64 | nan |
ART_DT | float64 | nan |
ART_TIME | float64 | nan |
ART_ANM | float64 | nan |
ART_PLNT | float64 | nan |
ART_AF | float64 | nan |
Unnamed: 24 | float64 | nan |
항목 | 값 |
---|---|
생성일시 | 2023-09-09T20:03:24.801040 |
curl | curl 'https://kdx.kr/product/getCsvSampleDataList' -H 'Accept: application/json, text/javascript, */*; q=0.01' -H 'Accept-Language: ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7,de;q=0.6' -H 'Cache-Control: no-cache' -H 'Connection: keep-alive' -H 'Content-Type: application/x-www-form-urlencoded; charset=UTF-8' -H 'Pragma: no-cache' -H 'User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36' -H 'X-Requested-With: XMLHttpRequest' --data-raw 'product_id=31059' --compressed |
아이디 | cbc3d54a-c6f7-4411-afa0-abae648564c9 |
key | 인물별 기사 KDX데이터.csv |
메타데이터 수정일시 | 2023-09-09T20:03:24.759435 |
데이터셋 아이디 | 84664236-ca65-4954-911e-9baf5ee54bdf |
상태 | active |