인물별 기사 KDX데이터.csv

샘플 데이터

테이블 미리보기 준비 중...

전체 화면 보기

항목
파일명 인물별 기사 KDX데이터.csv
파일 포맷 CSV
설명 샘플 데이터
데이터셋 설명

매경미디어그룹 MBN 방송 텍스트 데이터를 AI 머신러닝에 활용 할 수 있게 제공

매일경제신문 및 MBN 뉴스를 형태소 분리 가공하여 인물 기준으로 제공 합니다.


url 파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요)
원본 페이지 https://kdx.kr/data/view/31059
버전 2021-11-11
파일 크기650 KB
행 수 1,524
컬럼 수25
텍스트 인코딩utf-8
컬럼 구분자 , 콤마 (COMMA)

import pandas as pd

df = pd.read_csv('인물별 기사 KDX데이터.csv', on_bad_lines='skip', delimiter=',', encoding='utf-8', encoding_errors='ignore')

컬럼 타입 샘플
MBN_MDA_SP_CD string MBN
MBN_ART_ESSN_NO string 1030271
MDA_CGR_NM string 김동환
STD_YEAR string 20120722
ART_SJ_CN string 지붕 위에 오른 성화…런던올림픽 화제
ART_CN string 【 앵커멘트 】
ATCH_IMG_NM string 하나, 100m, 제2
JRNL_NM string 런던올림픽 소식, 뮌헨올림픽, 런던올림픽
WRT_DATE string 40주년, 1972년, 1992년
ART_POSA string 2시간 25분 2초
ART_NOUN string
ART_TAG float64 nan
ART_PRS_NM string 아리랑 고개
ART_RNK_NM float64 nan
ART_INST_NM float64 nan
ART_AREA_NM float64 nan
ART_GD_NM float64 nan
ART_QY float64 nan
ART_EVT float64 nan
ART_DT float64 nan
ART_TIME float64 nan
ART_ANM float64 nan
ART_PLNT float64 nan
ART_AF float64 nan
Unnamed: 24 float64 nan

항목
생성일시 2023-09-09T20:03:24.801040
curl curl 'https://kdx.kr/product/getCsvSampleDataList' -H 'Accept: application/json, text/javascript, */*; q=0.01' -H 'Accept-Language: ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7,de;q=0.6' -H 'Cache-Control: no-cache' -H 'Connection: keep-alive' -H 'Content-Type: application/x-www-form-urlencoded; charset=UTF-8' -H 'Pragma: no-cache' -H 'User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36' -H 'X-Requested-With: XMLHttpRequest' --data-raw 'product_id=31059' --compressed
아이디 cbc3d54a-c6f7-4411-afa0-abae648564c9
key 인물별 기사 KDX데이터.csv
메타데이터 수정일시 2023-09-09T20:03:24.759435
데이터셋 아이디 84664236-ca65-4954-911e-9baf5ee54bdf
상태 active