문화체육관광부 국립국어원_모두의 말뭉치 통계 목록.csv

테이블 미리보기 준비 중...

전체 화면 보기

항목
파일명 문화체육관광부 국립국어원_모두의 말뭉치 통계 목록.csv
파일 포맷 CSV
설명 설명 없음
데이터셋 설명

모두의 말뭉치를 통해 배포되고 있는 말뭉치의 통계 정보를 소개하고, 현재 배포 중인 말뭉치의 종류와 문서수 어절수를 소개합니다.

url 파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요)
원본 페이지 https://www.data.go.kr/data/15123464/fileData.do
버전 2023-09-22
파일 크기2 KB
행 수 55 보통
컬럼 수5
텍스트 인코딩cp949
컬럼 구분자 , 콤마 (COMMA)

import pandas as pd

df = pd.read_csv('문화체육관광부 국립국어원_모두의 말뭉치 통계 목록.csv', on_bad_lines='skip', delimiter=',', encoding='cp949', encoding_errors='ignore')

컬럼 타입 샘플
연번 int64 None
배포 말뭉치 string None
성격 string None
문서수 float64 None
어절수 float64 None

항목
생성일시 2023-09-28T18:59:15.341560
아이디 e05d0c32-5462-4c28-b930-966bb61038b8
key https://www.data.go.kr/cmm/cmm/fileDownload.do?atchFileId=FILE_000000002819400&fileDetailSn=1&insertDataPrcus=N
메타데이터 수정일시 2023-09-28T18:59:15.327257
데이터셋 아이디 a6fd840c-5f41-4a84-9855-01dc6dcad8e9
상태 active
url https://www.data.go.kr/cmm/cmm/fileDownload.do?atchFileId=FILE_000000002819400&fileDetailSn=1&insertDataPrcus=N