문화체육관광부 국립국어원_모두의 말뭉치 통계 목록.csv
테이블 미리보기 준비 중...
항목 | 값 |
---|---|
파일명 | 문화체육관광부 국립국어원_모두의 말뭉치 통계 목록.csv |
파일 포맷 | CSV |
설명 | 설명 없음 |
데이터셋 설명 | 모두의 말뭉치를 통해 배포되고 있는 말뭉치의 통계 정보를 소개하고, 현재 배포 중인 말뭉치의 종류와 문서수 어절수를 소개합니다. |
url | 파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요) |
원본 페이지 | https://www.data.go.kr/data/15123464/fileData.do |
버전 | 2023-09-22 |
파일 크기 | 2 KB |
행 수 | 55 보통 |
컬럼 수 | 5 |
텍스트 인코딩 | cp949 |
컬럼 구분자 | , 콤마 (COMMA) |
import pandas as pd
df = pd.read_csv('문화체육관광부 국립국어원_모두의 말뭉치 통계 목록.csv', on_bad_lines='skip', delimiter=',', encoding='cp949', encoding_errors='ignore')
컬럼 | 타입 | 샘플 |
---|---|---|
연번 | int64 | None |
배포 말뭉치 | string | None |
성격 | string | None |
문서수 | float64 | None |
어절수 | float64 | None |
항목 | 값 |
---|---|
생성일시 | 2023-09-28T18:59:15.341560 |
아이디 | e05d0c32-5462-4c28-b930-966bb61038b8 |
key | https://www.data.go.kr/cmm/cmm/fileDownload.do?atchFileId=FILE_000000002819400&fileDetailSn=1&insertDataPrcus=N |
메타데이터 수정일시 | 2023-09-28T18:59:15.327257 |
데이터셋 아이디 | a6fd840c-5f41-4a84-9855-01dc6dcad8e9 |
상태 | active |
url | https://www.data.go.kr/cmm/cmm/fileDownload.do?atchFileId=FILE_000000002819400&fileDetailSn=1&insertDataPrcus=N |