특허청_영한 특허 말뭉치_20211231 (2).csv
테이블 미리보기 준비 중...
항목 | 값 |
---|---|
파일명 | 특허청_영한 특허 말뭉치_20211231 (2).csv |
파일 포맷 | CSV |
설명 | 설명 없음 |
데이터셋 설명 | 2021년도 공공데이터 기업매칭 지원사업으로 구축된 데이터입니다. 약 15만건 이상의 양질의 학습용 한영 병렬 말뭉치 데이터를 CSV형태로 개방하고 있습니다. |
url | 파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요) |
원본 페이지 | https://www.data.go.kr/data/15096702/fileData.do |
버전 | 2023-08-29 |
파일 크기 | 10 MB |
행 수 | 39,581 큼 |
컬럼 수 | 9 |
텍스트 인코딩 | cp949 |
컬럼 구분자 | , 콤마 (COMMA) |
import pandas as pd
df = pd.read_csv('특허청_영한 특허 말뭉치_20211231 (2).csv', on_bad_lines='skip', delimiter=',', encoding='cp949', encoding_errors='ignore')
컬럼 | 타입 | 샘플 |
---|---|---|
국가코드 | string | None |
출원번호 | float64 | None |
언어코드 | string | None |
국제특허분류(IPC) | string | None |
문헌종류 | string | None |
구분 | string | None |
원문 | string | None |
번역문 | string | None |
어절수 | int64 | None |
항목 | 값 |
---|---|
생성일시 | 2022-06-03T22:06:35.807799 |
아이디 | eeb46047-141d-47d7-8cdd-27932be84645 |
key | https://www.data.go.kr/cmm/cmm/fileDownload.do?atchFileId=FILE_000000002540870&fileDetailSn=1&insertDataPrcus=N |
메타데이터 수정일시 | 2023-08-27T11:10:32.167394 |
데이터셋 아이디 | ea8bc017-447e-4596-842f-da53104b5533 |
상태 | active |
url | https://www.data.go.kr/cmm/cmm/fileDownload.do?atchFileId=FILE_000000002540870&fileDetailSn=1&insertDataPrcus=N |