특허청_영한 특허 말뭉치_20211231 (2).csv

테이블 미리보기 준비 중...

전체 화면 보기

항목
파일명 특허청_영한 특허 말뭉치_20211231 (2).csv
파일 포맷 CSV
설명 설명 없음
데이터셋 설명

2021년도 공공데이터 기업매칭 지원사업으로 구축된 데이터입니다. 약 15만건 이상의 양질의 학습용 한영 병렬 말뭉치 데이터를 CSV형태로 개방하고 있습니다.

url 파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요)
원본 페이지 https://www.data.go.kr/data/15096702/fileData.do
버전 2023-08-29
파일 크기10 MB
행 수 39,581
컬럼 수9
텍스트 인코딩cp949
컬럼 구분자 , 콤마 (COMMA)

import pandas as pd

df = pd.read_csv('특허청_영한 특허 말뭉치_20211231 (2).csv', on_bad_lines='skip', delimiter=',', encoding='cp949', encoding_errors='ignore')

컬럼 타입 샘플
국가코드 string None
출원번호 float64 None
언어코드 string None
국제특허분류(IPC) string None
문헌종류 string None
구분 string None
원문 string None
번역문 string None
어절수 int64 None

항목
생성일시 2022-06-03T22:06:35.807799
아이디 eeb46047-141d-47d7-8cdd-27932be84645
key https://www.data.go.kr/cmm/cmm/fileDownload.do?atchFileId=FILE_000000002540870&fileDetailSn=1&insertDataPrcus=N
메타데이터 수정일시 2023-08-27T11:10:32.167394
데이터셋 아이디 ea8bc017-447e-4596-842f-da53104b5533
상태 active
url https://www.data.go.kr/cmm/cmm/fileDownload.do?atchFileId=FILE_000000002540870&fileDetailSn=1&insertDataPrcus=N