-
고려대학교 산학협력단 - 한국어-영어 합성 기계번역 품질 예측 데이터셋
한국어-영어 합성 기계번역 품질 예측 데이터(A Synthetic Quality Estimation Dataset for Korean-English Neural Machine Translation, QUAK)는 한국어 문장과 영어 기계번역 문장을 참조하여 각 문장들에 대한 기계번역 결과 품질을 토큰별 OK/BAD... -
한국외국어대학교 - 기계번역 품질 검증 데이터
한국어-영어 양방향에 대하여 기계번역 사후교정 및 어절, 문장, 문서 수준에서 기계번역 품질주석 데이터 구축 HTML 미리보기 -
미니게이트 - 한국어-다국어 번역 말뭉치 (인문학)
인문학 30만 문장 이상의 원시데이터에 대한 인공지능 학습용 데이터 저작권 확보 후 중분류 5개 분야, 소분류 10개 분야로 분류하여 원시데이터를 수집하고 정제, 가공(특수라벨링/번역), 검수 작업을 실시하여 공공/산업전반에 빅데이터로 활용할 수 있는 인문학 분야 다국어(영어, 중국어, 일본어) 번역 말뭉치 데이터... -
미니게이트 - 한국어-다국어 번역 말뭉치(기초과학)
기초과학 30만 문장 이상의 원시데이터에 대한 인공지능 학습용 데이터 저작권 확보 후 중분류 5개 분야, 소분류 10개 분야로 분류하여 원시데이터를 수집하고 정제, 가공(특수라벨링/번역), 검수 작업을 실시하여 공공/산업전반에 빅데이터로 활용할 수 있는 기초과학 분야 다국어(영어, 중국어, 일본어) 번역 말뭉치... -
미니게이트 - 한국어-다국어(영어 제외) 번역 말뭉치(기술과학)
기술과학 30만 문장 이상의 원시데이터에 대한 인공지능 학습용 데이터 저작권 확보 후 중분류 5개 분야, 소분류 10개 분야로 분류하여 원시데이터를 수집하고 정제, 가공(특수라벨링/번역), 검수 작업을 실시하여 공공/산업전반에 빅데이터로 활용할 수 있는 기술과학 분야 다국어(중국어, 일본어) 번역 말뭉치 데이터... -
(주)에버트란 - 방송콘텐츠 한국어-영어 번역 말뭉치
인공지능 학습용 다국어 방송콘텐츠 번역 말뭉치 구축 방송 콘텐츠 분야의 영어, 스페인어, 러시아어 통·번역 성능 향상을 통해 한국 문화 확산 및 콘텐츠 산업 활성화를 위한 한국어 방송 콘텐츠의 인공지능 학습용 통·번역 데이터 상황별 신조어, 약어, 은어, 관용적 의미와 어투까지 효과적으로 전달할 수 있는... -
한국외국어대학교 - 한-영 및 한-중 음성발화 데이터
다국어 음성 합성을 위한 같은 의미의 한국어-영어/ 한국어-중국어 AI 학습용 데이터 구축 -
한국외국어대학교 - 한영 혼합 인식 데이터
대화 중 자연스럽게 구사되는 영문 단어(외래어 및 외국어) 및 관용적 표현이 포함된 문장과 스크립트를 통해 AI 학습용 데이터 구축 -
플리토 - 전문분야 한영 말뭉치
AI기반 자동 번역 기술 개발을 위해 고품질의 한-영 병렬 말뭉치 150만 이상의 문장을 학습용 번역 데이터로 구축하여 특화된 맞춤 번역기 서비스 제공 -
(주)에버트란 - 방송콘텐츠 한국어-영어 통번역 음성 데이터
인공지능 학습용 다국어 방송콘텐츠 번역 말뭉치 구축 방송 콘텐츠 분야의 영어, 스페인어, 러시아어 통·번역 성능 향상을 통해 한국 문화 확산 및 콘텐츠 산업 활성화를 위한 한국어 방송 콘텐츠의 인공지능 학습용 통·번역 데이터 상황별 신조어, 약어, 은어, 관용적 의미와 어투까지 효과적으로 전달할 수 있는... -
-
특허청 KIPRISPlus 기계번역용 국문초록
2008년부터 2013년까지 공개된 특허의 기계번역용 국문초록 정보를 제공합니다. (KIPRISPlus 서비스) -
특허청 구글 AutoML MTPE 작업도구 이용가이드
2021년도 공공데이터 기업매칭 지원사업 산출물입니다. 특허청_구글Auto MLMTPE작업도구 이용가이드입니다. 작업도구가 필요하신 경우 데이터 신청을 통하여 이용부탁드립니다. -
고려대학교 산학협력단 - 윤리 및 사회적 문제를 초래하는 기계번역 오류 탐지를 위한 학습 데이터셋
기계번역 결과에 포함된 오류는 불완전한 의미의 왜곡으로 이어지면서 때로는 사용자로 하여금 불편한 반응을 야기하거나 사회적 파장을 초래하는 경우가 존재한다. KoCED(English-Korean Critical Error Detection) 데이터셋은 영어-한국어 기계번역에서 나타나는 치명적 오류들을 감지하는 모델... -
특허청 KIPRISPlus 기계번역용 국문초록 REST API
한국 특허정보를 영문으로 가공한 한국특허영문초록(KPA)와 유사하게 해외데이터 교류 및 서비스를 위한 재가공 번역초록을 XML 형태로 제공합니다. -
솔트룩스 - 트랜스위즈 자동번역 API
o 트랜스위즈 자동번역 API는 유료입니다. o 트랜스위즈 자동번역 API로 영↔한, 일↔한 기계번역기능을 이용할 수 있습니다. -
기계번역용 국문초록 데이터
[DB개요] o 한국 특허정보를 영문으로 가공한 한국특허영문초록(KPA)와 유사하게 해외데이터 교류 및 서비스를 위한 재가공 번역초록을 API(SOAP 방식)와 대용량(BULK)으로 제공합니다. [제공정보] o API 서비스 - 국문초록 : 출원번호, 등록번호, 공개번호 정보를 조회하여, 국문초록... -
밍키 재팬 - 중한 IT특화 사전학습(Pre-trained) 인공신경망 번역 모델 | NMT | Fairseq Transfomer | AI...
IT특화 Fairseq Transformer (중한) 사전학습 번역 모델을 ModernMT에서 사용 가능한 형태로 제공합니다. ■ ModernMT 오픈소스툴을 이용하여 AI 자동 번역을 이용하실수 있습니다. 구입한 모델은 구글이나 아마존 클라우드 환경에서 간단히 릴리스 가능합니다. ・이용자수・문자제한 없는... -
[무료] OpenNMT-py(AI) 자동번역 전처리 한일 일한 학습 데이터 (소프트웨어관련)
인공신경망 자동번역 OpenNMT-py 딥러닝 학습을 위한 한일-일한 프리프로세스 데이터셋입니다. OpenNMT-py의 학습용 프리프로세스 데이터셋은 인공신경망 기계번역(NMT)기의 모델 작성 및 학습 옵티마이저 등의 테스트 목적으로도 사용이 가능합니다. ■특징 기계학습 알고리즘을 이용한 문장 단위 학습 데이터 추출... -
밍키 재팬 - 일중, 중일 뉴스 베이스 사전학습(Pre-trained) 인공신경망 번역 모델 | NMT | Fairseq Transfome...
뉴스 베이스 Fairseq Transformer (일중, 중일)사전학습 번역 모델을 ModernMT에서 사용 가능한 형태로 제공합니다. -