미니게이트 - 한국어-다국어 번역 말뭉치(기초과학)

기초과학 30만 문장 이상의 원시데이터에 대한 인공지능 학습용 데이터 저작권 확보 후 중분류 5개 분야, 소분류 10개 분야로 분류하여 원시데이터를 수집하고 정제, 가공(특수라벨링/번역), 검수 작업을 실시하여 공공/산업전반에 빅데이터로 활용할 수 있는 기초과학 분야 다국어(영어, 중국어, 일본어) 번역 말뭉치 데이터

리소스

항목
CKAN dataset id bef17c8c-784a-41d7-bdd4-d803dc21215c
상태 active
url https://aihub.or.kr/aihubdata/data/view.do?dataSetSn=71496
버전 2023-12-22
라이선스 cc-zero
pricing 무료
담당자 2
담당자 연락처 인공신경망 기반 번역모델의 문장 번역 성능 (한-일)
업데이트일 2,023-12-22
유/무료 무료
이용방법 다운로드
제공 기관 수행기관(주관) : 미니게이트
최초 제공일 2,023-06-23
파일 크기 72,834,112
최초 수집 일시 2023-08-05T01:24:00…
최근 수집 일시 2024-02-28T10:57:24…

  • 미니게이트 - 한국어-다국어(영어 제외) 번역 말뭉치(기술과학) AI 허브

    기술과학 30만 문장 이상의 원시데이터에 대한 인공지능 학습용 데이터 저작권 확보 후 중분류 5개 분야, 소분류 10개 분야로 분류하여 원시데이터를 수집하고 정제, 가공(특수라벨링/번역), 검수 작업을 실시하여 공공/산업전반에 빅데이터로 활용할 수 있는 기술과학 분야 다국어(중국어, 일본어) 번역 말뭉치 데이터
  • 미니게이트 - 한국어-다국어 번역 말뭉치 (인문학) AI 허브

    인문학 30만 문장 이상의 원시데이터에 대한 인공지능 학습용 데이터 저작권 확보 후 중분류 5개 분야, 소분류 10개 분야로 분류하여 원시데이터를 수집하고 정제, 가공(특수라벨링/번역), 검수 작업을 실시하여 공공/산업전반에 빅데이터로 활용할 수 있는 인문학 분야 다국어(영어, 중국어, 일본어) 번역 말뭉치 데이터

한줄평을 쓰려면 로그인하세요.

전체 데이터셋 보기