고려대학교 산학협력단 - 윤리 및 사회적 문제를 초래하는 기계번역 오류 탐지를 위한 학습 데이터셋

기계번역 결과에 포함된 오류는 불완전한 의미의 왜곡으로 이어지면서 때로는 사용자로 하여금 불편한 반응을 야기하거나 사회적 파장을 초래하는 경우가 존재한다. KoCED(English-Korean Critical Error Detection) 데이터셋은 영어-한국어 기계번역에서 나타나는 치명적 오류들을 감지하는 모델 학습을 위한 것이며, 해당 모델을 통해 왜곡된 번역의 무분별한 증식을 줄일 수 있다.

리소스

    리소스가 없습니다.

항목
CKAN dataset id 6fc2a2fb-548d-472f-af55-db817120252a
상태 active
url https://aihub.or.kr/aihubdata/data/view.do?dataSetSn=71269
버전 2023-04-07
라이선스 None
pricing 무료
업데이트일 2,023-04-07
유/무료 무료
이용방법 다운로드
최초 제공일 2,022-11-28
파일 크기 758,883
최초 수집 일시 2022-12-02T21:06:46…
최근 수집 일시 2024-02-28T10:55:45…

댓글을 달려면 로그인이 필요합니다.

데이터셋으로 돌아가기