동양시스템즈 - 다양한 형태의 한글 문자 OCR

한글의 광학글자인식(OCR, Optical Character Recognition) 알고리즘 성능 개선을 위한 다양한 형태(테이블 내 텍스트, 숫자, 문장부호 등 포함)의 한글 글자체(인쇄체 + 손글씨) 데이터셋 구축

리소스

항목
CKAN dataset id c6df756c-e01b-45d1-9fdb-3bb130874c80
상태 active
url https://aihub.or.kr/aihubdata/data/view.do?dataSetSn=91
버전 2023-04-14
라이선스 cc-zero
pricing 무료
담당자 김시진
담당자 연락처 02-405-7443
업데이트일 2,023-04-14
유/무료 무료
이용방법 다운로드
제공 기관 수행기관(주관) : 동양시스템즈
최초 제공일 2,021-06-22
파일 크기 42,529,354,169
최초 수집 일시 2022-09-18T08:19:36…
최근 수집 일시 2024-02-28T10:57:32…

  • 동양시스템즈 - 대용량 손글씨 OCR 데이터 AI 허브

    산업 및 실생활에서 사용되는 각종 신청서등에 포함된 다양한 한글 손글씨를 AI 기반의 OCR 기술을 통해 디지털 텍스트로 자동 확보하기 위하여, 다양한 손글씨 원문을 수집하고 작성된 손글씨에 대한 바운딩박스와 라벨링 정보로 구성된 JSON 파일과 해당 손글씨 원문이미지 파일의 쌍으로 구성된 OCR AI 학습용 데이터셋

한줄평을 쓰려면 로그인하세요.

전체 데이터셋 보기