-
동양시스템즈 - 대용량 손글씨 OCR 데이터 AI 허브
산업 및 실생활에서 사용되는 각종 신청서등에 포함된 다양한 한글 손글씨를 AI 기반의 OCR 기술을 통해 디지털 텍스트로 자동 확보하기 위하여, 다양한 손글씨 원문을 수집하고 작성된 손글씨에 대한 바운딩박스와 라벨링 정보로 구성된 JSON 파일과 해당 손글씨 원문이미지 파일의 쌍으로 구성된 OCR AI 학습용 데이터셋 -
누리IDT - 고서 한자 인식 (OCR) AI 허브
고서 한자 이미지를 인식하기 위한 이미지 데이터 -
㈜메트릭스 - 객체 간 관계성 인지용 한국형 비전 데이터 AI 허브
한국 상황을 잘 설명할 수 있는 한국형 객체인식 데이터셋 구축하기 위해 300만장의 이미지로와 설명문으로부터 객체 간 관계성 지도를 작성함 -
동양시스템즈 - 고서 한자 인식 OCR 데이터 AI 허브
현존 고문헌의 대부분을 차지하고 있는 조선시대 고서의 원문 한자를 AI 기반의 OCR 기술을 통해 디지털 텍스트로 자동 확보하기 위하여, 고서 원문 내의 각 낱자 한자들에 대한 바운딩박스와 라벨링(유니코드 한자) 정보로 구성된 JSON 파일과 해당 고서 원문이미지 파일의 쌍으로 구성된 한자 글자수 기준 1천만 자 규모의 고서 한자... -
한국지식재산연구원 - 산업정보 연계 주요국 특허 영-한 데이터 AI 허브
해외 주요국 영문 특허명세서를 전문가(변리사)가 관여한 한국어 번역, KSIC(표준산업분류) 라벨링 및 기술용어를 태깅한 데이터셋으로, 기술적 관점의 국제특허분류(IPC, International Patent Classification)가 아닌 통계청에 고시하고 있는 표준산업분류를 연계한 데이터를 통해 기술, 경제, 산업 간 유기적... -
제주특별자치도 관내 관광지 다국어 텍스트데이터 공공데이터포털
제주특별자치도 관광지명, 관광지분야 언어, 등의 기준으로 구분되어 기재되어있는 제주특별자치도 관내 관광지의 관광지 안내 텍스트에 대한 정보를 제공합니다. -
한국학중앙연구원 한국향토문화전자대전 텍스트 메타데이터 공공데이터포털
한국향토문화전자대전에서 서비스하는 텍스트 콘텐츠의 메타데이터 목록(항목명(대표, 한글, 한자, 영문), 분야, 유형, 시대, 집필자, URL 등을 포함) -
한국학중앙연구원 장서각 가락삼왕기 공공데이터포털
가락삼왕기 텍스트 28책,가락삼왕기 텍스트 28책,가락삼왕기 텍스트 28책,가락삼왕기 텍스트 28책가락삼왕기 텍스트 28책 -
한국학중앙연구원 장서각 금위영등록 공공데이터포털
한국학중앙연구원내 장서각에 소장중인 금위영등록 본문 텍스트,한국학중앙연구원내 장서각에 소장중인 금위영등록 본문 텍스트,한국학중앙연구원내 장서각에 소장중인 금위영등록 본문 텍스트 -
한국학중앙연구원 유이양문록 공공데이터포털
본 데이터는 장서각에 소장되어 있으며 조선 왕실에서 애독하던 한글 고선 소설 유이양문록의 원문 텍스트 77책에 대한 자료입니다. -
케이플러스 - 외식 소비패턴 데이터(음식 블로그 데이터) 농식품 빅데이터
※ 본 데이터는 매 월 단위로 작성 및 배포됩니다. ■ 데이터 개요 ※ 음식 블로그 데이터 POS 데이터 중 큰 비중을 차지하고 있는 요식업 POS 가맹점에 대해 이용객의 소비 패턴을 파악하기 위해 맛집 블로그 내용에 대한 수집을 시행하였습니다. ※ 메뉴 트렌드 데이터 음식 블로그 데이터 내에서 표준 품목(메뉴)에 대한 언급 횟수를... -
주식회사 여기어때컴퍼니 - 월별 인기 리뷰 금융 빅데이터
맛집 앱 사용자의 다양한 평가 정보 데이터 중, 월별로 가장 인기 있었던 리뷰 목록 -
주식회사 여기어때컴퍼니 - 오늘의 리뷰 금융 빅데이터
맛집 앱 사용자의 다양한 평가 정보 데이터 중, 일별로 선정한 가장 주목할만한 리뷰