-
㈜이루온아이앤에스 - 브레이킹 동작 데이터(비보잉 동작 데이터) AI 허브
탑락, 다운락, 파워무브, 프리즈 네 가지 클래스에서 대표 동작 각 20개와 응용 동작인 컴비네이션 5가지를 선정 총 85개 동작을 8개의 카메라로 다각도에서 직접 촬영한 Multi-view 영상 데이터 브레이킹 국가대표 선수, 세계 랭커부터 초·중급 비보이·비걸까지 총 102명, 다양한 숙련도의 시연자 동작 영상 데이터 구축 -
KAIST - 스마트폰 앱/웹 사용 로그 데이터셋 AI 허브
Android 6.0.0 이상을 대상으로 UsageStat API를 활용 앱 사용 내역을 수집함 31명의 피험자를 대상으로 3주간 앱 사용 내역을 수집하였으며, 그 양은 약 10만 건에 달함 데이터베이스는 MariaDB + MaxScale Load Balancer를 활용함 -
경기도청 - 자율주행 및 ADAS AI인지모델 학습용 데이터 AI 허브
데이터 수집 차량에 장착된 카메라(전/후/좌/우)를 통해 차량, 보행자, 개인형 이동장치 등 주변 객체를 다양하게 수집하여 프레임 단위로 이미지화한 데이터로 전처리(BBOX)를 통해 객체를 구분하고 개인정보(얼굴, 번호판 등) 비식별화 작업을 통하여 개인정보 문제를 해결한 원천 데이터를 확보 -
경기도청 - 교통 CCTV 영상 BBOX 데이터 AI 허브
경기도 내 교통 CCTV를 통해 차량, 보행자 등 주변 객체를 다양하게 수집하여 프레임 단위로 이미지화한 데이터로 전처리(BBOX)를 통해 객체를 구분하고 개인정보(얼굴, 번호판 등) 비식별화 작업을 통하여 개인정보 문제를 해결한 원천 데이터를 확보 -
한국어 생성 기반 상식추론 데이터셋 AI 허브
사전에 구축된 AI-HUB의 대화 요약 및 이미지 캡션 텍스트 데이터로부터 Tagger 및 신경망 네트워크를 통해 반자동화 구축 방식을 적용하여 형태소를 추출. 추출한 형태소는 하나의 개념 집합을구성하며, 개념 집합의 내용을 바탕으로 일반 상식에 부합하는 짧은 문장을 재구성하도록 하는 자연어 생성 데이터. -
노년층 대상 감성 분류 모델 AI 허브
노인이 포함된 화자 간의 대화 내용을 보고, 노인의 감정 상태를 분류하는 과제 -
한국인 헤어스타일 세그먼테이션 모델 AI 허브
주어진 인물 이미지 내에서 헤어스타일 부분만 분리하여 영역에 대한 mask 진행하는 과제 -
셀바스에이아이 - 웰니스 대화 스크립트 데이터셋 AI 허브
강남 세브란스에서 전달받은 상담데이터 1만 6천건에서 초진이고 환자 본인이 직접 내원한 경우인 4200건 추출 추출된 상담 데이터를 기준으로 문장별 분리 및 대화 의도 분류 분류별로 유저-챗봇 대화스크립트 생성 -
연세대학교 - 심리상담을 위한 멀티모달 데이터셋 AI 허브
스트레스 상황 하에서의 100명 한국인의 피부전도도, 광용적맥파, 피부 온도, 가속도계 정보를 수집 실험 단계 별로 시작 시간과 끝 시간을 저장하고 각 단계의 스트레스 단계 정의 -
㈜엠티데이타 - 관광 KVQA 데이터(서부권) AI 허브
지식정보(텍스트)-시각정보(이미지)-질의응답(텍스트)로 이루어진 다중쌍데이터셋 관광지 및 관광 상품, 무인 스토어 등 다양한 분야에서 탐지, 식별 솔루션에 활용 가능, 잠재가치가 매우 높은 데이터로 인식 -
KAIST - 상황/의미적 정보 데이터셋 AI 허브
스마트폰의 내장 센서 및 사용 정보로부터 수집되는 다양한 데이터는 사용자의 다양한 상태 및 맥락을 파악하는 데 필수적임. 이러한 데이터들은 실/내외 위치, 통화 시간/횟수, 문자 횟수, 화면 켬/끔 등을 포함함. 또한, 스마트폰의 내장 센서를 통해서 사용자의 활동을 유추할 수 있음. Google 사에서 제공하는 Fitness API는... -
KAIST - 모바일 기기의 데이터셋 AI 허브
2개의 모바일 플랫폼(Nvidia jetxon tx2, Google pixel 3a)에서 측정 Google pixel 3a의 경우, Moonsoon power monitor를 이용하여 전력 소모 측정 프로세서 built-in센서를 이용한 CPU/GPU 온도, clock 주파수 측정 Application 혹은 kernel 단에서의... -
시각장애인 시스템 개발을 위한 VQA 모델 AI 허브
VQA는 시각 정보를 기반으로 질의응답 하는 시스템으로, 이미지 내 객체 및 상황에 대한 이해를 바탕으로, 관련 질문 시 적절한 답변을 진행하는 과제 -
㈜ 아크릴 - 한국어 감정 정보가 포함된 연속적 대화 데이터셋 AI 허브
웹 크롤링 등의 방법으로 대화를 수집하고, 적정 길이와 turn 수 및 주제를 가진 대화를 선정하였으며 감정 레이블링 수행 챗봇이 말하기 부적절한 용어(지나치게 전문적인 용어, 비속어 등)을 가능한 범위에서 필터링 하였음 -
㈜엘솔루 - 어린이 음성 데이터셋 AI 허브
초등학생 1학년에서 6학년의 남녀가 발성한 총 22.387시간의 음성데이터 -
법률 문서 요약 모델 AI 허브
여러 개의 문장으로 이루어진 법률 문서 내에서 내용의 중요성을 파악하여 원문을 잘 나타내는 3개의 문장을 추출하는 문서 요약 과제 문장 별로 포함될지 안될지 구분하는 classification 문제 -
㈜ 아크릴 - 라이프로그 신호 기반 감정 분류용 데이터셋 AI 허브
20~40대의 일반인 사용자 180명 대상으로 1개월간 수집 진행 텍스트 작성 기준 총 2,800건 수집 (TPO 정보 포함) -
고려대학교 산학협력단 - 한국어-영어 합성 기계번역 품질 예측 데이터셋 AI 허브
한국어-영어 합성 기계번역 품질 예측 데이터(A Synthetic Quality Estimation Dataset for Korean-English Neural Machine Translation, QUAK)는 한국어 문장과 영어 기계번역 문장을 참조하여 각 문장들에 대한 기계번역 결과 품질을 토큰별 OK/BAD 태그로 예측하는... -
㈜스마트레이더시스템 - 4D 이미징 레이다 센서 기반의 주행환경 객체인지 데이터 AI 허브
자율주행차에 설치된 4D 이미징 레이다 센서를 이용하여 고속도로와 도심 주행환경에서 수집된 주행환경객체 인식을 위한 데이터셋 구축 - 주행환경객체: 중앙분리대, 방음벽, 육교, 터널, 가로수, 표지판, 램프 -
마인즈랩 - 일반상식 AI 허브
한국어 위키백과 내 주요 문서 15만 개에 포함된 지식을 추출하여 객체(entity), 속성(attribute), 값(value)을 갖는 트리플 형식의 데이터 75만 개를 구축한 지식베이스 제공.