AI 허브 - 기미나인

㈜이루온아이앤에스 - 브레이킹 동작 데이터(비보잉 동작 데이터) AI 허브

탑락, 다운락, 파워무브, 프리즈 네 가지 클래스에서 대표 동작 각 20개와 응용 동작인 컴비네이션 5가지를 선정 총 85개 동작을 8개의 카메라로 다각도에서 직접 촬영한 Multi-view 영상 데이터 브레이킹 국가대표 선수, 세계 랭커부터 초·중급 비보이·비걸까지 총 102명, 다양한 숙련도의 시연자 동작 영상 데이터 구축

HTML

KAIST - 스마트폰 앱/웹 사용 로그 데이터셋 AI 허브

Android 6.0.0 이상을 대상으로 UsageStat API를 활용 앱 사용 내역을 수집함 31명의 피험자를 대상으로 3주간 앱 사용 내역을 수집하였으며, 그 양은 약 10만 건에 달함 데이터베이스는 MariaDB + MaxScale Load Balancer를 활용함

HTML

경기도청 - 자율주행 및 ADAS AI인지모델 학습용 데이터 AI 허브

데이터 수집 차량에 장착된 카메라(전/후/좌/우)를 통해 차량, 보행자, 개인형 이동장치 등 주변 객체를 다양하게 수집하여 프레임 단위로 이미지화한 데이터로 전처리(BBOX)를 통해 객체를 구분하고 개인정보(얼굴, 번호판 등) 비식별화 작업을 통하여 개인정보 문제를 해결한 원천 데이터를 확보

HTML

경기도청 - 교통 CCTV 영상 BBOX 데이터 AI 허브

경기도 내 교통 CCTV를 통해 차량, 보행자 등 주변 객체를 다양하게 수집하여 프레임 단위로 이미지화한 데이터로 전처리(BBOX)를 통해 객체를 구분하고 개인정보(얼굴, 번호판 등) 비식별화 작업을 통하여 개인정보 문제를 해결한 원천 데이터를 확보

HTML

한국어 생성 기반 상식추론 데이터셋 AI 허브

사전에 구축된 AI-HUB의 대화 요약 및 이미지 캡션 텍스트 데이터로부터 Tagger 및 신경망 네트워크를 통해 반자동화 구축 방식을 적용하여 형태소를 추출. 추출한 형태소는 하나의 개념 집합을구성하며, 개념 집합의 내용을 바탕으로 일반 상식에 부합하는 짧은 문장을 재구성하도록 하는 자연어 생성 데이터.

HTML

노년층 대상 감성 분류 모델 AI 허브

노인이 포함된 화자 간의 대화 내용을 보고, 노인의 감정 상태를 분류하는 과제

HTML

한국인 헤어스타일 세그먼테이션 모델 AI 허브

주어진 인물 이미지 내에서 헤어스타일 부분만 분리하여 영역에 대한 mask 진행하는 과제

HTML

셀바스에이아이 - 웰니스 대화 스크립트 데이터셋 AI 허브

강남 세브란스에서 전달받은 상담데이터 1만 6천건에서 초진이고 환자 본인이 직접 내원한 경우인 4200건 추출 추출된 상담 데이터를 기준으로 문장별 분리 및 대화 의도 분류 분류별로 유저-챗봇 대화스크립트 생성

HTML

연세대학교 - 심리상담을 위한 멀티모달 데이터셋 AI 허브

스트레스 상황 하에서의 100명 한국인의 피부전도도, 광용적맥파, 피부 온도, 가속도계 정보를 수집 실험 단계 별로 시작 시간과 끝 시간을 저장하고 각 단계의 스트레스 단계 정의

HTML

㈜엠티데이타 - 관광 KVQA 데이터(서부권) AI 허브

지식정보(텍스트)-시각정보(이미지)-질의응답(텍스트)로 이루어진 다중쌍데이터셋 관광지 및 관광 상품, 무인 스토어 등 다양한 분야에서 탐지, 식별 솔루션에 활용 가능, 잠재가치가 매우 높은 데이터로 인식

HTML

KAIST - 상황/의미적 정보 데이터셋 AI 허브

스마트폰의 내장 센서 및 사용 정보로부터 수집되는 다양한 데이터는 사용자의 다양한 상태 및 맥락을 파악하는 데 필수적임. 이러한 데이터들은 실/내외 위치, 통화 시간/횟수, 문자 횟수, 화면 켬/끔 등을 포함함. 또한, 스마트폰의 내장 센서를 통해서 사용자의 활동을 유추할 수 있음. Google 사에서 제공하는 Fitness API는...

HTML

KAIST - 모바일 기기의 데이터셋 AI 허브

2개의 모바일 플랫폼(Nvidia jetxon tx2, Google pixel 3a)에서 측정 Google pixel 3a의 경우, Moonsoon power monitor를 이용하여 전력 소모 측정 프로세서 built-in센서를 이용한 CPU/GPU 온도, clock 주파수 측정 Application 혹은 kernel 단에서의...

HTML

시각장애인 시스템 개발을 위한 VQA 모델 AI 허브

VQA는 시각 정보를 기반으로 질의응답 하는 시스템으로, 이미지 내 객체 및 상황에 대한 이해를 바탕으로, 관련 질문 시 적절한 답변을 진행하는 과제

HTML

㈜ 아크릴 - 한국어 감정 정보가 포함된 연속적 대화 데이터셋 AI 허브

웹 크롤링 등의 방법으로 대화를 수집하고, 적정 길이와 turn 수 및 주제를 가진 대화를 선정하였으며 감정 레이블링 수행 챗봇이 말하기 부적절한 용어(지나치게 전문적인 용어, 비속어 등)을 가능한 범위에서 필터링 하였음

HTML

㈜엘솔루 - 어린이 음성 데이터셋 AI 허브

초등학생 1학년에서 6학년의 남녀가 발성한 총 22.387시간의 음성데이터

HTML

법률 문서 요약 모델 AI 허브

여러 개의 문장으로 이루어진 법률 문서 내에서 내용의 중요성을 파악하여 원문을 잘 나타내는 3개의 문장을 추출하는 문서 요약 과제 문장 별로 포함될지 안될지 구분하는 classification 문제

HTML

㈜ 아크릴 - 라이프로그 신호 기반 감정 분류용 데이터셋 AI 허브

20~40대의 일반인 사용자 180명 대상으로 1개월간 수집 진행 텍스트 작성 기준 총 2,800건 수집 (TPO 정보 포함)

HTML

고려대학교 산학협력단 - 한국어-영어 합성 기계번역 품질 예측 데이터셋 AI 허브

한국어-영어 합성 기계번역 품질 예측 데이터(A Synthetic Quality Estimation Dataset for Korean-English Neural Machine Translation, QUAK)는 한국어 문장과 영어 기계번역 문장을 참조하여 각 문장들에 대한 기계번역 결과 품질을 토큰별 OK/BAD 태그로 예측하는...

HTML

㈜스마트레이더시스템 - 4D 이미징 레이다 센서 기반의 주행환경 객체인지 데이터 AI 허브

자율주행차에 설치된 4D 이미징 레이다 센서를 이용하여 고속도로와 도심 주행환경에서 수집된 주행환경객체 인식을 위한 데이터셋 구축 - 주행환경객체: 중앙분리대, 방음벽, 육교, 터널, 가로수, 표지판, 램프

HTML

마인즈랩 - 일반상식 AI 허브

한국어 위키백과 내 주요 문서 15만 개에 포함된 지식을 추출하여 객체(entity), 속성(attribute), 값(value)을 갖는 트리플 형식의 데이터 75만 개를 구축한 지식베이스 제공.

HTML

전체 752개 데이터셋을 찾았습니다