-
㈜비네아 - 한국어 지식기반 관계 데이터 AI 허브
문장 내 등장하는 개체(Named Entity) 사이의 관계(Relation) 및 그 속성을 라벨링하여, 문맥 속에서 개체 간 관계 등 다양한 분야의 의미 기반 관계 분석이 가능한 인공지능 학습용 데이터셋을 구축함 -
데이터리(Data.ly) - 민원 업무 자동화 인공지능 언어 데이터 AI 허브
창원시로부터 제공받은 콜센터 및 민원게시판(국민신문고) 원시 데이터에 학습에 필요한 정보(개체명, 의도분류, 부서정보, 키워드 등)를 부착하고 유사문장생성을 통해 표현의 다양성과 언어이해 능력을 향상한 인공지능 데이터셋 -
㈜넥스인테크놀로지 - 금융, 법률 문서 기계독해 데이터 AI 허브
● 금융, 법률(ODT, HWP, PDF, 등) 포함, 다양한 영역의 복합데이터(텍스트, 테이블)를 대상으로 한 MRC QA학습 데이터 구축 ● 정답경계 추출형, Yes/No 단문형, Table 정답 추출형, 다지선다형 등의 다양한 융형의 학습 데이터 구축 및 기계독해 모델 개발 -
솔트룩스 - 온라인 구어체 말뭉치 데이터 AI 허브
온라인 플랫폼(게시판, 댓글 등)에서 구어체 위주의 텍스트 데이터를 수집 후 전사 도구를 활용하여 구축된 10억 어절의 말뭉치 요소별(범용용어 및 고유명사) AI 학습 데이터셋 -
솔트룩스 - 대규모 웹데이터 기반 한국어 말뭉치 데이터 AI 허브
웹사이트 기반 (메가뉴스) 대용량의 텍스트 데이터를 수집 후 전사 도구를 활용하여 타이틀, 단락 제목, 본문 텍스트가 구조화된 10억 어절의 말뭉치 요소별(범용용어 및 고유명사) AI 학습 데이터셋