문화체육관광부 국립국어원 모두의 말뭉치 통계 목록

모두의 말뭉치를 통해 배포되고 있는 말뭉치의 통계 정보를 소개하고, 현재 배포 중인 말뭉치의 종류와 문서수 어절수를 소개합니다.

리소스

항목
CKAN dataset id a6fd840c-5f41-4a84-9855-01dc6dcad8e9
상태 active
url https://www.data.go.kr/data/15123464/fileData.do
버전 2023-09-22
라이선스 cc-zero
pricing 무료
관리 부서 언어정보과
기타 유의사항 수치가 비워져 있는 셀은 통계 정보 중 문서나 어절 수로 셀 수 없는 특수한 자료입니다. 단순하게 파일을 수를 공개하는 것은 의미가 없어서 공란으로 두었습니다.
담당자 연락처 226,699,679
데이터 한계
매체유형 텍스트
분류체계 문화체육관광 - 문화체육관광일반
비용부과기준 및 단위
비용부과유무 무료
수집방법
업데이트 주기 연간
이용조건 로그인 없이 다운로드
이용허락범위 이용허락범위 제한 없음
전체 행 55
제공 기관 문화체육관광부 국립국어원
제공형태 공공데이터포털에서 다운로드(원문파일등록)
차기 등록 예정일 2,024-09-20
키워드 모두의 말뭉치,통계정보,어절수
확장자 CSV
최초 수집 일시 2023-09-28T18:59:15…
최근 수집 일시 2023-12-12T14:03:05…

  • 문화체육관광부 국립국어원 국회 회의록 말뭉치 2021 공공데이터포털

    2021년 국립국어원 국회 회의록 말뭉치 구축 사업을 통해 구축된 말뭉치입니다. 2003년부터 2020년까지 국회 소위원회 회의록을 대상으로 구축한 말뭉치로 발화 내 한자로 기록된 용어나 이름을 한글로 변환하였고, 행동이나 상황 묘사와 원어 삽입구를 정제하였습니다. LINK 미리보기
  • 문화체육관광부 국립국어원 우리말샘 공공데이터포털

    ㅇ 개방형 사전(우리말샘)은 온 국민이 내용을 깁고 더하는 사용자 참여형 사전(단어 찾기, 집필하기 등)임. ㅇ 이 개방형 사전(우리말샘) 데이터는 해당 누리집에서 회원가입 후 이용자가 직접 내려받기 가능하며, 별도로 국립국어원에서 이용자에게 자료를 직접 제공(메일 등)하지 않음. 이에, 이용 문의자 및 데이터 신청자에게는 이용...
  • 문화체육관광부 우리말샘 공공데이터포털

    국립국어원의 우리말 샘은 사용자가 참여한 사전를 외부 개발자 및 사용자가 이를 활용 할 수 있도록 전달하는 API서비스입니다. 단어의 설명, 발음 등 다양한 정보를 제공합니다.
  • 문화체육관광부 국립국어원 한국어기초사전 공공데이터포털

    국립국어원의 한국어 기초사전 정보를 외부 개발자 및 사용자가 이를 활용 할 수 있도록 전달하는 API 서비스입니다. 한국어 기초사전 목록정보와 상세정보 등 다양한 정보를 제공합니다.

한줄평을 쓰려면 로그인하세요.

전체 데이터셋 보기