텍스트분석용사전 산업별 분류 개체명 사전

소셜 분석 플랫폼을 활용하여 온라인/소셜 Data 수집/분석 후 추출한 명사형 키워드를 산업별 카테고리 및 속성으로 분류

  • 수집 기간 : 2011.1~2019.9
  • 수집 채널 : 뉴스(258개_우측 도표 참고), SNS(트위터), 카페(네이버,다음,이글루스,티스토리), 블로그(네이버,다음), 게시판(MLBPARK_BULLPAN, Youtube, 네이버 지식인, 네이트톡, 다음 TIP, 디스이즈게임-커뮤니티, 디시인사이드_갤러리, 루리웹_자유게시판, 보배드림, 뷰티쁠, 세티즌, 시코_미니기기게시판, 오늘의유머, 와이고수, 웃긴대학, 인벤_게시판)
  • 카테고리 및 속성 구분 : 대분류, <산업별> 구분 = 공공/경제·금융/문화·엔터테인먼트/물류·유통/서비스/스포츠/인물/정치/제조/상권/사회이슈/공통키워드 중분류, <분야별> 구분 = 공공 = <중앙행정기관>, <지방자치단체> .... / 경제·금융 = <은행>, <증권>, <카드>... 소분류, <속성별> 구분 = <지방자치단체> = [부산광역시청], [서울특별시청], [경기도청] ... 세부단위, 속성당 세부 키워드 리스트 = [부산광역시청] = 금정구청,기장군청,동래구청,부산강서구청...

  • 키워드 리스트 가공 방법 : ① 반자동화 *키워드 볼륨 분석 모듈을 활용하여 전체 분석 기간(월 또는 연단위) 대상 상위 1000위 키워드 리스트 추출 ② 상위 1000위 키워드 리스트에서 산업/분야와 연관도 높은 키워드 발췌, 일반 조사(격조사,접속조사,보조사) 또는 중복 발현된 특정 ID/URL 등 불필요 키워드 삭제 등 정제 작업 진행 ③ 유의미 키워드 발췌, 정제된 키워드 리스트에 포털사 분석 주제 검색 시 확인되는 연관어, 원문 내 주요 키워드 신규 추가 작업

*키워드 볼륨 분석 = [모듈명] keyword_vol_proc, 기간별(시,일,주,월)로 키워드를 추출하여 키워드 랭킹 및 빈도를 제공하는 모듈

  • 코드표를 참조하여 구매승인 후 개별 화일 전송

리소스

항목
CKAN dataset id d879205e-b634-4406-a200-2c461bd4c9f8
상태 active
url https://kdx.kr/data/view/159
버전 2019-11-21
라이선스 cc-zero
pricing 유료
가격 10,000,000
담당자 연락처 데이터 구매 문의는 상품 문의를 이용해주세요
제공 기관 SK텔레콤
최초 수집 일시 2023-09-12T06:26:19…
최근 수집 일시 2023-09-12T18:55:35…

한줄평을 쓰려면 로그인하세요.

전체 데이터셋 보기