더아이엠씨 - SNS 산업텍스트마이닝종합지표

"산업 관련 검색어로 수집된 데이터에서 추출된 키워드의 텍스트마이닝 지표

단어빈도(TF) : 한 문서 내에서 빈번하게 등장하는지를 나타내는 값으로, 빈도 값이 높을 수록 문서 내에서 중요한 단어로 판단할 수 있음.

단어중요도(TF-IDF) : 단어빈도(TF)와 문서빈도의 역수(IDF)를 곱한 값으로, 특정 단어가 문서내에서 얼마나 중요한지(희소가치)를 나타냄. 단어중요도값이 높은 단어는 문서 내에서 핵심적인 메시지를 담고 있을 확률이 높음.

연결정도중심성(Degree Centrality) : 특정 단어가 다른 단어와 직접적으로 얼마나 연결(동시출현)되어 있는 지를 나타내는 것으로, 단어연결중심성값이 높을 수록 문서내 다른 단어들과 연결이 많은 것을 뜻함.

매개중심성(Betweenness Centrality) : 특정 단어가 다른 단어와 관계를 구축하는데 있어 중개 역할을 얼마나 수행하는 지를 측정한 것으로, 단어매개중심성값이 높을 수록 문서내 속한 단어와 단어 사이를 연결(매개)할 확률이 높은 것을 뜻함."

데이터 구간 : 2010년 1월 ~ 2021년 10월

분석인덱스 : 순번

수집년월 : 텍스트 데이터가 속한 기간(년-월)

키워드명 : 텍스트 데이터에서 추출된 키워드

단어빈도 : 텍스트 데이터에서 추출된 키워드의 빈도값

단어중요도 : 텍스트 데이터에서 추출된 키워드의 TF-IDF값

연결정도중심성 : 텍스트 데이터에서 추출된 키워드의 연결중심성값

매개중심성 : 텍스트 데이터에서 추출된 키워드의 매개중심성값

리소스

항목
CKAN dataset id 08aac2bc-0018-4f7a-bd24-fac32d64115e
상태 active
url https://bigdata-region.kr/#/dataset/394df779-6187-4594-9f63-273dc934aa51
버전 2021-11-19
라이선스 cc-by
pricing 무료
가격 무료
갱신일자 2,021-11-19
갱신주기 매년
데이터 유형 비정형
생성일자 2,020-11-13
이용조건 로그인, 이용신청 후 다운로드
최초 수집 일시 2023-09-09T17:47:02…
최근 수집 일시 2023-12-10T13:51:48…

  • 더아이엠씨 - SNS 관광텍스트마이닝종합지표 지역경제 빅데이터

    관광 관련 검색어로 수집된 데이터에서 추출된 키워드의 텍스트마이닝 지표 단어빈도(TF) : 한 문서 내에서 빈번하게 등장하는지를 나타내는 값으로, 빈도 값이 높을 수록 문서 내에서 중요한 단어로 판단할 수 있음. 단어중요도(TF-IDF) : 단어빈도(TF)와 문서빈도의 역수(IDF)를 곱한 값으로, 특정 단어가 문서내에서 얼마나...
  • 더아이엠씨 - SNS 데이트텍스트마이닝종합지표 지역경제 빅데이터

    데이트 관련 검색어로 수집된 데이터에서 추출된 키워드의 텍스트마이닝 지표 단어빈도(TF) : 한 문서 내에서 빈번하게 등장하는지를 나타내는 값으로, 빈도 값이 높을 수록 문서 내에서 중요한 단어로 판단할 수 있음. 단어중요도(TF-IDF) : 단어빈도(TF)와 문서빈도의 역수(IDF)를 곱한 값으로, 특정 단어가 문서내에서 얼마나...
  • 더아이엠씨 - SNS 지역텍스트마이닝종합지표 지역경제 빅데이터

    경기도 내 11개 지역명으로 수집된 데이터에서 추출된 키워드의 텍스트마이닝 지표 단어빈도(TF) : 한 문서 내에서 빈번하게 등장하는지를 나타내는 값으로, 빈도 값이 높을 수록 문서 내에서 중요한 단어로 판단할 수 있음. 단어중요도(TF-IDF) : 단어빈도(TF)와 문서빈도의 역수(IDF)를 곱한 값으로, 특정 단어가 문서내에서...
  • 더아이엠씨 - SNS 창업텍스트마이닝종합지표 지역경제 빅데이터

    창업 관련 검색어로 수집된 데이터에서 추출된 소비 제품 관련 키워드의 텍스트마이닝 지표 단어빈도(TF) : 한 문서 내에서 빈번하게 등장하는지를 나타내는 값으로, 빈도 값이 높을 수록 문서 내에서 중요한 단어로 판단할 수 있음. 단어중요도(TF-IDF) : 단어빈도(TF)와 문서빈도의 역수(IDF)를 곱한 값으로, 특정 단어가...

한줄평을 쓰려면 로그인이 필요합니다.

데이터셋으로 돌아가기