(sample)NL_BO_SENSE.csv

Sample

테이블 미리보기 준비 중...

전체 화면 보기

항목
파일명 (sample)NL_BO_SENSE.csv
파일 포맷 CSV
설명 Sample
데이터셋 설명

ㅇ 데이터 소개 - 1만 여개의 어휘가 담긴 도서 감성어 사전 - 긍정점수(positive score)와 부정점수(nagative score)를 계산하여 도서가 가진 긍부정 이미지를 분석할 수 있습니다.

. "아주 신기한 이야기입니다." → 긍정 긍정점수 : 0.15241+0.00867+0.80554 = 0.96662 부정점수 : 0.09503+0.00628+0.63460 = 0.73591

. "무슨 이런 어처구니없는 이야기가..." → 부정 긍정점수 : 0.03995+0.23706+0.00038+0.80554 = 1.08293 부정점수 : 0.12370+0.43747+0.00157+0.63460 = 1.19734

ㅇ 활용 분야 - (공공도서관) 도서관 회원 독후감 분석 시 활용 - (문헌정보학 연구자) 평가 관련 연구 데이터로 활용 - (스타트업) 도서 관련 어플리케이션 개발 시 활용 - (출판사) 자사 출판물 모니터링 시 활용 - (온라인 서점) 이용자를 위한 도서 구매 참고용 데이터로 활용

ㅇ 데이터 출처 - 국립중앙도서관

ㅇ 특이사항 - 해당 데이터는 관련사업 종료로 인해 2022년부터 업데이트가 중단되었습니다. 추가적인 문의는 데이터 상담소 > 데이터 문의 게시판을 이용해주세요.

url 파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요)
원본 페이지 https://www.bigdata-culture.kr/bigdata/user/data_market/detail.do?id=32bc97f3-79ca-4cc0-bab3-fa6603bd8222
버전 2021-06-04
파일 크기4 KB
행 수 100 보통
컬럼 수4
텍스트 인코딩utf-8
컬럼 구분자 , 콤마 (COMMA)

import pandas as pd

df = pd.read_csv('(sample)NL_BO_SENSE.csv', on_bad_lines='skip', delimiter=',', encoding='utf-8', encoding_errors='ignore')

컬럼 타입 샘플
id int64 None
term string None
positive_score float64 None
nagative_score float64 None

항목
생성일시 2023-09-28T16:44:43.398587
아이디 632c06f0-0f95-40b5-b339-7fca8512a4da
메타데이터 수정일시 2023-10-08T16:02:50.675313
MIME 타입 text/csv
데이터셋 아이디 e7dc993d-0ba7-4da7-b5d4-74f3a4a89949
상태 active
url https://kr.object.gov-ncloudstorage.com/sampledata/NL_admin/%28sample%29NL_BO_SENSE.csv