샘플데이터(스팸시그니처).csv
샘플 데이터
테이블 미리보기 준비 중...
항목 | 값 |
---|---|
파일명 | 샘플데이터(스팸시그니처).csv |
파일 포맷 | CSV |
설명 | 샘플 데이터 |
데이터셋 설명 | □ 개요스팸용 주요 키워드 (시그니처) 데이터에는 이메일의 스팸여부를 판단할 수 있는 본문의 대상과 필터링값, 분류 조건 등을 포함한 정보를 제공하고 있습니다. □ 특징스팸여부를 판단하는 키워드 중심의 데이터로서 이메일의 스팸차단 솔루션을 개발하거나 기 운영중인 차단 솔루션의 기능 보강을 위한 보완 데이터로 활용이 가능합니다.□ 상품 제공 범위데이터 구매(요청)시점까지 축적된 스팸 시그니처를 제공합니다.□ 상품 컬럼(속성) 정보본 상품은 필터ID, 필터링 값, 필터링 대상, 필터링 조건, 스팸유형 분류, 수정시간 등의 정보를 제공하고 있습니다. |
url | 파일 다운로드 (안 되면 원본 페이지에서 다운 받으세요) |
원본 페이지 | https://www.findatamall.or.kr/market/dataProdDetail?gdsSn=27&gdsSeCd=GENERAL&gdsVer=1 |
버전 | 2023-04-14 |
파일 크기 | 11 KB |
행 수 | 129 큼 |
컬럼 수 | 6 |
텍스트 인코딩 | UTF-8-SIG |
컬럼 구분자 | , 콤마 (COMMA) |
import pandas as pd
df = pd.read_csv('샘플데이터(스팸시그니처).csv', on_bad_lines='skip', delimiter=',', encoding='UTF-8-SIG', encoding_errors='ignore')
컬럼 | 타입 | 샘플 |
---|---|---|
필터ID | int64 | 9447169 |
필터링 값 | string | 1GtdpkxN7izueE1696LQUSRB72Mh71BeNh |
필터링 대상 | string | 본문 |
필터링 조건 | string | 포함하면 |
분류 | string | 피싱(X) |
수정시간 | string | 2019-07-15 18:04:42 |
항목 | 값 |
---|---|
생성일시 | 2024-03-03T07:49:19.261856 |
아이디 | dfa7a9dc-03cc-47c5-927b-96a627ae686f |
key | https://www.findatamall.or.kr/file/sampleDown?gdsSn=27&gdsVer=1 |
메타데이터 수정일시 | 2024-03-03T07:49:19.256707 |
데이터셋 아이디 | 1fd46e37-4fb6-46dc-8481-58146b6f8d78 |
상태 | active |
url | https://www.findatamall.or.kr/file/sampleDown?gdsSn=27&gdsVer=1 |