에이아이스페라 - [AISpera] AI 기반 웹트래픽 데이터

■ 개요

  • 'AI 기반 웹트래픽 데이터'는 실제 홈페이지에서 습득할 수 있는 다양한 정보(네트워크 로그, 기술 스택 정보, 인증서 정보, 스크린샷 정보 등)를 수집

  • 해당 정보를 바탕으로 해당 홈페이지가 위협적인지 판단한 결과 데이터(summary, score 등)를 제공

■ 특징

  • 데이터베이스 약 3만 6천건 / 400MB

  • 웹브라우저 창 내에서는 확인할 수 없는 실제 웹페이지의 상세 데이터, 자체 수집한 피싱 사이트 정보를 머신 러닝 알고리즘을 이용하여 학습시켜 도출한 피싱 확률 제공

■ 제공 조건

  • 계약 체결 후 데이터 제공 및 활용가능

  • 온라인 및 오프라인에서의 재판매 및 제3자의공유,배포 불가능

  • 데이터는 .json 으로 제공

■ 데이터 명세(예시)

-도메인 서치 검색결과

-웹 페이지 접속 시 다른 웹 페이지로 redirect 될 경우의 정보

-웹 페이지의 frame 태그에 연결된 url에 대한 정보

-도메인에 연결된 subdomain의 정보

-페이지에 연결된 인증서 정보

-웹 페이지 내에 연결된 프로그램 데이터 파일 여부

-연결된 웹 페이지의 쿠키 정보

-연결된 ip의 상세 정보

-java 변수의 이름 및 유형

-웹 페이지에서 사용된 기술 스택 정보

-웹 페이지의 네트워크 로그 정보

-웹 페이지의 스크린샷 저장 경로

-페이지에 대한 subdomain 리스트

-해당 웹 페이지의 dns record 정보

-해당 웹 페이지의 dns record 정보

-웹 페이지의 메타 정보

-도메인 분류 결과(구글 세이프 브라우징, 도메인 유형, DGA Score)

-Security Headers 정보

-Cloudflare로 숨겨진 실제 IP의 정보

-페이지에 연결된 URL의 정보

-페이지에 연결된 HTML 파일 저장 경로

-위험 탐지 알고리즘에서 탐지된 요소

-웹 페이지의 전체 java 파일 저장 경로

-페이지에 연결된 IP 주소 및 스코어

-도메인 주소에 매핑된 IP의 정보

-페이지 네트워크 정보(인증서, 쿠키 등)

-HTML 페이지 링크에 연결된 도메인에 대한 정보

리소스

항목
CKAN dataset id 7731ac51-ebbc-4847-b4af-29ab0ca8ed39
상태 active
url https://www.findatamall.or.kr/market/dataProdDetail?gdsSn=4522&gdsSeCd=GENERAL&gdsVer=1
버전 2023-04-14
라이선스 cc-zero
pricing 유료
가격 협의
등록 일자 2,022-12-27
최종 업데이트 2,023-04-14
최초 수집 일시 2024-03-03T07:29:00…
최근 수집 일시 2024-03-03T07:29:00…

한줄평을 쓰려면 로그인하세요.

전체 데이터셋 보기