Datasets desde distintas fuentes disponibles para que sean descargados para realizar sus modelos de ML o Data Science. Para subir Datasets contactar al usuario ssyspe.org.
Responder
Foto de Usuario
Edityucra

Ranking Troomes
Mensajes: 23
Registrado: 24 Ago 2019, 15:08

Seguridad - Webs maliciosos y benignos

Mensaje por Edityucra » 20 Dic 2019, 17:34

DESCRIPCION:
Los datos se obtuvieron mediante el uso de diferentes fuentes verificadas de URL benignas y maliciosas, en un honeypot de cliente interactivo bajo para aislar el tráfico de red.
Con el fin de evaluar diferentes modelos de clasificación para predecir sitios web maliciosos y benignos, en función de la capa de aplicación y las características de la red.

ATRIBUTOS:
URL: es la identificación anónima de la URL analizada en el estudio
URL_LENGTH: es el número de caracteres en la URL
NUMBER_SPECIAL_CHARACTERS: es el número de caracteres especiales identificados en la URL, como "/", "%", "#", "&", ". "," = "
CHARSET: es un valor categórico y su significado es el estándar de codificación de caracteres (también llamado conjunto de caracteres).
SERVIDOR: es un valor categórico y su significado es el sistema operativo del servidor obtenido de la respuesta del paquete.
CONTENT_LENGTH: representa el tamaño del contenido del encabezado HTTP.
WHOIS_COUNTRY: es una variable categórica, sus valores son los países que obtuvimos de la respuesta del servidor (específicamente, nuestro script utilizó la API de Whois).
WHOIS_STATEPRO: es una variable categórica, sus valores son los estados que obtuvimos de la respuesta del servidor (específicamente, nuestro script usó la API de Whois).
WHOIS_REGDATE: Whois proporciona la fecha de registro del servidor, por lo que esta variable tiene valores de fecha con formato DD / MM / AAAA HH: MM
WHOIS_UPDATED_DATE: a través de Whois obtuvimos la última fecha de actualización del servidor analizado
TCP_CONVERSATION_EXCHANGE: esta variable es el número de paquetes TCP intercambiados entre el servidor y nuestro cliente honeypot
DIST_REMOTE_TCP_PORT: es el número de puertos detectados y diferentes a TCP
REMOTE_IPS: esta variable tiene el número total de IP conectadas al honeypot
APP_BYTES: este es el número de bytes transferidos
SOURCE_APP_PACKETS: paquetes enviados desde el honeypot al servidor
REMOTE_APP_PACKETS: paquetes recibidos del servidor
APP_PACKETS: este es el número total de paquetes IP generados durante la comunicación entre el honeypot y el servidor
DNS_QUERY_TIMES: este es el número de paquetes DNS generados durante la comunicación entre el honeypot y el servidor
TIPO: esta es una variable categórica, sus valores representan el tipo de página web analizada, específicamente, 1 es para sitios web maliciosos y 0 es para sitios web benignos

FUENTE:
https://www.kaggle.com/xwolf12/maliciou ... n-websites
Adjuntos
dataset.csv
(187.16 KiB)


Foto de Usuario
VladimirTitoG

Ranking Troomes
Mensajes: 26
Registrado: 20 Dic 2019, 16:56

Re: Seguridad - Webs maliciosos y benignos

Mensaje por VladimirTitoG » 01 Oct 2020, 05:05

El siguiente enlace también muestra un repositorio de webs maliciosas y benignas también útil: https://data.mendeley.com/datasets/gdx3pkwp47/2
Tomar en cuenta que contiene casi un GB de peso.


Responder