Datasets desde distintas fuentes disponibles para que sean descargados para realizar sus modelos de ML o Data Science. Para subir Datasets contactar al usuario ssyspe.org.
Foto de Usuario
ccaico

Ranking Troomes
Mensajes: 9
Registrado: 24 Ago 2019, 15:06

Educación - Indicadores de educación rural

Mensaje por ccaico » 20 Dic 2019, 20:30

Descripcion: En este dataset, se proporcionan datos obtenidos de la aplicación de juegos PBS KIDS Measure Up!. En esta aplicación, los niños navegan por un mapa y completan varios niveles, que pueden ser actividades, videoclips, juegos o evaluaciones. Cada evaluación está diseñada para evaluar la comprensión de un niño de un cierto conjunto de habilidades relacionadas con la medición. Hay cinco evaluaciones: medidor de aves, equilibrador de carro, relleno de caldero, clasificador de cofres y clasificador de hongos.

La intención de la competencia es usar los datos del juego para pronosticar cuántos intentos tomará un niño para aprobar una evaluación determinada (una respuesta incorrecta se cuenta como un intento). Cada instalación de la aplicación está representada por un installation_id. Por lo general, esto corresponderá a un niño, pero debe esperar ruido de problemas como dispositivos compartidos. En el conjunto de entrenamiento, se le proporciona el historial completo de los datos del juego. En el conjunto de pruebas, hemos truncado el historial después del evento de inicio de una única evaluación, elegida al azar, para la cual debe predecir el número de intentos. Tenga en cuenta que el conjunto de entrenamiento contiene muchos correos installation_idelectrónicos que nunca tomaron evaluaciones, mientras que todos installation_iden el conjunto de prueba intentaron al menos una evaluación.

Los resultados en esta competencia se agrupan en 4 grupos (con la etiqueta accuracy_groupen ):

3: la evaluación se resolvió en el primer intento
2: la evaluación se resolvió en el segundo intento
1: la evaluación se resolvió después de 3 o más intentos
0: la evaluación nunca se resolvió

Dataset: El archivo train_labels.csv se ha proporcionado para mostrar cómo se calcularían estos grupos en las evaluaciones del conjunto de capacitación. Los intentos de evaluación se capturan en event_code 4100 para todas las evaluaciones, excepto para Bird Measurer, que usa event_code 4110. Si el intento fue correcto, contiene "correct":true.
Se tienen los siguientes atributos para los archivos:
  • train.csv y test.csv Estos son los principales archivos de datos que contienen los eventos de juego. Tiene los siguientes atributos:
event_id Identificador único generado aleatoriamente para el tipo de evento. Se asigna a la event_idcolumna en la tabla de especificaciones.
game_session - Eventos de agrupación de identificadores únicos generados aleatoriamente dentro de un solo juego o sesión de video.
timestamp - Fecha y hora generada por el cliente
event_data- Cadena con formato JSON semiestructurada que contiene los parámetros de eventos. Campos predeterminados son: event_count, event_codey game_time; de lo contrario, los campos están determinados por el tipo de evento.
installation_id- Sesiones de juegos de agrupación de identificadores únicos generados aleatoriamente en una sola instancia de aplicación instalada.
event_count- Contador incremental de eventos dentro de una sesión de juego (compensación en 1). Extraído de event_data.
event_code- Identificador del evento 'clase'. Único por juego, pero puede duplicarse en todos los juegos. Por ejemplo, el código de evento '2000' siempre identifica el evento 'Iniciar juego' para todos los juegos. Extraído de event_data.
game_time- Tiempo en milisegundos desde el inicio de la sesión del juego. Extraído de event_data.
title - Título del juego o video.
type- Tipo de medios del juego o video. Los valores posibles son: 'Juego', 'Evaluación', 'Actividad', 'Clip'.
world- La sección de la aplicación a la que pertenece el juego o el video. Útil para identificar los objetivos del plan de estudios educativos de los medios. Los valores posibles son: 'NINGUNO' (en la pantalla de inicio de la aplicación), TREETOPCITY '(Longitud / Altura),' MAGMAPEAK '(Capacidad / Desplazamiento),' CRYSTALCAVES '(Peso).
  • specs.csv Este archivo proporciona la especificación de los diversos tipos de eventos. Tiene los siguientes atributos:
event_id- Identificador único global para el tipo de evento. Se une a la event_idcolumna en la tabla de eventos.
info - Descripción del evento.
args- Cadena con formato JSON de argumentos de eventos. Cada argumento contiene:
name - Nombre del argumento.
type- Tipo del argumento ( string, int, number, object, array).
info - Descripción del argumento.

Fuente:
https://www.kaggle.com/c/data-science-bowl-2019/data


Responder