La intención de la competencia es usar los datos del juego para pronosticar cuántos intentos tomará un niño para aprobar una evaluación determinada (una respuesta incorrecta se cuenta como un intento). Cada instalación de la aplicación está representada por un installation_id. Por lo general, esto corresponderá a un niño, pero debe esperar ruido de problemas como dispositivos compartidos. En el conjunto de entrenamiento, se le proporciona el historial completo de los datos del juego. En el conjunto de pruebas, hemos truncado el historial después del evento de inicio de una única evaluación, elegida al azar, para la cual debe predecir el número de intentos. Tenga en cuenta que el conjunto de entrenamiento contiene muchos correos installation_idelectrónicos que nunca tomaron evaluaciones, mientras que todos installation_iden el conjunto de prueba intentaron al menos una evaluación.
Los resultados en esta competencia se agrupan en 4 grupos (con la etiqueta accuracy_groupen ):
3: la evaluación se resolvió en el primer intento
2: la evaluación se resolvió en el segundo intento
1: la evaluación se resolvió después de 3 o más intentos
0: la evaluación nunca se resolvió
Dataset: El archivo train_labels.csv se ha proporcionado para mostrar cómo se calcularían estos grupos en las evaluaciones del conjunto de capacitación. Los intentos de evaluación se capturan en event_code 4100 para todas las evaluaciones, excepto para Bird Measurer, que usa event_code 4110. Si el intento fue correcto, contiene "correct":true.
Se tienen los siguientes atributos para los archivos:
- train.csv y test.csv Estos son los principales archivos de datos que contienen los eventos de juego. Tiene los siguientes atributos:
game_session - Eventos de agrupación de identificadores únicos generados aleatoriamente dentro de un solo juego o sesión de video.
timestamp - Fecha y hora generada por el cliente
event_data- Cadena con formato JSON semiestructurada que contiene los parámetros de eventos. Campos predeterminados son: event_count, event_codey game_time; de lo contrario, los campos están determinados por el tipo de evento.
installation_id- Sesiones de juegos de agrupación de identificadores únicos generados aleatoriamente en una sola instancia de aplicación instalada.
event_count- Contador incremental de eventos dentro de una sesión de juego (compensación en 1). Extraído de event_data.
event_code- Identificador del evento 'clase'. Único por juego, pero puede duplicarse en todos los juegos. Por ejemplo, el código de evento '2000' siempre identifica el evento 'Iniciar juego' para todos los juegos. Extraído de event_data.
game_time- Tiempo en milisegundos desde el inicio de la sesión del juego. Extraído de event_data.
title - Título del juego o video.
type- Tipo de medios del juego o video. Los valores posibles son: 'Juego', 'Evaluación', 'Actividad', 'Clip'.
world- La sección de la aplicación a la que pertenece el juego o el video. Útil para identificar los objetivos del plan de estudios educativos de los medios. Los valores posibles son: 'NINGUNO' (en la pantalla de inicio de la aplicación), TREETOPCITY '(Longitud / Altura),' MAGMAPEAK '(Capacidad / Desplazamiento),' CRYSTALCAVES '(Peso).
- specs.csv Este archivo proporciona la especificación de los diversos tipos de eventos. Tiene los siguientes atributos:
info - Descripción del evento.
args- Cadena con formato JSON de argumentos de eventos. Cada argumento contiene:
name - Nombre del argumento.
type- Tipo del argumento ( string, int, number, object, array).
info - Descripción del argumento.
Fuente:
https://www.kaggle.com/c/data-science-bowl-2019/data