Temas acerca de Inteligencia Artificial
Foto de Usuario
Kmucching

Ranking Troomes
Mensajes: 4
Registrado: 14 Nov 2020, 14:09

Modelo de Inteligencia Artificial aplicado al bono independiente dado por el MTPE

Mensaje por Kmucching » 15 Ene 2021, 20:55

1. Modelo de Inteligencia Artificial aplicado al bono independiente dado por el MTPE


2. Resumen del trabajo

En el presente trabajo se utiliza inteligencia artificial para escoger el mejor modelo para la predicción del cobro del bono independiente, se usará datos publicados por el Ministerio de Trabajo y Promoción del Empleo (MTPE). Para ello se usarán metodologías que permitan limpiar el dataset de manera que tenga la data necesaria y crucial para su posterior procesamiento, los algoritmos de regresión que se pondrán a prueba serán: Random Forest, Support Vector Machine, Redes Bayesianas y Árbol de decisión. Se van a mostrar los resultados de cada algoritmo utilizado y se concluirá cuál es el más eficiente.

3. Descripción del Dataset
  • Data set original: El data set original cuenta con 13 atributos, que son los siguientes:
    • COD_HOGAR: Es el código único por hogar
    • UBIGEO: Es el código de ubicación geográfica
    • DE_DEPARTAMENTO: Indica el departamento del hogar beneficiado
    • DE_PROVINCIA: Indica la provincia del hogar beneficiado
    • DE_DISTRITO: Indica el distrito del hogar beneficiado
    • PERSONAS_HOGAR: Indica el número de personas del hogar beneficiado
    • MONTO: Indica el monto asignado, en todos los casos es de 780.
    • TIPO_BONO: Indica el tipo de bono, en todos los casos es Bono Independiente
    • BONO_COBRADO: Indica si el bono se ha cobrado o no
    • FECHA_COBRO: Indica la fecha en la que se cobró el bono, en caso no se haya cobrado no existe fecha
    • ENTIDAD_COBRO: Indica la entidad financiera donde se ha cobrado el bono, en todos los casos es Banco de la nación
    • MEDIO_COBRO: Indica el medio por el cuál se cobró el bono
    • FECHA_ACTUALIZACION: Indica la última fecha de actualización del dataset, en todos los casos es el 20/06/2020
    Fig1.JPG

  • Limpieza del dataset
    • Se eliminarán atributos irrelevantes a la hora de la predicción como los que tienen todos los valores diferentes por fila: COD_HOGAR, FECHA_COBRO, MEDIO_COBRO
    • Se eliminarán atributos donde la información siempre es la misma, puesto que esto no influirá para nada en la predicción: MONTO, TIPO_BONO, ENTIDAD_COBRO, FECHA_ACTUALIZACIÓN
    • Con esto, el dataset solo se quedaría con 6 atributos que nos permitirán predecir si el bono se cobrará o no. Así mismo hay una gran cantidad de instancias que no permitirán correr correctamente los algoritmos en la plataforma Weka, por lo que se trabajará solo con una muestra de 5026 instancias.
      Fig2.JPG
El dataset original se puede encontrar en el siguiente enlace: https://www.datosabiertos.gob.pe/datase ... mpleo-mtpe

4. Descripción de los resultados obtenidos con las técnicas usadas
  • 4.1. Árbol de decisión: J48
    TreeDecisionJ48.JPG
  • 4.2. Random Forest
    TreeRF.JPG
  • 4.3. SVM
    SVM.JPG
  • 4.4. Redes bayesianas:
    Bayes.JPG
5. Conclusiones
Después de ver los resultados de cada algoritmo, podemos concluir que el mejor modelo es el Árbol de decisión J48, seguido por el modelo SVM ya que tienen el mayor porcentaje de precisión (92.83% y 92.63% respectivamente). Este resultado no es decisivo al cien por ciento, ya que solo es una muestra de toda la data, para conseguir resultados más precisos podrían utilizarse otras plataformas con mayor capacidad de procesamiento de datos.

6. Ruta Github
En la siguiente ruta Github se podrá encontrar el dataset original y el dataset procesado: https://github.com/Kmucching/BonoIndependientePeru


Responder