Temas acerca de Inteligencia Artificial
Foto de Usuario
willians124uni

Ranking Troomes
Mensajes: 3
Registrado: 13 Ago 2020, 16:22

CLUSTERIZACIÓN DE LA POBLACIÓN PERUANA PARA LOS BONOS INDEPENDIENTES TRABAJA PERÚ, MTPE(CON IMAGENES)

Mensaje por willians124uni » 15 Ene 2021, 21:58

CLUSTERIZACIÓN DE LA POBLACIÓN PERUANA PARA LOS BONOS INDEPENDIENTES TRABAJA PERÚ, MTPE

1. Resumen del trabajo
En el contexto actual de la pandemia, es necesario entender qué grupos del perú han sido beneficiados por el bono independiente trabaja Perú, esto con la finalidad de destinar los siguientes bonos a personas no beneficiadas y así poder apoyar a todos los peruanos. La dataset que se ha utilizado para realizar el clustering es “Bono independiente” obtenido de la página de la PCM. Se utilizó como herramientas google colab para la limpieza de la data y Weka para el entrenamiento y resultado de los modelos de clusterización, en esta ocasión utilice K-Means.

2. Descripción del Dataset
La dataset fue construida a partir de los padrones de beneficiarios generados por el programa social Trabaja Perú y los reportes de las entidades financieras encargadas de la entrega de bonos a ciudadanos.
La dataset consta de 773291 filas y 13 columnas, donde los tipos de datos de las columnas lo veremos en el python mediante el método info() y veremos algunos valores de la dataset con el método head().
5.png
5.png
5.png




fuente de la dataset: https://www.datosabiertos.gob.pe/datase ... e2749-e07e

3. Descripción de los resultados obtenidos
Se realizó la limpieza de los datos eliminando nulos y columnas no necesarias, como COD_HOGAR, ya que todos los valores eran diferentes, los métodos usados se pueden visualizar en el github.
Luego de la limpieza de los datos nos quedamos con las 8 columnas "UBIGEO","DE_DEPARTAMENTO","DE_PROVINCIA","DE_DISTRITO","PERSONAS_HOGAR","MONTO","BONO_COBRADO","MEDIO_COBRO". Las cuales podemos visualizar en el weka





Utilizamos el modelo de K Means para realizar el proceso de clusterizacipon, con lo cual obtenimos los siguientes resultados:
5.png
5.png


Hemos obtenido 2 clusteres, a partir de 773291 instancias y 8 atributos, el porcentaje de split utilizado fue de 80%. Como podemos observar uno de los clusters es de Lima del distrito de de SAN JUAN DE LURIGANCHO donde existe 1.8004 personas_hogar y el segundo cluster es Lima de el tambo donde existe 1.6825 persona_hogar.

4. Conclusiones
EL modelo utilizado para la clusterizacion realizó 4 interacciones donde el cluster 0 es del 29% de la data osea 45065 y el cluster 1 es del 71% osea del 109594, y como resultados nos dio la provincia de lima, por lo que podemos concluir que se a otorgado en mayor medida bonos idependientes a personas que residen en Lima, por lo que se debe destimar los siguientes bonos a provincias fuera de lima.

5. Github
https://github.com/willians124/IAA
Adjuntos
4.png
3.png
2.png
1.png


Responder