Temas acerca de Inteligencia Artificial
Foto de Usuario
alexander.contreras

Ranking Troomes
Mensajes: 4
Registrado: 07 Sep 2020, 23:05

Clusterización de contrataciones directas por el estado de emergencia

Mensaje por alexander.contreras » 15 Ene 2021, 23:16

1.Resumen
En este post se estudiara el dataset del OSCE en donde se encontraban los datos de las contrataciones de proovedores realizadas por la emergencia sanitaria.También se realizara un clustering para poder agrupar las contrataciones de proveedores con características similares. Se utilizará el método "Elbow Method" para hallar la cantidad de clusters adecuada y el algoritmo K-Means para hallar los clusters.
2.Descripción del Dataset
Dataset original
https://www.datosabiertos.gob.pe/datase ... -organismo
El dataset original está compuesto por un total de 11285 instancias, y presenta los siguientes atributos :
descripcion_datos.PNG
Data procesada:
Eliminamos data irrelevante como fechas,descripciones y ids.Al final nos quedamos con los siguientes atributos
data_procesada.png
3.Descripción de los resultados con las técnicas usadas
Utilizamos el Elbow Method para hallar el número de clusters y para ello usaremos los siguientes comandos para obtener el numero de clústeres
df <- scale(ContratacionesOSCE)
fviz_nbclust(df,kmeans,method="wss")+geom_vline(xintercept=3,linetype=2)+labs(subtitle="Elbow method")

luego de ejecutar los comando obtenemos la siguiente grafica
clusterR.png
Donde aparece la forma de un codo es 9 aproxiamdamente,por lo que definiremos que el numero de clústeres sea 9
En weka corremos el algoritmo kmenas con k=9 y se tiene el siguiente resultado
weka_Cluster.png
Podemos observar que las mayorías de instancias están en el cluster #0,1,4,5y 7.También podemos ver con mayor detalle los centroides de los clústeres
centroid1-3.PNG
centroide4-6.PNG
centroide7-9.PNG
4.Conclusiones
Podemos ver que las contrataciones directas encontradas muestran cierta relación con la ubicación geográfica que se halló en el cluster. Asimismo, los montos de dinero más grandes por contratación se encuentran asignados a las ciudades cerca Lima. También se encontró que la mayoría de contrataciones directas están en los cluster 0,1,4,5y 7 y todos estos cluster son lo más cercanos a Lima.
5.Github
https://github.com/dsw555/Contratacione ... -Sanitaria


Responder