Temas acerca de Inteligencia Artificial
Foto de Usuario
AugustoChoy

Ranking Troomes
Mensajes: 5
Registrado: 11 Sep 2021, 13:12

Algoritmo de Clasificación Para Determinar si una Persona es o no Sospechosa de COVID19, basado en los síntomas.

Mensaje por AugustoChoy » 22 Nov 2021, 14:15

Título:
“Algoritmo de Clasificación Para Determinar si una Persona es o no Sospechosa de COVID19, basado en los síntomas.”

Resumen:
El algoritmo de clasificación ha sido extraído de la Tabla de Sospechosos de COVID19 en datos abiertos del gobierno del Perú. En el trabajo se utilizó RandomTree para establecer el árbol de decisión que se utiliza en la tabla, luego Regresión Lineal a fin de comparar la precisión de los métodos. El primer método fue mucho más acertado y es el que utilizamos para predecir.

Descripción de los datos originales
Los datos fueron obtenidos del siguiente enlace de datos abiertos del Gobierno del Perú: https://www.datosabiertos.gob.pe/datase ... e-covid-19 el archivo se llama TB_F00_SICOVID.csv y su estructura es como sigue:
Los atributos de los datos son como sigue: id_persona – correlativo entero, fecha_contacto – la fecha en que la persona se contact’0 al 113, flag_sospechoso - 1 es sospechoso de COVID19, 0 no es sospechoso, fecha_síntomas – fecha de inicio de los síntomas, sigue una lista de 14 síntomas y el valor es 1 si la persona presentaba el sínntoma y 0 si no lo presentaba. Los síntomas fueron: tos, cefalea, congestión nasal, dificultad respiratoria, dolor de garganta, fiebre, diarrea, nauseas anosmia hiposmia, dolor abdominal, dolor de articulaciones, dolor muscular, dolor de pecho, otros síntomas.
Para procesar los datos se eliminaron todos los atributos que no tenían que ver con los síntomas y el flag sospechoso se pasó al final de los datos como objetivo.

Descripción de los resultados con las técnicas utilizadas
El primer método utilizado fue el de REPTree, pero la laptop se quedó sin memoria, era más de un millón de datos. Luego se corrió con Random Tree, este método proporciona además una árbol de decisión originado en los datos el que nos permite ver la relación entre los diversos atributos. El árbol dio primera importancia al dolor de garganta, si no había este síntoma, luego veía la dificultad respiratoria luego revisaba si había cefalea, dolor abdominal y tos. Si había dificultad respiratoria luego veía si había tos, cefalea y fiebre, en ese orden. Si había dolor de garganta luego revisaba si había fiebre y tos. El árbol generado es de 671 nodos, el coeficiente de correlación es de 0.9005 y el error absoluto medio es de 0.0745. Este método nos da un buen modelo. Pero como indican los datos, la predicción es de sospecha y no determina si el paciente tiene COVID19.
El segundo método utilizado fue el de Regresión Lineal
Este método le dio más importancia al síntoma de la tos y dolor de garganta seguido de fiebre, peor no produce el árbol de decisión que produce Random Tree. De otro lado el coeficiente de correlación nos dio sólo 0.7539, mucho menor que el de Random Tree y el Error medio absoluto es de 0.2294, bastante mayor que el de Random Tree.

Descripción de los resultados con las técnicas utilizadas
De los resultados obtenidos por ambos métodos, Random Tree nos produjo el mejor modelo, Nos dio un árbol detallado de la importancia de los síntomas y este modelo nos puede servir para predecir la sospecha de COVID19. El principal argumento que establece el mejor método es el coeficiente de correlación el cual es mucho más alto en este método, Random Tree que en el método de regresión.

Conclusión
El portal de Datos Abiertos del Gobierno del Perú nos permite el acceso a datos de lo más diverso y a medida que se vaya ampliando el portal, los ciudadanos tendremos más oportunidad de realizar estudios y analizar la situación del país en los más diversos campos. En este caso hemos trabajado los datos de Sospechosos de COVID19 basado en los síntomas de los pacientes, la base de datos original es de más de un millón de datos. Luego de reducir los datos y quedarnos con lo más relevante se ha realizado el análisis utilizando dos métodos para comparar su potencial y exactitud. Pero, como se menciona, el modelo es sólo de sospecha de COVID19 y no puede predecir la ocurrencia de COVID19. Pero si una persona con síntomas es sospechosa de COVID19, es razón para que se haga una prueba. De salir no sospechosa, no implica que esté libre de COVID19.


Responder