Temas acerca de Inteligencia Artificial
Foto de Usuario
jsalas

Ranking Troomes
Mensajes: 5
Registrado: 29 Sep 2022, 11:52
Contactar:

Resumen de trabajos de Machine Learning aplicados a la agricultura en Latinoamérica

Mensaje por jsalas » 21 Dic 2022, 21:59

Resumen de trabajos de Machine Learning aplicados a la agricultura en Latinoamérica

Jorge Roger Salas Escobar
Unidad de Posgrado UNI-FIIS, Universidad Nacional de Ingeniería
Lima, Perú
j.salas.e@uni.pe

DESCRIPCIÓN DE LOS TRABAJOS REALIZADOS.

1. ARTICULO 1: “MACHINE LEARNING APLICADOS A LA AGRICULTURA EN EL PERU O LATINOAMERICA”

Descripción.
En el presente artículo se hace un análisis de los casos en los que se ha aplicado el uso del Machine Learning como solución a problemas presentado en el área agrícola.

1.1. Paper 1: “Sistema de inteligencia artificial para la predicción temprana de heladas meteorológicas”

1.1.1. Descripción del problema
El problema que se aborda en este artículo es sobre eventos a los que sen expuestos los cultivos como las heladas como un factor meteorológico importante para la hidrología, climatología y agricultura.

1.1.2. Algoritmos y resultados de las pruebas
Para este trabajo de investigación se planea predecir el rendimiento de los cultivos en función de variables ambientales como el suelo, el agua y el clima.
1.1.2.1. Diseño y entrenamiento de un SLFN con el algoritmo Extreme Learning Machine (ELM)
El resultado final del proceso es un dataset de entrenamiento con 178.450 mediciones meteorológicas sin datos faltantes ni aberrantes principalmente ocasionados por fallas en las estaciones metereológicas del SENAMHI, también se preparó un segundo dataset de validación con 14.535 mediciones meteorológicas.

Se demuestra que con una estructura de red neuronal mono capa con propagación hacia adelante, utilizando el algoritmo de ELM, se consiguen altos niveles de generalización similares o superiores a otros algoritmos y estructuras de redes neuronales.

Según indica este artículo se propone crear una máquina de aprendizaje extremo (ELM) utilizando el algoritmo propuesto por Huang sobre una red neuronal monocapa con propagación hacia adelante, como base para la predicción temprana de heladas meteorológicas. El estudio fue desarrollado en el Valle Alto del departamento de Cochabamba-Bolivia, los datos fueron colectados en 6 estaciones meteorológicas llegando a un total de 178450 mediciones, se para el entrenar la red neuronal. Para la verificación se utilizaron los datos obtenidos de las estaciones meteorológicas de Tiquipaya y Arque del año 2016. Con márgenes de confianza superiores al 90%.

1.1.3. Herramientas

Scipy, Es una librería para la programación científica que comenzó su desarrollo en 2001 está escrita en Python. SciPy es una expansión de NumPy, que integra nuevos paquetes para el tratamiento científico de datos. Integra gran cantidad de funciones de procesamiento de imágenes, procesado de la señal, estadística, integración numérica.

1.1.4. Descripción de los Dataset

Se han identificado 2 grupos de dataset:
1.1.4.1. Dataset de entrenamiento
La investigación se concentra en el Valle Alto del departamento de Cochabamba. Los datos fueron proporcionados por el Servicio Nacional de Meteorología e Hidrología (SENAMHI), de 6 estaciones meteorológicas automatizadas que se encuentran en las poblaciones de Tarata, Arbieto, Punata, Cliza y San Benito:

El periodo de Colecta de datos corresponde a diciembre de 2011 hasta agosto de 2015, se tienen 1.360 días observados. El tiempo entre mediciones que realizan las estaciones meteorológicas es de 15 min, como resultado se obtienen 96 mediciones por día, lo que nos proporciona entre todos los días observados y las 6 estaciones un dataset de 179.320 mediciones.

1.1.4.2. Dataset de validación
Para validar el modelo y demostrar la alta capacidad de adaptación del ELM se utilizarán dos nuevas estaciones meteorológicas la primera ubicada en la población de Tiquipaya (valle) y la segunda en la población de Arque (zona andina) del departamento de Cochabamba.

1.1.4.3. Las variables de estudio en la investigación son:
• Temperatura relativa
• Radiación Solar
• Viento
• Humedad
• Precipitación

1.2. Paper 2: “An Assertive Machine Learning Model for Rural Micro Credit Assessment in Peru”

1.2.1. Descripción del problema
La población rural en Perú tiene un acceso limitado al sistema financiero debido al alto costo del crédito y el alto riesgo (tasas de morosidad) causado por el sector informal. Por lo tanto, es necesario mejorar los microcréditos asertivos en favor de la economía rural.
Se propone encontrar el nivel más alto de asertividad para el proceso de concesión de crédito y la consiguiente reducción del riesgo de crédito utilizando varios modelos de Machine Learning.

1.2.2. Algoritmos y resultados de las pruebas
La metodología propuesta para este trabajo es:
1.2.2.1. Determinación de Variables Rurales.
Las variables rurales determinadas como, los datos fueron extraídos, preprocesados y validados para ejemplos de entrenamiento.
1.2.2.2. Implementación del modelo.
Con base en las variables seleccionadas en el paso anterior, se eligen los modelos de aprendizaje automático, considerando trabajos sobre riesgo de crédito, como se muestra en la Tabla 2, donde los modelos utilizados son:
Logistic Regression (LR); Random Forest (RF); Support Vector Machine (SVM); Artificial Neural Network (ANN); Decision Tree (dTree); Naive Bayer classifier (NBC); k-Nearest Neighbors (kNN); Linear Discriminant Analysis (LDA); Multimonial Regresion (MR); Extreme Gradient Boosting (XGBoost); Light Gradient Boosting Machine (LightGBM); Gradient-Boosted Decision Trees (GBDT) and Adaptive Boosting (ADABoost):

Se determinan las métricas Accuracy, Precision, Recall, F1 Score y AUC ROC

Estos modelos consideraron variables significativas del proceso de evaluación del microcrédito en áreas rurales, técnicas de prueba como SMOTE y K-fold y, evaluando los modelos utilizando algunas métricas, como Precisión, Precisión, Recuerdo, F1 Score, AUC ROC. El modelo LightGBM, basado en árboles de decisión, logró un excelente nivel de asertividad, con una tasa de éxito de préstamos del 96,20%. Los resultados de la reducción de la tasa de morosidad demuestran que es óptimo utilizar herramientas tecnológicas

1.2.3. Herramientas.
Para las implementaciones de algoritmos, se utilizó la biblioteca Scikit Learn, que tiene dependencias mínimas y se distribuye bajo la licencia simplificada Berkeley Software Distribution (BSD) y la biblioteca Keras, bajo Licencia MIT, ambos módulos Python, que integran un amplio rango de algoritmos para modelos de aprendizaje automático de próxima generación que incluyen problemas supervisados y no supervisados. Las bibliotecas Pandas se utilizaron para la lectura de archivos otorgados por la entidad, Numpy para el procesamiento previo de datos y Matploit, para la representación de los resultados gráficos, los tres últimos bajo la licencia BSD.
1.2.4. Descripción de los Dataset.

Para la toma de decisiones como puntuación de crédito; basado en algunos criterios como Conducta, Pagabilidad y condiciones macroeconómicas como El método de las cinco "C".
La empresa microfinanciera dedicada al sector rural evaluada utilizó 17.454 productos de microcréditos agrícolas entre 2017 y 2018. La metodología utilizada fue el método de las cinco "C", en el que se especificaron las variables rurales, en función de la importancia que tiene la concesión de microcréditos; los modelos fueron implementados y finalmente, evaluados. La principal contribución de este trabajo es obtener el modelo con los mejores resultados en tiempo computacional y asertividad para reducir el riesgo de crédito. Los resultados buscan mejorar la exactitud de los préstamos otorgados y la reducción del tiempo empleado por los analistas en tales evaluaciones, buscando obtener una mejor capacidad de pago del cliente rural, mejorando su calidad de vida.

1.3. Paper 3: “Aplicación de técnicas de Machine Learning como método de validación para predecir la efectividad de un modelo estadístico de series de tiempo en la producción de fruta fresca en las diferentes provincias del Ecuador”

1.3.1. Descripción del problema.
El objetivo de este paper para predecir la demanda/precio de productos agroalimentarios. Este acercamiento busca encontrar los principales factores que afectan la demanda de estos productos, además, la evaluación de diversos algoritmos de inteligencia artificial, que aplicando aprendizaje automático ayuden a obtener valores de predicción de una manera eficiente y con niveles de precisión adecuados.


1.3.2. Algoritmos y resultados de las pruebas.
Para este trabajo de investigación se planea predecir el rendimiento de los cultivos en función de variables ambientales como el suelo, el agua y el clima. Se explica los modelos, donde el algoritmo aprende interactuando con el medio ambiente, y obtendrá recompensas por acciones correctas realizadas y sanciones por las incorrectas.

• Redes neuronales
• Series de tiempo
• Máquina de Soporte Vectorial (SVM)
• K-Vecinos: basado en instancia de tipo supervisado de Machine Learning.
• Modelo Bayesiano

Dado que el dataset cuenta con 28 datos, de los cuales 24 son de entrenamiento y 4 como parte del conjunto de datos de prueba y validación. Se crea y entrena un modelo tipo ForecasterAutoreg a partir de un regresor RandomForestRegressor y una ventana temporal de seis lags, significando con ello que estamos utilizando los seis registros temporales anteriores.

1.3.3. Herramientas.
Software desarrollado en Python, sería el siguiente paso implementaciones similares usando los productos de software especializados como Matlab® y Weka.

1.3.4. Descripción de los Dataset.

Para efectos de la determinación del modelo inicial sólo es de interés para esta primera etapa el volumen de la predicción y la temporalidad se incluye en una variable de marca de tiempo. También se identificó el ciclo de vida del producto en cuestión, así como las tendencias o comportamientos del costo en el mercado, al igual que elementos que determinan el costo de producción, los cuales eventualmente podrán ser considerados como variables complementarias del modelo.

2. CONCLUSIONES

• PAPER 1: En este caso se utilizó algoritmo Extreme Learning Machine (ELM), el cual demostró su efectividad, logrando un 90% de confianza.(BOLIVIA)

• PAPER 2: En este caso se optó por SMOTE y K-fold utilizando un grupo de modelos siendo el mejor resultado con LightGBM 96,20% de préstamos.(PERU)

• PAPER 3: En este caso se optó ForecasterAutoreg para lo cual se trabajó con 28 datos, 24 como parte de entrenamiento y 4 como prueba y validación.(MEXICO)

3. REFERENCIAS BIBLIOGRAFICAS.

 [1] Sistema de inteligencia artificial para la predicción temprana de heladas meteorológicas.
http://www.scielo.org.bo/scielo.php?scr ... 6000200007

 [2] An Assertive Machine Learning Model for Rural Micro Credit Assessment in Peru
https://www.sciencedirect.com/science/a ... 0922005749

 [3] Determinación de los factores implicados y algoritmos de aprendizaje automático para la predicción de la demanda de productos agrícolas
http://pistaseducativas.celaya.tecnm.mx ... /2757/2129
Adjuntos
Machine Learning aplicados a la agricultura.docx
(515.38 KiB)


Responder