Grupo 7 - Machine Learning - Sección A
2025-1
Miembros del Grupo
- Luis Koc
Alex Mancilla
Herbert Melendez
Dennis Paitan
Resumen—La predicción de la producción horaria en parques eólicos es clave para garantizar la estabilidad del sistema eléctrico, reducir penalizaciones por desvío y facilitar la integración de energías renovables en el mercado diario. Este estudio desarrolla un modelo de aprendizaje autom´atico con horizonte de 24
horas, basado en un enfoque que incluye limpieza avanzada de datos, ingeniería y selección automatizada de características,
y ensamblaje de modelos. Se analizaron múltiples algoritmos supervisados —entre ellos Random Forest, Gradient Boosting,
XGBoost, LightGBM, CatBoost y redes neuronales MLP—, integrados mediante técnicas de ensamblado (stacking y combinación ponderada). Adicionalmente, se incorporó un sistema de detección no supervisada de anomalías basado en DBSCAN aplicado sobre los residuos del modelo.
El mejor desempe˜no se obtuvo con un ensemble ponderado (90 % MLP y 10 % regresión lineal), que alcanzó un coeficiente de determinación R2= 0,82 y un error absoluto medio (MAE) de 0.43. Estos resultados superan a los modelos individuales, validando la efi cacia de losm étodos ensemble para la predicción operativa de potencia eólica. La metodología propuesta es consistente con las mejores pr´acticas encontradas en la literatura, como el uso de modelos híbridos din´amicos, optimización de
pesos mediante algoritmos de enjambre, y reducción de errores mediante clasifi cación previa de los datos o corrección de predicciones meteorológicas. Se recomienda su implementación práctica y actualización diaria para mejorar la precisión y robustez en escenarios reales de operación.
Palabras Claves:
predicción de potencia eólica, aprendizaje automático, modelos ensemble, limpieza de datos