Análisis de técnicas de validación en modelos aprendizaje automático aplicadas en series tiempo de variable energéticas de un edificio universitario.


Abstract:

El ahorro de energía o reducción del consumo de energía es la forma más fácil y efectiva de reducir las emisiones de dióxido de carbono y otros gases contaminantes a la atmósfera; a fin de combatir el calentamiento global y el cambio climático. En este trabajo de titulación se propone tres modelos de Machine Learning supervisado para que sean evaluadas por técnicas de validación cruzada y poder elegir el mejor luego de comparar los valores de sus métricas de pronósticos entre los modelos. Se utiliza la metodología de experimentación de prueba y error como herramienta de investigación a un conjunto de datos obtenido de sensores ubicados en el edificio de la Facultad de Ciencias Matemáticas y Físicas. El conjunto de datos fue sometido a un preprocesamiento para tratamiento de datos nulos y atípicos. Los modelos de aprendizaje automático supervisado escogidos para la experimentación son Random Forest, SVR y XGBoost. Estos modelos pasaron por una afinación de hiperparámetros y así elegir el mejor modelo de cada uno para una mejor precisión de resultados. Se proponen cuatro escenarios considerando cada técnica de validación escogida luego de un análisis de literatura como KFold, ShuffleSplit, RepeatedKFold y TimeSeriesSplit. Los resultados que arrojaron la evaluación de las cuatro técnicas, utilizando el conjunto de datos de prueba o testing indican que el modelo Support Vector Regression (SVR) es el más adecuado y que podrá predecir con más exactitud en escenarios para series de tiempo.

Año de publicación:

2022

Keywords:

  • SVR
  • Cross validation
  • RF
  • XGBoost
  • TIME SERIES
  • SERIES DE TIEMPO
  • validación cruzada
  • Machine Learning supervisado
  • Supervised machine learning
  • Energy consumption
  • Consumo energético

Fuente:

rraaerraae

Tipo de documento:

Bachelor Thesis

Estado:

Acceso abierto

Áreas de conocimiento:

  • Aprendizaje automático
  • Energía
  • Estadísticas

Áreas temáticas:

  • Ciencias de la computación