Multi-objective evolutionary feature selection with deep learning applied to air quality spatio-temporal forecasting
- Espinosa Fernández, Raquel
- Fernando Jiménez Barrionuevo Director
- José Tomás Palma Méndez Director
Universidade de defensa: Universidad de Murcia
Fecha de defensa: 11 de xullo de 2023
- Amparo Alonso Betanzos Presidenta
- Juan Botía Blaya Secretario/a
- Grzegorz Jacek Nalepa Vogal
Tipo: Tese
Resumo
Objetivos - El objetivo principal es desarrollar técnicas de selección de atributos eficientes y eficaces para el deep learning mediante algoritmos evolutivos multi-objetivo y aplicación de los métodos creados para la predicción de series temporales en diferentes áreas de interés. Este objetivo general se divide en los siguientes objetivos específicos: - Desarrollar una metodología completa y aplicar un proceso de toma de decisiones multicriterio para la comparación y evaluación de modelos predictivos de previsión de series temporales. - Estudiar, diseñar y desarrollar un enfoque evolutivo multi-objetivo basado en características espacio-temporales dentro de la Comunidad Autónoma de Murcia. - Definir problemas de optimización multi-objetivo para la selección de atributos, con objetivos de distinta naturaleza, tanto filter como wrapper. - Resolver los problemas de optimización propuestos identificando los mejores algoritmos evolutivos multi-objetivo del estado del arte y desarrollando enfoques asistidos por sustitutos para reducir el coste computacional de los algoritmos. - Identificar métricas para cuantificar la variabilidad entre los enfoques asistidos por sustitutos y facilitar el establecimiento de análisis cualitativos. - Evaluar, validar y comparar los métodos de selección de atributos desarrollados con datos de series temporales para la predicción de la calidad del aire en el contexto de la Comunidad Autónoma de Murcia, así como en otras localizaciones geográficas y en otros problemas de predicción de series temporales en aras de la verificación de la generalización. Metodología - En el transcurso de esta tesis se ha desarrollado una metodología genérica y nuevas métricas para la comparación de modelos de machine learning y deep learning, estableciendo así el mejor modelo para usar en un problema determinado de series temporales. Se ha diseñado un proceso de toma de decisiones multicriterio que tiene en cuenta la exactitud y robustez del RMSE, MAE y CC de los modelos, y reúne estos criterios en una única métrica ponderada denominada goodness. Se ha propuesto una nueva técnica fundamentada en las propiedades espacio-temporales de los datos para inferir información de zonas de las que no se tienen datos. Para ello, se ha formalizado el problema de predicción de calidad del aire como un problema de optimización multi-objetivo. Los algoritmos evolutivos multi-objetivo evaluados han sido: NSGA-II, MOEA/D y SPEA2. Los frentes de Pareto resultantes del algoritmo evolutivo son la entrada para construir un modelo de aprendizaje ensemble. Se han utilizado los siguientes algoritmos de aprendizaje para entrenar el modelo ensemble: RF, LR, SVM, QRNN, KNN y ZeroR. Por otra parte, se han formalizado problemas de optimización con hasta cuatro objetivos, basados en métodos filter, wrapper e híbridos, para realizar la selección de atributos. Gracias a un modelo sustituto, este método permite el uso de modelos de deep learning como algoritmo de aprendizaje de un método wrapper pero sin el inconveniente del elevado coste computacional que ello conlleva. Se ha estudiado cuál es el mejor algoritmo evolutivo multi-objetivo entre NSGA-II, NSGA-III, MOEA/D, SPEA2, IBEA, ε-NSGA-II y ε-MOEA, y el rendimiento de las predicciones con un modelo sustituto basado en una red neuronal LSTM. Adicionalmente, se propone una nueva métrica multicriterio de rendimiento, H, la cual permite ajustar la importancia de las métricas que la forman. También se ha evaluado el comportamiento del uso de múltiples modelos sustitutos para lograr una mejor capacidad de generalización de los modelos predictivos tanto en problemas de regresión como de clasificación. Se ha desarrollado una métrica para establecer un análisis cualitativo de los métodos desarrollados. En los enfoques descritos anteriormente, el modelo sustituto mantiene siempre la misma información que al principio del método. Esto no tiene en cuenta la información subyacente obtenida durante el transcurso del algoritmo evolutivo. Por este motivo, se han propuesto dos enfoques para actualizar el modelo sustituto, uno basado en el aprendizaje incremental y otro basado en la actualización de la base de datos y la construcción de un nuevo modelo sustituto. Conclusiones - Las principales conclusiones derivadas de esta tesis tras el desarrollo y ejecución de todos los experimentos planteados son las siguientes: - La adopción de una metodología completa para la evaluación y comparación de algoritmos de aprendizaje ha permitido obtener resultados unificados y adaptados para resolver cualquier problema de predicción con series temporales. - Las redes neuronales recurrentes, como LSTM y GRU, han sido capaces de captar la complejidad de las series temporales y construir modelos predictivos precisos y fiables. Entre las técnicas de machine learning analizadas, RF ha presentado un rendimiento satisfactorio cuando se aplica a la predicción de series temporales. - Un proceso de toma de decisiones multicriterio ha permitido agrupar varias métricas de rendimiento y establecer una comparación más adecuada entre diferentes algoritmos de aprendizaje en el contexto de problemas de pronóstico de series temporales. - Para el pronóstico de la calidad del aire con series temporales en una zona de la que no se dispone de información, la predicción se ha aproximado con algoritmos evolutivos multi-objetivo utilizando las previsiones de otras zonas geográficamente cercanas. - Los algoritmos evolutivos multi-objetivo asistidos por sustitutos han permitido la selección de atributos en problemas costosos como la predicción de series temporales basada en deep learning. - El uso de un MOEA asistido por sustitutos con un algoritmo de aprendizaje profundo para la selección de atributos ha conseguido encontrar un subconjunto satisfactorio de atributos en un tiempo computacional más corto en comparación con un método de selección de atributos de tipo wrapper convencional. - Entre todos los MOEAs estudiados, NSGA-II es el que mejores resultados ha obtenido en términos de hipervolumen, en comparación con otros MOEAs del estado del arte. - El enfoque de control de la evolución fija basado en la generación de elementos permite añadir información de forma eficiente a los modelos sustitutos dentro del proceso de selección de atributos. - Se han identificado modelos de predicción en diversos contextos reales (Polonia, Murcia, Valencia) que potencialmente permiten realizar previsiones en un futuro próximo y que pueden ayudar a las instituciones a tomar decisiones en materia medioambiental.