Machine learning for anomaly detection: From surface to deep

Novoa Paradela, David

Machine learning for anomaly detectionFrom surface to deep

Novoa Paradela, David

Dirigida por:

Óscar Fontenla Romero Director
Bertha Guijarro-Berdiñas Directora

Universidad de defensa: Universidade da Coruña

Fecha de defensa: 24 de mayo de 2024

Tribunal:

María Jesús Taboada Iglesias Presidente/a
Elena Hernández-Pereira Secretaria
Óscar Luaces Rodríguez Vocal

Tipo: Tesis

Teseo: 839420 DIALNET RUC editor

Resumen

La detección de anomalías es la rama del aprendizaje automático encargada de construir modelos capaces de diferenciar entre datos normales y anómalos. A priori, esto convierte la detección de anomalías en un problema de clasificación en dos únicas clases. Sin embargo, dado que las anomalías suelen ocurrir de forma esporádica, los datos normales son los que prevalecen en estos escenarios, por lo que es habitual que se requieran modelos específicos cuyo entrenamiento se lleve a cabo empleando únicamente datos de la clase normal. Estos sistemas juegan un papel vital en una amplia gama de aplicaciones reales, como la medicina, la detección de fraudes bancarios, intrusiones en la red, o el mantenimiento predictivo de sistemas industriales. Esta tesis se ha centrado en el desarrollo de nuevos algoritmos de detección de anomalías para tres escenarios diferentes, desde modelos basados en la geometría de los datos, hasta modelos más complejos basados en aprendizaje profundo. En el primer escenario proponemos un método basado en cierres no convexos subdivisibles para entornos tradicionales, en los que algunos de los principales problemas son la dimensionalidad de los datos de entrenamiento y la forma de la nube de puntos en el espacio n-dimensional. En el segundo escenario se presenta una red autoencoder profunda válida para entornos de computación en el borde y aprendizaje federado debido a su entrenamiento no iterativo, así como una arquitectura federada para su implementación semi-centralizada. Por último, en línea con las nuevas tendencias de inteligencia artificial aplicable, se ha estudiado la aplicabilidad de la detección de anomalías sobre textos, proponiendo un pipeline para la detección de reseñas anómalas explicable en plataformas de comercio electrónico. El trabajo desarrollado ha sido compartido con la comunidad investigadora a través de publicaciones en revistas y congresos científicos, así como repositorios de código abierto, contribuyendo de este modo al avance del campo de la detección de anomalías.