Machine learning for anomaly detectionFrom surface to deep
- Novoa Paradela, David
- Óscar Fontenla Romero Director
- Bertha Guijarro-Berdiñas Director
Universidade de defensa: Universidade da Coruña
Fecha de defensa: 24 de maio de 2024
- María Jesús Taboada Iglesias Presidente/a
- Elena Hernández-Pereira Secretaria
- Óscar Luaces Rodríguez Vogal
Tipo: Tese
Resumo
A detección de anomalías é a rama da aprendizaxe automática encargada de construír modelos capaces de diferenciar entre datos normais e anómalos. A priori, isto converte a detección de anomalías nun problema de clasificación en dúas clases. Con todo, dado que as anomalías adoitan ocorrer de forma esporádica, os datos normais son os que prevalecen nestes escenarios, polo que é habitual que se requiran modelos específicos cuxo adestramento sexa levado a cabo empregando unicamente datos da clase normal. Estes sistemas xogan un papel vital nunha ampla gama de aplicacións reais, como a medicina, a detección de fraudes bancarias, intrusións na rede, ou o mantemento preditivo de sistemas industriais. Esta tese centrouse no desenvolvemento de novos algoritmos de detección de anomalías para tres escenarios diferentes, desde modelos baseados na xeometría dos datos, ata modelos máis complexos baseados en aprendizaxe profunda. No primeiro escenario propoñemos un método baseado en peches non convexos subdivisibles para escenarios tradicionais, nos que algúns dos principais problemas son a dimensionalidade dos datos de adestramento e a forma da nube de puntos no espacio n-dimensional. No segundo escenario preséntase unha rede autoencoder profunda válida para escenarios de computación no borde e aprendizaxe federado debido ao seu adestramento non iterativo, así como unha arquitectura federada para a súa implementación semi-centralizada. Por último, en liña coas novas tendencias da intelixencia artificial aplicable, estudouse a aplicabilidade da detección de anomalías sobre textos, propoñendo un pipeline para a detección de recensións anómalas explicable en plataformas de comercio electrónico. O traballo desenvolvido foi compartido coa comunidade investigadora a través de publicacións en revistas e conferencias científicas, ademais de repositorios de código aberto, contribuíndo así ao avance do campo da detección de anomalías.