Machine learning for anomaly detection: From surface to deep

Novoa Paradela, David

Machine learning for anomaly detectionFrom surface to deep

Novoa Paradela, David

Dirixida por:

Óscar Fontenla Romero Director
Bertha Guijarro-Berdiñas Director

Universidade de defensa: Universidade da Coruña

Fecha de defensa: 24 de maio de 2024

Tribunal:

María Jesús Taboada Iglesias Presidente/a
Elena Hernández-Pereira Secretaria
Óscar Luaces Rodríguez Vogal

Tipo: Tese

Teseo: 839420 DIALNET RUC editor

Resumo

A detección de anomalías é a rama da aprendizaxe automática encargada de construír modelos capaces de diferenciar entre datos normais e anómalos. A priori, isto converte a detección de anomalías nun problema de clasificación en dúas clases. Con todo, dado que as anomalías adoitan ocorrer de forma esporádica, os datos normais son os que prevalecen nestes escenarios, polo que é habitual que se requiran modelos específicos cuxo adestramento sexa levado a cabo empregando unicamente datos da clase normal. Estes sistemas xogan un papel vital nunha ampla gama de aplicacións reais, como a medicina, a detección de fraudes bancarias, intrusións na rede, ou o mantemento preditivo de sistemas industriais. Esta tese centrouse no desenvolvemento de novos algoritmos de detección de anomalías para tres escenarios diferentes, desde modelos baseados na xeometría dos datos, ata modelos máis complexos baseados en aprendizaxe profunda. No primeiro escenario propoñemos un método baseado en peches non convexos subdivisibles para escenarios tradicionais, nos que algúns dos principais problemas son a dimensionalidade dos datos de adestramento e a forma da nube de puntos no espacio n-dimensional. No segundo escenario preséntase unha rede autoencoder profunda válida para escenarios de computación no borde e aprendizaxe federado debido ao seu adestramento non iterativo, así como unha arquitectura federada para a súa implementación semi-centralizada. Por último, en liña coas novas tendencias da intelixencia artificial aplicable, estudouse a aplicabilidade da detección de anomalías sobre textos, propoñendo un pipeline para a detección de recensións anómalas explicable en plataformas de comercio electrónico. O traballo desenvolvido foi compartido coa comunidade investigadora a través de publicacións en revistas e conferencias científicas, ademais de repositorios de código aberto, contribuíndo así ao avance do campo da detección de anomalías.