Statistical learning in complex and temporal datadistances, two-sample testing, clustering, classification and Big Data

  1. Montero Manso, Pablo
Dirixida por:
  1. José Vilar Director

Universidade de defensa: Universidade da Coruña

Fecha de defensa: 30 de xaneiro de 2019

Tribunal:
  1. Alicia Troncoso Lara Presidente/a
  2. Rubén Fernández Casal Secretario
  3. Jorge Caiado Vogal
Departamento:
  1. Matemáticas

Tipo: Tese

Teseo: 580496 DIALNET lock_openRUC editor

Resumo

Esta tesis trata sobre aprendizaxe estatístico en obxetos complexos, con énfase en series temporais. O problema abórdase introducindo coñecemento sobre o dominio do fenómeno subxacente, mediante distancias e características. Proponse un contraste de dúas mostras basado en distancias e estúdase o seu funcionamento nun gran abanico de escenarios. As distancias para clasificación e clustering de series temporais acadan un incremento da potencia estatística cando se aplican a contrastes de dúas mostras. O noso test compárase de xeito favorable con outros métodos gracias á súa flexibilidade ante diferentes alternativas. Defínese unha nova distancia entre series temporais mediante un xeito innovador de comparar as distribucións retardadas das series. Esta distancia herda o bo funcionamento empírico doutros métodos pero elimina algunhas das súas limitacións. Proponse un método de predicción baseada en características das series. O método combina diferentes algoritmos estándar de predicción mediante unha suma ponderada. Os pesos desta suma veñen dun modelo que se axusta a un conxunto de entrenamento de gran tamaño. Propónse un método de clasificación distribuida, baseado en comparar, mediante unha distancia, as funcións de distribución empíricas do conxuto de proba común e as dos datos que recibe cada nodo de cómputo.