Selección de variables en sistemas de aprendizaje automático de preferencias

Fernandez Bayón, Gustavo

Selección de variables en sistemas de aprendizaje automático de preferencias

Fernandez Bayón, Gustavo

Supervised by:

Antonio Bahamonde Rionda Director
José Ramón Quevedo Pérez Director

Defence university: Universidad de Oviedo

Fecha de defensa: 24 May 2007

Committee:

Daniel Borrajo Millán Chair
Óscar Luaces Rodríguez Secretary
Pedro Larrañaga Múgica Committee member
José Hernández Orallo Committee member
Amparo Alonso Betanzos Committee member

Type: Thesis

Teseo: 136559 DIALNET

Abstract

En algunos problemas reales de aprendizaje la información a tratar viene dada en forma de ordenaciones de objetos, En estos casos, una alternativa válida puede ser adaptar la metodología de aprendizaje a la naturaleza de los datos. El objetivo entonces consiste en diseñar algoritmos de aprendizaje capaces de aprender a partir de ordenaciones de objetos. Este tipo de algoritmos son conocidos como métodos de aprendizaje de preferencias. El conocimiento de partida de este tipo de algoritmos está formado por comparaciones u ordenaciones parciales entre objetos, y el modelo de representación del conocimiento varía en función de la aproximación empleada. Algunos ejemplos del uso del aprendizaje de preferencias incluyen el análisis de riesgos para la toma de decisiones estratégicas en ámbitos financieros, los sistemas de navegación con ayudas al usuario, o los buscadores como Google. Muchos algoritmos de aprendizaje de preferencias ven como su eficacia disminuye cuando el número de variables en los datos de entrada que no guardan relación con el concepto que se desea aprender se dispara. Intuitivamente se puede señalar que no todas las variables de un problema tienen la misma importancia. Algunas están relacionadas con el concepto que se desea aprender, y otras pueden ser ignoradas en el proceso. Este grado de relación es conocido como relevancia de variables. La detección de variables relevantes, en el sentido más puro del término, puede dar lugar a métodos ineficaces. En estos casos, la alternativa consiste en centrar la búsqueda en las variables útiles para el problema y algoritmo de aprendizaje empleados. La utilidad de un subconjunto de variables es un concepto íntimamente ligado al método de aprendizaje empleado. La búsqueda e identificación de variables útiles conlleva una serie de ventajas, como la reducción de los requisitos computacionales del sistema, la disminución del coste de obtención de los datos de entrada, o una mejor comp