Selección de variables en sistemas de aprendizaje automático de preferencias
- Fernandez Bayón, Gustavo
- Antonio Bahamonde Rionda Director
- José Ramón Quevedo Pérez Director
Defence university: Universidad de Oviedo
Fecha de defensa: 24 May 2007
- Daniel Borrajo Millán Chair
- Óscar Luaces Rodríguez Secretary
- Pedro Larrañaga Múgica Committee member
- José Hernández Orallo Committee member
- Amparo Alonso Betanzos Committee member
Type: Thesis
Abstract
En algunos problemas reales de aprendizaje la información a tratar viene dada en forma de ordenaciones de objetos, En estos casos, una alternativa válida puede ser adaptar la metodología de aprendizaje a la naturaleza de los datos. El objetivo entonces consiste en diseñar algoritmos de aprendizaje capaces de aprender a partir de ordenaciones de objetos. Este tipo de algoritmos son conocidos como métodos de aprendizaje de preferencias. El conocimiento de partida de este tipo de algoritmos está formado por comparaciones u ordenaciones parciales entre objetos, y el modelo de representación del conocimiento varía en función de la aproximación empleada. Algunos ejemplos del uso del aprendizaje de preferencias incluyen el análisis de riesgos para la toma de decisiones estratégicas en ámbitos financieros, los sistemas de navegación con ayudas al usuario, o los buscadores como Google. Muchos algoritmos de aprendizaje de preferencias ven como su eficacia disminuye cuando el número de variables en los datos de entrada que no guardan relación con el concepto que se desea aprender se dispara. Intuitivamente se puede señalar que no todas las variables de un problema tienen la misma importancia. Algunas están relacionadas con el concepto que se desea aprender, y otras pueden ser ignoradas en el proceso. Este grado de relación es conocido como relevancia de variables. La detección de variables relevantes, en el sentido más puro del término, puede dar lugar a métodos ineficaces. En estos casos, la alternativa consiste en centrar la búsqueda en las variables útiles para el problema y algoritmo de aprendizaje empleados. La utilidad de un subconjunto de variables es un concepto íntimamente ligado al método de aprendizaje empleado. La búsqueda e identificación de variables útiles conlleva una serie de ventajas, como la reducción de los requisitos computacionales del sistema, la disminución del coste de obtención de los datos de entrada, o una mejor comp