Improvements to the performance and applicability of dependency parsing

  1. Fernández-González, Daniel
Dirigida por:
  1. Manuel Vilares Ferro Director/a
  2. Carlos Gómez Rodríguez Director

Universidad de defensa: Universidade da Coruña

Fecha de defensa: 03 de noviembre de 2015

Tribunal:
  1. Giorgio Satta Presidente/a
  2. Miguel Á. Alonso Secretario
  3. Arantza Díaz de Ilarraza Sánchez Vocal
  4. Pablo Gamallo Otero Vocal
  5. Jesús Vilares Vocal
Departamento:
  1. Ciencias de la Computación y Tecnologías de la Información

Tipo: Tesis

Teseo: 394866 DIALNET lock_openRUC editor

Resumen

Los analizadores de dependencias han generado un gran interés en las últimas décadas debido a su utilidad en un amplio rango de tareas de procesamiento de lenguaje natural. Estos utilizan grafos de dependencias para definir la estructura sintáctica de una oración dada. En particular, los algoritmos basados en transiciones proveen un análisis sintáctico de dependencias eficiente y preciso. Sin embargo, su principal inconveniente es que tienden a sufrir propagación de errores. Así, una decisión temprana tomada erróneamente podría posicionar el analizador en un estado incorrecto, causando más errores en futuras decisiones. Esta tesis se centra en mejorar la precisión de los analizadores basados en transiciones mediante la reducción del efecto de la propagación de errores, mientras mantienen su velocidad y eficiencia. Concretamente, proponemos cinco enfoques diferentes que han demostrado ser beneficiosos para su rendimiento, al aliviar la propagación de errores e incrementar su precisión. Además, hemos ampliado la utilidad de los analizadores de dependencias más allá de la construcción de grafos de dependencias. Presentamos una novedosa técnica que permite que estos sean capaces de construir representaciones de constituyentes. Esto cubriría la necesidad de la comunidad de procesamiento de lenguaje natural de disponer de un analizador eficiente capaz de proveer un árbol de constituyentes para representar la estructura sintáctica de las oraciones.