Parsing schemata for practical text analysis

  1. Gómez Rodríguez, Carlos
Dirigida por:
  1. Manuel Vilares Ferro Director/a
  2. Miguel Á. Alonso Director

Universidad de defensa: Universidade da Coruña

Fecha de defensa: 05 de junio de 2009

Tribunal:
  1. John A, Carroll Presidente/a
  2. Jesús Vilares Secretario
  3. Giorgio Satta Vocal
  4. Víctor Jesús Díaz Madrigal Vocal
  5. Leo Wanner Vocal
Departamento:
  1. Ciencias de la Computación y Tecnologías de la Información

Tipo: Tesis

Teseo: 227061 DIALNET

Resumen

Esta tesis presenta varias herramientas teóricas y prácticas, con el objetivo común de acercar la teoría de esquemas de análisis sintáctico de Sikkel a las necesidades prácticas que surgen en el desarrollo de analizadores sintácticos para textos en lenguaje natural, Para ello, desde un punto de vista práctico, se presenta un compilador que permite generar automáticamente implementaciones eficientes de analizadores sintácticos a partir de sus descripciones formales en forma de esquemas de análisis. A continuación, se muestra el uso de este sistema para obtener implementaciones de diversos analizadores conocidos para gramáticas independientes del contexto y gramáticas de adjunción de árboles; y se lleva a cabo un estudio del rendimiento empírico de los analizadores aplicando estas implementaciones a gramáticas de lenguaje natural. Por otra parte, desde un punto de vista teórico, se presentan dos extensiones de la teoría de esquemas de análisis sintáctico, que permiten a este formalismo describir dos nuevos tipos de analizadores que, a pesar de ser de gran utilidad práctica, no eran cubiertos hasta el momento por esta teoría. La primera extensión es para analizadores sintácticos con corrección de errores, que son algoritmos capaces de analizar frases agramaticales de forma robusta. Además de la propia extensión, se define también una transformación que permite añadir automáticamente la capacidad de corrección de errores a analizadores que no la poseen. La segunda extensión define una variante de los esquemas de análisis sintáctico para analizadores de dependencias, que son algoritmos que representan la estructura de las frases como un conjunto de enlaces entre sus palabras. Este formalismo se utiliza para comparar y relacionar entre sí varios de los analizadores de dependencias más conocidos, tanto proyectivos como no proyectivos; además de para resolver el problema abierto de analizar eficientemente estructuras de dependencias suavemente no proyectivas, definiendo analizadores nuevos para varios de estos conjuntos de estructuras. En conjunto, los resultados descritos en esta tesis proporcionan al desarrollador de analizadores sintácticos unos fundamentos formales comunes que pueden ser utilizados para diseñar, analizar y comparar diferentes clases de analizadores, incluyendo aquéllos con corrección de errores y los basados en dependencias; además de herramientas prácticas para obtener implementaciones eficientes de estos analizadores de forma automática, partiendo de su representación formal.