Normalización de términos multipalabra mediante pares de dependencia sintáctica

  1. Alonso, Miguel Á.
  2. Barcala Rodríguez, Francisco Mario
  3. Vilares, Jesús
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2001

Título del ejemplar: XVII Congreso de la SEPLN: Sociedad Española para el Procesamiento del Lenguaje Natural: Universidad de Jaén, 12-14 septiembre 2001

Número: 27

Páginas: 123-130

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

En este artículo se presentan dos nuevas técnicas para la indexación de textos escritos en español. A nivel de palabra, proponemos la utilización de la morfología derivativa para obtener conjuntos de palabras relacionadas semánticamente. Esta técnica se combina, a nivel de frase, con la utilización de una gramática aproximada, lo que nos permitirá normalizar a una forma base común las variantes sintácticas y morfosintácticas de un término multipalabra. Dichos métodos han sido evaluados sobre un corpus de documentos periodísticos, obteniendo unos resultados que muestran una mejora considerable con respecto a los métodos clásicos de indexación.