Normalización de términos multipalabra mediante pares de dependencia sintáctica
- Alonso, Miguel Á.
- Barcala Rodríguez, Francisco Mario
- Vilares, Jesús
ISSN: 1135-5948
Año de publicación: 2001
Título del ejemplar: XVII Congreso de la SEPLN: Sociedad Española para el Procesamiento del Lenguaje Natural: Universidad de Jaén, 12-14 septiembre 2001
Número: 27
Páginas: 123-130
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
En este artículo se presentan dos nuevas técnicas para la indexación de textos escritos en español. A nivel de palabra, proponemos la utilización de la morfología derivativa para obtener conjuntos de palabras relacionadas semánticamente. Esta técnica se combina, a nivel de frase, con la utilización de una gramática aproximada, lo que nos permitirá normalizar a una forma base común las variantes sintácticas y morfosintácticas de un término multipalabra. Dichos métodos han sido evaluados sobre un corpus de documentos periodísticos, obteniendo unos resultados que muestran una mejora considerable con respecto a los métodos clásicos de indexación.