Etiquetación robusta del lenguaje naturalpreprocesamiento y segmentación
- Graña Gil, Jorge
- Barcala Rodríguez, Francisco Mario
- Vilares, Jesús
ISSN: 1135-5948
Año de publicación: 2001
Título del ejemplar: XVII Congreso de la SEPLN: Sociedad Española para el Procesamiento del Lenguaje Natural: Universidad de Jaén, 12-14 septiembre 2001
Número: 27
Páginas: 173-180
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
Una de las tareas previas más importantes para la etiquetación robusta del lenguaje natural es la correcta segmentación o preprocesamiento de los textos. Esta fase, que puede involucrar a procesos mucho más complejos que la simple identificación de las diferentes frases del texto y de cada uno de sus componentes individuales, es a menudo obviada en muchos de los desarrollos actuales. A pesar de esto, se trata de una tarea de una enorme importancia práctica y abordarla con pleno rigor científico, sin caer repetidamente en el análisis de la casuística particular de cada fenómeno detectado, es una labor que resulta especialmente compleja. En este trabajo hemos desarrollado un esquema de preprocesamiento orientado a la desambigüación y etiquetación robusta del gallego. No obstante, se trata de una propuesta de arquitectura general que puede ser aplicada a otros idiomas, como por ejemplo el español, con modificaciones muy ligeras.