Técnicas de compresión e estruturas de indexación compactas para texto en linguaxe natural e contidos dixitaisaplicacións prácticas
- Rodríguez López, Eduardo
- Ángeles Saavedra Places Director
- Antonio Fariña Director
Defence university: Universidade da Coruña
Fecha de defensa: 21 December 2015
- Nieves R. Brisaboa Chair
- Miguel Á. Martínez Prieto Secretary
- Raquel Trillo Lado Committee member
Type: Thesis
Abstract
La aplicación de los resultados de la investigación al desarrollo software permite crear sistemas innovadores que resuelven problemas, organizan procesos o que ofrecen servicios a la sociedad de una forma más eficaz y eficiente. En la primera parte de esta tesis se presentan dos nuevas técnicas del área de investigación en compresión e indexación de texto en lenguaje natural. Por una parte, un autoíndice que permite obtener una representación comprimida del texto utilizando tan solo un 35-40% de su tamaño original, a la vez que realizar búsquedas muy eficientes dentro de él. Por otra parte, un compresor orientado a frases que permite reducir un texto hasta ocupar un 25-30% de su tamaño original, ofreciendo una descompresión muy rápida y la posibilidad de realizar búsquedas eficientes en el texto comprimido. En la segunda parte se presentan distintas soluciones tecnológicas que hemos desarrollado e integrado en sistemas reales en producción para resolver diferentes aspectos relacionados con el consumo de contenidos digitales, como su creación y distribución protegida, y cómo estas hacen uso de diferentes resultados de la investigación en compresión e indexación para mejorar la eficiencia en el almacenamiento, acceso, procesado y transmisión de los contenidos de naturaleza textual.