Técnicas de compresión e estruturas de indexación compactas para texto en linguaxe natural e contidos dixitaisaplicacións prácticas

  1. Rodríguez López, Eduardo
Supervised by:
  1. Ángeles Saavedra Places Director
  2. Antonio Fariña Director

Defence university: Universidade da Coruña

Fecha de defensa: 21 December 2015

Committee:
  1. Nieves R. Brisaboa Chair
  2. Miguel Á. Martínez Prieto Secretary
  3. Raquel Trillo Lado Committee member
Department:
  1. Computer Science and Information Technologies

Type: Thesis

Teseo: 397873 DIALNET lock_openRUC editor

Abstract

La aplicación de los resultados de la investigación al desarrollo software permite crear sistemas innovadores que resuelven problemas, organizan procesos o que ofrecen servicios a la sociedad de una forma más eficaz y eficiente. En la primera parte de esta tesis se presentan dos nuevas técnicas del área de investigación en compresión e indexación de texto en lenguaje natural. Por una parte, un autoíndice que permite obtener una representación comprimida del texto utilizando tan solo un 35-40% de su tamaño original, a la vez que realizar búsquedas muy eficientes dentro de él. Por otra parte, un compresor orientado a frases que permite reducir un texto hasta ocupar un 25-30% de su tamaño original, ofreciendo una descompresión muy rápida y la posibilidad de realizar búsquedas eficientes en el texto comprimido. En la segunda parte se presentan distintas soluciones tecnológicas que hemos desarrollado e integrado en sistemas reales en producción para resolver diferentes aspectos relacionados con el consumo de contenidos digitales, como su creación y distribución protegida, y cómo estas hacen uso de diferentes resultados de la investigación en compresión e indexación para mejorar la eficiencia en el almacenamiento, acceso, procesado y transmisión de los contenidos de naturaleza textual.