Técnicas de compresión e estruturas de indexación compactas para texto en linguaxe natural e contidos dixitaisaplicacións prácticas

  1. Rodríguez López, Eduardo
Dirigida por:
  1. Ángeles Saavedra Places Directora
  2. Antonio Fariña Director

Universidad de defensa: Universidade da Coruña

Fecha de defensa: 21 de diciembre de 2015

Tribunal:
  1. Nieves R. Brisaboa Presidenta
  2. Miguel Á. Martínez Prieto Secretario/a
  3. Raquel Trillo Lado Vocal
Departamento:
  1. Ciencias de la Computación y Tecnologías de la Información

Tipo: Tesis

Teseo: 397873 DIALNET lock_openRUC editor

Resumen

La aplicación de los resultados de la investigación al desarrollo software permite crear sistemas innovadores que resuelven problemas, organizan procesos o que ofrecen servicios a la sociedad de una forma más eficaz y eficiente. En la primera parte de esta tesis se presentan dos nuevas técnicas del área de investigación en compresión e indexación de texto en lenguaje natural. Por una parte, un autoíndice que permite obtener una representación comprimida del texto utilizando tan solo un 35-40% de su tamaño original, a la vez que realizar búsquedas muy eficientes dentro de él. Por otra parte, un compresor orientado a frases que permite reducir un texto hasta ocupar un 25-30% de su tamaño original, ofreciendo una descompresión muy rápida y la posibilidad de realizar búsquedas eficientes en el texto comprimido. En la segunda parte se presentan distintas soluciones tecnológicas que hemos desarrollado e integrado en sistemas reales en producción para resolver diferentes aspectos relacionados con el consumo de contenidos digitales, como su creación y distribución protegida, y cómo estas hacen uso de diferentes resultados de la investigación en compresión e indexación para mejorar la eficiencia en el almacenamiento, acceso, procesado y transmisión de los contenidos de naturaleza textual.