Desarrollo de un sistema ontológico para la integración de fuentes de datos heterogéneas
- Rodríguez Martínez, Francisco Javier
- Ángeles Saavedra Places Director
- Miguel Rodríguez Luaces Director
Defence university: Universidade da Coruña
Fecha de defensa: 07 July 2008
- Juan Carlos González Moreno Chair
- Nieves R. Brisaboa Secretary
- Fernando Díaz Gómez Committee member
- María Angélica Caro Gutiérrez Committee member
- Enrique Barreiro Alonso Committee member
Type: Thesis
Abstract
La proliferación de fuentes de datos en Internet ha sido enorme en los últimos años, y gracias a la evolución de la tecnología y a la madurez de los usuarios, cada vez nos encontramos con sitios web con información más compleja, con todo tipo de contenidos, y con muchos más servicios más allá de simples búsquedas por los datos "estructurados" o, incluso, por contenido, que los convierten en auténticas bibliotecas digitales, En este contexto, y para facilitar al usuario el acceso a la información, tratando de hacerle transparente la heterogeneidad de las fuentes (tanto estructural como semántica), el elevado número que existe y su dispersión, y la autonomía y total independencia de cada fuente, han surgidos numerosos trabajos que permiten integrar en una única interfaz de usuario el acceso a varias fuentes de datos. Sin embargo, estos trabajos sólo consiguen solucionar el problema de forma parcial. De hecho, la comunidad internacional de investigación en bibliotecas digitales, lleva manteniendo los tópicos de interoperabilidad e integración semántica en los congresos que celebra y en las publicaciones que edita, por representar para ellos un problema que es preciso resolver, y por no existir todavía una solución que lo salve en todas sus dimensiones. El trabajo realizado en esta tesis cae totalmente dentro de este tema de investigación. Se presenta una arquitectura basada en mediadores para integrar fuentes de datos heterogéneas, en general, y bibliotecas digitales, en particular. La característica fundamental de la arquitectura es que consigue aprovechar toda la semántica de las fuentes de datos ya que incorpora un sistema ontológico diseñado especificamente para ese fin. Además, en el diseño de la arquitectura se usan agentes, los cuales le aportan flexibilidad para adaptarse a los cambios y escalabilidad para soportar un número de fuentes elevado. En este trabajo se describe esta arquitectura y el sistema ontológico en el que se basa. Además, se presenta un prototipo para integrar tres Bibliotecas Digitales del Siglo de Oro Español existentes y totalmente independientes, en el que la arquitectur de agentes se implementó en JADE, y tantos las tres ontologías locales a cada biblioteca digital, como la ontología global se construyeron con el lenguaje OWL-DL. Junto con la cantidad y calidad de las revistas y los congresos nacionales e internacionales en los que hemos publicado los resultados de investigación obtenidos, este prototipo nos ha permitido validar la características de la arquitectura propuesta.