A framework for ontology-based library data generation, access and exploitation

  1. Vila Suero, Daniel
Supervised by:
  1. Jorge Gracia del Río Director
  2. Asunción Gómez Pérez Director

Defence university: Universidad Politécnica de Madrid

Fecha de defensa: 27 July 2016

Committee:
  1. Nieves R. Brisaboa Chair
  2. Oscar Corcho García Secretary
  3. María Fernanda Peset Mancebo Committee member
  4. Iuliana Botezan Albu Committee member
  5. Mathieu d'Aquin Committee member

Type: Thesis

Abstract

Históricamente, las bibliotecas han sido responsables de almacenar, preservar, catalogar y hacer disponibles para el público grandes colecciones de recursos. Con el objetivo de clasificar y organizar estas colecciones, la comunidad de bibliotecas ha desarrollado diferentes estándares para la producción, almacenamiento y comunicación de datos describiendo diferentes aspectos de los activos de conocimiento bibliográfico. Sin embargo, como discutimos en esta tesis, la mayoría de prácticas y estándares disponibles en la actualidad tienen un alcance limitado para la integración de estos activos de información bibliográfica en la Web, la mayor red de información creada por el ser humano hasta la fecha. Esta tesis pretende proveer fundamentos teóricos y soluciones tecnológicas para abordar algunos de los retos que se presentan a la hora de conectar las dos áreas citadas anteriormente: la biblioteconomía y la Web de datos. La investigación de estos aspectos ha sido abordada mediante una combinación de enfoques teóricos, tecnológicos y empíricos. En particular, la investigación presentada en esta tesis ha sido aplicada en la práctica para sostener el servicio de datos online datos.bne.es de la Biblioteca Nacional de España. Específicamente, esta tesis propone y evalúa un conjunto lenguajes, modelos y métodos con el objetivo de transformar y publicar datos de catálogos de bibliotecas en la Web haciendo uso de tecnologías semánticas y ontologías. En esta tesis, introducimos marimba-framework, un marco de trabajo basado en ontologías para la generación y publicación de datos semánticos. Dicho marco de trabajo aúna dichos lenguajes, modelos y métodos. Las contribuciones de esta tesis son las siguientes: • marimba-datamodel, un modelo de datos anidados para representar fuentes de datos de bibliotecas que puede ser procesado y consultado utilizando un álgebra recursiva. • La sintaxis y semántica de un lenguaje de consulta, marimba-sql, que puede ser usado para consultar y operar con fuentes de datos de bibliotecas en el modelo de datos marimba-datamodel. • La sintaxis y semántica operacional de un lenguaje de mapeo, marimba-rml, para mapear y transformar fuentes de datos de bibliotecas al modelo de datos semántico RDF (Resource Description Framework). • Guías metodológicas para el desarrollo de ontologías de bibliotecas y el mapeo de fuentes de datos de bibliotecas a RDF, así como la implementación y publicación de una ontología para bibliotecas, la ontología BNE. • Un método para la extracción de tópicos de ontologías que facilita la comparación de ontologías en función de los tópicos que describen, así como una serie de métricas de similitud basadas en los tópicos extraídos. • Un estudio en profundidad del impacto de las tecnologías semánticas en catálogos online para usuarios finales con respecto a la eficiencia y experiencia de los usuarios así como la usabilidad.