Técnicas de indexación y recuperación de documentos utilizando referencias geográficas y textuales
- Miguel Rodríguez Luaces Director
- José Ramón Ríos Viqueira Director/a
Universidad de defensa: Universidade da Coruña
Fecha de defensa: 23 de septiembre de 2009
- José Miguel Toro Bonilla Presidente/a
- Nieves R. Brisaboa Secretaria
- Antonio Corral Liria Vocal
- Javier Nogueras Iso Vocal
- Francisco Javier Rodríguez Martínez Vocal
Tipo: Tesis
Resumen
Internet y la World Wide Web se han convertido en un enorme repositorio de información que consultan diariamente millones de usuarios, Además, otros repositorios de información, como las bases de datos documentales o las bibliotecas digitales, también han aumentado su popularidad considerablemente. Esto ha provocado que la recuperación de información se haya convertido en una de las áreas de investigación más importantes dentro de la informática. Aunque estos repositorios contienen información de distinta naturaleza, la información más común es de tipo textual. A menudo, en el texto de un documento se pueden encontrar referencias geográficas que permiten asignar a ese documento una zona del espacio en la cual es relevante. Los usuarios de los sistemas que enumerábamos demandan cada vez más servicios que les permitan situar la información recuperada en un mapa. Además, también está aumentando el interés en consultas que permitan recuperar documentos relevantes no sólo para un tema determinado sino también para una zona determinada. El desarrollo de arquitecturas de sistemas, estructuras de indexación y otros componentes que permitan satisfacer estas necesidades es el objetivo principal de una nueva área de investigación denominada recuperación de información geográfica (GIR). En esta tesis abordamos varios problemas de interés en el área. En primer lugar, las estructuras de indexación que permiten recuperar documentos empleando tanto su ámbito textual como su ámbito espacial no tienen en cuenta la naturaleza jerárquica del espacio geográfico ni las relaciones topológicas entre los objetos espaciales que indexan. Por tanto, nuestro primer objetivo es desarrollar una estructura que solucione los problemas causados por estas limitaciones. Esta estructura constituye la base de la arquitectura para sistemas GIR que proponemos como segundo objetivo de la tesis. Estudiamos las limitaciones de las arquitecturas de los sistemas GIR propuestos hasta la fecha y proponemos una arquitectura genérica, modular y extensible. Además desarrollamos un prototipo de sistema basado en dicha arquitectura. Finalmente, como tercer objetivo de esta tesis proponemos una estructura para indexar objetos geográficos optimizada para las características de la información que se maneja habitualmente en sistemas GIR.