Ontology customization for biomedical informatics

  1. LOPEZ GARCIA, PABLO
Supervised by:
  1. Arantza Illarramendi Echave Director

Defence university: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 07 June 2013

Committee:
  1. Nieves R. Brisaboa Chair
  2. Jesús Bermúdez de Andrés Secretary
  3. Stefan Schulz Committee member
  4. Eduardo Mena Nieto Committee member
  5. José Francisco Aldana Montes Committee member

Type: Thesis

Teseo: 116064 DIALNET

Abstract

Una buena parte de la investigación más reciente en los campos de la Web Semántica y la Informática Biomédica se ha centrado en estudiar cómo reducir el tamaño y la complejidad de una ontología, y otra parte importante en cómo resolver el problema de la heterogeneidad de ontologías, tanto a nivel de dominio como de formatos de representación. El objetivo principal de esta tesis es entender mejor el papel que pueden jugar las tecnologías semánticas como herramientas para superar ambos obstáculos personalizando las ontologías a un campo o dominio de aplicación concreto. En primer lugar se estudia el problema de la reducción de complejidad y tamaño utilizando técnicas de extracción de módulos basadas en lógica, técnicas de extracción de subconjuntos basadas en grafos, y técnicas de filtrado basadas en frecuencia, utilizando SNOMED CT como ontología de referencia. Mediante un caso de estudio se demuestra que las técnicas de recorrido de grafos de pueden combinar con los datos de frecuencia de aparición de los términos en un corpus de referencia para así poder la ontología y obtener subconjuntos compactos y con buena cobertura en aplicaciones de anotación de textos biomédicos. En segundo lugar, se estudian los repositorios de ontologías biomédicas con mappings como herramientas para inferir nuevos subconjuntos de interés. Se propone un caso de estudio de anotación utilizando un subconjunto de referencia en el dominio de las enfermedades (subconjunto CORE de SNOMED CT) y un subconjunto objetivo a extraer de otra ontología diferente en el dominio de los medicamentos (RxNorm) utilizando tecnologías semánticas estándar: UMLS como repositorio de ontologías biomédicas y NDF-RT como ontología que conecta el dominio de las enfermedades y los medicamentos. Se demuestra que los repositorios de ontologías biomédicas con mappings son herramientas útiles para extraer subconjuntos de ontologías de otros dominios relacionados de manera muy eficiente computacionalmente hablando.