Ontology customization for biomedical informatics
- LOPEZ GARCIA, PABLO
- Arantza Illarramendi Echave Director/a
Universidad de defensa: Universidad del País Vasco - Euskal Herriko Unibertsitatea
Fecha de defensa: 07 de junio de 2013
- Nieves R. Brisaboa Presidenta
- Jesús Bermúdez de Andrés Secretario/a
- Stefan Schulz Vocal
- Eduardo Mena Nieto Vocal
- José Francisco Aldana Montes Vocal
Tipo: Tesis
Resumen
Una buena parte de la investigación más reciente en los campos de la Web Semántica y la Informática Biomédica se ha centrado en estudiar cómo reducir el tamaño y la complejidad de una ontología, y otra parte importante en cómo resolver el problema de la heterogeneidad de ontologías, tanto a nivel de dominio como de formatos de representación. El objetivo principal de esta tesis es entender mejor el papel que pueden jugar las tecnologías semánticas como herramientas para superar ambos obstáculos personalizando las ontologías a un campo o dominio de aplicación concreto. En primer lugar se estudia el problema de la reducción de complejidad y tamaño utilizando técnicas de extracción de módulos basadas en lógica, técnicas de extracción de subconjuntos basadas en grafos, y técnicas de filtrado basadas en frecuencia, utilizando SNOMED CT como ontología de referencia. Mediante un caso de estudio se demuestra que las técnicas de recorrido de grafos de pueden combinar con los datos de frecuencia de aparición de los términos en un corpus de referencia para así poder la ontología y obtener subconjuntos compactos y con buena cobertura en aplicaciones de anotación de textos biomédicos. En segundo lugar, se estudian los repositorios de ontologías biomédicas con mappings como herramientas para inferir nuevos subconjuntos de interés. Se propone un caso de estudio de anotación utilizando un subconjunto de referencia en el dominio de las enfermedades (subconjunto CORE de SNOMED CT) y un subconjunto objetivo a extraer de otra ontología diferente en el dominio de los medicamentos (RxNorm) utilizando tecnologías semánticas estándar: UMLS como repositorio de ontologías biomédicas y NDF-RT como ontología que conecta el dominio de las enfermedades y los medicamentos. Se demuestra que los repositorios de ontologías biomédicas con mappings son herramientas útiles para extraer subconjuntos de ontologías de otros dominios relacionados de manera muy eficiente computacionalmente hablando.