Research on Cancer Risk and Drug Treatment Efficacy Based on Database Construction and IFPTML Prediction Model
- Ren, Shumin
- Julián Dorado Director
- Aliuska Duardo Sánchez Codirector/a
Universidad de defensa: Universidade da Coruña
Fecha de defensa: 15 de mayo de 2024
- Juan Manuel Ruso Beiras Presidente/a
- A. Pazos Secretario
- Miren Josune Pérez Estrada Vocal
Tipo: Tesis
Resumen
En el campo de la investigación del cáncer, la construcción de bases de datos y modelos predictivos ha surgido como una herramienta de trabajo esencial. La característica distintiva del cáncer es la proliferación descontrolada de células anormales. Esto requiere investigar sus intrincados mecanismos de inicio y progresión, guiando las intervenciones terapéuticas. Abordar estos desafíos implica aprovechar los abundantes datos de diversos niveles, que abarcan genómica, proteómica, documentación clínica e imágenes. Estos datos pueden recopilarse y organizarse en bases de datos específicas, revelando relaciones biológicas, patrones y biomarcadores potenciales. Mientras tanto, con el avance de los modelos de aprendizaje automático, la combinación de diferentes niveles de información biológica y genética mejora la capacidad de predecir y evaluar el riesgo y pronóstico del cáncer de manera más precisa. Sin embargo, aunque actualmente existen algunas bases de datos sobre riesgo de cáncer y farmacogenómica, aún faltan bases de conocimientos para comparar y evaluar modelos de riesgo de cáncer, así como bases de datos para los efectos del tratamiento farmacológico basado en moléculas multiómicas. Para abordar esta brecha de investigación, nuestro grupo estableció la Base de Conocimientos del Modelo de Predicción de Riesgo de Cáncer (CRPMKB) y creamos la Base de Conocimientos de Eficacia del Tratamiento del Cáncer de Próstata (PCaTEKB). La creación de estas dos bases de datos, accesible a través de sitios web públicos, ha facilitado la investigación sobre la prevención del riesgo de cáncer, el tratamiento personalizado y los mecanismos del cáncer. También proporcionan recursos para el posterior desarrollo de modelos interpretables. En este trabajo también introducimos el algoritmo de Fusión de Información, Teoría de Perturbación y Aprendizaje Automático (IFPTML), para establecer modelos predictivos que integran varios tipos de entradas. Así en este trabajo se ha desarrollado un modelo IFPTML basado en datos de las bases ChEMBL y PCaTEKB. Este modelo está diseñado para predecir los resultados terapéuticos de medicamentos relacionados con el cáncer de próstata. Posteriormente, implementamos este modelo en el sitio web de PCaTEKB. Finalmente, discutimos la evolución de los principios FAIR, que han ido ganando terreno como paradigma de la gestión ética de datos en la investigación científica. Discutimos su incorporación a la legislación española, la extensión al software de investigación y la aplicación de los mismo a nuestra base de datos de conocimiento.