Astrofísica computacionalaplicación de técnicas de inteligencia artificial en la clasificación y parametrización de espectros estelares

  1. Rodríguez Fernández, Alejandra
Supervised by:
  1. Carlos Dafonte Director
  2. Minia Manteiga Director

Defence university: Universidade da Coruña

Fecha de defensa: 02 July 2010

Committee:
  1. Bernardino Arcay Chair
  2. Juan Romero Secretary
  3. Silvana Guadalupe Navarro Jiménez Committee member
  4. José Angel Taboada González Committee member
  5. Ana María Ulla Miguel Committee member
Department:
  1. Computer Science and Information Technologies

Type: Thesis

Teseo: 295161 DIALNET lock_openRUC editor

Abstract

En este trabajo de tesis doctoral se aborda la automatización de la clasificación de las estrellas a través del análisis de su espectro óptico mediante técnicas computacionales, fundamentalmente dentro de la rama de la Inteligencia Artificial. El sistema de información desarrollado, STARMIND, permite automatizar la clasificación en el sistema MK y la extracción de parámetros físicos tales como la temperatura efectiva o la gravedad, mediante la combinación de algoritmos de procesamiento de señales, métodos estadísticos y técnicas de Inteligencia Artificial integradas por medio de una base de datos astronómicos disponible a través de Internet. La revisión exhaustiva de los criterios que rigen el proceso de clasificación en el sistema MK ha posibilitado la adquisición y representación del conocimiento heurístico de los astrónomos expertos en tales tareas, integrándose este en una base de reglas jerarquizadas que reflejan de manera objetiva las relaciones implícitas entre los diferentes índices relativos a características morfológicas de los espectros y los distintos grupos considerados en el sistema estándar, esto es, tipos espectrales y clases de luminosidad. El grado de adecuación de cada uno de los criterios de clasificación obtenidos como resultado del mencionado estudio, se ha evaluado objetivamente por medio de la verificación de su capacidad real de discriminación sobre un conjunto completo y consistente de espectros de estrellas estándares del sistema MK, recopilado a través de diversas campañas propias de observación llevadas a cabo en el Observatorio Astronómico Internacional del Roque de los Muchachos. Como resultado de este análisis de sensibilidad, ha sido posible obtener un conjunto final completo de índices y criterios de clasificación entre los que se recogen algunos que, si bien no se consideran explícitamente en las técnicas manuales (SiII, bandas tempranas de TiO, etc.), han demostrado un comportamiento altamente satisfactorio. Durante el proceso de búsqueda de soluciones eficientes para el tratamiento automático de espectros estelares, se llevó a cabo un análisis diferencial completo de distintos métodos computacionales tanto estadísticos (K-means, FCM, ISODATA, PCA, Max-Min, FKNN) como pertenecientes a la rama de la Inteligencia Artificial (redes neuronales, sistemas basados en el conocimiento, lógica difusa, redes funcionales), que condujo de manera natural a la formalización de un sistema híbrido que representa una forma más versátil, adaptada y eficiente de emular el proceso actual de clasificación basado en el estudio visual de las características morfológicas más relevantes de los espectros. En una primera aproximación, el desarrollo de tal sistema se abordó desde la perspectiva de la integración funcional de las implementaciones de los métodos computacionales evaluados que redundaron en un rendimiento óptimo, incluyendo asimismo un mecanismo de traducción conexionista-simbólico basado en la estimación de los factores de certeza de las reglas de conocimiento a partir de los pesos sinápticos de las arquitecturas neuronales. Finalmente, se llegó a un enfoque neuro-simbólico que se sustenta en la cooperación activa entre un sistema experto difuso, encargado de efectuar las estimaciones iniciales, y un conjunto de redes neuronales de clasificación que refinan las conclusiones obtenidas hasta los niveles de subtipo y clase de luminosidad, asignándoles asimismo un valor de probabilidad que indica el grado de confianza que se puede depositar en sus respuestas. La experiencia adquirida en el diseño de arquitecturas neuronales eficientes durante el desarrollo del sistema híbrido de clasificación tuvo una aplicación adicional en el problema de obtención de los parámetros físicos más relevantes de las estrellas, lográndose una caracterización adecuada de las mismas especialmente en temperatura, lo cual condujo a proponer asimismo una calibración propia e inicial entre tipo espectral MK y temperatura estelar efectiva. La estructuración de toda la información disponible a través de una base de datos relacional permite disponer en todo momento de un catálogo uniforme y estadísticamente significativo de estrellas estándares de clasificación. El diseño de una interfaz ergonómica para el acceso público a esta base de datos astronómica online ha conseguido que el carácter de esta sea fuertemente dinámico, pues se nutre de los espectros, medidas y clasificaciones que se obtienen durante su fase de explotación. Asimismo, ofrece al usuario-astrónomo la posibilidad de visualizar, analizar y clasificar los espectros de una forma fácil y sencilla sin necesidad de la ejecución de código adicional alguno. La interfaz web desarrollada, además de posibilitar la realización no supervisada de tantos análisis morfológicos, clasificaciones y parametrizaciones físicas como se desee, constituye una herramienta óptima para solicitar y recibir la retroalimentación de la comunidad astrofísica, lo cual facilita enormemente el mantenimiento y perfeccionamiento del sistema, logrando que este se adapte más convenientemente para satisfacer las necesidades específicas de los usuarios. Asimismo, el diseño modular de la misma garantiza la flexibilidad del sistema de información desarrollado, pues posibilita la fácil integración de nuevos métodos de tratamiento estelar basados en técnicas astronómicas y/o computacionales distintas que puedan resultar apropiadas en un futuro para tratar el problema de clasificación/parametrización estelar. La incorporación de un módulo autoexplicativo en la aplicación final facilita la comprensión tanto del proceso de razonamiento llevado a cabo por el sistema como del significado de las respuestas obtenidas, convirtiéndose al mismo tiempo en un mecanismo muy útil de verificación de criterios de clasificación que adquiere un valor añadido como herramienta didáctica en la formación y entrenamiento de nuevo personal en el campo de la clasificación espectral. El sistema híbrido desarrollado, que supone la solución computacional final propuesta para el problema planteado al inicio de esta tesis doctoral, ha demostrado ser capaz de estimar la clasificación bidimensional de los espectros estelares con una tasa de éxito similar, y en algunos casos ligeramente superior, al porcentaje de acuerdo entre los expertos humanos que los han clasificado manualmente (alrededor del 85% tanto para tipo espectral como para clase de luminosidad), seleccionando y aplicando a cada tipo de espectro particular el método más idóneo para su procesamiento automático, lográndose de este modo una mayor eficiencia, versatilidad y adaptación al proceso tradicional de clasificación de espectros ópticos estelares en el sistema MK.