El impacto del aprendizaje profundo para el análisis de cartografiados de galaxias.

Cambio relativo del número de artículos en arXiv:astro-ph con diferentes palabras clave en el resumen en función del tiempo. El número de trabajos que mencionan redes neuronales en el resumen ha experimentado un crecimiento sin precedentes en los últimos ~ 6 años, significativamente más pronunciado que cualquier otro tema en astrofísica. Fuente: ArXivSorter

Fecha de publicación
Autores
François Lanusse
Referencias

El volumen y la complejidad de los datos proporcionados por los cartografiados cosmológicos modernos han estado aumentando constantemente en los últimos años. Próximamente, nuevas instalaciones proporcionarán imágenes y espectros de cientos de millones de galaxias. Extraer información científica coherente de estos conjuntos de datos grandes y multimodales sigue siendo un desafío abierto para la comunidad. Enfoques basados en datos, como el aprendizaje profundo, han surgido rápidamente como una solución potencialmente interesante para algunos desafíos de largo alcance. Este entusiasmo se refleja en un crecimiento exponencial sin precedentes de publicaciones que emplean redes neuronales, pasando de unas pocas obras en 2015 a un promedio de un artículo por semana en 2021 en el área de encuestas galácticas. Cinco años después del primer trabajo publicado en astronomía que menciona el aprendizaje profundo, y poco antes de que nuevos conjuntos de datos grandes como Euclid y LSST comiencen a estar disponibles, creemos que es oportuno revisar cuál ha sido el impacto real de esta nueva tecnología en el campo y su potencial para resolver desafíos clave planteados por el tamaño y la complejidad de los nuevos conjuntos de datos.

El propósito de esta revisión es, por tanto, doble. En primer lugar, pretendemos resumir en un documento común las principales aplicaciones del aprendizaje profundo para el análisis de cartografiados que han surgido hasta ahora. En segundo lugar, extraemos los principales logros y lecciones aprendidas y destacamos las preguntas abiertas clave y las limitaciones que, en nuestra opinión, requerirán atención especial en los próximos años. En general, los métodos de aprendizaje profundo de última generación son rápidamente adoptados por la comunidad astronómica, lo que refleja una democratización de estos métodos. Esta revisión muestra que la mayoría de los trabajos que utilizan el aprendizaje profundo hasta la fecha están orientados a tareas de visión artificial (por ejemplo, clasificación, segmentación). Este es también el ámbito de aplicación donde el aprendizaje profundo ha logrado los avances más importantes hasta ahora. Sin embargo, también informamos que las aplicaciones se están volviendo más diversas y el aprendizaje profundo se utiliza para estimar propiedades de galaxias, identificar valores atípicos o limitar el modelo cosmológico. La mayoría de estos trabajos siguen estando en un nivel exploratorio, lo que podría explicar en parte el impacto limitado en términos de citas. Es probable que se deban abordar desafíos comunes antes de pasar a la próxima fase de implementación masiva del aprendizaje profundo en el procesamiento de conjuntos de datos futuros; como son la cuantificación de la incertidumbre, la interpretabilidad, la etiquetación de datos y los problemas de cambio de dominio al entrenar con simulaciones, que constituye una práctica común en astronomía.