Por MIGUEL LÓPEZ RUBIO
“Si estás tratando averiguar si detrás de una estrella hay un planeta y careces de información para aseverar con un 100% de seguridad su existencia, con la teoría bayesiana expresas matemáticamente cuánto de incierta es tu conclusión, si hay o no hay planeta.”
“La metodología bayesiana tiene aplicaciones en múltiples ámbitos, como por ejemplo la medicina.”
“Nos encontramos con un doble reto: manejar grandes cantidades de datos y gestionar estos datos en términos de tiempo. Estadística a gran escala.”
Tom Loredo nunca pensó que viviría rodeado de datos. Tras graduarse, pensaba centrarse en la observación. “Quería conocer la física detrás de las estrellas”. Pero entonces, por indicación de su ‘advisor’, se embarcó en el proyecto de comparar el marco teórico de las supernovas con una serie de hallazgos que parecían prometedores. Tras un primer año poco satisfactorio, Loredo se encontró por primera vez con la disciplina que marcaría para siempre su trayectoria profesional: la estadística bayesiana. “Me capturó”, asegura.
Loredo, investigador de la Universidad de Cornell (EEUU), es uno de los profesores en la 26ª edición de la Winter School of Astrophysics del Instituto de Astrofísica de Canarias (IAC). En ella habla de inferencias bayesianas, esto es, de cómo determinar propiedades de una población estadística a partir de una pequeña parte de la misma. Esta técnica permite, por ejemplo, sacar conclusiones de las estrellas de toda una galaxia a partir de los datos extraídos de unos cientos de ellas. Todo ello, conviviendo con la incertidumbre…
Pregunta: Cualquier artículo que trate de explicar qué es la estadística bayesiana incluye siempre el término “incertidumbre”. ¿Es esa su clave?
Respuesta: En un problema matemático, tratas de buscar un punto de partida que te lleve a una solución. Sin embargo, en el mundo real no solemos disponer de la suficiente información para poder llegar a ese resultado. No siempre se puede asumir que las cosas son verdaderas o falsas. Admitimos entonces que existe una incertidumbre sobre la verdad. La estadística bayesiana determina cuál es el nivel de incertidumbre, en una escala por ejemplo del 0 a 10, y a partir de ahí trata de establecer conclusiones.
P: Así que se recurre a la aproximación bayesiana cuando no se está seguro…
R: Pongamos como ejemplo que estás tratando de averiguar si detrás de una determinada estrella hay un planeta, y que careces de información para aseverar con un 100% de seguridad su existencia. Con la teoría bayesiana expresas matemáticamente cuánto de incierta es tu conclusión, si hay o no hay planeta. Ya tienes un dato, que puedes extrapolar a otras situaciones a través del análisis científico.
P: Y abordar realidades de mayor envergadura, como galaxias.
R: Así es, por ejemplo para estudiar su demografía. Tras analizar varios cientos de estrellas y teniendo en cuenta que en una galaxia hay cientos de miles de millones, ¿qué podemos decir de esa galaxia? Lo que puedas decir del conjunto de estrellas de esa galaxia depende de lo que puedas decir de las que has observado y, a su vez, lo que puedas decir de esos cientos depende de los datos que cada estrella ofrece de forma individual. Aplicando la estadística bayesiana cuantificas la incertidumbre en ese camino. Los datos inciertos de la primera medición son extrapolados a la conclusión final, de una a todas las estrellas de la galaxia. Al fin y al cabo, se trata de llevar la incertidumbre a otro nivel. No es muy diferente de lo que se hace con las encuestas de opinión, por ejemplo, para determinar la intención de voto.
P: Parece una técnica novedosa, pero la teoría tiene algunos siglos a sus espaldas.
R: Lo interesante de la teoría bayesiana es que fue la primera manera de usar la probabilidad para analizar datos. Echando la vista atrás, astrónomos de la talla de Laplace la empleaban para estudiar nuestro propio sistema solar. Él, por ejemplo, la usó para calcular la masa de Saturno y sus conclusiones se probaron algunos años después. Laplace hizo una buena deducción manejando la incertidumbre. Sin embargo, a principios del siglo XX, irrumpió otra aproximación estadística –la frecuentista- que se hizo dominante. Este método tiene que ver con la variabilidad. La idea es repetir muchas veces la observación, ver qué cambia y extraer conclusiones.
P: ¿Y cómo logró volver a concitar el interés de la comunidad científica?
R: Fue en los 80 y ha tenido mucho que ver con el avance en computación. A medida que se ha avanzado en este terreno, se ha podido aplicar la metodología bayesiana en terrenos en los que hasta entonces resultaba imposible.
P: ¿Y cuál será su futuro?
R: Lo tendrá, seguro. En este momento, el manejo de grandes cantidades de datos –el conocido big data- ha puesto la estadística en el foco. Tiene aplicaciones en múltiples ámbitos, como por ejemplo la medicina. Es cierto que hasta ahora en el ámbito del big data ha predominado la estadística frecuentista porque permite muchas combinaciones. El reto ahora es desarrollar herramientas eficientes que permitan responder, con la inferencia bayesiana, a preguntas complejas.
P: Una pregunta personal ¿qué le atrapó de esta técnica?
R: La estadística bayesiana tiene coherencia, a mi modo de ver. Si planteas bien el problema, te lleva de manera metódica a la respuesta. Tiene una belleza similar a la que yo veía en la física y la que me hizo, en mis inicios, querer ser astrofísico.
P: Ha aplicado esta técnica en una de las cuestiones que más interés público despierta en Astrofísica, la búsqueda de planetas similares a La Tierra fuera del Sistema Solar.
R: Estamos en el filo de poder detectar planetas similares a La Tierra en estrellas tipo Sol. Empezamos a identificar planetas alrededor de estrellas hace 20 años, lo cual fue revolucionario pues, hasta entonces, solo conocíamos nuestro sistema solar. Resultó que los primeros planetas que vimos eran completamente diferentes: planetas como Júpiter, con mucha masa, orbitando muy cerca de las estrellas, en lugar de lejos, como en nuestro sistema. Los llamamos “Júpiter calientes”. Con la mejora de los sistemas de detección, especialmente la misión de la NASA Kepler, podemos empezar a ver planetas con tamaños algo mayores al nuestro.
La principal forma de detección de los planetas es analizando cómo afecta su presencia a una estrella y ahí es donde surgen los obstáculos, ya que las superficies estelares están sujetas a permanentes cambios. Es entonces cuando la estadística se convierte en una herramienta tremendamente útil, especialmente a medida que vamos identificando planetas más pequeños.
P: También colabora en el desarrollo del LSST, el gran telescopio de rastreos sinópticos
R: Históricamente, un astrónomo tenía una idea, recurría a un telescopio, observaba, recogía datos y los analizaba. Ahora, con los nuevos telescopios y cámaras, y la computación avanzada, podemos mirar una parte significativa del cielo en pocos días. Eso es lo que plantean proyectos como el LSST aunque, en este caso concreto, en lugar de facilitarnos una gran cantidad de datos estáticos, obtendremos una gran película en stop-motion. Podremos recoger información de los objetos transaccionales, que aparecen y desparecen; y analizar cómo van cambiando las cosas en el cielo. Nos encontramos con un doble reto: manejar grandes cantidades de datos y gestionar estos datos en términos de tiempo. Estadística a gran escala.
P: Casi a escala hollywoodiense
R: (Risas) Es una buena forma de verlo. A escala Hollywood y de acceso público para toda la comunidad científica. Se espera que el LSST comience sus operaciones en unos siete años.
Comité Organizador: Andrés Asensio Ramos, Íñigo Arregui, Antonio Aparicio y Rafael Rebolo.
Secretaría: Lourdes González.
Contactos:
Andrés Asensio Ramos (IAC): aasensio [at] iac.es (aasensio[at]iac[dot]es) y 922605238
Íñigo Arregui (IAC): iarregui [at] iac.es (iarregui[at]iac[dot]es) y 922605465
Prensa:
Carmen del Puerto: prensa [at] iac.es (prensa[at]iac[dot]es) y 922605208
Programa: http://www.iac.es/winterschool/2014/pages/about-the-school/timetable.php
Notas de prensa relacionadas:
INAUGURADA LA XXVI ESCUELA DE INVIERNO DEL IAC
ESTADÍSTICA PARA EL ESTUDIO DEL UNIVERSO
Más información: http://www.iac.es/winterschool/2014/