JOSÉ MIGUEL BERNARDO: “Los métodos estadísticos tradicionales son ineficaces para los problemas de la ciencia moderna”

José Miguel Bernardo, catedrático de Estadística de la Universidad de Valencia, es uno de los profesores en la XXVI edición de la Winter School of Astrophysics del Instituto de Astrofísica de Canarias (IAC). Crédito: Miguel Briganti, SMM (IAC).
Fecha de publicación

Por ADELINA PASTOR

En unas elecciones, con apenas un 1% del voto escrutado es posible predecir con mucha precisión el resultado final. 

La inferencia bayesiana se utiliza para ver lo verosímiles que son los diferentes modelos del origen del Universo o las fechas del Big Bang. 

Los métodos estadísticos potentes son capaces de analizar con mucha rapidez toda la información relevante de la que se dispone para sacar las conclusiones pertinentes.

José Miguel Bernardo, catedrático de Estadística de la Universidad de Valencia, es una autoridad internacional en inferencia bayesiana, una forma de estadística tan versátil que se utiliza en diferentes contextos: elecciones, bolsa, marketing, diagnóstico médico… incluso en la búsqueda de planetas extrasolares. Profesor de la Escuela de Invierno del Instituto de Astrofísica de Canarias que se está celebrando en La Laguna, este investigador fue precisamente miembro fundador de la Sociedad Internacional de Análisis Bayesiano y alma máter de los Valencia meetings, un foro que cada cuatro años reúne a los expertos en el tema. “Es difícil encontrar una publicación sobre inferencia bayesiana que no cite alguno de los proceedings [actas] de estos encuentros”, comenta con orgullo de padre este matemático que ha colaborado con partidos y medios de comunicación en España, América Latina y África del Sur, y que el próximo martes, 11 de noviembre, a las 19h, en el Museo de la Ciencia y el Cosmos, ofrecerá una conferencia sobre predicción de resultados electorales. 

Pregunta: Su conferencia del día 11 lleva por título cómo hacer predicciones electorales sensatas.  Pregunta obligada: ¿es eso posible? 

Respuesta: Hay dos momentos para hacer predicciones electorales. Antes de las votaciones se hacen mediante encuestas, lo que a veces conlleva problemas de representatividad o veracidad de la gente cuyos sesgos no siempre se pueden matizar. Yo me voy a centrar principalmente en predicciones donde no hay ningún tipo de subjetividad: el muestreo de los primeros resultados leídos en unas cuantas mesas electorales sabiamente elegidas. Con estos datos -muy pocos, apenas un 1% del voto- es posible predecir con mucha precisión el resultado final y saber lo que ha pasado apenas a la hora de cerrar las mesas electorales; además de determinar si ha habido alguna probabilidad de fraude.

P: ¿Cómo se eligen esas mesas? 

R: En cualquier país con cierta tradición democrática existen resultados electorales públicos mesa por mesa para cada una de las elecciones. Dados los resultados de esas mesas, es posible crear un algoritmo matemático que extraiga un subconjunto pequeño (20 ó 30 mesas) que constituya un microcosmos del resultado global: se puede demostrar que sólo con la combinación de esas 20 mesas se hubiera podido predecir el resultado de las elecciones, por lo que los resultados de la predicción son fiables... a menos que la composición de la mesa haya cambiado, cosa que hay que comprobar cada vez. 

P: Pero usted está en Canarias como invitado de la XXVI Winter School of Astrophysics. ¿Qué tienen en común unas elecciones y la Astrofísica? 

R: Poco... salvo la metodología bayesiana, que se está imponiendo poco a poco en todas las ciencias experimentales, incluyendo la Astronomía.

En la estadística convencional (también llamada frecuentista) la probabilidad se entiende como la frecuencia relativa de que ocurra algo. En la estadística bayesiana, sin embargo, la probabilidad es una medida de lo verosímil, que es un suceso o hipótesis en función de la información de la que se dispone. Son dos paradigmas distintos, como los freudianos o los jungianos en psicología. Exagerando un poco, la diferencia es como trabajar con una concepción heliocéntrica o geocéntrica del Sistema Solar.

P: ¿Cuáles son las ventajas de la inferencia bayesiana para las ciencias experimentales?

R: Para hablar de frecuencia relativa es necesario que algo se repita indefinidamente en las mismas condiciones, y esto no siempre ocurre. Por ejemplo, la probabilidad de tener un hijo varón es de 0,51, pero eso es cierto con una información muy restringida, de modo muy general. Si quieres conocer el sexo que resultará del embarazo de un matrimonio que ya tiene dos varones es más complicado de relativizar, porque necesitas datos de parejas comparables. En el momento en que se añaden datos, resulta que estás ante un caso único y el concepto de frecuencia se desvanece. Y en las ciencias experimentales son cada vez más frecuentes las situaciones en las que no se puede hablar de frecuencias. Ahí están, por ejemplo, los problemas de genética, de biología molecular o de desarrollo de nuevos fármacos: las combinaciones son de tal calibre, hay tantos parámetros a tener en cuenta, que los métodos convencionales no bastan. A medida que los problemas se han ido complicando no es ya que los métodos tradicionales sean peores, que lo son, sino que son incapaces de tratar estos problemas.

P: Póngame un ejemplo relacionado con la Astronomía

R. Por ejemplo, ver lo verosímiles que son los diferentes modelos del origen del Universo o las fechas del Big Bang. Elegir entre modelos concretos es un problema de probabilidad y la estadística bayesiana permite aquí dar las probabilidades a posteriori: es decir, las probabilidades de que, dada la información que se tiene, el modelo correcto sea uno u otro. Y esto es algo que no se puede hacer desde el punto de vista clásico.

P: Pero la inferencia bayesiana es muy antigua: se basa en el teorema de Bayes, que data del siglo XVIII…

R: Es cierto que se usa el teorema de Bayes en una versión sofisticada, pero la aplicación es reciente. Hay una parte de la teoría que fue desarrollada por Laplace en el siglo XIX, pero sólo era válida en unas condiciones muy limitadas (con distribuciones iniciales uniformes) y por eso no se desarrolló como alternativa. A mediados del siglo XX quedó claro que se podía generalizar su uso, pero requería de integrales con mucho parámetros y ni los ordenadores eran lo suficientemente potentes ni se conocían las técnicas de Montecarlo, que se desarrollaron aproximadamente en los años 90. Esto es lo que ha permitido aplicaciones reales importantes, porque antes se conocía la teoría, pero no se sabía cómo aplicarla en la práctica. 

P: ¿Estamos ante un cambio en las ciencias experimentales?

R: Hay montones de problemas que son demasiado complicados como para que la mente humana saque conclusiones sin ayuda... Un ejemplo muy simple es el diagnóstico automático en medicina, que se apoya en bases de datos para un síndrome determinado con información sobre el historial clínico de los pacientes y su diagnóstico final; por ejemplo, hepatitis o cirrosis si es un problema de hígado. Si ahora llega un paciente nuevo con su propia historia clínica, naturalmente distinta, se usa la base de datos para obtener una distribución de probabilidad de lo que le pasa: dada su historia clínica y los datos históricos de los que dispongo, tiene cirrosis con probabilidad .8 y cáncer hepático con probabilidad .1, por ejemplo. Un médico puede intuir esto, pero no lo puede comprobar experimentalmente. Los métodos estadísticos potentes son capaces de analizar con mucha rapidez toda la información relevante de la que se dispone para sacar las conclusiones pertinentes. Y eso vale en medicina, en física y en cualquier disciplina. 

 

Comité Organizador: Andrés Asensio Ramos, Íñigo Arregui, Antonio Aparicio y Rafael Rebolo.

Secretaría: Lourdes González.

Contactos:

Andrés Asensio Ramos (IAC): aasensio [at] iac.es (aasensio[at]iac[dot]es) y 922605238

Íñigo Arregui (IAC): iarregui [at] iac.es (iarregui[at]iac[dot]es) y 922605465

Prensa:

Carmen del Puerto: prensa [at] iac.es (prensa[at]iac[dot]es) y 922605208

Programa: http://www.iac.es/winterschool/2014/pages/about-the-school/timetable.php

Notas de prensa relacionadas:

INAUGURADA LA XXVI ESCUELA DE INVIERNO DEL IAC

ESTADÍSTICA PARA EL ESTUDIO DEL UNIVERSO

Más información: http://www.iac.es/winterschool/2014/

Tipo de noticia