Today, navigating among the old files in my computer, I found a text and some figures in which I tried to explain why comparative methods might be of interest for people studying macroeconomy. I just applied the same reasoning we usually do in biology: countries are not independent entities since historically they’ve had different degrees of relationships (some have arisen from some others). Therefore, the type of relationship among macroeconomic variables we usually see in graphs with a large number of countries might only reflect a random correlation product of the historical relationship among countries. I know, this kind of metaphors biology-economy (or evolution-history) are flawed and, as one of my former bosses put it once: ‘the danger of metaphors is that the better they are the less they look like a metaphor’.
That’s probably why it was among old files in my computer, where this kind of fast idea should be, and I’m happy to say that. However, because this blog is a bit of a jumble too, I thought I’d share the graphs here:
Here, ‘Felsenstein’s best case scenario’Here, ‘Felsenstein’s worst case scenario’
Twitter me ha dado una excusa magnífica para explicar un fenómeno de moda en mi trabajo y no pienso dejarla escapar. En realidad, este fenómeno va más allá de mi trabajo: es un concepto estadístico y está últimamente en boca de todo el mundo en ciencias y ciencias sociales (sobre todo para mal). Son los p-valores. Aprovecho para contarlo en versión técnica y en versión ‘juicio del procés’.
Versión técnica:
Imaginad que queréis saber si el nuevo medicamento para bajar la tensión que habéis desarrollado funciona o no. ¿Qué hacemos? Pues hacemos dos grupos de personas: un grupo toma el medicamento y el otro no. Entonces, les medimos la tensión a las personas de los dos grupos y vemos si hay diferencia entre las medias de los grupos. Si el grupo al que le hemos dado el medicamento tiene la tensión más baja que el grupo control, quizá nuestro medicamento esté funcionando.
¿Solamente ‘quizá’? Solamente quizá, porque si la diferencia entre los dos grupos es mínima a lo mejor la diferencia no es por el medicamento sino por mil otras cosas que pueden estar influyendo de manera diferente a los dos grupos por azar. Entonces hacemos un pequeño cálculo: Si suponemos que la tensión varía de manera aleatoria entre los individuos de la población, ¿cuál es la probabilidad de obtener una diferencia entre dos grupos de personas al azar como la que hemos obtenido o más grande? Esa probabilidad es un p-valor. Cuanto más bajo sea, más sugiere que la diferencia entre nuestro grupo control y el grupo que ha tomado el medicamento no es debido al azar. ¿Cuál es el debate? Mira, os lo voy a explicar con el procés.
Versión procés:
Encuentro este artículo en Twitter, escrito por un señor con muchos seguidores. Habla sobre el juicio del procés, lo titula ‘Cuando una moneda siempre cae del mismo lado’ y en el texto incluye ese parrafito que veis. ¿Se parece a lo que acabo de explicar, verdad? Cuando un p-valor es muy bajo, cuando la probabilidad de que algo haya ocurrido al azar es muy baja, debe de haber un mecanismo de interés por detrás que lo está afectando.
Pues el p-valor está últimamente muy criticado y os ilustro por qué con este párrafo:
¿Qué es ‘sistemáticamente’? ¿Tirar la moneda 2 veces? ¿4? ¿50? Además, que la probabilidad sea baja no quiere decir que sea nula: se puede tirar una moneda al aire 6 veces y que las 6 veces te salga cruz. Es difícil, pero no imposible. Que una cosa sea improbable no es una garantía de nada: a todos nos pasan cosas improbables continuamente.
¿Te sorprendería si en vez de una moneda fuera un dado? ¿Te sorprendería tirar un dado 6 veces y que ninguna te saliera un tres? A mí no mucho. ¿Por qué comparamos esta situación con una moneda y no con un dado? ¿A lo mejor habría que pensar mejor las condiciones con las que describimos ‘el azar’? Porque si no, estamos manipulando.
¿’La probabilidad de que alguien esté dirigiendo la moneda‘? Las monedas no son perfectas: están deformadas, no son regulares en su peso… A la larga, una moneda va a caer sistemáticamente de un lado por su propias imperfecciones, no necesito a nadie dirigiendo la moneda. De hecho: ¿cómo se ‘dirige’ una moneda? La estadística te puede dar una probabilidad, pero no la interpreta: cuando este señor se encuentra una moneda que siempre cae del mismo lado él piensa que hay alguien trucando las tiradas y yo diría que es simplemente una moneda deformada.
Así que los p-valores son herramientas, si se utilizan bien, para ver cuándo algo sale de la normalidad. Si eso es relevante (o no) es otra cosa y hay que explicarlo bien. No podemos usar una probabilidad como una garantía de que las cosas pasen como nosotros decimos.
De hecho, la desafortunada metáfora de este periodista sólo mostraría que el transcurso del juicio seguramente no ha sido resultado del azar. Pues eso esperábamos todos; la verdad.