Esta diseñado para intercambiar conocimiento en las áreas de Estadística y Diseño y Desarrollo de Sistemas de páginas Web
UCV
UCV
martes, 22 de octubre de 2019
Paradojas Probabilística
Probablemente quizás: variación de helado
Escrito por Christoforos Anagnostopoulos y Spiros Doxiadis en . Publicado en Science
. El dicho dice que "las probabilidades son contra-intuitivas". Puede parecer que un problema simple tiene una respuesta directa a primera vista, pero solo luego aprendemos, mediante una explicación cuidadosa, que nuestra intuición ha sido subvertida. De hecho, rara vez se puede confiar en la intuición humana cuando se trata de hacer juicios probabilísticos, especialmente bajo la presión del tiempo. Incluso aquellos capacitados en estadística, como la mayoría de los lectores de Significance , pueden ser víctimas de sesgos cognitivos al tomar decisiones rápidas.
Pero las probabilidades no solo se manifiestan como paradojas. A veces podemos estar intuitivamente en lo cierto sobre un problema que se nos presenta, aunque sea por razones equivocadas o por razones que son difíciles de comprender. Y a veces nos enfrentamos a problemas probabilísticos por los cuales la intuición nos abandona por completo.
Por lo tanto, esta columna se propone ponerlo a usted, el lector, a prueba. Cada vez que presentamos una pregunta para desafiar su instinto probabilístico, junto con la respuesta y algunos comentarios y explicaciones.
Entonces, para comenzar:
El problema En el pueblo de Chedrok, hay dos vendedores de helados, Dimitrius y Zaza. Dimitrius es un gran trabajador. Él instala su mostrador todos los días temprano en la tarde y no se detiene hasta la mañana siguiente. Atiende a unos 220 clientes por día. Zaza es más relajado. Trabaja solo unas pocas horas por la tarde y rara vez por la noche. Atiende a unos 45 clientes por día.
El abastecimiento de helados es difícil en esta área, por lo que solo venden una cucharada a cada cliente y ambos se conformaron con solo dos sabores, el jengibre y la frambuesa, que son los favoritos de los locales. En general, alrededor del 50% de los clientes eligen la frambuesa. Sin embargo, el porcentaje exacto varía de un día a otro. A veces es superior al 50%, a veces inferior.
Dimitrius y Zaza han tenido una pequeña apuesta entre ellos. Durante un período de tres meses, cada uno registró los días en que más del 60% de sus clientes eligieron el jengibre. Llamaremos a ese día un "día de jengibre".
¿Quién crees que grabó más días de jengibre?
(a) Dimitrius
(b) Zaza
(c) Aproximadamente lo mismo (dentro del 5% del total de cada vendedor)
Lea la descripción nuevamente y tómese un minuto para decidir una respuesta.
Es habitual que los encuestados salten a (c): cualquier discrepancia entre el número de días de jengibre para Zaza y Dimitrius debería ser pequeña; después de todo, ambos vendedores atienden a la misma audiencia con la misma distribución de gustos. Por lo tanto, cualquier diferencia debe limitarse a pequeñas fluctuaciones aleatorias. Fácil.
Excepto que no es tan fácil. Para ayudar a guiar su intuición, hagamos la pregunta un poco más extrema. Imagine que Dimitrius era en realidad un conglomerado de helados, que atiende a un sorprendente millón de clientes por día. Sería bastante contradictorio para Dimitrius ver que más del 60% de sus clientes eligen jengibre en un día determinado, dada una distribución de sabor igual. Dicho de otro modo, si observara tal eventualidad, probablemente concluiría que la distribución del sabor había cambiado, dada la improbabilidad de la alternativa. Contraste con Zaza, cuyo negocio, en este escenario imaginario, está en tal desorden que solo atiende a cuatro clientes por día. Parece claro que la variación aleatoria tendría un fuerte efecto aquí, y los días de jengibre (y los días de frambuesa también) aparecerían con suficiente frecuencia.
Entonces, menos clientes significa más variabilidad. Más variabilidad significa una mayor probabilidad de que cualquier día dado sea un día de jengibre. Una mayor posibilidad de días de jengibre significa más días de jengibre en cualquier período de tiempo. Entonces, deberías apostar en (b) Zaza.
De hecho, el fenómeno subyacente es ampliamente conocido: a medida que aumenta el tamaño de la muestra, la frecuencia observada de un evento se aproxima a su media real. Las desviaciones de la media son, por lo tanto, mucho más probables para tamaños de muestra pequeños. Pero, incluso si está entre los que eligieron correctamente, aún podría sorprenderse por la velocidad de esta convergencia. En la pregunta original anterior, se espera que aproximadamente 1 de cada 9 días sea un día de jengibre para Zaza, enfrentado a un raro 1 de cada 550 días para Dimitrius. No solo es (b) más probable, es extraordinariamente más probable.
Ahora, imaginemos que le ofrecemos una apuesta: le pagaremos £ 100 si Zaza tiene más días de jengibre en tres meses que Dimitrius, pero debe pagarnos £ 100,000 si no. ¿Tomarías esa apuesta? Es probable que pierda mucho por muy poca ganancia, pero la probabilidad de que gane es 0.9999417. Incluso con la tolerancia del 5% dada en la pregunta, es casi seguro que Zaza tendrá más días de jengibre que Dimitrius. La razón de estas asombrosas probabilidades es que, una vez más, la ley de los grandes números entra en vigencia y la mayor probabilidad de un día de jengibre para los compuestos de Zaza durante más de 90 días, lo que obliga al número promedio de días de jengibre a acercarse a sus valores teóricos esperados: aproximadamente 10 para Zaza, y efectivamente 0 para Dimitrius. Deberías haber tomado esa apuesta.
Hay un nombre en la literatura para este sesgo cognitivo particular: "insensibilidad al tamaño de la muestra" . Lo que es bastante sorprendente, pero también tranquilizador, es que la mayoría de las personas dudarán fácilmente de la precisión de una estadística basada en un tamaño de muestra muy pequeño y, en el extremo, podrían descartarla por completo como anecdótica si se basa solo en uno o dos ejemplos. . Sin embargo, la mayoría de la gente todavía se equivoca con la apuesta de Zaza-Dimitrius: esperan que dos promedios provenientes de muestras de diferentes tamaños de la misma población varíen mucho menos de lo que lo hacen en realidad.
Pero la incertidumbre es variación. Dos lados de la misma moneda.
No hay comentarios.:
Publicar un comentario