Matemáticas no tan básicas. La varianza

(me ha quedado una entrada un poco densa e ininteligible. lo siento. ininteligible es inteligible? lo dudo)


La puta varianza!
La varianza es el nombre técnico que dan los jugadores de poker a una racha de mala suerte. La varianza justifica que aunque un jugador esté jugando bien esté, a su vez, perdiendo: todas sus acciones tienen EV positivo pero su banca registra pérdidas. Los jugadores dicen (decimos) que no importa perder porque "ha sido culpa de la varianza". El buen jugador de poker parece que sólo tiene un enemigo: la varianza.
Para defenderse de la varianza lo más común es mejorar la gestión de los recursos propios (banca) para que "un zarpazo de la varianza" no termine en "bancarrota". Es decir que una racha negativa no acabe con toda nuestra banca y podamos seguir jugando hasta que llegue una racha positiva.

Mi opinión:
la varianza existe (sin duda) pero no es la única culpable de nuestras perdidas. Además de la varianza, existen otros "culpables" como, por ejemplo, nuestros rivales que son cada vez más y mejores. Y más peligroso que la varianza estadística (aleatoria) es la inestabilidad del nivel de juego propio. Contra la varianza: jugar cada vez mejor y, a ser posible, mejor que los rivales.

Bueno, después del inciso, vamos a explicar qué es la varianza y cómo se calcula. Luego presentaremos unas simulaciones donde intentamos demostrar que la varianza, paradójicamente, siempre tienda a cumplirse.

Definición de varianza
La varianza es el cuadrado de la desviación típica, es decir hay una relación directa entre ambas. Yo siempre usé "desviación típica" pero es más sonoro "varianza" y es el término que se usa normalmente en los foros, artículos y libros de poker.
La varianza mide la dispersión de una muestra en función de la diferencia (la distancia) de cada uno de los elementos de la muestra con el valor medio de la misma.
En un caso extremo, si la varianza es nula (0) todos los elementos de la muestra tienen el mismo valor que coincide con el valor medio de la misma. Si tengo 10 sacos que pesan 25 kg cada uno {25, 25, 25, 25, 25, 25, 25, 25, 25, 25}: el peso medio es 25 y la varianza de la muestra es 0.

Otros ejemplos
Ejemplo 1: en una clase hay 10 niños cuyas edades son: 8, 7, 8, 8, 8, 8, 8, 8, 8 y 9 (años). La media de edad es 8 y la varianza es muy pequeña: 0,22.
Ejemplo 2, una muestra más dispersa; 10 personas en un autobús tienen las siguientes edades: 2, 16, 20, 22, 34, 40, 55, 55, 60, 80. La edad media es 38 y la varianza es 578 (desv. típica 24).
Ejemplo 3, una muestra menos dispersa: 10 personas en un autobús escolar tienen las siguientes edades: 30 (el conductor), 26 (una maestra), 12, 12, 14, 14, 14, 16, 16, 16. En este caso la edad media es 17 y la varianza es 36 (desv. típica 6).

En el primer ejemplo, la media (8) representa con eficacia el valor de la muestra, mientras que en el segundo ejemplo, la media (38) no nos dice mucho sobre la edad de un elemento cualquiera de la muestra. El tercer ejemplo es un caso intermedio.

La regla del 68/95/99.7
En una muestra con una varianza pequeña es más fácil predecir el valor de un elemento desconocido que en una muestra con una varianza mayor. La regla empírica del 68/95/99,7 afirma que, si las distribución de la muestra es normal (un suponer), el 68% de los elementos se encuentran a una distancia de la media menor que el valor de la desviación típica. En el ejemplo 2 podríamos afirmar, con un 68% de fiabilidad, que la edad de uno de los viajeros estaría comprendido entre 14 y 52 (38 +/- 24). En el primer ejemplo este intervalo "de confianza" se reduce a 7,78 - 8,22. Y en el tercer ejemplo el intervalo sería 11-23.
La regla también dice que el 95% de los elementos estaría a una distancia de la media menor de 2 veces la desviación típica (y de 3 veces para el 99,7%).

Cálculo de la varianza
En una muestra continua, una función f(x), la varianza es la integral de la función distancia a la media, teniendo en cuenta el peso de la probabilidad de la función para cada valor de x.
Es más fácil poner la fórmula que explicarlo:


En una muestra discreta (que va a ser siempre nuestro caso cuando evalúemos situaciones que se dan en el poker, donde todos los fenómenos son discretos) la varianza se calcula así:


Como se aprecia a simple vista, el cálculo es el mismo en ambos casos.

Entonces es falso que la varianza no se pueda conocer. Se puede conocer y calcular: sólo hay que aplicar la fórmula ;)


Simulador de varianza para S&G
Ahora vamos a hacer un experimento con el que demostramos que la varianza se puede calcular a priori y, por tanto, se puede actuar sobre sus factores para intentar minimizar su valor.
Repito: vamos a demostrar que un valor que representa la aleatoriedad de un fenónemo es, paradójicamente, predecible.


Imaginemos S&G de 10 jugadores, 3$ de entrada y premios para los tres primeros (15$, 9$ y 6$ respectivamente). Imaginemos, a su vez, que la probabilidad de acabar en cada uno de los puestos es igual (10 puestos, 0,1 en cada puesto).

Con estos datos ya podemos calcular la varianza de estos torneos.
¿cuál es la media? 5,5. Este es el puesto medio en el que deberíamos terminar cada torneo si no hubiese varianza. Es el famoso "medio pollo" de los estadísticos.
¿cuál es la probabilidad de cada uno de los 10 puestos posibles en los que podemos acabar? 1/10= 0,1 (10%).
Aplicamos la fórmula de la varianza: (10-5,5)*(10-5,5)*0,1 + (9-5,5)*(9-5,5)*0,1 ..... = 8,25
Es decir, la varianza de estos torneos es 8,25 (y su desviación típica 2,87).
Ya sabéis, en el 68% de los torneos vamos a acabar entre el puesto 2,7 y el puesto 8,3.

Pues bien, ahora simulamos que tenemos un saldo inicial de 100$ y vamos a jugar 10.000 torneos, calculando el resultado de cada torneo con una función aleatoria (el RNG del excel).
Efectivamente, la varianza de jugar 10.000 torneos es, aproximademente 8,25. Es decir, la varianza de un suceso se puede calcular a priori y coincide con la varianza del resultado del suceso después de suficientes repeticiones (cqd). Este es el primer paso para poder dominar a la varianza.


En las gráficas que incluyo se ven diferentes resultados de ejecutar el experimento. La línea indica la evolución de nuestra banca, debajo de la gráfica se indican los estadísticos (media y varianza) de dos variables:
- el saldo de nuestra banca a la izquierda
- la ganancia de cada partida a la derecha
Como se puede comprobar, la varianza del resultado de cada partida coincide aproximadamente con el valor teórico que hemos calculado (8,25). Sin embargo, el resultado final en forma de saldo es diferente en cada caso.

Otro día hablaremos del riesgo de ruina (Risk of ruin) pero ya podemos adelantar que, como el EV del experimento es 0, el riesgo de ruina es 1 (100%): en este escenario es seguro (100%) que acabaríamos arruinados después de infinitos torneos. De hecho en los ejemplos que hemos incluido alcanzamos la ruina en todos los casos (saldo=0) excepto en uno de ellos.
Esto no quiere decir que este ejemplo sea ganador, sino que no llega a la bancarrota en las 10.000 primeras partidas pero se puede afirmar que llegará.










En resumen, la varianza no es incontrolable: se puede calcular y, por tanto, se puede intentar minimizar su efecto. El peor efecto de la varianza es su relación con la "bancarrota". En próximos artículos analizaremos matemáticamente cómo calcular la probabilidad de acabar en "bancarrota" y, por supuesto, cómo minimizar esta probabilidad.



Fuente de las fórmulas: wikipedia

4 comentarios:

  1. This is really a fascinating Matemáticas no tan básicas. La varianza website and all your articles like Matemáticas no tan básicas. La varianza , lots of useful stuff.
    --------------------------
    Free Cash Bonus

    ResponderEliminar
  2. By the way, I love Matemáticas no tan básicas. La varianza topic too! Very interesting read.
    See you soon!
    --------------------------
    True Poker Player

    ResponderEliminar
  3. por fin entiendo la varianza!!

    ResponderEliminar
  4. cuando pones 5,5 de media como has sacado ese cálculo¿?

    ResponderEliminar

Tus comentarios son bienvenidos