You are on page 1of 10

"Modelos de probabilidad para las apuestas de hockey"

Ravi Patel IB SL Matemáticas


El hockey se ha consolidado indefinidamente como uno de los deportes de mayor
crecimiento en Norteamérica. Desde que de niño veía Hockey Night in Canada, he desarrollado una
gran pasión por el deporte nacional de invierno de Canadá. A lo largo de mi vida viendo estos
partidos, me apasioné por la gran rivalidad entre las dos franquicias gigantes de la NHL. Por
supuesto, esto hace referencia a la aclamada rivalidad entre los Toronto Maple Leaf's y los Montreal
Canadiens.

A lo largo de mi jornada viendo estos partidos de hockey, siempre veía anuncios de empresas
de apuestas que animaban a sus espectadores a apostar por el resultado y el ganador de estas
rivalidades deportivas de alto nivel a cambio de dinero. Todo el concepto de las apuestas deportivas
me parecía extremadamente enrevesado, sobre todo cuando me topé con un vídeo de la CBC en el
que se mostraba que el gran esquema de ganadores de la web de apuestas deportivas eran unos
empollones que habían creado modelos matemáticos para predecir los ganadores/clasificaciones de
futuros partidos y/o temporadas. La complejidad de estos modelos matemáticos no se presentó hasta
que por fin aprendí los conceptos de estadística y distribución de probabilidades en mi clase de
matemáticas de SL. Me di cuenta de que determinadas distribuciones de probabilidad pueden
analizarse y extrapolarse utilizando teoremas de probabilidad para crear modelos matemáticos de
probabilidad para situaciones futuras.

Al principio, tenía mis dudas sobre la correlación de las distribuciones normales de


probabilidad en las apuestas de hockey, sin embargo, al investigar diferentes conceptos en el libro de
texto de matemáticas HL, me había levantado a un tema. Mi razonamiento de esta Evaluación Interna
es crear modelos de probabilidad a partir de las estadísticas de Goles Marcados tanto de Toronto
como de Montreal de la temporada 2017-18 de la Liga Nacional de Hockey, y luego encontrar una
ecuación de un modelo de probabilidad que mejor se ajuste a los datos para predecir el marcador de
un futuro partido de liga. Para mantener limitados los parámetros de la ecuación y evitar cualquier
sesgo del equipo local dentro de mi modelo matemático, voy a suponer que el partido se jugará en
Los Ángeles como un "Winter Classic Game" anual. Para crear datos extremadamente precisos, no
redondearé ninguna de las cifras que muestra mi calculadora gráfica para asegurarme de que los
valores de mis parámetros son lo más exactos posible. Además, también accederé y reflexionaré
sobre distintas variables que afectarán a mis cálculos. Estas precauciones matemáticas garantizarán
que mis probabilidades esperadas finales sean lo más exactas posible.
El primer paso que hay que dar en el proceso de modelización matemática es hallar el valor esperado
de los goles que cada equipo puede marcar en el partido. Para ello, se crea un histograma de los
Goles Anotados (GF) por cada equipo individual a lo largo de la temporada de 82 partidos de 2017-
18. También he optado por añadir una línea de tendencia para mostrar la tendencia de los promedios
goleadores de los Maple Leaf a lo largo de la temporada. Los datos recogidos se mostrarán en un
histograma en la figura siguiente.

(Figura 1.0)

GF of the Toronto Maple Leafs


25
20
20 18
FREQUENCY

15 13
11
10 7 6
5 2 3 2
0
0 1 2 3 4 5 6 7 8
# of goals forwarded

Ahora que hemos creado una tabla de frecuencias para los goles encajados por Toronto, estos datos
deben convertirse en un gráfico que muestre la probabilidad, de modo que puedan interpretarse para
hallar los valores esperados de las tendencias goleadoras del equipo. Al principio me resultaba difícil
encontrar un patrón de curva distinto (por ejemplo, exponencial, normal) que se ajustara a mis datos,
ya que son discretos. Tras investigar un poco más, veo que este modelo se ajusta mejor a una curva
de distribución de Poisson. La distribución de Poisson es una distribución discreta de frecuencias que
da la probabilidad de que se produzca un número de sucesos independientes en un tiempo fijo. Para
determinar si el número de llegadas por minuto sigue una distribución de Poisson, se escriben a
continuación las hipótesis nula y alternativa:
H 0: El número de llegadas por minuto sigue una distribución de Poisson

H 1: El número de llegadas por minuto no sigue una distribución de Poisson

Para analizar si mis datos siguen un Proceso de Poisson, primero debo determinar el parámetro de
mis datos, que es la media, modelada como Lambda ( ƛ ).
c

∑ mj f j
X = j=1
n
277
X= =3.37805= ƛ
82
Este valor de X no se redondeará a tres cifras significativas, ya que estoy utilizando este valor medio
como estimación de ƛ . Por lo tanto, utilizando Lambda como estimación de la media, se pueden
hallar las frecuencias de los aciertos X para ( X =1 ,2 , 3 , 4 , 5 , 6 , 7 , 8). Además, la frecuencia teórica
de cada valor de X se obtiene multiplicando el tamaño de la muestra (N) por la probabilidad de
Poisson de cada valor de X.

Ahora que he encontrado la estimación de la media para los datos totales, debo calcular la
Probabilidad de Poisson para 10 intervalos de X. Estos intervalos incluyen (
X =1 ,2 , 3 , 4 , 5 , 6 , 7.8.9∨more ). Debo calcular la probabilidad de 9 o más, ya que es importante
tener en cuenta que la Probabilidad de Poisson muestra un concepto teórico de los goles marcados
por los Toronto Maple Leaf's. Así pues, dado que teóricamente es posible marcar más de 9 goles en
un partido, o estimación de la media (3,37805) proporcionará el valor esperado de ( X =[ 9 , ∞ ])
Para encontrar la Probabilidad de Poisson teórica de X, descubrí la Fórmula de Distribución de
Poisson que se muestra a continuación:
x −ƛ
ƛ e
P ( X=x ) =
x!
Dónde:
ƛ = Se utiliza como parámetro en la ecuación (como se ha mencionado anteriormente)
e =Número de Euler, constante matemática de valor 2,71828
Calcular las probabilidades esperadas de cada uno de los goles reenviados parece bastante fácil al
principio, sin embargo me acerqué a una etapa enrevesada cuando tuve que hallar la probabilidad
esperada de (X=0). Fue entonces cuando recordé el proceso que me había enseñado mi tutor para
demostrar que el factorial de 0 es igual a 1.

n !=n ( n−1 )( n−2 ) ( n−3 ) … .


n !=n(n−1)!
1 !=1(1−1)!
1=1(0! )
1=0!
Utilizando la expresión de n !=n ! , sustituí entonces un valor de n por 1, ya que sabía que su factorial
sería simplemente 1 (1x1). Además, el valor (n-1) también me daría cero y, por lo tanto, ¡encontré
uno que 1= 0! Ahora puedo continuar con mis cálculos de la Probabilidad de Poisson sustituyendo X
por 0 y ƛ por 3,37805.
0 −3.37805
( ) 3.37805 e
P X=0 =
0!
P ( X=0 )=1 e−3.37805 ¿ ¿
0!
1(0.03411)
P ( X=0 )=
1
P ( X=0 )=0.03411
Ahora que he calculado mi Probabilidad de Poisson Esperada de (X=0), debo seguir haciendo lo
mismo para todos los demás intervalos de X, que incluyen (X= 0,1,2,3,4,5,6,7,8,9 o más). A
continuación se enumeran las Probabilidades Esperadas:
Cuadro 1.1
# Nº de goles P(X) de la distribución
marcados (X) de Poisson con
ƛ=3.37805
0 0.03411 También encontré un poco de dificultad al intentar
1 0.11524 encontrar la Probabilidad de 9 o más, sin embargo
2 0.19464 simplemente apliqué mis conocimientos de
3 0.21917 estadística y probabilidad para obtener su
4 0.18509 Probabilidad Esperada.
5 0.12505
P ( X ≥ 9 )=1− [ P ( X =0 ) + P ( X =1 ) + P ( X=2 ) + P ( X =3 ) + P ( X=4 )+
6 0.07040
7 0.03398 P ( X ≥ 9 )=0.00744
8 0.01435
9 o más 0.00744

Ahora que tengo cada uno de los P(X) de los goles enviados por los Toronto Maple Leaf's,
puedo tomar esos datos y crear una curva visual, que debería modelar el gráfico original GF vs
Frecuencia de la Figura 1.1

Figura 1.2
GF Probablity with Lambda = 3.37805
0.25
0.21917
0.2 0.19464
0.18509
Probability of (X)

0.15
0.12505
0.11524
0.1
0.0704

0.05 0.03411 0.03398


0.01435 0.00744
0
0 1 2 3 4 5 6 7 8 9
# of goals forwarded (X)

Evidentemente puedo ver que esta distribución es una Distribución de Poisson ya que la Figura 1.2
utilizando Lambda como parámetro de probabilidad teórica coincide con el modelo original de la
Figura 1.1. Puedo confirmarlo ya que las líneas de tendencia tienen los mismos intervalos de
aumento y disminución entre los diferentes puntos. Sin embargo, el gráfico no retrata perfectamente
los datos de los Objetivos Reenviados.
En lugar de utilizar modelos matemáticos cualitativos, necesitaba encontrar una forma de obtener un
proceso matemático que pudiera tomar mis datos y determinar si mis datos eran Poisson de la forma
más precisa posible. Para obtener una representación más precisa de lo cerca que están mis datos de
un modelo de Poisson, decidí realizar una prueba Chi-cuadrado. La prueba de bondad de ajuste Chi-
cuadrado es una prueba no paramétrica que se utiliza para averiguar en qué medida el valor
observado de un fenómeno dado es significativamente diferente del valor esperado. La ecuación se
muestra como:
❑ 2
(f 0−f e )
=∑
2
ƛ k− p−1
k fe

Dónde:
f 0 = Es la frecuencia observada

f e = Es la frecuencia teórica o esperada

k = Número de categorías o clases que quedan después de combinar las clases


p = Número de parámetros estimados a partir de los datos
Si observamos la ecuación siguiente, es evidente que me faltan algunas variables en la ecuación.
Necesito hallar la probabilidad teórica ( f e). Esta frecuencia se puede encontrar en: f e =( n ) ( P ( X ) ) . La
siguiente tabla muestra los cálculos que hice para obtener el valor final de aproximación de Lambda
al cuadrado. Para ello, establecí una tabla de ecuaciones en la que completé un proceso paso a paso
para intentar obtener la suma de la fórmula final, que se enumeran en la tabla siguiente:
Cuadro 1.2
fe ¿) ¿ 2
( f 0−f e )
fe
2.79702 0.79702 0.635241 0.227113
9.44968 1.55032 2.40349 0.254346
15.9605 -2.9605 8.76456 0.549141
17.9719 2.0281 4.11319 0.228868
15.1774 2.8226 7.96707 0.52493
10.2541 -3.2541 10.5892 1.03268
5.7728 0.2272 0.05162 0.008942
2.78636 0.21364 0.045642 0.016381
1.1767 0.8233 0.677823 0.576037
0.61008 0.61008 0.372198 0.61008
Total: 4.02652

Después de completar la tabla, desconfío un poco de cómo el dígito de la frecuencia teórica de


10,2541 llegó a ser un valor tan alto en comparación con el resto. No obstante, la suma de esta
ecuación de la distribución de Poisson señala que ƛ 2=4.02652 .

Ahora que el proceso paso a paso se ha completado, debo continuar para encontrar el subíndice bajo
ƛ. Para determinar el subíndice bajo ƛ, debo determinar un concepto asociado a la Distribución de
Poisson conocido como Grados de Libertad. La ecuación se escribe a continuación como:
2
ƛ =k −p−1
Recordemos que las definiciones de las variables k y p ya se han indicado anteriormente. Por lo
tanto, el valor de k, que es el número de clases que quedan una vez combinadas las clases, es 9, ya
que es la clase teórica que no aparece en las frecuencias observadas reales. Además, el valor de p es
1, ya que el único parámetro considerado es Lambda, que está en correlación con la prueba Chi-
cuadrado. Por lo tanto, puedo encontrar los grados de libertad de la siguiente manera:
k − p−1=9−1−1=7
Ahora que hemos encontrado nuestros grados de libertad, debemos utilizar el método alternativo de
comprobación de hipótesis para determinar por fin si la distribución es una Distribución de Poisson.
Para seguir con este método de prueba, debo utilizar la misma hipótesis de rechazo que se mencionó
en la página 1. Al principio, estaba muy confuso a la hora de encontrar la relación entre la prueba de
hipótesis nula y la adecuación de mis datos a una distribución de Poisson. Entonces decidí ver
algunos vídeos de YouTube y aprender a llevar a cabo el método de prueba, que implica un concepto
que me enseñaron en clase, conocido como puntos críticos. Primero me puse a establecer el teorema
del rechazo:
H 0 : ƛ=3.37805
H 1 : ƛ ≠3.37805

Habrá que seguir trabajando en ello. Procedí con el siguiente paso de mi IA ya que podía inferir que
mi Distribución era Poisson a partir de observaciones cualitativas, sin embargo todavía necesito
trabajar en este cálculo

Ahora que mi prueba de Chi-cuadrado ha demostrado que la distribución del recuento de Goles
Enviados de los Toronto Maple Leaf's es una Distribución de Poisson, sin embargo mi trabajo aún no
está completo. Como mi objetivo final es crear una matriz de probabilidades para mostrar la fuerza
de ataque de cada equipo, también debo determinar la Distribución de Poisson de los Montreal
Canadiens.
Dado que mi prueba anterior de Chi-cuadrado demostró que la distribución de los goles marcados por
los Maple Leaf era en efecto una distribución de Poisson, ahora puedo llegar a la conclusión de que
los goles marcados en el deporte del hockey son un proceso de Poisson. Con estos conocimientos,
ahora puedo crear un modelo P(X) de anotación de goles en relación con el valor lambda encontrado
de los Montreal Canadiens.
Figura 2
GF by the Montreal Canadiens
20
15 17 18
Frequency

14
10 12
10
5 6
0 2 1 1 1
0 1 2 3 4 5 6 7 8 9 10
# of goals forwaded

Esta figura es muy parecida a la Figura 1, en la que los datos de Objetivos Reenviados se distribuían
en una curva similar. Para continuar y encontrar mi gráfico P(X), debo determinar el valor de ƛ y
luego calcular una vez más.
c

∑ mj f j
X = j=1
n
209
X= =2.54878=ƛ
82
# Nº de goles P(X) de la distribución
marcados (X) de Poisson con
ƛ=2.54878
0 0.07818
1 0.19926
2 0.25393 P ( X ≥11 )=1− [ P ( X =0 ) + P ( X =1 )+ P ( X=2 ) + P ( X =3 ) + P ( X=
3 0.21574
4 0.13747 P ( X ≥11 )=0.00006
5 0.07007
6 0.02977
7 0.01084
8 0.00345
9 0.00098
10 0.00025
11 o más 0.00006
Figura 2.1
Probability of GF with Lambda = 2.54878
0.3
0.25393
0.25
0.21574
0.19926
0.2
Probability of (X)

0.15 0.13747

0.1 0.07818
0.07007
0.05 0.02977
0.01084 0.00345 0.00098 0.00025 0.00006
0
0 1 2 3 4 5 6 7 8 9 10 11 or
more
# of goals scored (X)

La figura 2.1 se parece al gráfico calculado a partir de los datos de la figura 2. Me di cuenta de que
las probabilidades teóricas de P(7 ≤ X ≤ 11∨more ) no coincidían realmente con los resultados del
gráfico original. Reflexionando sobre los posibles factores limitantes, la razón es que la frecuencia
observada de marcar goles en rangos altos es extremadamente rara, por eso hay pequeñas
fluctuaciones entre o y 1 para P(7 ≤ X ≤ 11∨more ) y, sin embargo, una disminución gradual en el
gráfico de probabilidad teórica.
Ahora que se han encontrado todas las probabilidades de Poisson para los goles a favor de los
Toronto Maple Leaf's y los Montreal Canadians, debo calcular las probabilidades de nuevo en la
fórmula de distribución de Poisson y luego crear una matriz de probabilidades con los posibles
resultados de puntuación.

You might also like