Professional Documents
Culture Documents
Matemáticas IA
Matemáticas IA
A lo largo de mi jornada viendo estos partidos de hockey, siempre veía anuncios de empresas
de apuestas que animaban a sus espectadores a apostar por el resultado y el ganador de estas
rivalidades deportivas de alto nivel a cambio de dinero. Todo el concepto de las apuestas deportivas
me parecía extremadamente enrevesado, sobre todo cuando me topé con un vídeo de la CBC en el
que se mostraba que el gran esquema de ganadores de la web de apuestas deportivas eran unos
empollones que habían creado modelos matemáticos para predecir los ganadores/clasificaciones de
futuros partidos y/o temporadas. La complejidad de estos modelos matemáticos no se presentó hasta
que por fin aprendí los conceptos de estadística y distribución de probabilidades en mi clase de
matemáticas de SL. Me di cuenta de que determinadas distribuciones de probabilidad pueden
analizarse y extrapolarse utilizando teoremas de probabilidad para crear modelos matemáticos de
probabilidad para situaciones futuras.
(Figura 1.0)
15 13
11
10 7 6
5 2 3 2
0
0 1 2 3 4 5 6 7 8
# of goals forwarded
Ahora que hemos creado una tabla de frecuencias para los goles encajados por Toronto, estos datos
deben convertirse en un gráfico que muestre la probabilidad, de modo que puedan interpretarse para
hallar los valores esperados de las tendencias goleadoras del equipo. Al principio me resultaba difícil
encontrar un patrón de curva distinto (por ejemplo, exponencial, normal) que se ajustara a mis datos,
ya que son discretos. Tras investigar un poco más, veo que este modelo se ajusta mejor a una curva
de distribución de Poisson. La distribución de Poisson es una distribución discreta de frecuencias que
da la probabilidad de que se produzca un número de sucesos independientes en un tiempo fijo. Para
determinar si el número de llegadas por minuto sigue una distribución de Poisson, se escriben a
continuación las hipótesis nula y alternativa:
H 0: El número de llegadas por minuto sigue una distribución de Poisson
Para analizar si mis datos siguen un Proceso de Poisson, primero debo determinar el parámetro de
mis datos, que es la media, modelada como Lambda ( ƛ ).
c
∑ mj f j
X = j=1
n
277
X= =3.37805= ƛ
82
Este valor de X no se redondeará a tres cifras significativas, ya que estoy utilizando este valor medio
como estimación de ƛ . Por lo tanto, utilizando Lambda como estimación de la media, se pueden
hallar las frecuencias de los aciertos X para ( X =1 ,2 , 3 , 4 , 5 , 6 , 7 , 8). Además, la frecuencia teórica
de cada valor de X se obtiene multiplicando el tamaño de la muestra (N) por la probabilidad de
Poisson de cada valor de X.
Ahora que he encontrado la estimación de la media para los datos totales, debo calcular la
Probabilidad de Poisson para 10 intervalos de X. Estos intervalos incluyen (
X =1 ,2 , 3 , 4 , 5 , 6 , 7.8.9∨more ). Debo calcular la probabilidad de 9 o más, ya que es importante
tener en cuenta que la Probabilidad de Poisson muestra un concepto teórico de los goles marcados
por los Toronto Maple Leaf's. Así pues, dado que teóricamente es posible marcar más de 9 goles en
un partido, o estimación de la media (3,37805) proporcionará el valor esperado de ( X =[ 9 , ∞ ])
Para encontrar la Probabilidad de Poisson teórica de X, descubrí la Fórmula de Distribución de
Poisson que se muestra a continuación:
x −ƛ
ƛ e
P ( X=x ) =
x!
Dónde:
ƛ = Se utiliza como parámetro en la ecuación (como se ha mencionado anteriormente)
e =Número de Euler, constante matemática de valor 2,71828
Calcular las probabilidades esperadas de cada uno de los goles reenviados parece bastante fácil al
principio, sin embargo me acerqué a una etapa enrevesada cuando tuve que hallar la probabilidad
esperada de (X=0). Fue entonces cuando recordé el proceso que me había enseñado mi tutor para
demostrar que el factorial de 0 es igual a 1.
Ahora que tengo cada uno de los P(X) de los goles enviados por los Toronto Maple Leaf's,
puedo tomar esos datos y crear una curva visual, que debería modelar el gráfico original GF vs
Frecuencia de la Figura 1.1
Figura 1.2
GF Probablity with Lambda = 3.37805
0.25
0.21917
0.2 0.19464
0.18509
Probability of (X)
0.15
0.12505
0.11524
0.1
0.0704
Evidentemente puedo ver que esta distribución es una Distribución de Poisson ya que la Figura 1.2
utilizando Lambda como parámetro de probabilidad teórica coincide con el modelo original de la
Figura 1.1. Puedo confirmarlo ya que las líneas de tendencia tienen los mismos intervalos de
aumento y disminución entre los diferentes puntos. Sin embargo, el gráfico no retrata perfectamente
los datos de los Objetivos Reenviados.
En lugar de utilizar modelos matemáticos cualitativos, necesitaba encontrar una forma de obtener un
proceso matemático que pudiera tomar mis datos y determinar si mis datos eran Poisson de la forma
más precisa posible. Para obtener una representación más precisa de lo cerca que están mis datos de
un modelo de Poisson, decidí realizar una prueba Chi-cuadrado. La prueba de bondad de ajuste Chi-
cuadrado es una prueba no paramétrica que se utiliza para averiguar en qué medida el valor
observado de un fenómeno dado es significativamente diferente del valor esperado. La ecuación se
muestra como:
❑ 2
(f 0−f e )
=∑
2
ƛ k− p−1
k fe
Dónde:
f 0 = Es la frecuencia observada
Ahora que el proceso paso a paso se ha completado, debo continuar para encontrar el subíndice bajo
ƛ. Para determinar el subíndice bajo ƛ, debo determinar un concepto asociado a la Distribución de
Poisson conocido como Grados de Libertad. La ecuación se escribe a continuación como:
2
ƛ =k −p−1
Recordemos que las definiciones de las variables k y p ya se han indicado anteriormente. Por lo
tanto, el valor de k, que es el número de clases que quedan una vez combinadas las clases, es 9, ya
que es la clase teórica que no aparece en las frecuencias observadas reales. Además, el valor de p es
1, ya que el único parámetro considerado es Lambda, que está en correlación con la prueba Chi-
cuadrado. Por lo tanto, puedo encontrar los grados de libertad de la siguiente manera:
k − p−1=9−1−1=7
Ahora que hemos encontrado nuestros grados de libertad, debemos utilizar el método alternativo de
comprobación de hipótesis para determinar por fin si la distribución es una Distribución de Poisson.
Para seguir con este método de prueba, debo utilizar la misma hipótesis de rechazo que se mencionó
en la página 1. Al principio, estaba muy confuso a la hora de encontrar la relación entre la prueba de
hipótesis nula y la adecuación de mis datos a una distribución de Poisson. Entonces decidí ver
algunos vídeos de YouTube y aprender a llevar a cabo el método de prueba, que implica un concepto
que me enseñaron en clase, conocido como puntos críticos. Primero me puse a establecer el teorema
del rechazo:
H 0 : ƛ=3.37805
H 1 : ƛ ≠3.37805
Habrá que seguir trabajando en ello. Procedí con el siguiente paso de mi IA ya que podía inferir que
mi Distribución era Poisson a partir de observaciones cualitativas, sin embargo todavía necesito
trabajar en este cálculo
Ahora que mi prueba de Chi-cuadrado ha demostrado que la distribución del recuento de Goles
Enviados de los Toronto Maple Leaf's es una Distribución de Poisson, sin embargo mi trabajo aún no
está completo. Como mi objetivo final es crear una matriz de probabilidades para mostrar la fuerza
de ataque de cada equipo, también debo determinar la Distribución de Poisson de los Montreal
Canadiens.
Dado que mi prueba anterior de Chi-cuadrado demostró que la distribución de los goles marcados por
los Maple Leaf era en efecto una distribución de Poisson, ahora puedo llegar a la conclusión de que
los goles marcados en el deporte del hockey son un proceso de Poisson. Con estos conocimientos,
ahora puedo crear un modelo P(X) de anotación de goles en relación con el valor lambda encontrado
de los Montreal Canadiens.
Figura 2
GF by the Montreal Canadiens
20
15 17 18
Frequency
14
10 12
10
5 6
0 2 1 1 1
0 1 2 3 4 5 6 7 8 9 10
# of goals forwaded
Esta figura es muy parecida a la Figura 1, en la que los datos de Objetivos Reenviados se distribuían
en una curva similar. Para continuar y encontrar mi gráfico P(X), debo determinar el valor de ƛ y
luego calcular una vez más.
c
∑ mj f j
X = j=1
n
209
X= =2.54878=ƛ
82
# Nº de goles P(X) de la distribución
marcados (X) de Poisson con
ƛ=2.54878
0 0.07818
1 0.19926
2 0.25393 P ( X ≥11 )=1− [ P ( X =0 ) + P ( X =1 )+ P ( X=2 ) + P ( X =3 ) + P ( X=
3 0.21574
4 0.13747 P ( X ≥11 )=0.00006
5 0.07007
6 0.02977
7 0.01084
8 0.00345
9 0.00098
10 0.00025
11 o más 0.00006
Figura 2.1
Probability of GF with Lambda = 2.54878
0.3
0.25393
0.25
0.21574
0.19926
0.2
Probability of (X)
0.15 0.13747
0.1 0.07818
0.07007
0.05 0.02977
0.01084 0.00345 0.00098 0.00025 0.00006
0
0 1 2 3 4 5 6 7 8 9 10 11 or
more
# of goals scored (X)
La figura 2.1 se parece al gráfico calculado a partir de los datos de la figura 2. Me di cuenta de que
las probabilidades teóricas de P(7 ≤ X ≤ 11∨more ) no coincidían realmente con los resultados del
gráfico original. Reflexionando sobre los posibles factores limitantes, la razón es que la frecuencia
observada de marcar goles en rangos altos es extremadamente rara, por eso hay pequeñas
fluctuaciones entre o y 1 para P(7 ≤ X ≤ 11∨more ) y, sin embargo, una disminución gradual en el
gráfico de probabilidad teórica.
Ahora que se han encontrado todas las probabilidades de Poisson para los goles a favor de los
Toronto Maple Leaf's y los Montreal Canadians, debo calcular las probabilidades de nuevo en la
fórmula de distribución de Poisson y luego crear una matriz de probabilidades con los posibles
resultados de puntuación.