Professional Documents
Culture Documents
Inferència estadística
● Relacióentre una variable quantitativa i una variable quantitativa
○ Diagramade dispersió per punts
○ Coeficientde correlació lineal de Pearson
○ Contrastd’hipòtesi F de Fisher
% dentro de género: sumando todos los valores de % dentro de genero de cada uno de
los géneros y lo que de restarlo a 100.
Interpretar el resultado:
Si se aproxima a 0, la relación entre variables es floja a la muestra, por lo que hay poca
relación.
Si se aproxima a 1, la relación entre variables es fuerte a la muestra, por lo que hay relación.
- Valor crítico
X2= ? →Risc 5%= 0,05
Gl (grados de libertad)= (𝑓𝑖𝑙𝑎𝑠 − 1) · (𝑐𝑜𝑙𝑢𝑚𝑛𝑎𝑠 − 1) (sin contar la
fila/columna del total)
Mirar en la tabla del Chi Cuadrado (0,05, gl) para saber el Valor Crítico.
- Interpretación: X2 > Valor Crítico, rechazamos la hipótesis, por lo tanto hay relación
significativa entre las variables.
X2 < Valor Crítico, no rechazamos la hipótesis , no existe relación significativa entre
las variables.
RELACIÓN ENTRE UNA VARIABLE CUANTITATIVA Y UNA VARIABLE
CUALITATIVA (CUANTI-CUALI)
Y1 salari mensual
Y2 edat
Y3 antiguitat a la feina
1. Solter
2. Casat
3. Altres
-Ejemplo (tabla):
2 2 2
𝑆𝑄𝑖𝑛𝑡𝑟𝑎 = (10 − 1) · 3, 723 + (10 − 1) · 3, 901 + (10 − 1) · 4, 085 = 411, 76
2. Variación entregrups.
2 2 3
𝑆𝑄𝑒𝑛𝑡𝑟𝑒 = 𝑛1 · (𝑥1 − 𝑥) + 𝑛2 · (𝑥2 − 𝑥) + 𝑛3 · (𝑥3 − 𝑥) ……
(tantos x nombres de grupos tengamos)
-Ejemplo (tabla):
2 2 2
𝑆𝑄𝑒𝑛𝑡𝑟𝑒 = 10 · (11 − 12, 33) + 10 · (14 − 12, 33) + 10 · (12 − 12, 33) = 46, 67
3. Variación total:
𝑆𝑄𝑡𝑜𝑡𝑎𝑙 = 𝑆𝑄𝑒𝑛𝑡𝑟𝑒 + 𝑆𝑄𝑖𝑛𝑡𝑟𝑎
-Ejemplo (tabla):
𝑆𝑄𝑡𝑜𝑡𝑎𝑙 = 46, 67 + 411, 76 = 458, 43
MEDIDA DE ASOCIACIÓN : ETA η
𝑆𝑄𝑒𝑛𝑡𝑟𝑒
η= 𝑆𝑄𝑡𝑜𝑡𝑎𝑙
Ejemplo (tabla):
46,67
η= 458,43
= 0, 320
La relación entre salarios y estado civil es débil ( η = 0, 320) a nivel de la muestra.
RECHAZAMOS?
-F.fisher
-F.Brown
-T.student
-T.student robusta.
Conclusiones:
F.Fisher > Valor Crítico, rechazamos Ho (hipótesis nula). Por tanto, podemos
generalizar la relación entre las dos variables a nivel de la población.
F.Fisher < Valor Crítico, no podemos rechazar Ho, no tenemos suficientes
datos para evaluar la relación de las variables.
Cálculo F.Fisher:
2 2
η /(𝑚−1) 0,320 /(3−1)
𝐹= 2 = 2 = 1, 54
(1−η )/(𝑛−𝑚) (1−0,320 )/(30−1)
𝑆𝑄𝑒𝑛𝑡𝑟𝑒
𝐹. 𝐵𝑟𝑜𝑤𝑛 − 𝐹𝑜𝑟𝑠𝑦𝑡ℎ𝑒 = 𝑛1 2 𝑛2 2 𝑛𝑚 2
(1− 𝑛
)𝑠 1+(1− 𝑛
)𝑠 1+...+(1− 𝑛
)𝑠 𝑚
m: número de grupos de la variable cualitativa
n: tamaño de la muestra total
𝑉𝑎𝑙𝑜𝑟 𝐶𝑟í𝑡𝑖𝑐𝑜 = α(𝑟𝑖𝑠𝑐) = 5% = 0, 05
→ 𝑔𝑙 = 𝑛𝑢𝑚𝑒𝑟𝑎𝑑𝑜𝑟 (𝑚 − 1)
→ 𝑔𝑙 = 𝑑𝑒𝑛𝑜𝑚𝑖𝑛𝑎𝑑𝑜𝑟 (𝑛 − 𝑚)
F.Brown > Valor Crítico, rechazamos Ho (hipótesis nula). Por tanto, podemos
generalizar la relación entre las dos variables a nivel de la población.
F.Brown < Valor Crítico, no podemos rechazar Ho, no tenemos suficientes
datos para evaluar la relación de las variables.
Contraste de t-Student.
Cálculo t-student (significación >0,05 var.=):
(𝑥1−𝑥2)
𝑡= 2 2
(𝑛1−1)𝑠 1
+ (𝑛2−1)𝑠2 1 1
(𝑛1−1) + (𝑛2−1)
· 𝑛1
+𝑛
2
Representar el diagrama.
- No parábolas
- No valores atípicos
- Correlación positiva o negativa
x Y Zx Zy Zx·Zy
𝑥1−𝑥 6−6,6
zx= 𝑠1
ej: 𝑧1= 2,510
=− 0, 239 (así con todos los números de la x)
𝑦1−𝑦 526−566
zy= 𝑠1
ej: 𝑧1= 97,701
=− 0, 239 (así con todos los números de la y)
x Y x.y 𝑥
2
6 526 3156 36
3 421 1263 9
9 630 5670 81
6 581 3486 36
9 672 6048 81
∑(𝑥)·∑(𝑦)
∑(𝑥·𝑦) − 𝑛
𝐵2 = 2
∑(𝑥)
2
∑(𝑥 )− 𝑛
33·2830
19623 − 5
ej: 𝐵2 = (33)
2 = 37, 5 Interpretación: A cada m de estantería, de
243− 4
media vendemos 37,5 cafés de más.
𝐵1 = 𝑦 − 𝐵2 · 𝑥
ej: 𝐵1 = 566 − 37, 5 · 6, 6 = 318, 5 Interpretación: A 0 m de estantería
venderemos 318,5 cafés. No tiene sentido la hipótesis.
Y=B1+B2·X →(sustituimos valores) Y=318,5+37,5·X
-volver a representar en una gráfica con los puntos anteriores,
dándole 3 valores diferentes a la x.
Medida de Bondad:
2 2
𝑅 = (γ𝑥𝑦)
2 2
ej: 𝑅 = (0, 963) = 0, 927 = 92, 7%
Interpretación: Teniendo en cuenta los metros lineales de estanterías podemos
predecir un 92,7% de la varianza de los cafés vendidos. Por tanto las predicciones
serán muy altas y buenas.
RECHAZAMOS?
2
γ𝑥𝑦
𝐹 = 2
(1−γ𝑥𝑦 )/(𝑛−2)
→gl numerador= 1
Interpretación:
F>Valor Crítico, sig<0,05: Rechazamos la hipótesis nula, por tanto existe relación
significativa entre las variables a la población.