Variabili categoriche:
qualità, proprietà,ecc... (non sono quantità misurabili)
Numero ottimale di classi:
√
n
STIMATORI PUN-TUALI
•
Metodo dei momenti
(momenti empiricicontro momenti teorici)
•
Metodo di massima verosimiglianza
Metodo dei momenti
X
∼
Γ
(
α
,
β
)
E
[
x
] =
αβ
Var
(
x
) =
αβ
2
M
(
n
)
x
=
E
[
x
n
]
M
(
1
)
x
=
E
[
x
]
E
[
x
2
] =
Var
(
x
) + (
E
[
x
])
2
=
αβ
2
+
α
2
β
2
=
αβ
2
(
1
+
α
)
ˆ
α
=
∑
ni
=
1
x
2
i
∑
ni
=
1
x
2
i
−
(
∑
ni
=
1
xi
)
2
ˆ
β
=
∑
ni
=
1
xi
(
∑
ni
=
1
x
2
i
−
(
∑
ni
=
1
xi
)
2
)
n
∑
ni
=
1
x
2
i
(
ˆ
α
e
ˆ
β
sono detti stimatori)
Metodo di massimaverosimiglianza
X
∼
Esp
(
λ
)
f
x
(
x
) =
λ
e
−
λ
x
(con
x
0)
L
(
x
1,...,
xn
)
(
λ
) =
∏
ni
=
1
λ
e
−
λ
xi
log
L
(
x
1,...,
xn
)
(
λ
) =
n
log
λ
−
λ
∑
ni
=
1
x
i
δ
log
L
(
x
1,...,
xn
)(
λ
)
δλ
=
n
λ
−
∑
ni
=
1
x
i
=
0
ˆ
λ
=
n
∑
ni
=
1
xi
=
1
x
(è l’inverso della media)
Intervalli di confidenza(I.C.)
x
=
∑
ni
=
1
xin
(la media campionaria è unostimatore corretto della media)
E
[
x
] =
1
n
[
∑
ni
=
1
xin
] =
1
n
nE
[
x
i
] =
µ
S
2
=
∑
ni
=
1
(
xi
−
x
)
2
n
(stimatore non corretto dellavarianza)
S
2
c
=
∑
ni
=
1
(
xi
−
x
)
2
n
−
1
(stimatore corretto dellavarianza)
E
[
S
2
c
] =
σ
2
=
Var
(
x
)
X
i
∼
N
(
µ
,
σ
2
)
X
∼
N
(
µ
,
σ
2
n
)
Var
(
x
) =
n
σ
2
n
2
=
σ
2
n
Proprietà:
Var
(
ax
) =
a
2
Var
(
x
)
I.C. per popol. normalecon
σ
2
non noto
T
=
x
−
µ
S
√
n
∼
T
n
−
1
I.C.
=
[
x
±
t
1
−
α
2
(
n
−
1
)
S
√
n
]
Distribuzione T diStudent
Z
∼
N
(
0,1
)
X
∼
χ
2
(
n
)
T
n
=
z
√
xn
(v.a.
t
a
n
gradi di libertà)
f
T n
(
x
) =
1
√
n
π
Γ
(
n
+
12
)
Γ
(
n
2
)
(
1
+
x
2
n
)
−
n
+
12
(densità,con
−
∞
<
x
<
∞
)
E
[
T
n
] =
0
Var
(
T
n
) =
nn
−
2
(con
n
>
2)
NOTA:
al crescere di
n
, Student si avvicinaalla Normale.
FREQUENZE
Frequenza assoluta:
Numero di volte cheappare un elemento.
Caso continuo:
f
i
=
{
#
x
/
x
∈
i
-esima classe
}
Caso discreto:
f
i
=
{
#
x
/
x
=
x
i
}
Frequenza relativa:
Numero di volte cheappare un elemento diviso il numero di provetotali.
f
r i
=
f i N
Frequenza assoluta cumulata:
F
i
=
∑
n
i
f
n
Frequenza relativa cumulata:
F
r i
=
∑
n
iF i N
Frequenza assoluta doppia:
f
i
,
k
= n. dielementi del campione con valore (
S
j
,
µ
k
)
Frequenza relativa doppia:
f
r i
,
k
=
f i
,
k n
Frequenza cumulativa assoluta doppia:
F
j
,
k
=
∑
f
r il
(con
r
:
S
r
S
j
e
l
:
µ
l
µ
k
)
Frequenza cumulativa relativa doppia:
F
j
,
k
=
∑
f
r il
Principali indici statistici
•
Di posizioneModa:
valore con frequenza più alta
Media:
x
=
∑
ni
=
1
xin
Mediana:
valore al di sotto del quale cadonola metà dei valori campionari
•
Di dispersioneRange:
|
x
imax
−
x
imin
|
Scarto medio assoluto:
1
n
∑
ni
=
1
|
x
i
−
x
|
Media dei quadrati degli scarti:
1
n
∑
ni
=
1
(
x
i
−
x
)
2
Varianza campionaria:
S
2
=
1
n
−
1
∑
ni
=
1
(
x
i
−
x
)
2
Media e var. campionarie per dati raggr.in classi:
x
=
∑
k i
=
1
∞
i
x
i
S
2
=
1
n
∑
ni
=
1
(
x
i
−
x
)
2
f
i
=
1
n
∑
ni
=
1
(
x
2
i
f
i
)
−
(
x
)
2
•
Di formaIndice di asimmetria:
∑
ni
=
1
(
xi
−
x
)
3
n
σ
2
Curtosi:
∑
ni
=
1
(
xi
−
x
)
4
n
σ
4
Indici di variazionebidimensionale
•
Covarianza campionaria
C
x
,
y
=
1
n
∑
ni
=
1
x
i
y
i
−
xy x
i
y
i
−
xy
=
<
0
x
i
e
y
i
correl. negativ.
>
0
x
i
e
y
i
correl. positiv.
•
Indice di correlazione campionario
r
=
C x
,
y
√
S
2
(
x
)
S
2
(
y
)
(se
r
=
0, allora
x
e
y
nonsono correlate)
Funzione diverosimiglianza
x
1
,...,
x
n
campione casuale di popolazione condensità
ϕ
(
0,
θ
)
f
x
1,...,
xn
(
x
1
,...,
x
n
,
θ
) =
∏
ni
=
1
ϕ
(
x
i
,
θ
)
INTERVALLI DICONFIDENZA (I.C.)
α
= fiducia dell’intervallo1
−
α
= confidenza
Intervalli unilaterali
Con il 95% di confidenza, vedo quando
µ
èsuperiore (
x
,
∞
) o inferiore (
−
∞
,
x
)
Taglia del campione
n
z
1
−
α
2
σ
I
2
2
(
I
2
=
e
2
)
Errore massimo:
I
2
=
z
1
−
α
2
σ
√
n
(questo è un esempio)
I.C. per la media
•
Pop. normale o camp. di t. grande,
σ
notaVar. casuale:
x
−
µ σ
√
n
=
Z
∼
N
(
0,1
)
I
.
C
.
1
−
α
= [
x
±
z
1
−
α
2
σ
√
n
]
(se il campione è
<
30 si usa T di Student)
•
Pop. normale,
σ
non notaVar. casuale:
x
−
µ
S
√
n
∼
T
(
n
−
1
)
(con
n
>
30 tende allaNormale)
I
.
C
.
1
−
α
= [
x
±
t
1
−
α
2
(
n
−
1
)
S
√
n
]
I.C. per la varianza
•
Pop. normaleVar. casuale:
(
n
−
1
)
S
2
σ
2
∼
χ
2
(
n
−
1
)
I
.
C
.
1
−
α
=
(
n
−
1
)
S
2
χ
21
−
α
2
(
n
−
1
)
,
(
n
−
1
)
S
2
χ
2
α
2
(
n
−
1
)
I.C. per il rapp. travarianze
Var. casuale:
S
21
/
σ
21
S
22
/
σ
22
∼
F I
.
C
.
1
−
α
=
S
21
S
22
F
1
−
α
2
,
S
21
S
22
F
α
2
I.C. per la diff. tra 2medie
•
Pop. normale,
σ
1
e
σ
2
noteVar. casuale:
x
1
−
x
2
−
(
µ
1
−
µ
2
)
σ
21
n
1
+
σ
22
n
2
S p
∼
N
(
0,1
)
I
.
C
.
1
−
α
=
x
1
−
x
2
±
z
1
−
α
2
σ
21
n
1
+
σ
22
n
2
•
Pop. normale,
σ
1
e
σ
2
non note ma
=
Var. casuale:
x
1
−
x
2
−
(
µ
1
−
µ
2
)
1
n
1
+
1
n
2
S p
∼
T
(
n
1
+
n
2
−
2
)
Stimatore "pooled":
S
2
p
=
(
n
1
−
1
)
S
21
+(
n
2
−
1
)
S
22
n
1
+
n
2
−
2
•
Pop. normale,
σ
1
e
σ
2
non note e
=
Var. casuale:
non segue la T di Student
x
1
−
x
2
−
(
µ
1
−
µ
2
)
S
21
n
1
+
S
22
n
2
I
.
C
.
1
−
α
=
x
1
−
x
2
±
t
1
−
α
2
S
21
n
1
+
S
22
n
2
t
1
−
α
2
=
S
21
n
1
t
1
+
S
22
n
2
t
2
S
21
n
1
+
S
22
n
2
t
1
=
t
1
−
α
2
(
n
1
−
1
)
t
2
=
t
1
−
α
2
(
n
2
−
1
)
I.C. per proporzioni
Var. casuale:
Snn
−
E
(
Snn
)
Var
(
Snn
)
=
Z
∼
N
(
0,1
)
I
.
C
.
1
−
α
=
ˆ
p
±
z
1
−
α
2
ˆ
p
(
1
−
ˆ
p
)
n
p
=
E
(
Snn
)
Var
(
Snn
) =
p
(
1
−
p
)
n
NOTA:
si usa in caso si presentino degli errori.
E
MAX
=
z
1
−
α
22
n
z
1
−
α
22
pe
2
(dove
p
e
è la prob. di errore)
n
S z
1
−
α
2
pe
2
(quando
S
o
S
2
è data)
I.C. per diff. tra prop.con
n
1
ed
n
2
grandi
I
.
C
.
1
−
α
=
ˆ
p
1
−
ˆ
p
2
±
z
1
−
α
2
ˆ
p
1
(
1
−
ˆ
p
1
)
n
1
+
ˆ
p
2
(
1
−
ˆ
p
2
)
n
2
G
2
ˆ
p
1
−
ˆ
p
2
=
ˆ
p
1
(
1
−
ˆ
p
1
)
n
1
+
ˆ
p
2
(
1
−
ˆ
p
2
)
n
2
TEST PARA-METRICICaso della media di unadistr. Normale
•
C. estr. da pop. norm. con var. notaLivello di significatività:
z
=
x
−
µ
0
σ
√
n
(
µ
0
è la media da verificare)
H
0
H
1
Rifiuto
H
0
se
µ
=
µ
0
µ
=
µ
0
|
z
|
>
z
1
−
α
2
µ
µ
0
µ
>
µ
0
z
>
z
1
−
α
µ
µ
0
µ
<
µ
0
z
<
−
z
1
−
α
•
C. estr. da pop. norm. con var. non notaLivello di significatività:
t
(
n
) =
x
−
µ
0
S
√
n
(
µ
0
è la media da verificare)
H
0
H
1
Rifiuto
H
0
se
µ
=
µ
0
µ
=
µ
0
|
t
|
>
t
1
−
α
2
(
n
−
1
)
µ
µ
0
µ
>
µ
0
t
>
t
1
−
α
(
n
−
1
)
µ
µ
0
µ
<
µ
0
t
<
−
t
1
−
α
(
n
−
1
)
Per la var. di una pop.normale
(
n
−
1
)
S
2
σ
20
∼
χ
2
(
n
−
1
)
H
0
H
1
Rifiuto
H
0
se
σ
2
=
σ
20
σ
2
=
σ
20
χ
2
>
χ
21
−
α
2
(
n
−
1
)
o
χ
2
<
χ
2
α
2
(
n
−
1
)
σ
2
σ
20
σ
2
>
σ
20
χ
2
>
χ
21
−
α
(
n
−
1
)
σ
2
σ
20
σ
2
<
σ
20
χ
2
<
χ
2
α
(
n
−
1
)
Per la dev. standard concamp. normale
S
2
σ
2
(
n
−
1
)
χ
2
(
n
−
1
)
Test per proporzioni(pop. binomiali di tagliagrande)
xn
−
P
0
P
0
(
1
−
P
0
)
n
∼
N
(
0,1
)
H
0
H
1
Rifiuto
H
0
se
P
=
P
0
P
=
P
0
|
z
|
>
z
1
−
α
2
P
P
0
P
>
P
0
z
>
z
1
−
α
P
P
0
P
<
P
0
z
<
z
α
Test per la diff. traproporzioni
ˆ
p
1
−
ˆ
p
2
−
(
p
1
−
p
2
)
0
ˆ
p
1
(
1
−
ˆ
p
1
)
n
1
+
ˆ
p
2
(
1
−
ˆ
p
2
)
n
2
∼
N
(
0,1
)
Test a 2 code Coda dx Coda sx
H
0
:
p
1
−
p
2
= (
p
1
−
p
2
)
0
H
0
H
0
H
1
:
p
1
−
p
2
= (
p
1
−
p
2
)
0
H
1
>
H
1
<
NOTA:
Per la R.C. vedi la tabella sopra.La differenza tra le frequenze relative rilevate su due campionicasuali estratti dalle due popolazioni è statisticamentesignificativa o invece si può ritenere puro effetto del caso?
Test per il confronto tramedie (con var. nota)
x
1
−
x
2
−
δ
σ
21
n
1
+
σ
22
n
2
∼
N
(
0.1
)
NOTA:
se
n
30,
δ
=
30.Se
σ
21e
σ
22non sono note e il campione è di taglia grande,vengono stimate tramite
S
21e
S
22.
H
0
H
1
Rifiuto
H
0
se
µ
1
=
µ
2
+
δ µ
1
=
µ
2
+
δ
|
z
|
>
z
1
−
α
2
µ
1
µ
2
+
δ µ
1
>
µ
2
+
δ
z
>
z
1
−
α µ
1
µ
2
+
δ µ
1
<
µ
2
+
δ
z
<
z
α
Var. non nota uguale
x
1
−
x
2
−
(
µ
1
−
µ
2
)
0
S
2
P
(
1
n
1
+
1
n
2
)
∼
T
(
n
1
+
n
2
−
2
)
H
0
H
1
Rifiuto
H
0
se
µ
1
=
µ
2
µ
1
=
µ
2
|
t
|
>
t
1
−
α
2
(
n
1
+
n
2
−
2
)
µ
1
µ
2
µ
1
>
µ
2
t
>
t
1
−
α
(
n
1
+
n
2
−
2
)
µ
1
µ
2
µ
1
<
µ
2
t
<
t
α
(
n
1
+
n
2
−
2
)
S
2
p
=(
n
1
−
1
)
S
21
+(
n
2
−
1
)
S
22
n
1
+
n
2
−
2
Leave a Comment