You are on page 1of 16

Statisztikai becslés

Makszin Lilla
Statisztikai döntés
A statisztika többféle módszerrel tudja közelíteni a minta segítségével a populációs
paramétereket.

I. Becslés
II. Hipotézisvizsgálat

I. Becslés:

1. Pontbecslés

2. Intervallumbecslés
Pontbecslés

- Egyetlen értékkel becsüli meg az adott paramétert: például a várható értéket vagy a szórást.

- Például, ha az adott csoport testmagasságának átlaga, x =171 cm, szórása, Sx= 10 cm, akkor a
populáció várható átlag értéke (µ) is 171 cm, szórása (σ) 10 cm.

- Annak valószínűsége, hogy egy minta átlaga pontosan megegyezik a populáció átlagával (várható
értékével a µ-vel), közel nulla.

Tehát ez a becslés bizonytalan, ezért inkább


egy intervallumot adunk meg, amely nagyobb
valószínűséggel tartalmazza az általunk
keresett µ értéket.
Intervallumbecslés

- Intervallum becslés esetén két számot választunk ( „a” és „b” ), és az mondjuk, hogy az becslendő érték
bizonyos valószínűséggel az (a,b) intervallumban – tehát „a” és „b” között – található.
- Ez a valószínűség az intervallumhoz tartozó valószínűségsűrűség függvény görbe alatti területével
határozható meg.
- Ha az intervallum szűk, akkor a hozzá tartozó terület kicsi, ha szélesítjük az intervallumot, akkor
nagyobb a görbe alatti terület, melyhez nagyobb valószínűség tartozik.
95%-os megbízhatósági intervallum

- Az intervallumbecslés speciális esete a megbízhatósági vagy idegen szóval konfidencia intervallum,


melyet akkor alkalmazunk, ha egy populációs paramétert, várható értéket szeretnénk becsülni.
- Ha a mintánk nagy elemszámmal rendelkezik, akkor a megbízhatóság is nagyobb lesz.
 
- Ha például a populáció várható értékét szeretnénk megbecsülni, akkor a mintaátlag köré képezünk
konfidencia intervallumot, általában 95 %-osat (jelölése: CI95).

A minta elemszámától függően két képletet alkalmazunk:

Ha az elemszám (n) nagy (legalább 60 adat):

𝑆𝑥
𝐶𝐼95 = x ± 2 ×
ξ𝑛
95%-os konfidencia intervallum

Kevés számú minta elemszám alapján szélesebb intervallumot kell megadni, hogy 100 mintacsoportból 95-é
benne legyen. Ezért minden mintaszámhoz egy karakterisztikus érték tartozik, melyet a t-táblázat foglal
össze.

ha az n <60:
𝑆𝑥
𝐶𝐼95 = x ± 𝑡n−1 ×
ξ𝑛
tn-1: a kétoldalas p=0,05-höz tartozó kritikus t-érték

df: szabadsági fokok száma (degree of freedom), df=n-1

CI95 definíció szerint: Ha megismételnénk 100-szor a kísérletet (pl.: 20 fős csoportra 100 kísérlet), s mindegyikből
kiszámolnánk a 95%-os konfidencia intervallumot, akkor az így nyert 100 különböző csoportátlaghoz kiszámolt 100
különböző intervallumból 95 tartalmazná a µ-t.
 
A való életben csak egy átlagunk van, s nem tudjuk, hogy az iménti 100 közül valójában melyik az: a 95 közül, vagy az
5 közül egy? Ezt értjük azon, hogy: Ha 100 átlagunk lenne ugyanabból az eloszlásból, akkor azok köré húzott 95
intervallum tartalmazná a µ-t, 5 viszont nem. Ezt a 95-öt tekintjük a becslés megbízhatóságának, az 5-öt pedig a
hibakockázatának.
95%-os konfidencia intervallum
Példa: Egy 70 fős csoport testmagasságának átlaga és szórása a következő:
x = 175 cm
Sx= 10 cm

Lehet-e a sokaság várható értéke (µ): 170 cm?

Megoldás:
𝑆𝑥 10
𝐶𝐼95 = x ± 2 × = 175± 2 × = 175 ± 2,4 = 𝟏𝟕𝟐, 𝟔 − 𝟏𝟕𝟕, 𝟒 𝐜𝐦
ξ𝑛 ξ 70

Tehát a populáció várható értéke 95% -os valószínűséggel


172,6 cm és 177,4 cm közé esik.
A 170 cm nem esik bele ebbe az intervallumba.
Nem lehet a sokaság várható értéke (µ) 170 cm.
(Tekintve, hogy a 95%-os megbízhatóságot használtuk, ezért
ez a becslésünk 5% hibakockázattal jár.)

172,6 177,4 cm
µ= 170 cm
95%-os konfidencia intervallum
Példa: Egy 12 fős csoport testmagasságának átlaga és szórása a következő:
x = 175 cm
Sx= 10 cm

Lehet-e a sokaság várható értéke (µ): 170 cm?

Megoldás:

n=12
df=n-1=12-1=11

df=11 táblázatos t-értéke=2,201

𝑆𝑥 10
𝐶𝐼95 = x ± 𝑡n−1 × 𝑛
= 175± 2,201 × = 175 ± 6,35 = 𝟏𝟔𝟖, 𝟔𝟓 − 𝟏𝟖𝟏, 𝟑𝟓𝐜𝐦
ξ ξ 12
95%-os konfidencia intervallum
Példa: Egy 12 fős csoport testmagasságának átlaga és szórása a következő:
x = 175 cm
Sx= 10 cm

Lehet-e a sokaság várható értéke (µ): 170 cm?

Megoldás:

n=12
df=n-1=12-1=11
df=11 táblázatos t-értéke=2,201

𝑆𝑥 10
𝐶𝐼95 = x ± 𝑡n−1 × = 175± 2,201 × = 175 ± 6,35 = 𝟏𝟔𝟖, 𝟔𝟓 − 𝟏𝟖𝟏, 𝟑𝟓𝐜𝐦
ξ𝑛 ξ 12

Lehet a sokaság várható értéke (µ) 170 cm.


168,65 181,35 cm

µ= 170 cm
95%-os konfidencia intervallum
Példa: Egy 9 fős beteg csoport szérum albumin szintjének átlaga és szórása a
következő:
x = 3,9 mg/100 ml
Sx= 0,6 mg/100 ml
Lehet-e vajon a betegek várható értéke az egészségesekre jellemző 4,2
mg/100 ml?
Azaz, lényegesen eltér-e a betegeknél kapott érték (3,9 mg/100 ml) az
egészségesekétől (4,2 mg/100ml)?

Megoldás:

n=9
df=n-1=9-1=8

df=8 táblázatos t-értéke=2,306

𝑆𝑥 0,6
𝐶𝐼95 = x ± 𝑡n−1 × 𝑛
= 3,9± 2,306 × = 3,9 ± 0,5 = 𝟑, 𝟒𝟒 − 𝟒, 𝟑𝟔 𝐦𝐠/𝟏𝟎𝟎 𝐦𝐥
ξ ξ9
95%-os konfidencia intervallum
Példa: Egy 9 fős beteg csoport szérum albumin szintjének átlaga és szórása a következő:
x = 3,9 mg/100 ml
Sx= 0,6 mg/100 ml
Lehet-e vajon a betegek várható értéke az egészségesekre jellemző 4,2 mg/100 ml?
Azaz, lényegesen eltér-e a betegeknél kapott érték (3,9 mg/100 ml) az egészségesekétől (4,2 mg/100ml)?

Megoldás:

n=9
df=n-1=9-1=8
df=8 táblázatos t-értéke=2,306
𝑆𝑥 0,6
𝐶𝐼95 = x ± 𝑡n−1 × 𝑛
= 3,9± 2,306 × = 3,9 ± 0,5 = 𝟑, 𝟒𝟒 − 𝟒, 𝟑𝟔 𝐦𝐠/𝟏𝟎𝟎 𝐦𝐥
ξ ξ9

Lehet a sokaság várható értéke (µ) 4,2 mg/100ml.

3,4 4,4 mg/100ml

µ= 4,2 mg/100ml
95%-os konfidencia intervallum
Példa: Egy 5 nőből álló csoportban a hemoglobin szint átlaga 142,5 g/l,
szórása 15 g/l.
Lehet-e a hemoglobinszint várható értéke 130 g/l?

Megoldás:

n=5
df=n-1=5-1=4

df=4 táblázatos t-értéke=2,776

𝑆𝑥 15
𝐶𝐼95 = x ± 𝑡n−1 × = 142,5± 2,776 × = 142,5 ± 18,62 = 𝟏𝟐𝟑, 𝟖𝟖 − 161,12
𝟏𝟔𝟐, 𝟏𝟐g/l
𝐠/𝐥
ξ𝑛 ξ5
95%-os konfidencia intervallum
Példa: Egy 5 nőből álló csoportban a hemoglobin szint átlaga 142,5 g/l, szórása 15 g/l.
Lehet-e a hemoglobinszint várható értéke 130 g/l?

Megoldás:

n=5
df=n-1=5-1=4
df=8 táblázatos t-értéke=2,776

𝑆𝑥 15
𝐶𝐼95 = x ± 𝑡n−1 × = 142,5± 2,776 × = 142,5 ± 18,62 = 𝟏𝟐𝟑, 𝟖𝟖 − 161,12
𝟏𝟔𝟐, 𝟏𝟐g/l
𝐠/𝐥
ξ𝑛 ξ5

Lehet a sokaság várható értéke (µ) 130 g/l.

123,88 162,12 g/l

µ= 130 g/l
95%-os konfidencia intervallum
Példa: Egy 75 nőből álló csoportban a hemoglobin szint átlaga 142,5 g/l, szórása 15 g/l.
Lehet-e a hemoglobinszint várható értéke 130 g/l?

Megoldás:

𝑆𝑥 15
𝐶𝐼95 = x ± 2 × = 142,5± 2 × = 142,5 ± 3,46 = 𝟏𝟑𝟗, 𝟎𝟒 − 𝟏𝟒𝟓, 𝟗𝟔 𝐠/𝐥
ξ𝑛 ξ 75

Nem lehet a sokaság várható értéke (µ) 130 g/l.

139,04 145,96 g/l

µ= 130 g/l
1. Zárthelyi dolgozat:​

2022. október 17. gyakorlat időpontjában, oktatóteremben (20 perces)


 10 kérdés (egyszeres és többszörös feleletválasztás) gyakorlati anyagból 6. hétig bezárólag


(modellek, változótípusok, ábrázolások, p számolás, leíró statisztika, normális eloszlás, CI95
számolás).

 Minimum 50% (1 pót zh a 8. héten, akik nem érték el az 50%-ot vagy hiányoztak)

 Gyakorlási lehetőség:
„Gyakorló feladatok_1zhra.pdf” (elérhető Moodle)
Köszönöm a figyelmet!

You might also like