Professional Documents
Culture Documents
Gyakorlat - Statisztikai Becslã©s - 2022 2
Gyakorlat - Statisztikai Becslã©s - 2022 2
Makszin Lilla
Statisztikai döntés
A statisztika többféle módszerrel tudja közelíteni a minta segítségével a populációs
paramétereket.
I. Becslés
II. Hipotézisvizsgálat
I. Becslés:
1. Pontbecslés
2. Intervallumbecslés
Pontbecslés
- Egyetlen értékkel becsüli meg az adott paramétert: például a várható értéket vagy a szórást.
- Például, ha az adott csoport testmagasságának átlaga, x =171 cm, szórása, Sx= 10 cm, akkor a
populáció várható átlag értéke (µ) is 171 cm, szórása (σ) 10 cm.
- Annak valószínűsége, hogy egy minta átlaga pontosan megegyezik a populáció átlagával (várható
értékével a µ-vel), közel nulla.
- Intervallum becslés esetén két számot választunk ( „a” és „b” ), és az mondjuk, hogy az becslendő érték
bizonyos valószínűséggel az (a,b) intervallumban – tehát „a” és „b” között – található.
- Ez a valószínűség az intervallumhoz tartozó valószínűségsűrűség függvény görbe alatti területével
határozható meg.
- Ha az intervallum szűk, akkor a hozzá tartozó terület kicsi, ha szélesítjük az intervallumot, akkor
nagyobb a görbe alatti terület, melyhez nagyobb valószínűség tartozik.
95%-os megbízhatósági intervallum
𝑆𝑥
𝐶𝐼95 = x ± 2 ×
ξ𝑛
95%-os konfidencia intervallum
Kevés számú minta elemszám alapján szélesebb intervallumot kell megadni, hogy 100 mintacsoportból 95-é
benne legyen. Ezért minden mintaszámhoz egy karakterisztikus érték tartozik, melyet a t-táblázat foglal
össze.
ha az n <60:
𝑆𝑥
𝐶𝐼95 = x ± 𝑡n−1 ×
ξ𝑛
tn-1: a kétoldalas p=0,05-höz tartozó kritikus t-érték
CI95 definíció szerint: Ha megismételnénk 100-szor a kísérletet (pl.: 20 fős csoportra 100 kísérlet), s mindegyikből
kiszámolnánk a 95%-os konfidencia intervallumot, akkor az így nyert 100 különböző csoportátlaghoz kiszámolt 100
különböző intervallumból 95 tartalmazná a µ-t.
A való életben csak egy átlagunk van, s nem tudjuk, hogy az iménti 100 közül valójában melyik az: a 95 közül, vagy az
5 közül egy? Ezt értjük azon, hogy: Ha 100 átlagunk lenne ugyanabból az eloszlásból, akkor azok köré húzott 95
intervallum tartalmazná a µ-t, 5 viszont nem. Ezt a 95-öt tekintjük a becslés megbízhatóságának, az 5-öt pedig a
hibakockázatának.
95%-os konfidencia intervallum
Példa: Egy 70 fős csoport testmagasságának átlaga és szórása a következő:
x = 175 cm
Sx= 10 cm
Megoldás:
𝑆𝑥 10
𝐶𝐼95 = x ± 2 × = 175± 2 × = 175 ± 2,4 = 𝟏𝟕𝟐, 𝟔 − 𝟏𝟕𝟕, 𝟒 𝐜𝐦
ξ𝑛 ξ 70
172,6 177,4 cm
µ= 170 cm
95%-os konfidencia intervallum
Példa: Egy 12 fős csoport testmagasságának átlaga és szórása a következő:
x = 175 cm
Sx= 10 cm
Megoldás:
n=12
df=n-1=12-1=11
𝑆𝑥 10
𝐶𝐼95 = x ± 𝑡n−1 × 𝑛
= 175± 2,201 × = 175 ± 6,35 = 𝟏𝟔𝟖, 𝟔𝟓 − 𝟏𝟖𝟏, 𝟑𝟓𝐜𝐦
ξ ξ 12
95%-os konfidencia intervallum
Példa: Egy 12 fős csoport testmagasságának átlaga és szórása a következő:
x = 175 cm
Sx= 10 cm
Megoldás:
n=12
df=n-1=12-1=11
df=11 táblázatos t-értéke=2,201
𝑆𝑥 10
𝐶𝐼95 = x ± 𝑡n−1 × = 175± 2,201 × = 175 ± 6,35 = 𝟏𝟔𝟖, 𝟔𝟓 − 𝟏𝟖𝟏, 𝟑𝟓𝐜𝐦
ξ𝑛 ξ 12
µ= 170 cm
95%-os konfidencia intervallum
Példa: Egy 9 fős beteg csoport szérum albumin szintjének átlaga és szórása a
következő:
x = 3,9 mg/100 ml
Sx= 0,6 mg/100 ml
Lehet-e vajon a betegek várható értéke az egészségesekre jellemző 4,2
mg/100 ml?
Azaz, lényegesen eltér-e a betegeknél kapott érték (3,9 mg/100 ml) az
egészségesekétől (4,2 mg/100ml)?
Megoldás:
n=9
df=n-1=9-1=8
𝑆𝑥 0,6
𝐶𝐼95 = x ± 𝑡n−1 × 𝑛
= 3,9± 2,306 × = 3,9 ± 0,5 = 𝟑, 𝟒𝟒 − 𝟒, 𝟑𝟔 𝐦𝐠/𝟏𝟎𝟎 𝐦𝐥
ξ ξ9
95%-os konfidencia intervallum
Példa: Egy 9 fős beteg csoport szérum albumin szintjének átlaga és szórása a következő:
x = 3,9 mg/100 ml
Sx= 0,6 mg/100 ml
Lehet-e vajon a betegek várható értéke az egészségesekre jellemző 4,2 mg/100 ml?
Azaz, lényegesen eltér-e a betegeknél kapott érték (3,9 mg/100 ml) az egészségesekétől (4,2 mg/100ml)?
Megoldás:
n=9
df=n-1=9-1=8
df=8 táblázatos t-értéke=2,306
𝑆𝑥 0,6
𝐶𝐼95 = x ± 𝑡n−1 × 𝑛
= 3,9± 2,306 × = 3,9 ± 0,5 = 𝟑, 𝟒𝟒 − 𝟒, 𝟑𝟔 𝐦𝐠/𝟏𝟎𝟎 𝐦𝐥
ξ ξ9
µ= 4,2 mg/100ml
95%-os konfidencia intervallum
Példa: Egy 5 nőből álló csoportban a hemoglobin szint átlaga 142,5 g/l,
szórása 15 g/l.
Lehet-e a hemoglobinszint várható értéke 130 g/l?
Megoldás:
n=5
df=n-1=5-1=4
𝑆𝑥 15
𝐶𝐼95 = x ± 𝑡n−1 × = 142,5± 2,776 × = 142,5 ± 18,62 = 𝟏𝟐𝟑, 𝟖𝟖 − 161,12
𝟏𝟔𝟐, 𝟏𝟐g/l
𝐠/𝐥
ξ𝑛 ξ5
95%-os konfidencia intervallum
Példa: Egy 5 nőből álló csoportban a hemoglobin szint átlaga 142,5 g/l, szórása 15 g/l.
Lehet-e a hemoglobinszint várható értéke 130 g/l?
Megoldás:
n=5
df=n-1=5-1=4
df=8 táblázatos t-értéke=2,776
𝑆𝑥 15
𝐶𝐼95 = x ± 𝑡n−1 × = 142,5± 2,776 × = 142,5 ± 18,62 = 𝟏𝟐𝟑, 𝟖𝟖 − 161,12
𝟏𝟔𝟐, 𝟏𝟐g/l
𝐠/𝐥
ξ𝑛 ξ5
µ= 130 g/l
95%-os konfidencia intervallum
Példa: Egy 75 nőből álló csoportban a hemoglobin szint átlaga 142,5 g/l, szórása 15 g/l.
Lehet-e a hemoglobinszint várható értéke 130 g/l?
Megoldás:
𝑆𝑥 15
𝐶𝐼95 = x ± 2 × = 142,5± 2 × = 142,5 ± 3,46 = 𝟏𝟑𝟗, 𝟎𝟒 − 𝟏𝟒𝟓, 𝟗𝟔 𝐠/𝐥
ξ𝑛 ξ 75
µ= 130 g/l
1. Zárthelyi dolgozat:
Minimum 50% (1 pót zh a 8. héten, akik nem érték el az 50%-ot vagy hiányoztak)
Gyakorlási lehetőség:
„Gyakorló feladatok_1zhra.pdf” (elérhető Moodle)
Köszönöm a figyelmet!