You are on page 1of 7

5.2.

Numerikus tesztek
• Kolmogorov-Smirnov egymintás teszt az
STATISZTIKA eloszlásra

7. Előadás
• Shapiro-Wilk teszt a normalitásra,
Összefüggés-vizsgálatok megfigyelések száma 3-5 000.
Regresszió-analízis

5.2. Kolmogorov-Smirnov 5.2. Shapiro-Wilk


egymintás teszt az eloszlásra normalitás teszt

Egymintás Kolmogorov-Smirnov teszt Shapiro-Wilk normalitás teszt

Standardizált maradékok: Standardizált maradékok:


D = 0,083761, p-value < 2,2e-16 W = 0,9806, p-value < 2,2e-16
alternative hypothesis: two-sided

5.3. Homoszkedasztikus 5.3 Heteroszkedasztikus

HIBÁS

1
5.3. Numerikus teszt a 6. A regressziós egyenes
homoszekdasztikusságra megadása
• Breusch-Pagan teszt (1979)
• Nem konstans a hiba varianciája

• H0: konstans a hibák varianciája Y’ = 770,9 - 21,1*hőmérséklet


• H1: a hibák varianciája az illesztett értékektől függ

Hiba variancia ~ Becsült érték


Chi2 = 809,7862 Df = 1 p = 4,021335e-178

7.1. Interpoláció 7.1. Extrapoláció

Nagy befolyással rendelkező,


Az illesztetlenség okai torzító esetek okai
• Nem lineáris az összefüggés
• Hibás adat-felvételezés, mérés
• Általunk nem vizsgált változó zavarja az
összefüggést • Adatrögzítési hiba

• Torzító esetek • Természetes ok, korreláció törő megfigyelések

2
Részletes diagnosztika Hatóerő (leverage)
• Befolyásos, torzító adatok keresése
• Egy adott pont (x) értékének távolsága a
minta x értékeinek átlagától (Pedhazur,
• Befolyásos pontok hatóerejének (leverage) 1982)
vizsgálata (az x-változó tulajdonsága)
• Részleges hatóerő (partial leverage)
• Kiugró, kirívó érték (outlier) az y-változó • A projekciós mátrix diagonális elemei
tulajdonsága
• Átlagos értéke p/n
• CSAK A BEFOLYÁSOS ESETHEZ TARTOZÓ
• Kritikus érték 2p/n felett
KIUGRÓ ÉRTÉK TORZÍT!

Projekciós mátrix
Projekciós mátrix, P (hat)
tengelymetszet nélkül

X = a független változók mátrixa, két


változós esetén:

Projekciós mátrix
tengelymetszet nélkül Kiugró értékek
• Maradékok

• Standardizált maradékok

Az átlóban az x-értékek négyzete áll.


• Törölt maradékok
Ezt kell szorozni az előbb kapott 1/14-gyel.
• Törölt studentizált maradékok

• Cook-távolságok

3
Standardizált maradékok Törölt maradékok

t-eloszlású, n-2 szabadságfokkal

Studentizált törölt
Cook-távolság, D-statisztika
maradékok
Standardizált index: a regressziós együtthatók
hogyan változnak meg, ha az adott adatpontot
töröljük (Hair et al., 1995).
Kritikusérték: >1 vagy 4/n

Befolyásos, torzító adatok

R. Dennis Cook

4
Példa Alapadatok

Diagnosztikai ábrák

Regressziós egyenes Becsült érték – Maradék ábra

QQ ábra Homoszekdasztikus a modell?

5
Hatóerő - Std. maradékok Döntés
• A 3. eset befolyásos, torzító pont

• Zárjuk ki az analízisből

Módosított becslés Becsült érték – Maradék ábra

QQ ábra Homoszkedasztikus?

6
Torzító értékek Eredményközlés

„Profibb” Eredményközlés Eredménytáblázat


• Coefficients:
• Estimate Std. Error t value Pr(>|t|)
• (Intercept) 770,9082 4,0493 190,38 <2e-16 ***
• Hőmérséklet -21,0725 0,3208 -65,69 <2e-16 ***

You might also like