Professional Documents
Culture Documents
Wykład
Wykład
dwóch zmiennych
jest niższy od geniuszu ich rodziców, czyli cofa się (ang. regress) do
Choć Galton posługiwał się pojęciem regresji na oznaczenie pewnej tendencji w dziedziczeniu
zdolności, to jednak obecnie termin ten najczęściej stosuje się w odniesieniu do statystycznej
OKREŚLONE ZJAWISKO.
Omawiając współczynnik korelacji r Pearsona, posługiwaliśmy się
Równanie linii regresji – określa się jako miejsce geometryczne średnich wartości zmiennej
zależnej przy ustalonych wartościach zmiennej niezależnej. Linia regresji to linia która jest
REGRESJI.
Stwierdzenie, że między cechami istnieje korelacja liniowa pozwala
cechy.
y y
Korelacja dodatnia
Korelacja ujemna
y y
x x
y
x =x
y
y =y
x
75
70
y, wynik czytania testu
65
60
55
50
100 105 110 115 120 125 130 135 140 145
x, iloraz inteligencji
• Uporządkowanie punktów [przedstawionych na wykresie] wykazuje
znaczną nieregularność.
Linia prosta określa, jak przeciętnie zmienia się jedna zmienna wraz ze
X N X 2 2
a yx
Y b X yx
__
Y byx X
__
N
W powyższym równaniu zmienna Y oznacza zmienną zależną
składowych:
•Możemy sprawdzić, czy ten uproszczony model relacji między zmiennymi lepiej
opisuje zależność, jaką udało nam się ustalić w badaniu, niż odwoływanie się do
przypadku.
Przykład c.d.
__ __
X Yi - średnie odpowiednio X i Y
X = 2 024, Y = 1 155
XY = 130 806
X 2 = 228 978
N = 18
Po zastosowaniu powyższych wzorów, czyli byx i a yx , otrzymamy:
18*130806 2024*1155
byx 0, 6708
18* 228978 2024* 2024
1155 0, 6708* 2024
a yx 11, 25
18
Linię regresji dla przewidywania Y na podstawie X opisuje zatem równanie
podstawie wyniku test czytania, musimy posłużyć się inną linią regresji, mianowicie
najmniejsza.
( X X ' )2
była najmniejsza
Wzór linii regresji X względem Y jest następujący:
'
X bxyY axy
gdzie: X - oszacowana bądź przewidziana wartość X
'
Y N Y
2 2
axy
Y b X yx
__
X bxy Y
__
N
Dla danych y tabeli
wielkość = 74 885. Wartości
Y 2
XY = 130 806.
18*130806 2024*1155
bxy 2
1, 207
18*74885 (1155)
'
X 1, 207 * Y 34,98
Tygodnik "Wprost" opublikował wyniki badań cen [w zł] produktów oryginalnych i podróbek tych
produktów, sprzedawanych na bazarach w Warszawie w 2003 roku.
80
60
40
20
0
0 200 400 600 800 1000 1200 1400 1600
Cena oryginału X
Statystyki regresji
Wielokrotność R 0,84
R kwadrat 0,71
Dopasowany R kwadrat 0,68
Błąd standardowy 19,23
Obserwacje 14
Ocena jakość oszacowania funkcji regresji
to, że proces ten przebiega podobnie, uwagę kierujemy na oceną funkcji regresji Y względem
X.
Dokonując oceny jakości funkcji regresji, chcemy uzyskać odpowiedź na pytanie: czy
Su
( y y ' 2
)
n2
Miara ta określa, o ile przeciętnie biorąc (+ / -), wartości empiryczne zmiennej objaśnianej
Su
Vu __
*100%
y
Współczynnik ten wskazuje, jaki % średniego poziomu zmiennej objaśnianej
(zależnej) stanowią wahania losowe, których miarą jest Su. Parametr Vu jest
Vu < 15%
• współczynnik determinacji R2 według wzoru:
2 2
R r *100%
Określa on, jaki % wariancji zmiennej objaśnianej (zależnej) został wyjaśniony