You are on page 1of 21

Regresi Linear

Chapter
9
Korelasi dan regresi

Elementary Statistics
Larson Farber

Kemalangan
60
50
40
30
20
10
0
0 2 4 6 8 10 12 14 16 18 20
Jam Latihan
Korelasi

Hubungan di antara dua two variabel.

Variabel Variabel
tak bersandar bersandar
x y

Jam latihan Bilangan kemalangan


Saiz kasut Ketinggian
Rokok yang dihisap sehari Kapasiti paru-paru
Skor SAT GPA
Ketinggian IQ
Apakah hubungan wujud di antara dua variabel dan adakah korelasi
signifikan?
Plot serakan dan jenis korelasi
x = Jam latihan
Kemalangan
y = bilangan kemalangan
60

50

40

30

20

10

0 2 4 6 8 10 12 14 16 18 20
Hours of Training

Korelasi negatif
apabila x meningkat, y menurun
GPA x = Skor SAT
4.00
3.75 y = GPA
3.50
3.25
3.00
2.75
2.50
2.25
2.00
1.75
1.50

300 350 400 450 500 550 600 650 700 750 800
Math SAT

Korelasi positif
apabila x meningkat y juga meningkat
x = ketinggian
IQ
160
y = IQ
150

140

130

120

110

100

90

80

60 64 68 72 76 80
Height

Tiada korelasi linear


x
Ketidakhadiran Gred Akhir
x y
8 78
2 92
5 90
Gred
12 58
Akhir
95 15 43
90 9 74
85
80 6 81
75
70
65
60
55
50
45
40
0 2 4 6 8 10 12 14 16
Ketidakhadiran x
Pekali korelasi
Satu ukuran kekuatan dan arah bagi hubungan linear di
antara dua variabel
nxy  xy
r 
nx 2  x  ny 2  (y ) 2
2

Julat r ialah dari -1 hingga 1.

-1 0 1
Jika r dekat Jika r dekat Jika r dekat
dengan -1 maka dengan 0 maka dengan 1 maka
korelasi negatif tiada korelasi korelasi positif
yang kuat wujud linear wujud yang kuat wujud
Komputasi r
x y xy x2 y2
1 8 78 624 64 6084
2 2 92 184 4 8464
3 5 90 450 25 8100
4 12 58 696 144 3364
5 15 43 645 225 1849
6 9 74 666 81 5476
7 6 81 486 36 6561
57 516 3751 579 39898
nxy  xy
r 
nx 2  x  ny 2  (y ) 2
2

 3155
r  = - 0.975
804 13030
r ialah pekali korelasi bagi sampel

ρ (rho) ialah pekali korelasi bagi populasi


Ujian Hipotesis bagi signifikans r.
H0: r  0 Tiada korelasi negatif yang signifikan
Ha: r < 0 korelasi negatif yang signifikan (hujung kiri)

H0: r  0 Tiada korelasi positif yang signifikan


Ha: r > 0 korelasi positif yang signifikan (hujung kanan)

H0: r = 0 Tiada korelasi yang signifikan


Ha: r  0 korelasi signifikan (dua hujung)
Taburan pensampelan bagi r ialah taburan t dengan n-2 darjah
kebebasan

r 0 r
Statistik ujian piawai t  
r 1 r 2
n2
Ujian signifikans r
Adalah didapati bahawa korelasi antara ketidakhadiran dan gred
akhir, r = - 0.975. Uji signifikans korelasi ini. Guna  = 0.01.

1. Tulis hipotesis nol dan alternatif


H0: r = 0 Tiada korelasi yang signifikan
Ha: r  0 korelasi signifikan (dua hujung)

2. Nyatakan aras keertian


 = 0.01

3. Tentukan taburan pensampelan


Taburan t dengan 6 darjah kebebasan
Rantau penolakan

t 0 Nilai Kritikal t0


-3.707 3.707

4. Cari nilai kritikal 5.Cari rantau


penolakan

6. Cari statistik ujian


r  0.975
t    9.811
1 r 2
1  0.975 2

n2 72
t 0
-3.707 3.707

7. Membuat keputusan
t = -9.811 jatuh dalam rantau penolakan, tolak hipotesis nol

8. Mentafsir keputusan
Terdapat korelasi signifikan di antara ketidakhadiran dan gred akhir
(xi,yi) = titik data
ˆi )
( xi , y = titik pada garis dengan nilai x yang same
d i  yi  y
ˆ i Dipanggil residual

hasil
260
(xi,yi)
250
di
240
230 ˆi )
( xi , y

220
210
200 d 2 ialah minimum
190
180
1.5 2.0 2.5 3.0
Pengiklanan (RM)
Garis Regresi
Apabila anda telah mengenal pasti korelasi linear yang signifikan
wujud, anda boleh menulis persamaan untuk menghuraikan
hubungan di antara variabel x dan y. Persamaan ini dipanggil garis
regresi atau garis kuasa dua terkecil

Dari algebra – persamaan garis ditulis sebagai


y = mx + b
di mana m ialah kecerunan garis dan b ialah pintasan-y
Garis regresi ialah: ˆ  mx  b
y
Kecerunan m diberi oleh
nxy  xy
m
nx 2  (x ) 2
Pintasan-y ialah
b  y  mx
x y xy x2 y2
1 8 78 624 64 6084
2 2 92 184 4 8464
3 5 90 450 25 8100
4 12 58 696 144 3364
5 15 43 645 225 1849
6 9 74 666 81 5476
7 6 81 486 36 6561
57 516 3751 579 39898
nxy  xy 7(3751)  (57)(516)
m  = -3.924
nx 2  (x ) 2 7(579)  (57) 2

b  y  mx
 73.714  ( 3.924)(8.143) =105.667

Garis regresi ialah: ˆ  3.924 x  105.667


y
Garis Regresi
m = -3.924 dan b = 105.667
Garis regresi ialah: ˆ  3.924 x  105.667
y

Gred
akhir 95
90
85
80
75
70
65
60
55
50
45
40
0 2 4 6 8 10 12 14 16
x
Ketidakhadiran
Perhatikan titik (8.143, 73.714) ada pada garis
Meramal nilai
Garis regresi boleh diguna untuk meramal nilai y bagi nilai x
dalam lingkungan data

Garis regresi bagi bilangan kali tidak hadir dan gred akhir
ialah:
ˆ  3.924 x  105.667
y

Gunakan persamaan di atas untuk meramal gred yang


dijangkakan bagi seorang pelajar yang tidak hadir
(a) 3 kali
(b) 12 kali
(a) ˆ  3.924(3)  105.667  93.895
y

(b) ˆ  3.924(12)  105.667  58.579


y
Pekali penentuan
Pekali penentuan, r2 ialah nisbah ubahan yang ternyata berbanding
jumlah ubahan
Ubahan yang boleh diterangka n
r2 
Jumlah ubahan

Pekali korelasi bagi bilangan kali tidak hadir dan gred akhir ialah
r = - 0.975. Jadi pekali penentuan ialah (-0.975)2 = 0.9506.

Pentafsiran: Hampir 95% daripada ubahan dalam gred akhir boleh


diterangkan dengan bilangan kali pelajar tidak hadir. 5% lagi tidak
dapat diterangkan dan mungkin disebabkan oleh ralat pensampelan
atau variabel lain seperti kecerdasan, amaun masa belajar, dll

You might also like