You are on page 1of 8

Kiểm định tính độc lập giữa hai BNN bằng phép kiểm khi^2

X Y 1 j r
1 N1, 1
I Ni, j
s Ns, r

H0: X Y độc lập

H: X, Y phụ thuộc

Bậc tự do: (s – 1)(r – 1) => tra bảng khi(s – 1)(r – 1)1-alpha

GT tới hạn: C = khi(s – 1)(r – 1)1-alpha

Tần số lý thuyết: ni, j’ = (ni.mj)/n

- Ni là tổng các số thuộc hàng thứ I (cuối hàng)


- Mj là tổng các số thuộc cột thứ j (cuối cột)
- N là cỡ mẫu

GT thực nghiệm: khi^2 = sigmai, j ((nij – nij’)^2/nij’)

Ví dụ: 140 người, màu tóc X, màu mắt Y

X Đen Nâu Bạch kim

Xanh 35 36 25

Đen 16 18 10

Mức ý nghĩa 5%, X, Y độc lập không?

Giải

Tổng dòng s: 2

Tổng cột: 3

Bậc tự do khi^2: (2 – 1)(3 – 1) = 2 => khi95% = 5,991

H0: độc lập

H: phụ thuộc

Tính nij

X Đen Nâu Bạch kim

Y
Xanh 35 (34,97) 36 (37,02) 25 (24,01) 96

Đen 16 (16,03) 18 (16,98) 10 (10,99) 44

51 54 35

Chú ý: 34,97 = 96.51/140; 37,02 = 96.54/140

GTTN: khi^2 = 0,219

|khi^2| < C => tạm chấp nhận H0

Chưa có đủ cơ sở cho rằng màu tóc và màu mắt là phụ thuộc

Kiểm định sự phù hợp (tuân theo quy luật)

Đặc tính X, quy luật R

Giả sử X chia k loại C1 đến Ck.

Mẫu cỡ mẫu n, tần số thực nghiệm với mỗi C: n1 đến nk

Tổng ni bằng n

Bảng

X C1 Ci Ck

N n1 ni nk

Bậc tự do 2(k – 1); Giá trị tới hạn: C = khi^21-alpha2(k – 1)

Tính ni, j = n.pi (p là tỉ lệ lý thuyết, n là cỡ mẫu thực nghiệm => đúng ra nó nên bao nhiêu)

GTTN: khi^2 = sigmai, j ((nij – nij’)^2/nij’)

Ví dụ: xem sách trang 58

Phân tích phương sai một yếu tố

Yếu tố A có k nhóm a1 – ak

A a1 ai ak

1 x11

j xij

nk x1nk x2nk xknk

x ngangi, si
x là các kết quả, phân theo nhóm ai

Đặt giả thuyết H0: trung bình các tổng thể như nhau  yếu tố A không ảnh hướng kết quả

H: Có 1 cặp trung bình khác nhau  yếu tố A có ảnh hưởng kết quả

GT tới hạn: C = F1-alpha(k – 1, N – k)

N = sigma tất cả ni

Phân phối Fischer

SSB: tổng bình phương độ lệch giữa các nhóm

- SSB: sigma (1 -> k) (ni.(x ngangi)^2) – N. (x ngang)^2

SSW: tổng bình phương độ lệch trên mỗi nhóm

- SSW: sigma (1 -> k) ((ni – 1)si^2)

GTTN: F = (SSB/(k – 1))/(SSW/(N – k))

Ví dụ:

4 loại thuốc ngủ

A B C D

180 120 150 142

162 140 160 158

155 145 157 163

167 160 163 174

158 180 161 180

200 185 170

145

Mức ý nghĩa 5%, khác nhau không

Giải

N1 = 7

N2 = 5

N3 = 6

N4 = 6

N = 24
A: x1 = 166,7; s1 = 18,2

B: x2 = 148; s2 = 22,5

C: x3 = 162,6; s3 = 11,8

D: x4 = 164,5; s4 = 13,5

X ngang = 161,5

H0: loại thuốc ngủ không tác động đến thời gian ngủ, hay tất cả các trung bình thời gian ngủ từ 4 nhóm
bệnh nhân dùng 4 loại thuốc ngủ trên là như nhau

H: loại thuốc ngủ có tác động đến thời gian ngủ, hay tồn tại 1 cặp trung bình thời gian ngủ từ 4 nhóm
bệnh nhân dùng 4 loại thuốc ngủ trên là khác nhau

C = F0,95(3; 20) = 3,1

SSB = 7.166,7^2 + 5.148^2 + 6.162,6^2 + 6.164,5^2 – 24.161,5^2 = 1034,3

SSW = 6.18,2^2 + 4.22,5^2 + 5.11,8^2 + 5.13,5^2 = 5624

F = SSB/3 x 20/SSW = 1,226

|F| < C => tạm chấp nhận H0

Chưa có đủ cơ sở để cho rằng các loại thuốc ngủ trên có ảnh hưởng khác nhau đến thời gian ngủ

Hồi quy và tương quan

Chắc chắn có thi

Hồi quy: từ giá trị thực nghiệm quy về 1 hàm lý thuyết

- Hồi quy tuyến tính: hàm lý thuyết có dạng đường thẳng


- Không học các dạng hồi quy khác

Ý nghĩa của hồi quy: dự đoán, dự báo

Hệ số tương quan thực nghiệm:

- Mô tả mức độ quan hệ tuyến tính giữa 2 BNN trên mẫu

N cặp số liệu đặc tính X, Y

R = (sigma (1 -> n) XiYi – n.X ngang.Y ngang)/((n – 1)SX.SY) => thực ra bấm máy là có (?)

|r| = 1 => tương quan hoàn toàn

Hệ số tương quan của tổng thể: pro

Phương sai hồi quy: đo lường mức độ phân tán dữ liệu xung quanh đường thẳng hồi quy

SYX^2 = (n – 1)/(n – 2) x (1 – r^2).SY^2


Cách bấm máy:

MODE > 3 > 2

- Hay: MODE > STATS > y = a+bx

Nhập mẫu > AC (nhập xong)

Shift 1 > 5 > 2 => a, b, r

- Hay: STAT (Shift 1) > REG (5)

Shift 1 > 4 > 4 => x ngang, y ngang, Sx, Sy

- Hay: STAT (Shift 1) > VAR (4)

Tự tính: Syx

Ví dụ:

Mẫu n = 17 người

(Cao, Nặng):

148 150 152 154 155 156 158 160 161 162 164 166 168

35 40 43 45 47 41 55 50 52 55 56 60 52

170 172 174 176

66 68 72 65

Tìm phương trình hồi quy của cân nặng Y theo chiều cao X

Giải:

Đặt phương trình hồi quy tuyến tính cần tìm là Y = aX + b

MODE > 3 > 2

Nhập X, Y như trên

AC (nhập xong)

Shift 1 > 5 > 2 có a, b, r

Shift 1 > 4 > 4 có x ngang, y ngang, Sx, Sy

Có a, b nên có phương trình

Khoảng dự báo của biến phụ thuộc Y: Y0 +- epsilon

Với Y0 = aX0 + b (X0 cho trước => dự báo Y0)


Dự báo cái gì: Y hay muyY

Có công thức riêng cho epsilon Y hoặc muyY

[thêm công thức]

Bấm máy là được

Kiểm định hệ số tương quan pro với 0

H0: pro = 0 (KHÔNG TƯƠNG QUAN)

H: pro <> 0

- Có thể đặt H: pro < 0 hoặc > 0 nếu đề bài yêu cầu => C = t1-alphan-2

Giá trị tới hạn: C = t1-alpha/2n-2 (alpha/2 vì <> chứ ko phải < hay >)

Giá trị thực nghiệm: T = r/căn(1 – r^2) x căn(n – 2)

Với n là cỡ mẫu

Kiểm định hệ số tương quan pro với một giá trị đã biết

H0: pro = pro0 (pro0: giá trị cho trước)

H: pro <> pro0

- Có thể đặt H: pro < pro0 hoặc > pro0 nếu đề bài yêu cầu

Giá trị tới hạn: tra bảng Z

C = Z1-alpha/2

Giá trị thực nghiệm:

Z = (Zr – Z0) x căn(n – 3)

Với:

Zr = 0,5 x ln ((r + 1)/(1 – r))

Z0 = 0,5 x ln ((pro0 +1)/(1 – pro0))

Ví dụ:

Số vi khuẩn: Y (triệu con)

Sau X giờ:

ghi nhận
0 1 2 3 4 5 6 7 8

30 32 35 40 48 52 58 62 69

Tìm hệ số tương quan thực nghiệm (r), phương trình hồi quy tuyến tính

Sau 10h số lượng ít nhất bao nhiêu với độ tin cậy 95%

Mức ý nghĩa 5%, X tăng thì Y tăng đúng không

Giải

MODE > 3 > 2

Nhập Y: số con, X: giờ như trên

AC (nhập xong)

Shift 1 > 5 > 2 có a, b, r

- R = 0,993
- A = 5,066
- B = 27,066

Shift 1 > 4 > 4 có Sx = 2,739, Sy = 13,973, x ngang = 4, y ngang = 47,333

Có Y = aX + b; r như đã có

Có n = 9 (không phải 8, vì có X = 0)

Tính phương sai hồi quy: SYX^2 = (n – 1)/(n – 2) x (1 – r^2).SY^2 = 3,112

Sau 10h: cần tìm khoảng dự báo

X0 = 10 => có Y0 = 77,726

Không nói trung bình: Y chứ ko phải muyY

Epsilon = t1-alpha/2n-2 x Syx x căn (1 + 1/n + (X0 – x ngang)^2/((n – 1)Sx^2)) = 5,457

Y0 – epsilon = 72,269 là giá trị nhỏ nhất với độ tin cậy 95%

Kiểm định pro so với 0

H0: pro = 0 (không tương quan)

H: pro > 0 (tương quan thuận)

C = t0,957 = 1,895

T = r/căn(1 – r^2) x căn(n – 2) = 22,24

|T| > C => bác bỏ H0, chấp nhận H, mức sai lầm 5%

You might also like