Professional Documents
Culture Documents
Trong phần chương 6 chúng ta đã đưa ra phương pháp để ước lượng cho tham số tổng thể dựa
trên dữ liệu mẫu dữ liệu, mục đích của chương 7 là đưa ra phương pháp cho việc kiểm tra các kết
luận đối với tham số tổng thể dựa trên mẫu dữ liệu.
Ví dụ 6.1 Một trường đại học, khảo sát về vấn đề tỷ lệ có việc làm của sinh viên sau khi học đại
học. Nếu trường đại học muốn đưa ra một số liệu về tỷ lệ có việc làm của sinh viên sau khi học, thì
đây là bài toán ước lượng. Trường hợp lúc này, trường đại học muốn khẳng định về uy tính và
chất lượng của trường ngày càng tăng, thì nhà trường phải khẳng định tỷ lệ sinh viên có việc làm
sau khi học có khuynh hướng tăng so với một mức tỷ lệ mà trường đã đạt được trong những năm
trước. Thì bài toán lúc này trở thành kiểm định giả thiết thống kê.
Trong bài toán kiểm định về giả thiết thống kê. Một giả thiết được đặt ra, thì mục tiêu chúng ta
muốn là thu thập dữ liệu để có thể khẳng định giả thiết đó là sai. Nhưng khi không thể khẳng định
giả thiết ban đầu sai, thì điều này đồng nghĩa là ta chưa thu thập đủ dữ liệu, chứ không phải là giả
thiết ban đầu đúng.
Mục tiêu bài toán có một sự tương đồng về qui trình được sử dụng tại một phiên tòa xét xử. Khi
xét xử một người vì tội trộm cắp, thì tòa án cho rằng bị cáo là vô tội cho đến khi được chứng minh
là có tội. Bên nguyên thu thập và trình bày tất cả các bằng chứng sẵn có trong một nỗ lực nhằm
phủ nhận giả thuyết “không có tội” để đạt được kết luận người này có tội. Tuy nhiên, nếu bên
nguyên thất bại trong việc bác bỏ giả thuyết “không có tội” này, thì điều này không chứng minh
được rằng bị cáo là “vô tội” mà chỉ đơn thuần là chưa có đủ bằng chứng để kết luận rằng bị cáo là
“có tội”.
Giả thiết H0 là một khẳng định mà nhà nghiên cứu không mong muốn ủng hộ. Giả thiết H0
được đặt ra để làm nền tảng tính toán cho bài toán kiểm định.
Đối thiêt H1 là sự phủ nhận của giả thiết H0 ; nghĩa là, nếu giả thuyết không là sai, thì đối thiết
phải là đúng. Và nhà nghiên cứu phải thu thập dữ liệu để cố gắng đạt được điều đó.
Quyết định bác bỏ hay chấp nhận giả thiết H0 được căn cứ vào thông tin chứa trong một mẫu
được lấy ra từ tổng thể. Các giá trị của mẫu được sử dụng để tính toán một con số duy nhất, gọi là
trị thống kê . Toàn bộ tập hợp các giá trị mà trị thống kê kiểm định này có thể có được chia thành
hai miền. Một miền, bao gồm các giá trị mà ủng hộ cho đối thiết H1 , được gọi là miền bác bỏ.
Miền kia, bao gồm các giá trị mà không mâu thuẫn với giả thuyết không, được gọi là miền chấp
nhận.
Miền chấp nhận và bác bỏ được phân cách bởi một giá trị tới hạn của trị thống kê kiểm định đó.
Nếu trị thống kê kiểm định này được tính từ một mẫu cụ thể có một giá trị nằm trong miền bác
bỏ, thì giả thuyết không bị bác bỏ, và giả thuyết thay thế H1 được chấp nhận. Nếu trị thống kê đó
rơi vào miền chấp nhận, thì hoặc là giả thuyết không được chấp nhận hoặc trị thống kê đó bị đánh
giá là không thuyết phục. Trong bất cứ trường hợp nào, thì sự thất bại trong việc bác bỏ H1
hàm ý rằng dữ liệu này không đủ bằng chứng để hỗ trợ H1 .
Ví dụ 6.2 Khảo sát về điểm trung bình của sinh viên sau khi tốt nghiệp, của một khoa, của một
trường Đại học. Chúng ta muốn biết điểm trung bình của sinh viên có khác 7,0 không. Thì giả thiết
và đối thiết như sau:
Giả thiết H0 : 7,0 Đối thiết H1 : 7,0
Công việc kiểm định được thực hiện, bằng cách khảo sát 100 sinh viên về điểm trung bình. Và tính
trung bình điểm trung bình của 1 sinh viên, giá trị là X . Vì ta đang so giữa trung bình mẫu và
trung bình tổng thể 7,0 , nên việc so sánh phải phù hợp với một sai số cho phép. Với sai số đó
ta mở ra một vùng giá trị xung quanh 7,0 . Nếu X không nằm trong vùng đó thì ta bác bỏ giả
thiết H0 , tức đối thiết H1 đúng, còn ngược lại thì ta chưa đủ bằng chứng bác bỏ H0 . Sơ đố
như sau:
Sai lầm loại I: Bác bỏ H0 khi thực tế H 0 đúng. Xác suất của việc tạo ra một sai lầm loại I được biểu
thị bởi ký hiệu .
Sai lầm loại II: Chấp nhận H0 khi thực tế H0 sai. Xác suất của việc tạo ra một sai lầm loại II được
biểu thị bởi ký hiệu .
Mức độ thích hợp của một kiểm định thống kê được đo lường bởi xác suất tạo ra sai lầm loại I và
sai lầm loại II. Bởi vì là xác suất của việc bác bỏ H0 khi thực tế giả thuyết này là đúng, cho nên
đây là một đại lượng của cơ may bác bỏ sai H0 . Bởi vì là xác suất của việc chấp nhận H0 khi
thực tế giả thuyết này là sai, cho nên phần bù của nó, 1 là xác suất của việc bác bỏ H 0 khi thực
tế giả thuyết này là sai. Xác suất 1 được gọi là năng lực của sự kiểm định của mô hình.
Một cách thức khác để báo cáo kết quả kiểm định là thông qua giá trị p ( p -value). Xác suất
của việc tạo ra sai lầm loại I thường gọi là mức ý nghĩa của mô hình kiểm định, và trong quá trình
kiểm định thì chúng ta có thể chọn các mức ý nghĩa khác nhau (ví dụ như 0,05 z /2 1,96 ,
0,01 z /2 2,58 ,…) nên đôi khi kết quả kiểm định bác bỏ với mức ý nghĩa thứ nhất, nhưng
lại chấp nhận với mức ý nghĩa thứ hai. Nên đôi khi các bài báo cáo sẽ chọn mức ý nghĩa thấp nhất
để mô hình kiểm định có ý nghĩa.
Giá trị p hay mức ý nghĩa quan sát được là giá trị nhỏ nhất của mà qua đó các mô hình kiểm
định có ý nghĩa về mặt thống kê
Nếu một kết quả kiểm định có ý nghĩa về mặt thống kê với 0,10 nhưng không có ý nghĩa với
0,05 thì ta có thể hiểu giá trị p là một số trong khoảng 0,05 p 0,10 . Hay nói cách khác nếu
giá trị p nhỏ hơn giá trị , thì ta bác bỏ giả thiết H 0 và ngược lại.
6.2 KIỂM ĐỊNH GIẢ THIẾT CHO MỘT GIÁ TRỊ TỶ LỆ TỔNG THỂ.
Quan sát từng phần tử, coi phần tử quan sát có mang tính chất A hay không. Thực hiện công việc
n lần, tương ứng chính là mẫu dữ liệu. Gọi X là biến ngẫu nhiên chỉ số phần tử mang tính chất A
, kết hợp giả thiết p p0 ta có (theo chương 3 và 6) ta có:
X np0
X ~ N npo , np0 1 p0 z ~ N 0;1
np0 1 p0
Đặt f là tỷ lệ phần tử mang tính chất A trong n phần tử quan sát. Ta có
X
X np0 p0 f p0
z n n ~ N 0;1
np0 1 p0 np0 1 p0 p0 1 p0
n
CHƯƠNG 6: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 61
Giá trị z mang ý nghĩa đo mức chênh lệch giữa f (tỷ lệ phần tử mang tính chất A trên mẫu dữ
liệu, đại diện cho p ) với p0 .
Trong bài toán kiểm định với giả thiết H0 : p p0 và đối thiết H1 : p p0 .
Mức ý nghĩa được phân đều 2 phía và P z z /2 : là
xác suất quyết định bác bỏ giả thiết H 0 khi thực tế giả thiết
H0 đúng.
Nghĩa là ta chấp nhận đối thiết H1 khi z z /2 hoặc
z z /2
Trong bài toán kiểm định với giả thiết H0 : p p0 và đối thiết H1 : p p0 .
Trong bài toán kiểm định với giả thiết H0 : p p0 và đối thiết H1 : p p0 .
Trị thống kê là : z
f p0
n
p0 1 p0
4. Miền bác bỏ
62
Đối thiết : H1 : p p0 Đối thiết : H1 : p p0 Đối thiết : H1 : p p0
Bác bỏ H0 khi: Bác bỏ H 0 khi: Bác bỏ H 0 khi:
z z /2 z z /2 z z
z z /2
z z /2
Ví dụ 6.3 Các báo cáo trước đây khảo sát về gia cảnh của sinh viên năm nhất ở một trường đại
học cho biết có 86% sinh viên đại học năm thứ nhất. Năm nay,trường đại học này làm một cuộc
khảo sát tương tự về vấn đề trên, khi hỏi 1000 sinh viên năm thứ nhất được chọn ngẫu nhiên thì
thấy có 890 sinh viên được nhận hỗ trợ tài chính từ gia đình. Với mức ý nghĩa 5% , các báo cáo
trên có còn đúng cho tình hình sinh viên năm nay hay không.
Giải. Mô hình kiểm định trong trường hợp này có dạng
1. H0 : p 86% và H1 : p 86%
Trong đó p là tỷ lệ sinh viên năm nhất nhận được hỗ trợ tài chính từ gia đình.
890
Và dữ liệu đề bài cho: n 1000 và f 0,89
1000
f p0
2. Trị thống kê dùng trong mô hình này là z n
p0 1 p0
Trong đó p0 0,86 nên ta có z 2,734
3. Mức ý nghĩa của kiểm định là 5% tương ứng phân vị z /2 1,96 .
Kết luận : vì trị thống kê cao hơn phân vị z z /2 nên ta hoàn toàn có thể bác bỏ giả thiết H0 , tức
tỷ lệ sinh viên năm nhất năm nay nhận được hỗ trợ tài chính từ gia đình khác với báo cáo các năm
trước.
6.3 KIỂM ĐỊNH GIẢ THIẾT CHO MỘT TRUNG BÌNH TỔNG THỂ.
2
của mẫu là X , (theo chương 5) ta có X ~ N ; . Kết hợp giả thiết 0 , đặt:
n
X X 0
z n ~ N 0;1
2
n
CHƯƠNG 6: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 63
Giá trị của z đo mức độ chênh lệch giữa trung bình mẫu (đại diện cho ) và 0 , là trị thống kê
trong mô hình kiểm định giả thiết H 0 : 0 .
Trong trường hợp phương sai tổng thể chưa biết, ta thay thế phương sai tổng thể bằng phương
sai mẫu S 2 . Đặt:
X X 1 X n 1
z . .
S S n 1 S 2
n n n 2
X n 1 S 2 X
n ~ t n 1
Trong đó ~ N 0;1 và ~ n21 nên z
2
S
n
Nhưng khi cỡ mẫu lớn hơn 30 thì phần phôi Student xấp xỉ bằng phân phối chuẩn. Nên khi phương
sai tổng thể chưa biết và cỡ mẫu n 30 , ta có:
X
n ~ N 0;1
z
S
6.3.2 So sánh trung bình tổng thể với một số khi biết phương sai.
1. Giả thiết không H0 : 0 .
2. Giả thiết đối.
Kiểm định hai phía Kiểm định một phía
H1 : 0 H1 : 0
H1 : 0
3. Trị thống kê
X 0
Trị thống kê : z n
4. Miền bác bỏ
Kiểm định 2 phía Kiểm định 1 phía Kiểm định 1 phía
Đối thiết : H1 : 0 Đối thiết : H1 : 0 Đối thiết : H1 : 0
Bác bỏ H0 khi: Bác bỏ H 0 khi: Bác bỏ H 0 khi:
z z /2 z z z z
z z /2
6.3.3 So sánh trung bình tổng thể với một số khi không biết phương sai.
1. Giả thiết không H0 : 0 .
2. Giả thiết đối.
Kiểm định hai phía Kiểm định một phía
H1 : 0 H1 : 0
H1 : 0
3. Trị thống kê
X 0
Trị thống kê : z n
S
64
4. Miền bác bỏ
a. Trường hợp cỡ mẫu n 30 , trị thống kê có quy luật phân phối chuẩn : z ~ N 0;1 .
Kiểm định 2 phía Kiểm định 1 phía Kiểm định 1 phí
Đối thiết : H1 : 0 Đối thiết : H1 : 0 Đối thiết : H1 : 0
Bác bỏ H0 khi: Bác bỏ H 0 khi: Bác bỏ H 0 khi:
z z /2 z z z z
z z /2
b. Trường hợp cỡ mẫu n 30 , trị thống kê có quy luật phân phối Student, bậc tự do
n 1 : z ~ t n 1 .
Kiểm định 2 phía Kiểm định 1 phía Kiểm định 1 phía
Đối thiết : H1 : 0 Đối thiết : H1 : 0 Đối thiết : H1 : 0
Bác bỏ H0 khi: Bác bỏ H 0 khi: Bác bỏ H 0 khi:
n 1
z t n 1
/2 z t z tn1
n 1
z t /2
Ví dụ 6.4 Sản lượng hàng ngày tại một nhà máy hóa chất, được ghi nhận cho n 50 ngày, có một
số trung bình và độ lệch chuẩn của mẫu là X 871 tấn và S 21 tấn. Hãy kiểm định giả thuyết
rằng sản lượng bình quân hàng ngày của nhà máy đó là 880 tấn mỗi ngày so với giả thuyết
thay thế là hoặc lớn hơn hay nhỏ hơn 880 tấn mỗi ngày.
Giải:
Mô hình kiểm định:
1. H 0 : 880 tấn và H1 : 880 tấn
Với là sản lượng trung bình của nhà máy hóa chất trong một ngày.
X 0
2. Trị thống kê : z
S/ n
Trong đó X 871; 880; S 21; n 50 , vậy ta có z 3,03
Ví dụ 6.5 Khảo sát về việc đánh bắt các ngừ tại một vùng biển trong năm qua. Một báo cáo cho
biết trọng lượng trung bình một con cá ngừ trong các năm trước là khoảng 30,31 pound
CHƯƠNG 6: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 65
1pound 0.453592kg . Nhưng gần đây việc đánh bắt cá ngừ gia tăng, làm ảnh hưởng đến trọng
lượng trung bình của một con cá ngừ trong vùng, khảo sát mẫu gồm 20 con cho bảng số liệu sau:
17,4 18,9 39,6 34,4 19,6 24,1 39,6 12,2 25,5 22,1
33,7 37,2 43,4 41,7 27,5 29,3 21,1 23,8 43,2 24,4
Hỏi mẫu dữ liệu trên có đủ sức bác bỏ luận điểm trên hay không với mức ý nghĩa 5%
Giải. Mô hình kiểm định tương ứng bài toán là:
1. H0 : 30,31 và H1 : 30,31
Trong đó là trọng lượng trung bình của 1 con cá ngừ bắt tại vùng biển này.
2. Trị thống kê của mô hình: (cỡ mẫu nhỏ n 20 ; phương sai tổng thể chưa biết) :
X 0
z n
S
Với các số liệu thu được ta có n 20 ; X 28,935 ; S 9,5074 . Nên ta có giá trị của trị thống kê:
z 0,6468 .
3. Với mức ý nghĩa 5% ta có phân vị sử dụng t n/21 t 0,025
19
2,093 .
6.4 KIỂM ĐỊNH GIẢ THIẾT CHO PHƯƠNG SAI TỔNG THỂ.
Trong trường hợp, tổng thể biết giá trị trung bình là và kết hợp giả thiết H0 : 2 02 . Với mẫu
dữ liệu lần lượt nhận giá trị X i với i 1, n , ta có
Xi
X i ~ N , 02
0
~ N 0;1 với i 1, n .
X
2
i
i 1
~ n2
02
Như vậy là trị thống kê trong mô hình kiểm định giả thiết H0 : 0 , với quy luật phân phối
2 2
n 1 S 2 ~ 2
n 1
02
Và ta có lúc này là trị thống kê cho mô hình kiểm định H0 : 2 02 , khi không biết trung bình
tổng thể, và có quy luật phân phối Chi bình phương bậc tự do n 1 .
6.4.2 So sánh phương sai tổng thể với một số khi biết trung bình µ.
1. Giả thiết không H0 : 2 02 .
66
x
2
i
Trị thống kê : i 1
02
4. Miền bác bỏ.
Trị thống kê có quy luật phân phối Chi bình phương bậc tự do n : ~ n2
Kiểm định 2 phía Kiểm định 1 phí Kiểm định 1 phía
6.4.3 So sánh phương sai tổng thể với một số khi chưa biết trung bình µ.
1. Giả thiết không H0 : 0 .
2 2
Đối thiết : H1 : 0 Đối thiết : H1 : 0 Đối thiết : H1 : 0
2 2 2 2 2 2
CHƯƠNG 6: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 67
Ví dụ 6.6 Một nhà máy sản xuất tay đòn kim loại dùng trong hệ thống giảm xóc của xe máy, một
mẫu gồm 15 tay đòn được chọn ngẫu nhiên,và được đo đạc đường kính. Kết quả theo đơn vị mm
cho bởi bảng dữ liệu sau:
8.24 8.25 8.2 8.23 8.24
8.21 8.26 8.26 8.2 8.25
8.23 8.23 8.19 8.28 8.24
Biết rằng các báo cáo trước đây khẳng định đường kính của tay đòn do nhà máy sản xuất có giá trị
trung bình là 8,22mm, và độ lệch chuẩn là 0,02mm. Hỏi các báo cáo trước đây về phương sai của
đường kính tay đòn có còn đúng với mức ý nghĩa 5% hay không.
Giải. Mô hình kiểm định có dạng là
1. H0 : 2 0,022 và H1 : 2 0,022
x
2
i
2. Trị thống kê của mô hình: (trường hợp trung bình tổng thể đã biết) i 1
.
02
Trong đó x i là đường kình của tay đòn thu từ mẫu dữ liệu, 8,22 , 02 0,022 . Ta có giá trị trị
thống kê: 29,75 .
Ví dụ 6.7 Một xí nghiệp sản xuất xi măng đã xác nhận rằng bê tông được làm từ xi măng của xí
2
nghiệp có sức chịu nén kg / cm khá ổn định theo tiêu chuẩn xây dựng là sức chịu nén dao động
quanh giá trị trung bình với độ lệch 10 kg / cm2 . Khảo sát trên n 10 mẫu bê tông đo tạo ra một
số trung bình và phương sai lần lượt bằng với X 312; S 2 195 . Liệu có đủ bằng chứng bác bỏ sự
xác nhận của nhà máy này không rằng sức chịu nén của bê tông là không ổn định, với mức ý nghĩa
5%.
Giải: Mô hình kiểm định trong trường hợp này có dạng
1. H0 : 2 102 và H1 : 2 102
n 1 S 2
2. Trị thống kê dùng trong mô hình này là
02
Trong đó n 10; 0 10; S 195 , nên trị thống kê 17,55 .
3. Mức ý nghĩa của kiểm định là 5% tương ứng phân vị n1 0,05
9
16,919 .
4. Kết luận : vì trị thống kê cao hơn phân vị ( 0,05
9
) nên ta hoàn toàn có thể bác bỏ khẳng
định của nhà máy này về bê tông của họ.
68
6.5 KIỂM ĐỊNH GIẢ THIẾT CHO HAI GIÁ TRỊ TỶ LỆ TỔNG THỂ.
6.5.1 Kiểm định giả thiết so sánh 2 tỷ lệ tổng thể sử dụng phân phối chuẩn.
i. Phân tích.
Xét hai tổng thể và một đặc trưng A , mỗi phần tử trong tổng thể chỉ mang hai tính chất là có tính
chất A hoặc không có tính chất A . Xét trên hai mẫu cụ thể lấy từ mỗi tổng thể, ta cần kiểm định
giả thiết tỷ lệ phần tử có tính chất A trong hai tổng thể này có bằng nhau hay không với mức ý
nghĩa .
Gọi f1 ; f2 là tỷ lệ phần tử mang đặc trưng A của hai mẫu, (theo chương 5) ta có :
p 1 p1 p2 1 p2
f1 ~ N p1 ; 1 ; f2 ~ N p2 ;
n1 n2
p 1 p1 p2 1 p2
Vậy f1 f2 ~ N p1 p2 ; 1 , nên ta có
n1 n2
f1 f2 p1 p2
z ~ N 0;1
p1 1 p1 p2 1 p2
n1 n2
Kết hợp giả thiết H0 : p1 p2 và gọi f là tỷ lệ phần tử mang đặc trưng A của cả hai mẫu dùng để
ước lượng cho p1 và p2 . Ta có
f1 f2 f1 f2
z ~ N 0;1
f 1 f f 1 f 1 1
f 1 f
n1 n2 n1 n2
z là trị thống kê cho mô hình kiểm định giả thiết về sự bằng nhau của 2 tỷ lệ phần tử mang đặc
trưng A trên hai tổng thể.
ii. Mô hình kiểm định.
1. Giả thiết không H0 : p1 p2
2. Giả thiết đối
Kiểm định hai phía Kiểm định một phía
H1 : p1 p2 H1 : p1 p2
H1 : p1 p2
3. Trị thống kê
Với f1 ; f2 : tỷ lệ phần tử mang tính chất A trên mỗi mẫu.
Với f : tỷ lệ phần tử mang tính chất A của 2 mẫu :
n1 f1 n2 f2
f
n1 n2
f1 f2
Trị thống kê : z
1 1
f 1 f
n1 n2
Trong đó f là tỷ lệ phần tử loại A của 2 mẫu lấy trên hai tổng thể.
4. Miền bác bỏ.
Trị thống kê có quy luật phân phối chuẩn : z ~ N 0;1
CHƯƠNG 6: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 69
Đối thiết : H1 : p1 p2 Đối thiết : H1 : p1 p2 Đối thiết : H1 : p1 p2
Bác bỏ H0 khi: Bác bỏ H0 khi: Bác bỏ H0 khi:
z z /2 z z z z
z z /2
Ví dụ 6.8 Một nguời quản lý bệnh viện nghi ngờ rằng trễ hạn trong việc thanh toán các hóa đơn
viện phí đã gia tăng trong năm vừa qua. Hồ sơ lưu trữ của bệnh viện cho thấy rằng các hóa đơn
của 48 trong số 1284 người nhập viện trong tháng Tư đã trễ hạn trong hơn 90 ngày. Con số này
so với 34 trong số 1002 người nhập viện trong cùng tháng này năm trước đó. Liệu những dữ liệu
này có cung cấp đủ bằng chứng để cho thấy có một sự gia tăng trong tỷ lệ trễ hạn thanh toán vượt
quá 90 ngày không? Hãy kiểm định qua việc sử dụng 0,10 .
Giải: Vì chúng ta muốn kiểm định có một sự gia tăng trong tỷ lệ, nên mô hình kiểm định có dạng
1. H0 : p1 p2 và H0 : p1 p2
(trong đó chỉ số 1 tương trưng số liệu năm cũ và chỉ số 2 chỉ số liệu cho năm nay)
6.5.2 Kiểm định giả thiết so sánh 2 tỷ lệ tổng thể sử dụng phân phối chi bình
phương
i. Phân tích.
Thay vì dùng kiểm định z cho hai tỷ lệ tổng thể thông qua việc so sánh trực tiếp hai giá trị tỷ lệ.
Ta có thể dùng kiểm định bằng cách sử dụng bảng 2 chiều bai gồm tần số thành công và không
thành công trong hai nhóm :
Biến trên cột
Biến trên hàng Nhóm 1 Nhóm 2 Tổng
Thành công X1 X2 X X 1 X2
Không thành công n1 X 1 n2 X 2 n X
Tổng n1 n2 n n1 n2
Trong đó
X1 ; X2 : tần số thực tế thành công trong nhóm 1 và 2.
70
O Eij
2
Eij
4. Trị tới hạn : Với mức ý nghĩa , tra bảng Chi bình phương : 2,1 .
Đối thiết H 1 : X ;Y không độc lập với nhau.
Bác bỏ H 0 khi: G
2;1
Ví dụ 6.9 Một công ty sở hữu hai khu nghỉ dưỡng trên một hòn đảo du lịch đã tiến hành một
cuộc khảo sát sự hài lòng của khách hàng sau khi họ nghỉ tại đây, trong bảng câu hỏi điều tra có
câu hỏi về việc khác hàng có dự định quay lại đây một lần nữa không? Số liệu thu được cho trong
bảng bên dưới. Với mức ý nghĩa 5%, có bằng chứng thống kê nào cho thấy có sự khác biệt trong
mức độ hài lòng của khách hàng (đo bằng ý định họ sẽ quay trở lại) tại hai khu nghỉ dưỡng A và B
hay không.
Khu nghỉ
Dự định quay lại A B Tổng
Có 163 154 317
Không 64 108 172
Tổng 227 262 489
CHƯƠNG 6: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 71
Giả thiết H 0 : p1 p2 ( p1 ; p2 là tỷ lệ khách hàng dự định quay lại khu nghỉ dưỡng A và B)
Đối thiết H 1 : p1 p2
Bảng tần số thực tế
Khu nghỉ
Dự định quay lại A B Tổng
317
Có E 11 163 E 12 154 317 ps
489
172
Không E 21 64 E 22 108 172 1 ps
489
Tổng 227 262 489
Bảng tần số lý thuyết
Khu nghỉ
Dự định quay lại A B Tổng
Có 317 317 317
O11 .227 O12 .262
489 489
Không 172 172 172
O21 .227 O22 .262
489 489
Tổng 227 262 489
O Eij
2
6.6 KIỂM ĐỊNH GIẢ THIẾT CHO HAI TRUNG BÌNH TỔNG THỂ.
z
X 1
X 2 1 2
X 1 X2 ~ N 0;1
2
2
2
2
1
2 1
2
n1 n2 n1 n2
z là trị thống kê trong mô hình kiểm định giả thiết H 0 : 1 2 , khi biết phương sai hai tổng thể.
6.6.2 So sánh hai trung bình tổng thể khi biết phương sai.
72
Đối thiết : H1 : 1 2 Đối thiết : H1 : 1 2 Đối thiết : H1 : 1 2
Bác bỏ H 0 khi: Bác bỏ H 0 khi: Bác bỏ H 0 khi:
z z /2 z z z z
z z /2
6.6.3 So sánh hai trung bình tổng thể khi không biết phương sai và cỡ mẫu lớn.
1. Giả thiết không H 0 : 1 2
2. Giả thiết đối
Kiểm định hai phía Kiểm định một phía
H1 : 1 2 H1 : 1 2
H1 : 1 2
3. Trị thống kê
Với hai mẫu có các dữ liệu như sau:
Mẫu Cỡ mẫu Trung bình mẫu Độ lệch chuẩn
I n1 30 X1 S1
II n2 30 X2 S2
X1 X 2
Trị thống kê : z
S 12 S 22
n1 n2
4. Miền bác bỏ
CHƯƠNG 6: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 73
6.6.4 So sánh hai trung bình tổng thể khi không biết phương sai, phương sai
bằng nhau và cỡ mẫu nhỏ.
1. Giả thiết không H 0 : 1 2
2. Giả thiết đối H 0
Kiểm định hai phía Kiểm định một phía
H1 : 1 2 H1 : 1 2
H1 : 1 2
3. Trị thống kê
Với hai mẫu có các dữ liệu như sau:
Mẫu Cỡ mẫu Trung bình mẫu Độ lệch chuẩn
I n1 30 X1 S1
II n2 30 X2 S2
n1 1 S n2 1 S
2 2
Với S 2
1 2
n1 n2 2
X1 X 2 X1 X 2
Trị thống kê : z
S 2
S 2
1 1
S2
n1 n2 n1 n2
4. Miền bác bỏ
Trường hợp phân vị z ~ t n1 n2 2 .
Kiểm định 2 phía Kiểm định 1 phía Kiểm định 1 phía
Đối thiết : H1 : 1 2 Đối thiết : H1 : 1 2 Đối thiết : H1 : 1 2
Ví dụ 6.10 Một cửa hàng bán thức ăn nhanh đã cân nhắc sử dụng phiếu giảm giá để kích thích
doanh số bán hàng của mình. Công ty đặc biệt quan tâm đến việc liệu có sự khác biệt giữa những
74
người độc thân so với các cặp vợ chồng đối với việc dùng phiếu giảm giá không. Một cuộc thăm dò
của người tiêu dùng đã yêu cầu họ trả lời câu hỏi "Bạn có sử dụng phiếu giảm giá thường xuyên?"
Theo thang điểm số, trong đó 1 là đồng ý mạnh mẽ, 2 cho đồng ý, 3 cho trung lập, 4 cho không
đồng ý, và 5 cho không đồng ý mạnh mẽ. Kết quả cuộc thăm dò được đưa ra trong bảng sau:
Người độc thân Cặp vợ chồng
n1 31 . n2 57 .
X 1 3,10 X2 2,43
S 1 1,460 S 2 1,350
Theo dữ liệu thu được, hỏi có sự khác biệt về điểm đánh giá trung bình của hai nhóm người khảo
sát với mức ý nghĩa 5% hay không
Giải. Mô hình kiểm định trong trường hợp này
1. H 0 : 1 2 và H1 : 1 2
Trong đó 1 ; 2 là điểm trung bình của nhóm người độc thân và nhóm các các cặp vợ chồng cho
đối với phiếu giảm giá.
X1 X 2
2. Trị thống kê trong mô hình: (Không biết phương sai, cỡ mẫu lớn) z .
S 12 S 22
n1 n2
4. Kết luận: Vì z z /2 nên bác bỏ giả thiết H 0 , nghĩa là hai nhóm người này có điểm đánh
giá trung bình cho phiếu khuyến mãi là khác nhau.
Ví dụ 6.11 Một công ty hóa chất, quan tâm ảnh hưởng của chất xúc tác ảnh hưởng đến tốc độ
trung bình của một quá trình hóa học. Một thử nghiệm được chạy trong nhà máy thí điểm và kết
quả trong các dữ liệu thể hiện trong bảng sau. Dựa trên dữ liệu, hỏi có sự khác nhau giữa tốc độ
trung bình của quá trình hóa học bị tác động bởi hai chất xúc tác khác nhau hay không với mức ý
nghĩa 5% và phương sai về tốc độ phản ứng tương ứng 2 chất xúc tác giống nhau.
Quá trình 1 2 3 4 5 6 7 8
Chất xúc tác 1 91.5 94.18 92.18 95.39 91.79 89.07 94.72 89.21
Chất xúc tác 2 89.19 90.95 90.46 93.21 97.19 97.04 91.07 92.75
Giải. Mô hình kiểm định trong trường hợp này là:
1. H 0 : 1 2 và H 0 : 1 2 .
Trong đó 1 ; 2 là tốc độ phản ứng trung bình khi cho tương ứng chất xúc tác 1 và 2.
2. Trị thống kê cho mô hình: (cỡ mẫu nhỏ, phương sai chưa biết và bằng nhau)
X X2 X 1 X2
z 1 .
S2 S2 2 1 1
S
n1 n2 n1 n2
Từ hai mẫu dữ liệu cho ta các kết quả về tốc độ của phản ứng hóa học ảnh hưởng bởi hai chất xúc
tác là:
Cỡ mẫu Trung bình Độ lệch chuẩn
Chất xúc tác 1 8 X1 92,255 S 1 2,39
CHƯƠNG 6: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 75
S 2
n1 1 S12 n2 1 S22 7.2,392 7.2,982
7,29625 .
n1 n2 2 8 8 2
Vậy trị thống kê của mô hình kiểm định là z 0,3539 .
3. Phân vị sử dụng trong mô hình: tn1/2n2 2 t0,025
14
2.145 .
Kết luận: Vì z t0,025 nên không đủ bằng chứng để bác bỏ giả thiết H 0 nghĩa là tốc độ trung
14
4.
bình của phản ứng hóa học khi tác động bởi 2 chất xúc tác là như nhau.
6.7 KIỂM ĐỊNH GIẢ THIẾT CHO HAI PHƯƠNG SAI TỔNG THỂ
Khi cần có một phương pháp để thực hiện kiểm định 2 tổng thể có biến động cùng mức độ như
nhau hay không (ví dụ tính ổn định của phương pháp sản xuất, cách cho điểm của 2 giảng viên đại
học…) chúng ta dùng phương pháp kiểm định phương sai của hai tổng thể độc lập:
1. Giả thiết không H0 :1 2 .
2 2
Đối thiết : H1 : 2
1
2
2 Đối thiết : H1 :
2
1
2
2 Đối thiết : H1 :
2
1
2
2
F n1/2;n2
Xét một tổng thể trên đó có hai dấu hiệu định tính X ;Y . Giả sử thuộc tính X có k trường hợp là
x1 ; x2 ;...; x k , và thuộc tính Y có m trường hợp là y1 ; y2 ;...; ym . Khảo sát một bộ mẫu gồm n dữ liệu,
bảng tần số tương ứng với từng cặp trường hợp của 2 thuộc tính X ;Y có dạng:
X Y y1 y2 … yj … ym Tổng cột
x1 n11 n12 … n1 j … n1m p1
x2 n21 .. … n2 j … n2m p2
… … … … … … … …
xi ni1 ni 2 … nij … nim pi
… … … … … … … …
xk nk 1 nk 2 ... nkj … nkm pk
Tổng hàng q1 q2 … qj … qm n
m k
Trong đó pi nij và q j nij
j 1 i 1
Giả thiết H 0 đặt ra là hai thuộc tính X ;Y là độc lập với nhau. Theo giả thiết đó ta có
P X xi Y y j P X x i .P Y y j
nij
pi q j
Và tương đương với . với mọi i 1, k ; j 1, m .
n n n
Vì thế trị thống kê cho mô hình kiểm định giả thiết H0 là:
nij pi q j
.
n n n
G n
k m
~ 2k 1m 1
i 1 j 1 pi q j
.
n n
Rút gọn biểu thức G ta có công thức tính trị thống kê:
k m nij2
G n 1
i 1 j 1 p .q
i j
6.8.2 Kiểm định độc lập của hai bộ dữ liệu định tính.
1. Giả thiết không H 0 : X ;Y độc lập với nhau.
2. Giả thiết đối H1 : X ;Y không độc lập với nhau.
3. Trị thống kê
Với nij : chỉ số phần tử mà thuộc tính X nhận giá trị xi và thuộc tính Y nhận
Ví dụ 6.12 Một hãng bánh muốn khảo sát về sự ảnh hưởng của màu sắc đối với các loại bánh được
khách hàng chọn mua. Một mẫu gồm 148 chiếc bánh được bán ra có kết quả như sau
Bánh đậu Bánh dừa Bánh thập cẩm
Màu tự nhiên 20 25 18
Phẩm màu 29 43 13
Với mức ý nghĩa 5% , kiểm định bánh được chọn mua có ảnh hưởng bởi màu sắc không.
Bánh đậu Bánh dừa Bánh thập cẩm Tổng cột
Màu tự nhiên 20 25 18 63
Phẩm màu 29 43 13 85
Tổng dòng 49 68 31 148
Mô hình kiểm định
1. H0 : Màu sắc và loại bánh độc lập với nhau.
H1 : Màu sắc và loại bánh phụ thuộc vào nhau.
2. Trị thống kê :
202 252 182 292 432 132
G 148 4,0552
49.63 68.63 31.63 49.85 68.85 31.85
3. Với mức ý nghĩa 5% ta có phân vị của phân phối Chi bình phương bậc tự do 2 1 3 1
là 0,05 5,991
3
Kết luận : Vì G 0,05 nên chấp nhận giả thiết H 0 nghĩa bánh được mua, giữa loại bánh và
3
4.
màu sắc là độc lập với nhau.