Chương VIII P2. Kiểm Định Giả Thiết - So Sánh Hai Quần Thể

Chương VIII P2.
Kiểm định giả thiết – So sánh

hai quần thể
Chương 11:
Kiểm tra giả thuyết:
So sánh hai quần thể
11.1 Giới thiệu
11.2 Kiểm tra sự khác biệt giữa hai trung bình quần thể: Mẫu độc lập
11.3 Kiểm tra sự khác biệt giữa 2 trung bình quần thể: Kiểm định cặp phù hợp
11.4 Kiểm tra sự khác biệt giữa hai tỷ lệ quần thể
11.5 Tóm tắt
CÁC LOẠI THUỐC ĐẮT TIỀN CÓ CỨU ĐƯỢC NHIỀU MẠNG SỐNG HƠN
KHÔNG?
Có hai loại thuốc được sử dụng để chữa trị cho các bệnh nhân đau tim. Streptokinase,
loại thuốc ít tốn kém hơn, đã có sẵn từ năm 1959. Loại thuốc thứ hai, đắt tiền hơn là t-
PA, một sản phẩm biến đổi gen. Cả streptokinase và t-PA đều hoạt động bằng cách mở
các động mạch và làm tan cục máu đông, là nguyên nhân gây ra các cơn đau tim. Một
số nghiên cứu trước đây đã không tiết lộ bất kỳ sự khác biệt nào giữa tác dụng của hai
loại thuốc. Do đó, ở nhiều quốc gia nơi chăm sóc sức khỏe được tài trợ bởi chính phủ,
các bác sĩ được yêu cầu sử dụng streptokinase ít tốn kém hơn. Tuy nhiên, nhà sản xuất
của t-PA, Genentech Inc., cho rằng trong các nghiên cứu trước đó cho thấy không có sự
khác biệt giữa hai loại thuốc, t-PA đã không được sử dụng đúng cách. Genentech quyết
định tài trợ cho một kiểm định kỹ lưỡng hơn. Thí nghiệm được tổ chức tại 15 quốc gia,
bao gồm Úc, Hoa Kỳ và Canada, và có sự tham gia của tổng cộng 41.000 bệnh nhân.
Trong nghiên cứu này, t-PA đã được trao cho bệnh nhân trong vòng 90 phút, thay vì ba
giờ như trong các kiểm định trước đó. Một nửa số mẫu 41.000 bệnh nhân được điều trị
bằng cách tiêm nhanh t-PA bằng heparin tiêm tĩnh mạch, trong khi nửa còn lại nhận
streptokinase cùng với heparin. Số ca tử vong trong mỗi mẫu đã được ghi nhận. Tổng
cộng có 1497 bệnh nhân được điều trị bằng streptokinase đã chết, trong khi 1292 bệnh
nhân dùng t-PA đã chết. Vậy liệu đủ bằng chứng để hỗ trợ những phát hiện của các
nghiên cứu trước đây rằng không có sự khác biệt giữa tác dụng của hai loại thuốc? Giải
pháp được hiển thị trên trang 474.
Phần 11.1 Giới thiệu

Trong chương này, chúng ta tiếp tục cuộc hành trình vào thế giới tuyệt vời của suy luận thống
kê. Chúng tôi sẽ mở rộng phạm vi kỹ thuật bằng cách thảo luận về cách thực hiện các kiểm
1
định giả thuyết khi mục tiêu vấn đề liên quan đến việc so sánh hai quần thể. Khi kiểu dữ liệu
là định lượng, chúng tôi sẽ kiểm tra các giả thuyết về sự khác biệt giữa hai trung bình quần thể,
1 − 2 . Khi kiểu dữ liệu là định tính, chúng tôi sẽ kiểm tra các giả thuyết về sự khác biệt giữa
hai tỷ lệ dân số, p1 − p2 . Ví dụ về việc sử dụng các phương pháp này bao gồm:
1 Các nhà quản lý thị trường và nhà quảng cáo rất háo hức muốn biết phân khúc dân số nào
đang mua sản phẩm của họ. Nếu họ có thể xác định các nhóm này, họ có thể nhắm mục
tiêu thông điệp quảng cáo của họ và điều chỉnh sản phẩm của họ cho những khách hàng
này. Ví dụ: nếu các nhà quảng cáo xác định rằng quyết định mua một sản phẩm gia dụng
cụ thể được đưa ra thường xuyên hơn bởi nam giới so với phụ nữ, thì sự quan tâm và mối
quan tâm của nam giới sẽ là trọng tâm của hầu hết các thông điệp thương mại. Ihe lựa chọn
phương tiện quảng cáo cũng phụ thuộc vào việc sản phẩm được nam giới hay phụ nữ quan
tâm nhiều hơn. Cách phổ biến nhất để đo lường yếu tố này là tìm sự khác biệt về tỷ lệ nam
và nữ mua sản phẩm. Trong những tình huống này, tham số cần kiểm tra là p1 − p2 , sự khác
biệt giữa hai tỷ lệ dân số.
2 Người tiêu dùng mua tivi, thiết bị gia dụng chính và xe hơi coi độ tin cậy là yếu tố chính
trong sự lựa chọn thương hiệu của họ. Độ tin cậy có thể được đo bằng lượng thời gian sản
phẩm tồn tại. Để so sánh hai thương hiệu tivi, chúng tôi sẽ kiểm tra 1 − 2 , sự khác biệt
giữa tuổi thọ trung bình của hai thương hiệu.
3 Giám sát sản xuất và kỹ sư kiểm soát chất lượng chịu trách nhiệm đo lường, kiểm soát và
giảm thiểu số lượng đơn vị bị lỗi được sản xuất tại nhà máy. Thông thường, nhiều hơn một
phương pháp hoặc máy móc có thể được sử dụng để thực hiện chức năng sản xuất. Quyết
định mua và sử dụng một trong hai máy nào thường phụ thuộc vào máy nào tạo ra tỷ lệ
đơn vị lỗi nhỏ hơn - hay nói cách khác, dựa trên thông số p1 − p2 , sự khác biệt về tỷ lệ của
các đơn vị bị lỗi từ mỗi máy.
4 Các nhà khoa học y tế tham gia vào các dự án nghiên cứu khác nhau. Một số dự án đang
xem xét các cách để giảm mức cholesterol, vì mức cholesterol cao có liên quan đến các
cơn đau tim và đột quỵ. Một phương pháp kiểm tra hiệu quả của một loại thuốc mới là đưa
thuốc cho một nhóm người và giả dược (một viên thuốc không có thuốc) cho một nhóm
người khác. Để đánh giá thuốc hoạt động tốt như thế nào, việc giảm cholesterol sẽ được
đo cho mỗi người. Mức giảm trung bình cho những người dùng thuốc ( 1 ) có thể được so
sánh với mức giảm trung bình cho những người dùng giả dược (  2 ). Mục tiêu là để kiểm
tra xem cái trước có lớn hơn cái sau hay không. Tham số quan tâm là sự khác biệt giữa hai
phương tiện 1 − 2 .
Phần 11.2 Kiểm tra sự khác biệt giữa hai trung bình quần thể:
Các mẫu độc lập
Trong phần này, chúng tôi xem xét các mẫu độc lập — các mẫu hoàn toàn không liên quan đến
nhau. Trong Phần 11.3, chúng tôi sẽ xem xét kiểm định các cặp phù hợp.
Trong Chương 10, chúng tôi đã trình bày quy trình sáu bước được sử dụng để kiểm tra các giả
thuyết cho một tham số quần thể duy nhất. Chúng ta sẽ trải qua sáu bước tương tự để kiểm tra
các giả thuyết liên quan đến hai quần thể trong chương này. Bước 1 chỉ rõ các giả thuyết không
2
và thay thế. Trong phần này, tất nhiên, tất cả các giả thuyết đều sẽ có 1 − 2 . Giả thuyết không
sẽ một lần nữa xác định rằng 1 − 2 bằng một số giá trị D (thường bằng không), trong khi giả
thuyết thay thế có một trong ba định dạng sau, tùy thuộc vào câu hỏi hỏi:
1 H A : 1 − 2  D ,
2 H A : 1 − 2  D ,
3 H A : 1 − 2  D ,
Bước thứ hai là xác định thống kê kiểm định. Như bạn có thể nhớ lại từ Chương 9, chúng tôi
đã thay vào ba công cụ ước tính khoảng tin cậy khác nhau về sự khác biệt giữa hai trung bình
quẩn thể, và lựa chọn ra một số yếu tố phụ thuộc trong đó. Những yếu tố tương tự kết hợp để
tạo ra ba thống kê kiểm định khác nhau. Số liệu thống kê kiểm định và các yếu tố xác định việc
sử dụng chúng như sau.
1 Nếu  12 và  22 đã biết, và quần thể thường phân bố hoặc n1 và n2 lớn
Thống kê kiểm định: z =

( x1 − x2 ) − ( 1 − 2 )
 12  22
+
n1 n2
2 Nếu  12 và  22 chưa biết, và  12 ≠  22

( s12 / n1 ) + ( s22 / n2 ) 
2
( x − x ) − ( 1 − 2 )
Thống kê kiểm định: t = 1 2 d.f. =  
s12 s22  ( s / n ) ( s / n )2 
2 2 2
+  1 1 + 2 2 
n1 n2  n1 − 1 n2 − 1 
 
3 Nếu  12 và  22 chưa biết, và  12 =  22
Thống kê kiểm định: t =

( x1 − x2 ) − ( 1 − 2 ) d.f. = n1 + n2 − 2
1 1
s 2p  + 
 n1 n2 
[Hãy nhớ lại rằng s 2p là ước tính phương sai gộp, được định nghĩa là
s 2p =
( n1 − 1) s12 + ( n2 − 1) s22
n1 + n2 − 2
và nếu d.f. ≥ 200, thống kê kiểm định được phân phối xấp xỉ bình thường, cho phép chúng tôi
tìm giá trị tới hạn của vùng loại bỏ từ Bảng 3 (biến ngẫu nhiên bình thường tiêu chuẩn) hoặc
Bảng 4 (biến ngẫu nhiên-t) trong Phụ lục C.]
Các phần còn lại của kiểm tra giống như trong Chương 10. Đó là, chúng tôi tiến hành như sau:
Bước 3: Chỉ ra mức tin cậy.
Bước 4: Xác định quy tắc quyết định.
3
Bước 5: Tính giá trị của thống kê kiểm định.
Bước 6: Đưa ra quyết định và trả lời câu hỏi.
Ba ví dụ tiếp theo minh họa quy trình kiểm định 1 − 2 .
Ví dụ 11.1. Việc lựa chọn địa điểm cửa hàng mới phụ thuộc vào nhiều yếu tố, một trong số đó
là mức thu nhập hộ gia đình ở các khu vực xung quanh địa điểm được đề xuất. Giả sử rằng một
chuỗi cửa hàng bách hóa lớn ở Queensland đang cố gắng quyết định xem nên xây dựng một
cửa hàng mới ở Mt Gravatt hay ở Thành phố Logan. Chi phí xây dựng ở Thành phố Logan thấp
hơn và công ty quyết định sẽ xây dựng ở đó trừ khi thu nhập hộ gia đình trung bình ở Mt
Gravatt cao hơn ở Thành phố Logan. Một cuộc khảo sát 100 nơi cư trú ở mỗi khu vực cho thấy
thu nhập hộ gia đình trung bình hàng năm là $29.980 ở Mt Gravatt và $28.650 ở Logan. Dữ
liệu được lưu trữ trong tệp XM11-01. Từ các nguồn khác, người ta biết độ lệch chuẩn của thu
nhập hộ gia đình hàng năm là $4740 ở Mt Gravatt và $5365 ở Thành phố Logan. Ở mức 5%,
liệu có thể kết luận thu nhập hộ gia đình trung bình ở Mt Gravatt vượt quá mức của Thành phố
Logan không?
GIẢI PHÁP
Xác định kỹ thuật
Mục tiêu của vấn đề là so sánh hai quần thể có kiểu dữ liệu là định lượng (thu nhập hộ gia đình
ở Mt Gravatt và Logan City). Điều này cho chúng ta biết rằng tham số được kiểm tra là 1 − 2 .
(trong đó 1 = thu nhập hộ gia đình trung bình hàng năm ở Mt Gravatt và  2 = thu nhập hộ gia
đình trung bình hàng năm ở Thành phố Logan). Bởi vì chúng tôi muốn biết liệu chúng tôi có
thể kết luận rằng 1 vượt quá  2 hay không, Giả thuyết thay thế là
H A : ( 1 − 2 )  D
Độ lệch chuẩn quần thể được biết đến ( 1 = 4740 hoặc  12 = 22 467 600 và  2 = 5365 hoặc
 22 = 28 783 225 ) và n1 và n2 là lớn. Thống kê kiểm định chính xác là
z=
( x1 − x2 ) − ( 1 − 2 )
 12  22
+
n1 n2
Phần kiểm định hoàn chỉnh như sau:
Bước 1: H 0 : ( 1 − 2 ) = 0
H A : ( 1 − 2 )  0 ,
Bước 2: Thống kê kiểm định: z =

( x1 − x2 ) − ( 1 − 2 )
 12  22
+
n1 n2
có phân phối bình thường tiêu chuẩn.
4
Bước 3: Mức độ tin cậy:  = 0.05
Bước 4: Quy tắc quyết định: Bác bỏ H 0 nếu z  z = z0.05 = 1.645
Bước 5: Giá trị thống kê kiểm định:
Giải thủ công:
z=
( x1 − x2 ) − ( 1 − 2 ) = ( 29980 − 28650 ) − 0 = 1.86
 12  22 47402 53652
+ +
n1 n2 100 100
Sử dụng máy tính:

Đầu ra Excel cho Ví dụ 11.1
D E F
1 z-Test: hai mẫu cho giá trị trung bình
2
3 Núi Gravatt Logan
4 Trung bình 29980 28650
5 Phương sai đã biết 22467600 28783225
6 Quan sát 100 100
7 Sự khác biệt trung bình giả thuyết 0
8 z 1.857809634
9 P(Z<=z) một phía 0.031597964
10 z Một phía quan trọng 1.644853
11 P(Z<=z) hai phía 0.063195927
12 z Hai phía quan trọng 1.959961082
Excel in giá trị trung bình mẫu, phương sai và kích thước. Nó cũng in các kết quả thống kê liên
quan đến kiểm định giả thuyết. Giá trị của thống kê thử nghiệm z Stat là 1.857809634 với giá
trị p một phía là 0.031597964. Excel cũng xuất ra các giá trị quan trọng (sử dụng mức tin cậy
5%) cho bài kiểm tra một phía và hai phía. Nó cũng cung cấp giá trị p kiểm tra hai phía, giá trị
không cần thiết trong ví dụ này.
LỆNH LỆNH TRONG VÍ DỤ 11.1
1 Nhập hoặc thêm dữ liệu vào hai cột. Mở tệp XM11-01
2 Nhấp Công cụ, Phân tích dữ liệu,… và z-Test:
Trung bình của hai mẫu. Nhấp OK.
3 Chỉ rõ phạm vi biến 1. A1:A101
4 Chỉ rõ phạm vi biến 2. B1:B101
5 Chỉ rõ sự khác biệt trung bình giả thuyết. 0
6 Phương sai biến 1 (đã biết) 22467600
Phương sai biến 2 (đã biết) 28783225
5
7 Nhấp Biểu tượng (nếu cần)
8 Chỉ rõ một giá trị cho ∝ (Alpha) và nhấp OK. .05
Bước 6: Kết luận: Vì z = 1.86  1.645, bác bỏ giả thuyết H 0 .

Có đủ bằng chứng để suy luận rằng thu nhập hộ gia đình trung bình ở Mt Gravatt vượt quá
thu nhập của Thành phố Logan.
Lưu ý rằng kết luận sẽ giống nhau ngay cả khi chúng ta sử dụng giá trị p.
Do đó, mặc dù chi phí xây dựng thấp hơn ở Thành phố Logan, chúng tôi khuyên bạn nên đặt
cửa hàng mới ở Mt Gravatt (xem Hình 11.1).
Hình 11.1 Phân bố lấy mẫu, ví dụ 11.1
Bởi vì ba thống kê thử nghiệm khác nhau có thể được sử dụng để kiểm tra sự khác biệt giữa
hai trung bình dân số, bạn phải đặc biệt cẩn thận để xác định các yếu tố xác định khi nào nên
sử dụng kiểm định z của 1 − 2 .
Các yếu tố xác định z-test của 1 − 2 .
1 Mục tiêu vấn đề: So sánh hai quần thể
2 Loại dữ liệu: Định lượng (khoảng)
3 Đo lường mô tả: vị trí trung tâm
4 Thiết kế thử nghiệm: mẫu độc lập
5 Phương sai dân số: đã biết
Ví dụ 11.2. Tham khảo Ví dụ 9.3. Ở mức độ tin cậy 5%, hãy kiểm tra tuyên bố của nhà khoa
học rằng những người ăn ngũ cốc giàu chất xơ cho bữa sáng sẽ tiêu thụ trung bình ít kilojoules
cho bữa trưa hơn những người không ăn ngũ cốc giàu chất xơ cho bữa sáng. Dữ liệu được lưu
trữ trong cột 1 và 2 của tệp XM11-02 [giống như tệp XM09-03 được sử dụng trong Ví dụ 9.3].
Giả sử rằng hai quần thể là bình thường.
GIẢI PHÁP
Để đánh giá tuyên bố, nhà khoa học cần so sánh dân số người tiêu dùng ngũ cốc giàu chất xơ
với dân số không tiêu dùng. Dữ liệu là định lượng (rõ ràng, như chúng tôi đã ghi lại số thực).
Sự kết hợp kiểu dữ liệu khách quan của vấn đề này cho chúng ta biết rằng tham số cần kiểm
tra là sự khác biệt giữa hai trung bình 1 − 2 .
6
Tuyên bố được thử nghiệm là lượng kilojoules trung bình của người tiêu dùng ( 1 ) ít hơn so
với người không tiêu dùng (  2 ) . Do đó, các giả thuyết không và thay thế là
H 0 : ( 1 − 2 ) = 0
H A : ( 1 − 2 )  0
Thống kê kiểm định: Sự khác biệt quần thể là không rõ. Đến xác định thống kê kiểm định, nhà
khoa học tính toán độ lệch chuẩn mẫu. Chúng là
s1 = 142.75 và s2 = 462.61
Có lý do để tin rằng sự khác biệt quần thể là không đồng đều. Chúng tôi cũng được cung cấp
rằng hai quần thể thường được phân phối. Do đó, chúng tôi sử dụng thống kê kiểm tra phương
sai không đồng đều.
( x − x ) − ( 1 − 2 ) có phân phối t với
t= 1 2
s12 s22
+
n1 n2
(s / n1 + s22 / n2 )
2 2
d.f. =
1
 ( s 2 / n )2 ( s 2 / n )2 
 1 1 + 2 2 
 n1 − 1 n2 − 1 
 
Mức độ tin cậy:  = .05
Giải thủ công
Quy tắc quyết định: Từ dữ liệu chúng ta tính được thống kê sau
x1 = 2383.2
x2 = 2644.4
s1 = 142.75
s2 = 462.61
Số bậc tự do của thống kê kiểm định:
(s / n1 + s22 / n2 )
2 2
d.f. =
1
 ( s 2 / n )2 ( s 2 / n )2 
 1 1 + 2 2 
 n1 − 1 n2 − 1 
 
2
(142.75 )2 / 10 + ( 462.61)2 / 20 
=  
  142.75 2 / 10  2  462.61 2 / 20  2 
 ( )  + ( )  
 10 − 1 20 − 1 
 
 
= 25.01
Chúng xoay quanh giá trị 25. Theo quy tắc quyết định:
Bác bỏ H 0 nếu t  t ,d . f . = −t.05,25 = −1.708
Giá trị của thống kê kiểm định:
7
t=
( x1 − x2 ) − ( 1 − 2 ) = ( 2383.2 − 2644.4 ) − 0 = −2.31
s12 s22 ( ) ( )
2 2
+ 142.75 462 .61
+
n1 n2 10 20
8
Sử dụng máy tính
A B C
1 t-Test: hai mẫu giả định cho phương sai không đồng đều
2
3 Người tiêu dùng Người không tiêu dùng
4 Trung bình 2383.2 2644.4
5 Phương sai 20376.17778 214004.0421
6 Quan sát 10 20
8 df 25
9 t Stat -2.31433179
10 P(Z<=t) một phía 0.014576434
11 t Một phía quan trọng 1.708140189
12 P(Z<=t) hai phía 0.029152868
13 t Hai phía quan trọng 2.05953711
quan đến kiểm định giả thuyết. Giá trị của thống kê thử nghiệm t Stat là 2.31433179 với giá
trị p một phía là 0.014576434. Excel cũng xuất ra các giá trị quan trọng (sử dụng mức tin cậy
5%) cho bài kiểm tra một phía và hai phía. Nó cũng cung cấp giá trị p kiểm tra hai phía, giá trị
2 Nhấp Công cụ, Phân tích dữ liệu,… và t-Test:
Hai mẫu giả định phương sai không đồng đều.
Nhấp OK.
Kết luận: Vì t = −2.31  −1.708, bác bỏ giả thuyết H 0 .

Giải thích kết quả
Như đã thảo luận trong Chương 10, giá trị p của thử nghiệm (từ đầu ra Excel) là nhỏ, cho thấy
rằng chúng tôi bác bỏ giả thuyết kho. Điều này khiến Hoa Kỳ kết luận rằng những dữ liệu này
cung cấp đủ bằng chứng để suy luận rằng người tiêu dùng ngũ cốc giàu chất xơ ăn ít kilojoules
vào bữa trưa hơn so với những người không tiêu dùng. Tuy nhiên, có một số lý do để thận trọng
khi kết luận rằng ngũ cốc giàu chất xơ tạo thành một đóng góp hiệu quả để giảm cân. Đầu tiên,
9
kích thước mẫu nhỏ. (Kích thước mẫu lớn hơn thực tế hơn, nhưng ức chế tính toán thủ công.)
Thứ hai, dữ liệu có khả năng tự báo cáo, có nghĩa là mỗi người xác định số kilojoules được ghi
lại mà người đó tiêu thụ. Dữ liệu như vậy thường không đáng tin cậy. Lý tưởng nhất là nên sử
dụng một phương pháp đếm kilojoules ít chủ quan hơn. Cuối cùng, cách thức thí nghiệm được
thực hiện có thể dẫn đến một số cách giải thích mâu thuẫn về dữ liệu. Chúng ta sẽ thảo luận về
vấn đề quan trọng này trong phần tiếp theo.
Xem Hình 11.2, mô tả sự phân bố lấy mẫu của thống kê thử nghiệm.
Hình 11.2. Phân bố lấy mẫu, ví dụ 11.2
Dưới đây là tóm tắt về cách chúng ta nhận biết khi nào nên sử dụng phương sai không đồng
đều t-test của 1 − 2 .
Các yếu tố xác định phương sai không đồng đều t-test của 1 − 2 .
10 Phương sai dân số: chưa biết và không đồng đều
ỨNG DỤNG TRONG QUẢN LÍ HOẠT ĐỘNG

Trong giai đoạn thiết kế sản xuất sản phẩm mới, người quản lý hoạt động xác định cách sản
xuất sản phẩm. Mục tiêu là sản xuất sản phẩm chất lượng cao nhất với chi phí hợp lý. Mục tiêu
này đạt được bằng cách chọn máy móc, vật liệu, phương pháp và 'nhân lực' (nhân sự), cái gọi
là 4 Ms. Người quản lý thường có thể sử dụng các công cụ thống kê để giúp đưa ra quyết định
này. Các thí nghiệm khác nhau có thể được tiến hành để ngăn chặn khai thác chi phí thấp nhất
hoặc tiến độ sản xuất nhanh nhất, thí nghiệm sử dụng vật liệu, máy móc, nhân sự phương pháp
khác nhau. Có một số cách để đánh giá các quá trình khác nhau. Người quản lý có thể xác định
xem sự khác nhau trong chất lượng tồn tại, hoặc sự khác biệt về chi phí. Nếu không có sự khác
biệt, ví dụ, người quản lý có thể quyết định trên cơ sở một số terion khác, chẳng hạn như quá
trình đòi hỏi thời gian đào tạo công nhân ít nhất.
Ví dụ 11.3. Người quản lý nhà máy của một công ty sản xuất thiết bị văn phòng tin rằng năng
suất của công nhân là một chức năng, trong số những thứ khác, thiết kế công việc, trong đó đề
cập đến chuỗi các phong trào của công nhân. Hai thiết kế đang được xem xét để sản xuất một
loại bàn máy tính tiện dụng mới. Để giúp quyết định cái nào nên được sử dụng, một thử nghiệm
10
đã được thực hiện. Hai mươi lăm công nhân được chọn ngẫu nhiên lắp ráp bàn làm việc bằng
thiết kế A và 25 công nhân lắp ráp sản phẩm bằng thiết kế B. Thời gian lắp ráp tính bằng phút
đã được ghi lại và được trưng bày dưới đây và được lưu trữ trong tệp XM11-03. Người quản
lý nhà máy muốn biết liệu thời gian lắp ráp của hai thiết kế có khác nhau hay không. Mức tin
cậy 5% được đánh giá là phù hợp. Giả sử rằng hai quần thể thời gian lắp ráp thường được phân
phối.
Thời gian lắm ráp
Thiết kế A Thiết kế B
6.8 5.0 7.9 5.2 7.6 5.0 5.9 5.2 6.7 5.7 6.6 8.5 6.5 5.9
5.2 6.5 7.4 6.1 6.2 7.1 4.6 6.7 6.6 4.2 4.2 4.5 5.3 7.9
6.0 7.1 6.1 5.0 6.3 7.0 6.4 7.0 5.9 7.1 5.8 7.0 5.7 5.9
6.1 6.6 7.7 6.4 4.9 5.3 4.2 7.1
GIẢI PHÁP
Dữ liệu là định lượng và mục tiêu của thí nghiệm là so sánh hai quần thể thời gian lắp ráp.
Tham số quan tâm là sự khác biệt giữa hai quần thể có nghĩa là 1 − 2 .
Người quản lý nhà máy muốn xác định xem có tồn tại sự khác biệt giữa hai thiết kế hay không.
Kết quả là, các giả thuyết không và thay thế là
H 0 : ( 1 − 2 ) = 0
H A : ( 1 − 2 )  0
Thống kê kiểm định: Sự khác biệt quần thể là không rõ. Đến xác định thống kê kiểm định, nhà
khoa học tính toán độ lệch chuẩn mẫu. Chúng là
s1 = .921 và s2 = 1.14
Vì s1 xấp xỉ bằng s2 , chúng ta có thể suy ra rằng phương sai quần thể xấp xỉ bằng nhau. (Trong
Chương 12, chúng tôi chính thức kiểm tra tuyên bố này.) Thời gian tập hợp hai quần thể thường
được phân phối. Do đó, chúng tôi sử dụng thống kê kiểm tra phương sai đồng đều:
( x − x ) − ( 1 − 2 )
t= 1 2
1 1
s 2p  + 
 n1 n2 
có phân phối t với d.f. = n1 + n2 − 2.
Quy tắc quyết định: Số bậc tự do là
d.f. = = n1 + n2 − 2 = 25 + 25 − 2 = 48.
Bác bỏ H 0 nếu t  t ,d . f . = −t.05 ,48 = 2.010.
Giải thủ công
Chúng ta tính được thống kê sau
11
x1 = 6.288
x2 = 6.016
s1 = .921
s2 = 1.142
( n − 1) s + ( n2 − 1) s22 ( 25 − 1)( .921) + ( 25 − 1)(1.142 )
2 2 2
s 2
= 1 1
= = 1.075
n1 + n2 − 2 25 + 25 − 2
p

( x − x ) − ( 1 − 2 ) = ( 6.288 − 6.016 ) − 0 = .93
t= 1 2
1 1  1 1 
s 2p  +  1.075  + 
 n1 n2   25 25 
A B C
1 t-Test: Hai mẫu giả định cho phương sai đồng đều
2
3 Thiết kế A Thiết kế B
4 Trung bình 6.288 6.016
5 Phương sai 0.847766667 1.303067
6 Quan sát 25 25
7 Phương sai gộp 1.075416667
9 df 48
10 t Stat 0.927332603
11 P(Z<=t) một phía 0.179196744
13 P(Z<=t) hai phía 0.358393488
Giá trị của thống kê thử nghiệm là .927332603. Vì đây là một thử nghiệm hai phía, giá trị p là
.358393488. Giá trị hai phía quan trọng t là 2.01063358.
Hai mẫu giả định phương sai đồng đều.
12
Kết luận: Vì t = .93  2.010, không thể bác bỏ giả thuyết H 0 .

Chúng tôi kết luận rằng có rất ít bằng chứng để suy luận rằng thời gian trung bình khác nhau.
Một lần nữa, người quản lý nên xác định rằng tất cả các điều kiện bắt buộc đã được thỏa mãn
(xem tiểu mục sau Ví dụ 11.4) và không có yếu tố nào khác cần được xem xét. Ví dụ, chất
lượng của thành phẩm có giống hệt nhau khi sử dụng hai thiết kế không? Có thể một thiết kế
tốt hơn thiết kế khác, nhưng thí nghiệm này đã không chứng minh được điều đó vì phải mất
nhiều thời gian hơn để thích ứng với thiết kế sản xuất mới so với thử nghiệm này cho phép?
Tuy nhiên, nếu kết luận là đúng, người quản lý nên chọn thiết kế bằng cách sử dụng một số
tiêu chí khác, chẳng hạn như sở thích của công nhân. Hình 11.3 mô tả sự phân bố lấy mẫu của
thống kê thử nghiệm.
Dưới đây là tóm tắt về cách chúng ta nhận biết khi nào nên sử dụng phương sai không đồng
đều t-test của 1 − 2 .
Các yếu tố xác định phương sai không đồng đều t-test của 1 − 2 .
15 Phương sai dân số: chưa biết nhưng đồng đều
Ví dụ 11.4. Một nhà thống kê muốn so sánh sự thành công tương đối của hai chuỗi cửa hàng
bách hóa lớn ở Brisbane. Cô quyết định đo lường doanh số trên mỗi mét vuông không gian mà
mỗi chuỗi cửa hàng sử dụng. Cô lấy một mẫu ngẫu nhiên gồm 50 cửa hàng từ chuỗi 1 và 50
cửa hàng từ chuỗi 2. Dữ liệu được lưu trữ trong tệp XM11-04. Những dữ liệu này có cung cấp
đủ bằng chứng để chỉ ra rằng doanh thu trung bình của chuỗi 1 cửa hàng trên mỗi mét vuông
cao hơn 3 đô la so với chuỗi 2 cửa hàng ở mức 10% quan trọng không?
GIẢI PHÁP
13
Dữ liệu là định lượng và mục tiêu của thí nghiệm là so sánh doanh số trên một mét vuông
không gian của hai chuỗi cửa hàng. Tham số quan tâm là sự khác biệt giữa hai quần thể có
nghĩa là 1 − 2 .
Nhà thống kê muốn xác định xem doanh thu trung bình của chuỗi 1 cửa hàng trên một mét
vuông ( 1 ) có cao hơn 3 đô la so với doanh thu trung bình của chuỗi 2 cửa hàng (  2 ) hay
không. Kết quả là, các giả thuyết không và thay thế là:
H 0 : ( 1 − 2 ) = 3
H A : ( 1 − 2 )  3
Thống kê kiểm định: Sự khác biệt quần thể là không rõ. Để xác định thống kê thử nghiệm chính
xác, chúng ta cần so sánh phương sai mẫu s12 và s22 . Từ dữ liệu đã cho, chúng tôi tính toán
s12 = 133.65 và s12 = 52.73 . Do đó, chúng ta có thể suy ra rằng phương sai quần thể có thể được
coi là không đồng đều. Do đó, chúng tôi sử dụng thống kê kiểm tra phương sai không đồng đều
như trong Ví dụ 11.2.
( x − x ) − ( 1 − 2 )
t= 1 2
s12 s22
+
n1 n2
(s / n1 + s22 / n2 )
2 2
có phân phối t với d.f. =

1
 ( s 2 / n )2 ( s 2 / n )2 
 1 1 + 2 2 
 n1 − 1 n2 − 1 
 
Giải thủ công
Quy tắc quyết định: Từ dữ liệu chúng ta tính được thống kê sau
x1 = 75.51
x2 = 71.66
s12 = 133.65
s22 = 52.73
Số bậc tự do của thống kê kiểm định:
(s / n1 + s22 / n2 )
2 2
d.f. =
1
 ( s 2 / n )2 ( s 2 / n )2 
 1 1 + 2 2 
 n1 − 1 n2 − 1 
 
2
(133.65 )2 / 50 + ( 52.73)2 / 50 
=  
  133.65 2 / 50  2  52.73 2 / 50  2 
 ( )  + ( )  
 50 − 1 50 − 1 
 
 
14
= 82.47
Chúng xoay quanh giá trị 82. Theo quy tắc quyết định:
Bác bỏ H 0 nếu t  t ,d . f . = −t.10 ,82 = 1.292.
t=
( x1 − x2 ) − ( 1 − 2 ) = ( 75.51 − 71.66 ) − 3 = .44
s12 s22 133.65 52.73
+
+
n1 n2 50 50
D E F
1 t-Test: hai mẫu giả định cho phương sai không đồng đều
2
3 Chuỗi 1 Chuỗi 2
4 Trung bình 75.51 71.66
5 Phương sai 133.6523 52.73143
6 Quan sát 50 50
8 df 82
9 t Stat 0.440251
10 P(Z<=t) một phía 0.330457
12 P(Z<=t) hai phía 0.660914
quan đến kiểm định giả thuyết. Giá trị của thống kê thử nghiệm t Stat là 0.440251với giá trị
p một phía là 0.330457. Excel cũng xuất ra các giá trị quan trọng (sử dụng mức tin cậy 10%)
cho bài kiểm tra một phía và hai phía. Nó cũng cung cấp giá trị p kiểm tra hai phía, giá trị
Hai mẫu giả định phương sai không đồng đều.
Nhấp OK.
15
Kết luận: Vì t = 0.44  1.292, nên không bác bỏ giả thuyết H 0 .

Do đó, chúng tôi kết luận rằng không có đủ bằng chứng để cho phép suy luận rằng doanh thu
trung bình của chuỗi cửa hàng 1 trên mỗi mét vuông cao hơn $3 so với chuỗi cửa hàng 2.
Kiểm tra điều kiện cần thiết

Cả hai kỹ thuật phương sai bằng nhau và phương sai không bằng nhau đều yêu cầu các quần
thể được phân phối bình thường. Như trước đây, chúng ta có thể kiểm tra xem yêu cầu có được
thỏa mãn hay không bằng cách vẽ biểu đồ tần suất của dữ liệu. Để minh họa, chúng tôi đã sử
dụng Excel để tạo biểu đồ tần suất cho Ví dụ 11.3 (Hình 11.4 và 11.5). Mặc dù biểu đồ không
có hình chuông, nhưng có vẻ như thời gian lắp ráp ít nhất là xấp xỉ bình thường. Bởi vì kỹ thuật
này mạnh mẽ, nê chúng ta có thể tự tin vào tính hợp lệ của kết quả.
Hình 11.4 Biểu đồ thời gian lắp ráp cho Thiết kế A
Hình 11.5 Biểu đồ thời gian lắp ráp cho Thiết kế B
Vi phạm điều kiện bắt buộc

Khi yêu cầu bình thường không được thỏa mãn, chúng ta có thể sử dụng một kỹ thuật phi tham
số — kiểm tra tổng thứ hạng Wilcoxon cho các mẫu độc lập (Chương 13) — để thay thế phép
thử đẳng phương sai của 1 − 2 . Chúng tôi không có lựa chọn thay thế cho thử nghiệm phương
sai không đồng đều của 1 − 2 khi quần thể rất không bình thường.
16
Định dạng dữ liệu
Có hai định dạng để sắp xếp dữ liệu khi rút ra suy luận về sự khác biệt giữa hai phương tiện.
Như chúng ta thảo luận trong Phụ lục 11.A, chúng ta có thể lưu trữ các quan sát của một mẫu
io một cột và các quan sát của mẫu thứ hai trong một cột khác. Khi dữ liệu được lưu trữ theo
cách này, chúng tôi nói rằng dữ liệu không được xếp chồng lên nhau. Ngoài ra chúng ta có thể
xếp chồng dữ liệu bằng cách lưu trữ tất cả các quan sát từ cả hai mẫu trong một cột và sử dụng
cột thứ hai để lưu trữ mã xác định mẫu mà quan sát được rút ra. Dưới đây là một ví dụ về dữ
liệu không xếp chồng.
Cột 1 Cột 2
(Mẫu 1) (Mẫu 2)
12 18
19 23
13 25
Dưới đây là cùng một dữ liệu ở dạng xếp chồng lên nhau.
Cột 1 Cột 2
12 1
19 1
13 1
18 2
23 2
25 2
Cần hiểu rằng dữ liệu không cần phải theo thứ tự. Do đó, chúng có thể đã được được lưu trữ
theo cách này.
Cột 1 Cột 2
18 2
25 2
13 1
12 1
23 2
19 1
Nếu có hai quần thể để so sánh và chỉ có một biến, có lẽ tốt hơn là ghi lại dữ liệu ở dạng không
xếp chồng lên nhau. Tuy nhiên, thường xảy ra trường hợp chúng ta muốn quan sát một số biến
và so sánh chúng. Ví dụ, giả sử rằng chúng tôi khảo sát MBA nam và nữ và yêu cầu mỗi người
báo cáo thu nhập, số năm học và số năm kinh nghiệm. Những dữ liệu này thường được lưu trữ
ở dạng xếp chồng lên nhau bằng định dạng sau.
Cột 1: Mã xác định nữ (1) và nam (2)
Cột 2: thu nhập
Cột 3: năm học
Cột 4: năm kinh nghiệm
Để so sánh thu nhập, chúng tôi sẽ sử dụng cột 1 và 2. Cột 1 và 3 được sử dụng để so sánh
giáo dục, và cột 1 và 4 được sử dụng để so sánh mức độ kinh nghiệm.
Hầu hết các phần mềm thống kê yêu cầu hình thức này hay hình thức khác. Excel (ngoại trừ
17
một số macro của chúng tôi) yêu cầu dữ liệu phải được xếp chồng lên nhau. May mắn thay, nó
cho phép nhà thống kê thay đổi định dạng. (Xem Phụ lục ll.A để biết chi tiết.) Chúng tôi nói
'may mắn', bởi vì điều này cho phép lưu trữ dữ liệu dưới một trong hai hình thức trên đĩa dữ
liệu được cung cấp cùng với cuốn sách này. Trên thực tế, chúng tôi đã sử dụng cả hai biểu mẫu
để cho phép bạn thực hành thao tác dữ liệu khi cần thiết. Bạn sẽ cần khả năng này để thực hiện
các kỹ thuật thống kê trong cuốn sách này và những chương khác trong cuốn sách này.
BÀI TẬP
Học các kỹ thuật
11.1 Bạn được cung cấp các thông tin sau:
Mẫu 1: n1 = 50 x1 = 52.3 1 = 6.1
Mẫu 2: n2 = 100 x2 = 49.0  2 = 7.9
Kiểm tra
H 0 : ( 1 − 2 ) = 0
H A : ( 1 − 2 )  0
 = 0.05
11.2 Giả sử rằng, từ các mẫu được rút ra từ hai quần thể bình thường, chúng ta có
Mẫu 1: n1 = 15 x1 = 140  1 = 10
Mẫu 2: n2 = 10 x2 = 150  2 = 15
Kiểm tra
H 0 : ( 1 − 2 ) = 0
H A : ( 1 − 2 )  0
 = 0.01
11.3 Cho
Mẫu 1: n1 = 40 x1 = 27.3  1 = 7 .2
Mẫu 2: n2 = 70 x2 = 24.6  2 = 6.9
Kiểm tra các giả thuyết
H 0 : ( 1 − 2 ) = 0
H A : ( 1 − 2 )  0
 = 0.05
11.4 Giá trị p của bài kiểm tra trong Bài tập 11.3 là gì?
11.5 Kiểm tra các giả thuyết sau:
a) H 0 : ( 1 − 2 ) = 0
H A : ( 1 − 2 )  0
Mẫu 1: n1 = 10 x1 = 200 s1 = 20
Mẫu 2: n2 = 8 x2 = 185 s2 = 15
 = 0.05
(Giả sử rằng x1 và x2 thường được phân phối.)
18
b) H 0 : ( 1 − 2 ) = 0
H A : ( 1 − 2 )  0
Mẫu 1: n1 = 50 x1 = 21 s1 = 2
Mẫu 2: n2 = 70 x2 = 20 s2 = 3
 = 0.01
(Giả sử rằng x1 và x2 thường được phân phối.)
11.6 Giả sử rằng các mẫu có kích thước n1 = 20 và n2 = 15 được rút ra từ hai quần thể bình
thường. Số liệu thống kê mẫu như sau:
x1 = 100 x2 = 125
s11 = 225 s22 = 150
Chúng ta có thể kết luận ở mức tin cậy 5% rằng 1 nhỏ hơn  2 không?
11.7 Các mẫu n1 = 60 và n2 = 80 được rút ra từ hai quần thể bình thường. Các số liệu thống
kê sau đây đã được tạo ra:
x1 = 70.6 x2 = 68.3
s1 = 14.9 s2 = 12.3
Những kết quả này có cho phép Hoa Kỳ kết luận rằng 1 lớn hơn  2 không? (Sử dụng
 = 0.10 .)
11.9 Hai mẫu sau đây được lấy từ hai quần thể bình thường:
Mẫu 1: n1 = 50 x1 = 52.3 1 = 6.1
Mẫu 2: n2 = 100 x2 = 49.0  2 = 7.9
Những dữ liệu này có cung cấp bằng chứng đầy đủ ở mức tin cậy 5% để cho phép Hoa
Kỳ kết luận rằng 1 không bằng  2 không?
11.10 Các mẫu có kích thước 8 được rút ra độc lập với hai quần thể bình thường. Những dữ
liệu này được liệt kê dưới đây. Kiểm tra để xác định xem trung bình của hai quần thể có
khác nhau hay không. (Sử dụng  = 0.05 .)
Mẫu 1: 7 4 6 3 7 5 8 7
Mẫu 2: 6 4 5 3 6 5 7 5
11.11 Các mẫu có kích thước 6 được rút ra độc lập với hai quần thể bình thường. Những dữ
liệu này được liệt kê dưới đây. Kiểm tra để xác định xem trung bình của hai quần thể có
khác nhau hay không. (Sử dụng  = 0.05 .)
Mẫu 1: 12 6 5 8 11 5
Mẫu 2: 7 11 13 5 8 7
Áp dụng các kỹ thuật
11.12 Bài tập tự điều chỉnh. Một nhà sản xuất thực phẩm trẻ em tuyên bố rằng sản phẩm của
cô ấy vượt trội so với đối thủ cạnh tranh hàng đầu của cô ấy, trong đó trẻ sơ sinh tăng
cân nhanh hơn với sản phẩm của cô ấy. Như một thí nghiệm, 10 trẻ sơ sinh khỏe mạnh
được chọn ngẫu nhiên. Trong hai tháng, năm trong số các em bé được cho ăn sản phẩm
của nhà sản xuất và năm em bé còn lại được cho ăn sản phẩm của đối thủ cạnh tranh.
Mức tăng cân của mỗi em bé (tính bằng gam) được thể hiện trong bảng đi kèm.
19
Tăng cân (gam)
Sản phẩm của nhà sản xuất Sản phẩm của đối thủ
900 cạnh tranh
960
1080 720
840 900
1110 870
1200 810
Chúng ta có thể kết luận rằng mức tăng cân trung bình của trẻ sơ sinh được cho ăn bằng
thức ăn trẻ em của nhà sản xuất lớn hơn mức tăng cân trung bình của trẻ sơ sinh được
cho ăn bằng thức ăn của đối thủ cạnh tranh không? (Sử dụng  = 0.05 )
11.13 Kool Kat, một nhà sản xuất điều hòa không khí cho xe, đang xem xét chuyển đổi nhà
cung cấp bình ngưng. Nhà cung cấp A, nhà sản xuất bình ngưng hiện tại cho Kool Kat,
định giá sản phẩm của mình cao hơn 5% so với nhà cung cấp B. Tuy nhiên, vì Kool Kat
muốn duy trì danh tiếng về chất lượng, Kool Kat muốn chắc chắn rằng bình ngưng của
nhà cung cấp B tồn tại ít nhất là miễn là nhà cung cấp A làm. Ban lãnh đạo Kool Kat đã
quyết định giữ lại nhà cung cấp A nếu có đủ bằng chứng thống kê cho thấy bình ngưng
của nhà cung cấp A có tuổi thọ trung bình lâu hơn so với bình ngưng của nhà cung cấp
B. Trong một thử nghiệm, 10 chiếc xe hạng trung được trang bị điều hòa không khí sử
dụng bình ngưng loại A, trong khi 10 chiếc xe hạng trung khác được trang bị bình ngưng
loại B. Số km lái xe của mỗi chiếc xe trước khi bình ngưng bị hỏng đã được ghi lại và
các số liệu thống kê liên quan được liệt kê dưới đây.
Bình ngưng loại A Bình ngưng loại B

x1 = 75000 x2 = 70 000
s1 = 6000 s1 = 5000
Giả sử rằng quãng đường di chuyển thường được phân phối, Kool Kat có nên giữ lại nhà
cung cấp A không? (Sử dụng  = 0.10 .)
11.14 Sinh viên tại các trường đại học ba năm có làm việc chăm chỉ hơn những sinh viên tại
các trường cao đẳng TAFE hai năm không? Để giúp trả lời câu hỏi này, 47 sinh viên đại
học được chọn ngẫu nhiên và 36 sinh viên đại học TAFE đã được hỏi họ dành bao nhiêu
giờ mỗi tuần để làm bài tập về nhà Phương tiện và phương sai cho cả hai nhóm được
hiển thị bên dưới. Những kết quả này có cho phép Mỹ trả lời câu hỏi mở đầu của chúng
tôi một cách khẳng định không? (Sử dụng  = 0.01 .)
Sinh viên đại học Sinh viên cao đẳng TAFE
x1 = 18.6 x2 = 14.7
s12 = 22.4 s22 = 20.9
11.16 Huyết áp cao là nguyên nhân hàng đầu gây đột quỵ. Các nhà nghiên cứu y tế không
ngừng tìm cách điều trị bệnh nhân mắc phải tình trạng này. Một chuyên gia về tăng
huyết áp tuyên bố rằng tập thể dục nhịp điệu thường xuyên có thể làm giảm huyết áp
cao cũng thành công như thuốc, không có tác dụng phụ bất lợi. Để kiểm tra tuyên bố,
50 bệnh nhân bị huyết áp cao đã được chọn để tham gia vào một thí nghiệm. Trong 60
ngày, một nửa mẫu tập thể dục ba lần mỗi tuần trong một giờ; Nửa còn lại dùng thuốc
20
tiêu chuẩn. Tỷ lệ phần trăm giảm huyết áp được ghi lại cho mỗi cá nhân và dữ liệu kết
quả rhe được hiển thị trong bảng đi kèm. Chúng ta có thể kết luận ở mức tin cậy 1%
rằng tập thể dục ít nhất cũng hiệu quả như thuốc trong việc giảm huyết áp?
Tỷ lệ phần trăm giảm huyết áp
Thể dục Thuốc
x1 = 14.31 x2 = 13.28
s1 = 1.63 s2 = 1.82
11.17 Pin dùng một lần đắt tiền và chúng giải phóng các hóa chất nguy hiểm khi bị loại bỏ. Do
đó, nhiều người hiện đang sử dụng pin sạc. Tuy nhiên, một số pin sạc không chấp nhận
sạc đầy và kết quả là không hoạt động tốt như những pin khác. Trong một thí nghiệm để
xác định loại pin nào chấp nhận sạc tốt hơn, 100 tế bào D do công ty A tạo ra và 100 tế
bào D khác do công ty 13 sản xuất đã được chọn ngẫu nhiên. Mỗi pin được sạc trong 14
giờ. Số lượng volt công suất mà mỗi tế bào có khả năng tạo ra được đo (các tế bào D
được cho là tạo ra 1,25 volt); Kết quả được tóm tắt trong bảng sau. Những kết quả này
có cho phép chúng tôi kết luận ở mức tin cậy 1% rằng công suất trung bình khác nhau
giữa hai thương hiệu pin không?
Công suất đầu ra (volt)
Công ty A Công ty B
x1 = 1.16 x2 = 1.21
s1 = 0.08 s2 = 0.10
11.18 Trong việc thiết kế các chiến dịch quảng cáo để bán tạp chí, điều quan trọng là phải biết
mỗi nhóm nhân khẩu học dành bao nhiêu thời gian để đọc tạp chí. Trong một nghiên cứu sơ
bộ, 20 người đã được chọn ngẫu nhiên. Mỗi người được hỏi họ dành bao nhiêu thời gian mỗi
tuần để đọc tạp chí; Ngoài ra, mỗi người được phân loại theo giới tính và theo mức thu nhập
(cao hoặc thấp). Dữ liệu được hiển thị trong bảng sau.
Người Thời gian đọc tạp chí (phút) Tình dục Thu nhập
1 80 M L
2 125 M H
3 150 F H
4 140 M H
5 105 F L
6 85 F H
7 70 F H
8 90 M L
9 80 M L
10 65 F L
11 150 M H
12 75 F L
13 90 F H
14 110 M H
15 115 M L
16 125 F H
17 90 F L
18 80 F L
19 130 F H
20 150 M H
a. Có đủ bằng chứng ở mức tin cậy 5% để cho phép Hoa Kỳ kết luận rằng đàn ông và phụ nữ
khác nhau về thói quen đọc tạp chí của họ không?
21
b. Liệu có đủ bằng chứng ở mức 5% để cho phép Hoa Kỳ kết luận rằng những người có thu
nhập cao hơn dành nhiều thời gian để đọc tạp chí hơn những người có thu nhập thấp hơn
không?
11.19 Một nhà thống kê đã thu thập dữ liệu từ hai quần thể và lưu trữ chúng trong các cột 1
(mẫu 1) và 2 (mẫu 2) trong tệp XR11-19. Tất cả các dữ liệu được liệt kê dưới đây. Nhà
thống kê có thể suy ra ở mức tin cậy 10% rằng trung bình của quần thể 1 nhỏ hơn trung
bình của quần thể 2 không?
Mẫu 1: 18 13 12 12 20 21 22 20 18 12
Mẫu 2: 9 26 19 27 22 25 18 26 18 14
Bài tập máy tính

11.20 Các mẫu ngẫu nhiên được rút ra từ mỗi quần thể. Dữ liệu được lưu trữ trong cột 1 (mẫu
1) và 2 (mẫu 2) trong tệp XR11-20. Một danh sách một phần của dữ liệu được hiển thị
dưới đây. Có đủ bằng chứng ở mức tin cậy 5% để suy luận rằng trung bình của dân số 1
lớn hơn trung bình của dân số 2 không?
Mẫu 1: 110 115 115 118 60 104 128 . . . 105 114 115
Mẫu 2: 67 82 46 120 89 67 65 . . . 108 89 73
Sử dụng gói phần HOẶC Các số liệu thống kê sau đây được tính
mềm để giải quyết toán từ dữ liệu.
vấn đề này. n1 = 25; x1 = 101.68;s1 = 19.07
n2 = 25; x2 = 80.32;s2 = 25.14
Hoàn thành câu trả lời bằng cách tính
thủ công.
11.21 Dữ liệu thu được từ việc lấy mẫu từ hai quần thể được lưu trữ trong tệp XR11-21. (Cột
1 chứa dữ liệu và cột 2 chỉ định mẫu.) Một số dữ liệu này được hiển thị bên dưới.
a. Tiến hành kiểm tra để xác định xem quần thể có nghĩa là khác nhau hay không. (Sử dụng
 = .05 .)
b. (Các) điều kiện bắt buộc của các kỹ thuật được sử dụng trong phần (a) là gì?
c Kiểm tra để đảm bảo rằng (các) điều kiện yêu cầu được thỏa mãn.
Mẫu 1: 25 15 38 38 20 . . . 39 -3 26
Mẫu 2: 1 1 1 1 1 . . . 2 2 2
vấn đề này. n1 = 100; x1 = 19.07; s1 = 9.57
n2 = 140; x2 = 16.38; s2 = 25.16
thủ công.
11.22 Hai mẫu gồm 40 quan sát từ mỗi quần thể trong số hai quần thể đã được lấy. Dữ liệu
được lưu trữ trong cột 1 (tất cả các quan sát) và 2 (mã chỉ định mẫu) trong tệp XR11-22. Những
dữ liệu này có cung cấp đủ bằng chứng ở mức tin cậy 1% để suy luận rằng trung bình của dân
số 2 lớn hơn trung bình của dân số 1 không?
22
Quan sát 5 5 7 4 7 . . . 8 2 5
Mẫu 1 1 1 1 1 . . . 2 2 2
Sử dụng gói phần HOẶC Các số liệu thống kê sau đây được
mềm để giải quyết tính toán từ dữ liệu.
vấn đề này. n1 = 40; x1 = 4.925;s1 = 1.141
n2 = 40; x2 = 6.200;s2 = 2.090
thủ công.
11.23 Các công ty bảo hiểm ô tô lấy nhiều yếu tố cần xem xét khi thiết lập tỷ lệ. Những yếu tố
này bao gồm tuổi tác, tình trạng hôn nhân và số km lái xe mỗi năm. Để xác định ảnh hưởng
của giới tính, 100 tài xế nam và 100 nữ đã được khảo sát. Mỗi người được hỏi họ đã lái xe bao
nhiêu km trong năm qua. Khoảng cách (tính bằng hàng ngàn km) được lưu trữ ở định dạng xếp
chồng lên nhau (mã 1 = nam và mã 2 = nữ) trong tệp XR11-23. (Danh sách một phần dữ liệu
được hiển thị bên dưới.)
a. Chúng ta có thể kết luận ở mức tin cậy 5% rằng các tài xế nam và nữ khác nhau về số km lái
xe mỗi năm không?
b. Kiểm tra để đảm bảo rằng (các) điều kiện yêu cầu của các kỹ thuật được sử dụng trong phần
(a) được thỏa mãn.
Số km lái xe 11.2 9.2 6.4 14.1 . . . 10.3 15.1 7.1
Nam/nữ: 1 1 1 1 . . . 2 2 2
vấn đề này. n1 = 100; x1 = 10.23;s1 = 2.87
n2 = 100; x2 = 9.66;s2 = 2.90
thủ công.
11.24 Giám đốc của một công ty sản xuất điều hòa không khí ô tô đang xem xét chuyển đổi
nhà cung cấp bình ngưng của mình. Nhà cung cấp A, nhà sản xuất bình ngưng hiện tại cho nhà
sản xuất, định giá sản phẩm của mình cao hơn 5% so với nhà cung cấp B. Vì giám đốc muốn
duy trì danh tiếng của công ty mình về chất lượng, ông muốn chắc chắn rằng bình ngưng của
nhà cung cấp B tồn tại ít nhất là lâu như nhà cung cấp A. Sau khi phân tích kỹ lưỡng, giám đốc
quyết định giữ lại nhà cung cấp A nếu có đủ bằng chứng thống kê cho thấy bình ngưng của nhà
cung cấp A có tuổi thọ trung bình lâu hơn so với bình ngưng của nhà cung cấp B. Trong một
thử nghiệm, 30 chiếc xe hạng trung được trang bị máy điều hòa không khí sử dụng bình ngưng
loại A, trong khi 30 chiếc xe hạng trung khác được trang bị bình ngưng loại B. Số km (tính
bằng hàng nghìn) được điều khiển bởi mỗi chiếc xe trước khi bình ngưng bị hỏng đã được ghi
lại và dữ liệu được lưu trữ ở định dạng không xếp chồng lên nhau (cột 1 = nhà cung cấp A và
cột 2 = nhà cung cấp B) trong tệp XR11-24. Một số dữ liệu này được trưng bày dưới đây, giám
đốc có nên giữ lại nhà cung cấp A không? (Sử dụng mức tin cậy 10%.)
Nhà cung cấp A 156 146 93 152 . . . 106 83 125
Nhà cung cấp A 109 86 75 131 . . . 88 115 103
23
Sử dụng gói phần mềm HOẶC Các số liệu thống kê sau đây được tính
để giải quyết vấn đề toán từ dữ liệu.
này. n1 = 30; x1 = 115.5;s1 = 21.7
n2 = 30; x2 = 109.4;s2 = 22.4
thủ công.
11.25 Một giảng viên thống kê sắp chọn một gói phần mềm thống kê cho khóa học của mình.
Một trong những tính năng quan trọng nhất, theo giảng viên, là sự dễ dàng mà sinh viên học
cách sử dụng phần mềm. Cô đã thu hẹp lựa chọn xuống còn hai khả năng: phần mềm A, gói
thống kê dựa trên menu với một số kỹ thuật công suất cao và phần mềm B, một bảng tính có
khả năng thực hiện hầu hết các kỹ thuật. Để giúp đưa ra quyết định của mình, cô yêu cầu 40
sinh viên thống kê được chọn ngẫu nhiên chọn một trong hai gói. Cô đưa cho mỗi học sinh một
bài toán thống kê để giải quyết bằng máy tính và hướng dẫn sử dụng phù hợp. Lượng thời gian
(tính bằng phút) mỗi học sinh cần để hoàn thành bài tập đã được ghi lại và lưu trữ ở định dạng
không xếp chồng (cột 1 = gói A và cột 2 = gói B) trong tệp XR11-25. Danh sách một phần dữ
liệu được cung cấp dưới đây.
a. Giảng viên có thể kết luận từ những dữ liệu này rằng hai gói phần mềm khác nhau về lượng
thời gian cần thiết để học cách sử dụng chúng không? (Sử dụng mức tin cậy 1%).
b. Kiểm tra xem các điều kiện bắt buộc có được thỏa mãn hay không.
Nhà cung cấp A 88 83 70 81 . . . 105 82 75
Nhà cung cấp A 55 57 67 47 . . . 60 49 67
vấn đề này. n1 = 24; x1 = 74.71;s1 = 24.02
n2 = 16; x2 = 52.50;s2 = 9.04
thủ công.
11.26 Khi đánh giá giá trị của quảng cáo trên đài phát thanh, các nhà tài trợ không chỉ đo lường
tổng số người nghe mà còn ghi lại độ tuổi của họ. Nhóm tuổi 18-34 được coi là chi tiêu nhiều
tiền nhất. Để kiểm tra vấn đề, người quản lý của một đài FM đã ủy thác một cuộc khảo sát.
Một mục tiêu là đo lường sự khác biệt trong thói quen nghe giữa các nhóm tuổi 18-34 và 35-
50. Cuộc khảo sát đã hỏi 250 người ở mỗi nhóm tuổi họ dành bao nhiêu thời gian để nghe đài
FM mỗi ngày. Kết quả (tính bằng phút) được ghi lại và lưu trữ trong tệp XR11-26 (cột 1 = thời
gian nghe và cột 2 xác định nhóm tuổi: 1 = 18-34 và 2 = 35-50). Một số dữ liệu được hiển thị
bên dưới.
a. Chúng ta có thể kết luận ở mức tin cậy 5% rằng có sự khác biệt tồn tại giữa hai nhóm không?
b. Các điều kiện cần thiết có được thỏa mãn cho các kỹ thuật khuôn mà bạn đã sử dụng trong
phần (a) không?
Thời gian nghe: 75 30 50 87 . . . 135 50 0
Nhóm tuổi: 1 1 1 1 . . . 2 2 2
24
vấn đề này. n1 = 250; x1 = 59.0;s1 = 30.8
n2 = 250; x2 = 53.0;s2 = 43.3
thủ công.
11.27 Một yếu tố trong năng suất thấp là lượng thời gian lãng phí của người lao động. Thời
gian lãng phí bao gồm thời gian dành cho việc dọn dẹp sai lầm, chờ đợi thêm vật liệu và thiết
bị và thực hiện bất kỳ hoạt động nào khác không liên quan đến sản xuất. Trong một dự án được
thiết kế để kiểm tra vấn đề, một nhà tư vấn quản lý hoạt động đã thực hiện một cuộc khảo sát
với 200 công nhân trong các công ty được phân loại là thành công (trên cơ sở lợi nhuận hàng
năm mới nhất của họ) và 200 công nhân khác từ các công ty không thành công. Lượng thời
gian (tính bằng giờ) lãng phí trong một tuần làm việc 40 giờ tiêu chuẩn được ghi lại cho mỗi
công nhân. Những dữ liệu này được lưu trữ trong cột 1 (công ty thành công) và 2 (công ty
không thành công) trong tệp XR11-27. Một số dữ liệu xuất hiện bên dưới.
Những dữ liệu này có cung cấp đủ bằng chứng ở mức tin cậy 1% để suy luận rằng lượng
thời gian lãng phí trong các công ty không thành công vượt quá thời gian của các công ty thành
công không?
Công ty thành công: 5.8 2.0 6.5 5.3 . . . 4.1 2.0 5.3
Công ty không thành công: 7.6 2.7 10.1 4.1 . . . 5.8 8.3 0.8
vấn đề này. n1 = 200; x1 = 5.02;s1 = 1.39
n2 = 200; x2 = 7.80;s2 = 3.09
thủ công.
11.28 Dữ liệu thu được từ việc lấy mẫu từ hai quần thể được lưu trữ trong tệp XR11-28. (Chú
ý: Thiếu dữ liệu)
a. Tiến hành kiểm tra để xác định xem dân số có nghĩa là khác nhau hay không.
b. Ước tính sự khác biệt về dân số có nghĩa là với độ tin cậy 95%.
c. (Các) điều kiện bắt buộc của các kỹ thuật được sử dụng trong các phần (a) và (b) là gì?
d. (Các) điều kiện bắt buộc có được thỏa mãn không?
vấn đề này. n1 = 165; x1 = 99.30;s1 = 23.80
n2 = 217; x2 = 95.77;s2 = 23.74
thủ công.
11.29 Các mẫu ngẫu nhiên được rút ra từ mỗi quần thể. Dữ liệu được lưu trữ ở định dạng xếp
chồng lên nhau trong tệp XR11-29.
a. Có đủ bằng chứng ở mức tin cậy 10% để suy luận rằng trung bình của dân số 1 lớn hơn trung
bình của dân số 2 không?
25
b. Ước tính với độ tin cậy 90% sự khác biệt giữa hai quần thể có nghĩa là,
c. (Các) điều kiện cần thiết của các kỹ thuật được sử dụng trong các phần (a) và (b).
d. (Các) điều kiện bắt buộc có được thỏa mãn không?
vấn đề này. n1 = 121; x1 = 21.51;s1 = 4.76
n2 = 84; x2 = 19.76;s2 = 4.13
thủ công.
11.30 Thường hữu ích cho các công ty để biết khách hàng của họ là ai và làm thế nào họ trở
thành khách hàng. Trong một nghiên cứu về việc sử dụng thẻ tín dụng, một mẫu ngẫu nhiên
của chủ thẻ đã đăng ký thẻ tín dụng và một mẫu ngẫu nhiên của chủ thẻ tín dụng đã được liên
hệ bởi các nhà tiếp thị qua điện thoại đã được rút ra. Tổng số giao dịch mua được thực hiện bởi
mỗi tháng trước đã được ghi lại và lưu trữ trong tệp XR11-30. Chúng ta có thể kết luận từ
những dữ liệu này rằng sự khác biệt tồn tại giữa hai loại khách hàng không?
vấn đề này. n1 = 100; x1 = 130.93;s1 = 31.99
n2 = 100; x2 = 126.14;s2 = 26.00
thủ công.
11.31 Các nghiên cứu gần đây dường như chỉ ra rằng sử dụng điện thoại di động trong khi lái
xe là nguy hiểm. Một lý do cho điều này là thời gian phản ứng của người lái xe có thể chậm lại
trong khi họ đang nói chuyện điện thoại. Các nhà nghiên cứu tại một trường đại học đã đo thời
gian phản ứng của một mẫu tài xế sở hữu điện thoại ô tô. Một nửa mẫu đã được thử nghiệm
trong khi nói chuyện điện thoại và nửa còn lại không có trên điện thoại. Thời gian phản ứng
được lưu trữ trong tệp XR11-31. Chúng ta có thể kết luận rằng thời gian phản ứng chậm hơn
đối với người lái xe sử dụng điện thoại di động không?
vấn đề này. Phone : n1 = 125; x1 = .646;s1 = .045
Not : n2 = 145; x2 = .601;s2 = .053
thủ công.
11.32 Tham khảo Bài tập 11.31. Để xác định xem loại sử dụng điện thoại có ảnh hưởng đến
thời gian phản ứng hay không, một nghiên cứu khác đã được đưa ra. Một nhóm tài xế được
yêu cầu tham gia vào một cuộc thảo luận. Một nửa nhóm tham gia vào chitchat đơn giản và
nửa còn lại tham gia vào một cuộc thảo luận chính trị. Một lần nữa, thời gian phản ứng được
đo và lưu trữ trong tệp XR11-32. Chúng ta có thể suy luận rằng loại thảo luận qua điện thoại
ảnh hưởng đến thời gian phản ứng không?
26
vấn đề này. Chitchat : n1 = 95; x1 = .648;s1 = .048
Political : n2 = 90; x2 = .662;s2 = .045
thủ công.
11.33 Giữa Hungry Jack's và McDonald's, cửa sổ lái xe qua thức ăn nhanh nào nhanh hơn?
Để trả lời câu hỏi, một mẫu ngẫu nhiên về thời gian phục vụ (tính bằng giây) cho mỗi nhà
hàng đã được đo và lưu trữ trong tệp XR11-33. Chúng ta có thể suy ra từ những dữ liệu này
rằng có sự khác biệt về thời gian phục vụ giữa hai chuỗi không?
Sử dụng gói phần HOẶC Các số liệu thống kê sau đây được tính toán từ
mềm để giải dữ liệu.
quyết vấn đề này. HungryJack' s : n1 = 213; x1 = 149.85;s1 = 21.82
McDonald ' s : n2 = 202; x2 = 154.43;s2 = 23.64
Hoàn thành câu trả lời bằng cách tính thủ công.
Phần 11.3 Kiểm tra sự khác biệt giữa hai trung bình quần thể:
Kiểm định cặp phù hợp
Chúng tôi tiếp tục trình bày các kỹ thuật thống kê giải quyết vấn đề so sánh hai quần thể dữ
liệu định lượng. Trong Phần 11.2, tham số quan tâm là sự khác biệt giữa hai trung bình quần
thể, trong đó dữ liệu được tạo ra từ các mẫu độc lập. Trong Phần 9.4, chúng tôi đã xem xét các
thí nghiệm ghép cặp, trong đó các mẫu không độc lập, để tính toán ước lượng khoảng cho μ1 -
μ2. Trong phần này, dữ liệu thu được từ một thí nghiệm ghép cặp được sử dụng để kiểm định
các giả thuyết về μ1 - μ2.
Để minh họa lý do tại sao cần thực hiện các thí nghiệm ghép cặp và cách chúng tôi xử lý dữ
liệu được tạo ra theo cách này, hãy xem xét ví dụ sau.
VÍ DỤ 11.5
Các nhà sản xuất lốp xe liên tục nghiên cứu các cách sản xuất lốp xe bền hơn. Những đổi mới
mới được các tay đua chuyên nghiệp kiểm định trên đường đua. Tuy nhiên, bất kỳ phát minh
nào có triển vọng cũng được các tài xế bình thường lái thử nghiệm. Các bài kiểm định sau này
gần hơn với những gì khách hàng của các công ty lốp xe thực sự trải nghiệm. Giả sử rằng để
xác định xem một lốp xe bán kính thép mới có bền hơn lốp xe hiện tại của công ty hay không,
hai lốp xe thiết kế mới đã được lắp đặt trên bánh sau của 20 chiếc ô tô được chọn ngẫu nhiên
và hai lốp xe thiết kế hiện tại đã được lắp đặt trên bánh sau của 20 chiếc ô tô khác. Tất cả người
lái xe được yêu cầu lái xe theo cách thông thường của họ cho đến khi lốp xe bị mòn. Số km mà
mỗi người lái xe đã đi được được ghi lại và được hiển thị bên dưới, cũng như được lưu trữ
trong tệp XM11-05. Liệu công ty có thể suy ra rằng lốp xe mới trung bình sẽ bền hơn lốp xe
hiện tại hay không? Giả sử rằng hai quần thể tuổi thọ lốp xe là bình thường.
Khoảng cách (tính bằng nghìn km) cho đến khi hao mòn
Lốp thiết kế mới Lốp thiết kế hiện tại
70 83 78 46 74 56 74 52 99 57 47 65 59 61 75 65 73 85 97 84
77 84 72 98 81 63 88 69 54 97 72 39 72 91 64 63 79 74 76 43
Giải
27
Mục tiêu là so sánh hai quần thể dữ liệu định lượng có phân bố bình thường. Tham số là sự
khác biệt giữa hai trung bình μ1 - μ2. (μ1 là độ bền trung bình của lốp xe thiết kế mới và μ2 là
độ bền trung bình của lốp xe thiết kế hiện tại.) Vì chúng tôi muốn xác định xem lốp xe mới có
bền hơn hay không, giả thuyết thay thế sẽ chỉ định rằng μ1 lớn hơn μ2. Việc tính toán các
phương sai mẫu cho phép chúng tôi sử dụng thống kê kiểm định
phương sai bằng nhau.
Thống kê kiểm định
Sử dụng máy tinh

Các lệnh Excel hoàn toàn giống với các lệnh trong Ví dụ 11.3.
Đầu ra Excel cho ví dụ 11.5
D E F
1 1-Kiểm định: Hai mẫu giả sử phương sai bằng nhau
2
3 Thiết kế mới Thiết kế hiện tại
4 Trung binh 73.6 69.2
5 Phương sai 243.4105263 226.8
6 Quan sát 20 20
7 Phương sai tổng hợp 235.1052632
8 Giả thuyết sai phân trung bình 0
9 d.f 38
10 t Stat 0.907447484
11 P(T<=1) một phía 0.184944575
12 t Quan trọng một phía 1.685953066
13 P(T<=t) hai phía 0.36988915
14 t Quan trọng hai phía 2.024394234
Giá trị của thống kê kiểm định (t = 91) và giá trị p của nó (0,18) chỉ ra rằng có rất ít bằng chứng
để hỗ trợ giả thuyết rằng lốp xe thiết kế mới có độ bền trung bình cao hơn lốp xe thiết kế hiện
tại.
Giống như một số ví dụ trước đây, chúng ta có một số bằng chứng để hỗ trợ giả thuyết thay
thế, nhưng không đủ. Lưu ý rằng sự khác biệt giữa các trung bình mẫu là
. Tuy nhiên, chúng ta đánh giá sự khác biệt giữa các trung bình mẫu
so với độ lệch chuẩn của phân phối mẫu. Như bạn có thể dễ dàng tính toán,
28
Kết quả là, giá trị của thống kê kiểm định là 4,4 / 4,8591, một giá trị không cho phép chúng ta
bác bỏ giả thuyết không (Null hypothesis). Chúng ta có thể thấy rằng mặc dù sự khác biệt giữa
giá trị trung bình của mẫu là khá lớn, nhưng độ biến thiên của dữ liệu, được đo bằng s, cũng
lớn, dẫn đến giá trị thống kê kiểm định nhỏ, điều này dẫn đến kết luận không bác bỏ giả thuyết
null.
VÍ DỤ 11.6
Giả sử bây giờ chúng ta làm lại thí nghiệm theo cách sau. Trên 20 ô tô được chọn ngẫu nhiên,
mỗi loại lốp được lắp một chiếc ở bánh sau và như trên, ô tô được lái cho đến khi lốp mòn. Số
km cho đến khi xảy ra hao mòn được hiển thị bên dưới và được lưu trong tệp XM11-06. Chúng
ta có thể kết luận từ những dữ liệu này rằng lốp mới tốt hơn không?
Khoảng cách (tính bằng nghìn km) cho đến khi hao mòn
Xe hơi Lốp xe thiết kế mới Lốp thiết kế hiện tại
1 57 48
2 64 50
3 102 89
4 62 56
5 81 78
6 87 75
7 61 50
8 62 49
9 74 70
10 62 66
11 100 98
12 90 86
13 83 78
14 84 90
15 86 98
16 62 58
17 67 58
18 40 41
19 71 61
20 77 82
Giải
Thí nghiệm được mô tả trong Ví dụ 11.5 là thí nghiệm trong đó các mẫu độc lập. Nghĩa là,
không có mối quan hệ nào giữa các quan sát trong một mẫu và các quan sát trong mẫu thứ hai.
Tuy nhiên, trong ví dụ này, thí nghiệm được thiết kế sao cho mỗi quan sát trong một mẫu đều
khớp với một quan sát trong mẫu kia. Việc so sánh được thực hiện bằng cách sử dụng cùng
một bộ ô tô cho mỗi mẫu. Vì vậy, việc so sánh quãng đường cho đến khi mòn của cả hai loại
lốp đối với mỗi ô tô là điều hợp lý. Loại thí nghiệm này tương tự như thí nghiệm ghép cặp
được giới thiệu ở Chương 9. Đây là cách chúng tôi tiến hành thử nghiệm.
Đối với mỗi ô tô, chúng tôi tính toán chênh lệch ghép cặp phù hợp giữa khoảng cách đạt được
với từng loại lốp.
Sự khác biệt của cặp kết hợp
Xe hơi Sự khác biệt Xe hơi Sự khác biệt
29
1 9 11 2
2 14 12 4
3 13 13 5
4 6 14 -6
5 3 15 -12
6 12 16 4
7 11 17 6
8 13 18 -1
9 4 19 10
10 -4 20 -5
Thiết kế thử nghiệm cho chúng ta biết rằng tham số quan tâm là giá trị trung bình của tổng
thể các khác biệt mà chúng ta gắn nhãn . Lưu ý rằng , nhưng chúng ta kiểm
định .vì cách thực hiện thí nghiệm.
Các giả thuyết cần kiểm định là
Thống kê kiểm định Chúng tôi đã trình bày các kỹ thuật suy luận về giá trị trung bình
của tổng thể. Hãy nhớ lại rằng trong Chương 8, chúng tôi đã giới
thiệu phép thử t khi phương sai tổng thể chưa được biết và quần
thể có phân phối chuẩn. Vì vậy, để kiểm định các giả thuyết về
chúng ta sử dụng thống kê kiểm định
có phân phối t với bậc tự do số với điều kiện là sự khác biệt

được phân phối chuẩn. (Ngoài chỉ số D, thống kê kiểm định này
giống với thống kê được trình bày trong Chương 8.) Chúng tôi
tiến hành kiểm định theo cách thông thường.
Mức ý nghĩa: a = 0.05
Quy tắc quyết định: Từ chối H0 nếu
Giải quyết bằng tay Sử dụng những khác biệt được tính toán ở trên, chúng tôi đã tìm
thấy những điều sau đây là số liệu thống kê.
Do đó, giá trị của thống kê kiểm định là:
30
Đầu ra Excel cho ví dụ 11.6
D E F
1 1-Kiểm định: Hai mẫu giả sử phương sai bằng nhau
2
3 Thiết kế mới Thiết kế hiện tại
4 Trung binh 73.6 69.05
5 Phương sai 242.7789474 316.3657895
6 Quan sát 20 20
7 Phương sai tổng hợp 0.914678935
8 Giả thuyết sai phân trung bình 0
9 d.f 19
10 t Stat 2.817586929
11 P(T<=1) một phía 0.005496978
13 P(T<=t) hai phía 0.010993955
Giá trị của thống kê kiểm định là 2,817586929 và giá trị p (một phía) của nó là 0,005496978.
Như vậy,chúng tôi bác bỏ giả thuyết không.
LỆNH CÁC LỆNH VÍ DỤ 11.6
1 Nhập hoặc nhập dữ liệu vào hai cột. Mở tập tin XM11-06
2 Nhấp vào Công cụ, Phân tích dữ liệu... và
t-Test: Ghép hai mẫu cho phương tiện. Bấm vào đồng ý.
3 Chỉ định phạm vi biến 1. A1:A21
4 Chỉ định phạm vi biến 2. B1:B21
5 Chỉ định sự khác biệt trung bình giả thuyết 0
6 Nhấp vào Nhãn (nếu cần).
7 Chỉ định giá trị cho a (Alpha) và nhấp vào OK.
Ngẫu nhiên, dữ liệu từ các thử nghiệm cặp trùng khớp hầu như luôn được lưu trữ ở dạng
không xếp chồng. Đôi khi chúng tôi bao gồm cột thứ ba xác định cặp phù hợp.
Với thiết kế thử nghiệm này, chúng tôi có đủ bằng chứng thống kê để suy ra rằng loại lốp mới
tốt hơn loại hiện có. Giống như các kỹ thuật khác, chúng ta phải kiểm định xem các điều kiện
yêu cầu có được thỏa mãn hay không và quy trình lấy mẫu có đáng tin cậy hay không. Nếu
kỹ thuật này hợp lệ, chúng ta có thể sử dụng kết quả này để cho phép thử nghiệm các cặp
khớp lớn hơn. Nếu đạt được kết luận tương tự, chúng ta có thể sử dụng nó để khởi động một
chiến dịch quảng cáo hiệu quả. Hình 11.6 mô tả phân bố mẫu.
Hình 11.6 Phân bố mẫu cho Ví dụ 11.6
31
Kiểm định điều kiện cần thiết
Giá trị của kết quả kiểm định t của Ho phụ thuộc vào tính quy phạm của các sai phân. Biểu
đồ hiển thị trong Hình 11.7 xác nhận rằng giả định tính chuẩn trong ví dụ này là hợp lý.
Hình 11.7 Biểu đồ của sự khác biệt giữa các cặp khớp trong Ví dụ 11.6
Mẫu độc lập hay ghép cặp phù hợp: Thiết kế kiểm định nào tốt hơn?
Các ví dụ 11.5 và 11.6 đã chứng minh rằng thiết kế thực nghiệm là một yếu tố quan trọng trong
suy luận thống kê. Tuy nhiên, hai ví dụ này cũng đặt ra một số câu hỏi về thiết kế thực nghiệm.
Đó là:
1. Tại sao thí nghiệm ghép cặp phù hợp lại dẫn đến việc bác bỏ giả thuyết null, trong khi
thí nghiệm mẫu độc lập thì không?
2. Chúng ta có nên luôn sử dụng thí nghiệm ghép cặp phù hợp không? Cụ thể, có nhược
điểm nào khi sử dụng nó không?
3. Làm thế nào để chúng ta nhận ra khi thí nghiệm ghép cặp phù hợp đã được thực hiện?
Dưới đây là câu trả lời
1. Thí nghiệm ghép cặp phù hợp trong Ví dụ 11.6 hoạt động bằng cách giảm độ biến thiên của
dữ liệu. Để hiểu rõ điểm này, chúng ta hãy xem xét thống kê từ cả hai ví dụ. Trong Ví dụ 11.5,
chúng ta đã tìm thấy . Trong Ví dụ 11.6, chúng ta đã tính được . Như vậy,
tử số của hai thống kê kiểm định gần như giống nhau. Tuy nhiên, lý do tại sao thống kê kiểm
định trong Ví dụ 11.5 lại nhỏ hơn nhiều so với thống kê kiểm định trong Ví dụ 11.6 là do độ
32
lệch chuẩn của phân phối lấy mẫu. Trong Ví dụ 11.5, chúng ta đã tính toán được
. Ví dụ 11.6
Như bạn thấy, sự khác biệt giữa các thống kê kiểm định không phải do tử số mà do mẫu số gây
ra. Điều này đặt ra một câu hỏi khác. Tại sao độ biến thiên của dữ liệu trong Ví dụ 11.5 lại lớn
hơn nhiều so với độ biến thiên của dữ liệu trong Ví dụ 11.6?
Nếu bạn kiểm định dữ liệu và thống kê từ Ví dụ 11.5, bạn sẽ thấy rằng có rất nhiều biến thể
giữa các ô tô. Đó là, một số tài xế lái xe theo cách kéo dài tuổi thọ của lốp xe, trong khi những
người khác lái xe nhanh hơn và phanh gấp hơn, dẫn đến tuổi thọ lốp xe ngắn hơn. Mức độ biến
thiên cao này khiến sự khác biệt giữa các giá trị trung bình của mẫu có vẻ nhỏ. Kết quả là,
chúng tôi không thể bác bỏ giả thuyết null.
Nhìn vào dữ liệu từ Ví dụ 11.6, chúng ta thấy rằng có rất ít biến thể giữa các sự khác biệt được
ghép đôi. Bây giờ, sự biến thiên do thói quen lái xe khác nhau đã giảm đáng kể. Sự biến thiên
nhỏ hơn làm cho giá trị của thống kê kiểm định lớn hơn. Do đó, chúng ta bác bỏ giả thuyết
null.
2. Thí nghiệm ghép cặp phù hợp có luôn luôn tạo ra một thống kê kiểm định lớn hơn so với thí
nghiệm mẫu độc lập không?
Câu trả lời là không nhất thiết. Giả sử trong ví dụ của chúng tôi, chúng tôi thấy rằng hầu hết
các tài xế đều lái xe theo cùng một cách và có rất ít sự khác biệt giữa các tài xế về khoảng cách
cho đến khi lốp xe bị mòn. Trong những trường hợp như vậy, thí nghiệm ghép cặp phù hợp sẽ
không dẫn đến việc giảm đáng kể biến động khi so sánh với mẫu độc lập. Có thể là thí nghiệm
ghép cặp phù hợp ít có khả năng bác bỏ giả thuyết null hơn so với thí nghiệm mẫu độc lập. Lý
do có thể được nhìn thấy bằng cách tính toán số bậc tự do. Trong Ví dụ 11.5, số bậc tự do là
38, trong khi ở Ví dụ 11.6 là 19. Mặc dù chúng tôi có cùng số quan sát (20 trong mỗi mẫu),
nhưng thí nghiệm ghép cặp phù hợp có một nửa số bậc tự do so với thí nghiệm mẫu độc lập
tương đương. Đối với cùng một giá trị của thống kê kiểm định, số bậc tự do nhỏ hơn trong
thống kê kiểm định phân phối Student sẽ cho p-value lớn hơn. Điều này có nghĩa là nếu có ít
sự giảm bớt biến động đạt được bởi thí nghiệm ghép cặp phù hợp, thì thay vì vậy, nhà thống kê
nên chọn tiến hành thí nghiệm với mẫu độc lập.
3. Như bạn đã thấy, trong cuốn sách này chúng tôi giải quyết các câu hỏi phát sinh từ các thí
nghiệm đã được thực hiện. Vì vậy, một trong những nhiệm vụ của bạn là xác định thống kê
kiểm định thích hợp. Trong trường hợp so sánh hai quần thể dữ liệu định lượng, bạn phải quyết
định xem các mẫu có độc lập (trong trường hợp đó tham số là μ1 - μ2) hay ghép cặp phù hợp
(trong trường hợp đó tham số là μd) để chọn thống kê kiểm định chính xác. Để giúp bạn làm
điều này, chúng tôi đề xuất bạn hỏi và trả lời câu hỏi sau: Có tồn tại mối quan hệ tự nhiên nào
giữa mỗi cặp quan sát cung cấp lý do hợp lý để so sánh quan sát đầu tiên của mẫu 1 với quan
sát đầu tiên của mẫu 2, quan sát thứ hai của mẫu 1 với quan sát thứ hai của mẫu 2, v.v. không?
Nếu vậy, thí nghiệm đã được thực hiện bởi ghép cặp phù hợp. Nếu không, nó đã được thực
hiện bằng cách sử dụng các mẫu độc lập.
Vi phạm điều kiện bắt buộc
Nếu các sự khác biệt không bình thường, chúng ta không thể sử dụng t-test của . Tuy nhiên,
chúng ta có thể sử dụng một kỹ thuật phi tham số - kiểm định Wilcoxon signed rank sum cho
các ghép cặp phù hợp, mà chúng tôi trình bày trong Chương 13.
33
Phát triển sự hiểu biết về các khái niệm thống kê
Hai trong những nguyên tắc quan trọng nhất trong thống kê đã được áp dụng trong phần này.
Nguyên tắc đầu tiên là khái niệm phân tích các nguồn biến động. Trong Ví dụ 11.5 và 11.6,
chúng tôi đã chỉ ra rằng bằng cách giảm thiểu sự biến động giữa các tài xế, chúng tôi có thể
phát hiện ra sự khác biệt thực sự giữa các thương hiệu lốp xe. Đây là một ứng dụng của quy
trình phân tích dữ liệu tổng quát hơn và gán một phần biến động cho một số nguồn. Trong Ví
dụ 11.6, hai nguồn biến động là tài xế ô tô và thương hiệu lốp xe. Tuy nhiên, chúng tôi không
quan tâm đến sự biến động giữa các tài xế vì chúng tôi không quan tâm đến việc xác định xem
các tài xế có thực sự khác nhau hay không. Thay vào đó, chúng tôi chỉ muốn loại bỏ nguồn
biến động đó, giúp dễ dàng xác định xem thương hiệu lốp xe có đại diện cho một nguồn biến
động thực sự hay không, và do đó một thiết kế lốp xe có tốt hơn một thiết kế lốp xe khác hay
không.
Trong Chương 15, chúng tôi sẽ giới thiệu một kỹ thuật gọi là phân tích phương sai, nó thực
hiện những gì tên gọi của nó gợi ý; nó phân tích các nguồn biến động trong nỗ lực phát hiện ra
những khác biệt thực sự. Trong hầu hết các ứng dụng của quy trình này, chúng tôi sẽ quan tâm
đến từng nguồn biến động chứ không chỉ đơn giản là giảm bớt một nguồn. Chúng tôi gọi quá
trình này là giải thích sự biến động. Khái niệm giải thích sự biến động cũng sẽ được áp dụng
trong Chương 18, 19 và 20.
Nguyên tắc thứ hai được thể hiện trong phần này là các nhà thống kê có thể thiết kế quy trình
thu thập dữ liệu theo cách mà chúng tôi có thể phân tích các nguồn biến động. Trước khi tiến
hành thí nghiệm trong Ví dụ 11.6, nhà thống kê nghi ngờ rằng có sự khác biệt lớn giữa các tài
xế trong cách họ làm mòn lốp xe. Do đó, anh ta (hoặc cô ta) thiết lập thí nghiệm sao cho tác
động của những khác biệt đó phần lớn bị loại bỏ. Cũng có thể thiết kế các thí nghiệm cho phép
phát hiện dễ dàng các sự khác biệt thực sự và giảm thiểu chi phí thu thập dữ liệu. Thật không
may, chúng tôi sẽ không trình bày chủ đề này. Tuy nhiên, bạn nên hiểu rằng toàn bộ chủ đề
thiết kế thí nghiệm là một chủ đề quan trọng, vì các nhà quản lý thường cần có khả năng phân
tích dữ liệu để phát hiện ra sự khác biệt, và chi phí gần như luôn là một yếu tố.
Thống kê kiểm định
Các yếu tố xác định t-test và ước lượng
1 Mục tiêu của vấn đề: So sánh hai quần thể

2 Kiểu dữ liệu: Định lượng (khoảng)
3 Đo lường mô tả: Vị trí trung tâm
4 Thiết kế thực nghiệm: Ghép cặp
Bài tập
11.34 Kiểm định các giả thuyết sau (giả sử xD là phân phối chuẩn):
34
11.35 Với kiểm định các giả thuyết sau (giả sử rằng hai quần thể đều bình thường)
đưa ra dữ liệu sau được tạo từ thử nghiệm ghép cặp phù hợp:
Quan sát Mẫu 1 Mẫu 2

1 25 32
2 11 14
3 17 16
4 7 14
5 29 36
6 21 22
11.36 Cho kết quả máy tính sau đây, hãy kiểm định các giả thuyết này ở mức ý nghĩa 10%. Giả
sử xD có phân phối chuẩn.
Biến phân tích XD

N Số trung bình T Xác suất > |T|
18 -0.73615 -1.52 0.1468
11.37 Để kiểm định các giả thuyết sau:

22 63.57 1.88 0.0740
11.38 Bản in máy tính kiểm định giả thuyết (giả sử x, là bình thường)
được hiển thị sau đây. Bạn sẽ rút ra kết luận gì với a = 0,01?
60 12.702 2.53 0.0140
11.39 Trong một bài kiểm định để so sánh tốc độ của hai loại máy tính có kích thước bằng
nhau, tám chương trình lớn được viết bằng Visual Basic đã được chạy trên cả hai máy tính. Sau
35
đó, lượng thời gian CPU tính bằng phút được đo và ghi lại. Thời gian CPU được phân phối
bình thường.
Thời gian CPU (phút)
Chương trình Máy 1 Máy 2
1 28 32
2 52 47
3 103 110
4 15 12
5 72 75
6 49 55
7 62 72
8 26 30
Chúng ta có thể kết luận rằng thời gian CPU trung bình của máy tính 1 nhỏ hơn thời gian CPU
trung bình của máy tính 2 không? (Sử dụng .)
11.40 Trong một nghiên cứu nhằm xác định xem giới tính có ảnh hưởng đến mức lương đưa ra
cho sinh viên MBA tốt nghiệp hay không, 25 cặp sinh viên đã được chọn. Mỗi cặp bao gồm
một sinh viên nữ và một sinh viên nam được xếp cặp theo điểm tổng thể, môn học, độ tuổi và
kinh nghiệm làm việc trước đây. Mức lương cao nhất được đưa ra (hàng nghìn đô la) cho mỗi
sinh viên tốt nghiệp đã được ghi nhận. Những dữ liệu này được hiển thị dưới đây.
a Có đủ bằng chứng ở mức ý nghĩa 10% để suy ra rằng giới tính không phải là yếu tố quyết
định mức lương được đề nghị không?
b Thảo luận tại sao thí nghiệm được tổ chức như vậy.
c Điều kiện cần thiết cho bài kiểm định ở phần (a) có được thỏa mãn không?
Cặp MBA 1 2 3 4 5 6 7 8 9 10 11 12 13
Lương cho nữ 71 55 68 61 62 54 44 49 42 55 67 69 69
Lương cho nam 72 60 70 63 61 49 48 47 40 53 69 72 71
Cặp MBA 14 15 16 17 18 19 20 21 22 23 24 25
Lương cho nữ 71 47 68 48 49 62 42 42 47 47 57 46
Lương cho nam 71 48 72 53 50 54 46 44 50 47 58 42
11.41 Dữ liệu bên dưới và được lưu trữ trong tệp XR11-41 được tạo ra từ một thí nghiệm ghép
cặp. Xác định xem những dữ liệu này có đủ để suy ra ở mức ý nghĩa 5% rằng ý nghĩa của hai
tổng thể khác nhau hay không.
Cặp 1 2 3 4 5 6 7 8 9 10
Mẫu 1 7 12 19 17 22 18 30 33 40 48
Mẫu 2 10 13 18 21 25 19 31 31 44 47
11.42 Các mẫu cỡ 12 được lấy độc lập từ hai quần thể bình thường. Những dữ liệu này được
liệt kê bên dưới và được lưu trữ trong cột 1 và 2 của tệp XR11-42. Sau đó, một thí nghiệm ghép
cặp tương ứng đã được tiến hành; 12 cặp quan sát được rút ra từ cùng một quần thể. Những dữ
liệu này cũng được hiển thị bên dưới và được lưu trữ trong cột 3 và 4 của tệp XR11-42.
a Sử dụng dữ liệu lấy từ các mẫu độc lập, kiểm định để xác định xem giá trị trung bình của hai
quần thể có khác nhau hay không. (Sử dụng a=.05.)
b Lặp lại phần (a) sử dụng dữ liệu các cặp tương ứng.
c. Hãy mô tả sự khác biệt giữa phần (a) và (b). Thảo luận tại sao những khác biệt này xảy ra.
36
Mẫu độc lập
Mẫu 1 66 19 88 72 61 32 75 61 71 54 79 40
Mẫu 2 69 37 66 59 27 18 47 67 83 61 32 37
Ghép cặp
Cặp 1 2 3 4 5 6 7 8 9 10 11 12
Mẫu 1 55 45 52 87 78 42 62 90 23 60 67 53
Mẫu 2 48 37 43 75 78 35 45 79 12 53 59 37
11.43 Lặp lại bài tập 11.42 sử dụng dữ liệu bên dưới, cũng được lưu trong cột 1 đến cột 4của
tệp XR11-43.
Mẫu độc lập
Mẫu 1 199 261 295 193 161 104 199 248 105 197 249 218
Mẫu 2 286 211 121 134 210 68 166 157 258 184 116 203
Ghép cặp
Cặp 1 2 3 4 5 6 7 8 9 10 11 12
Mẫu 1 218 144 286 208 234 256 133 87 224 212 256 133
Mẫu 2 154 160 239 198 211 241 136 39 192 183 215 117
11.43 Lặp lại bài tập 11.42 sử dụng dữ liệu bên dưới, cũng được lưu trong cột 1 đến cột 4của
tệp XR11-44
Mẫu độc lập
Mẫu 1 103 86 101 112 111 100 95 105 119 89 104 99
Mẫu 2 71 86 100 89 92 105 85 85 97 98 107 96
Ghép cặp
Cặp 1 2 3 4 5 6 7 8 9 10 11 12
Mẫu 1 91 120 97 94 107 107 91 118 94 101 87 102
Mẫu 2 88 75 108 84 97 92 92 76 86 97 107 98
11.45 Tham khảo Bài tập 9.31. Dựa trên cùng một dữ liệu mẫu (cũng có sẵn dưới dạng tệp dữ
liệu XR11-45), hãy trả lời câu hỏi sau:
a Chúng ta có thể suy ra ở mức ý nghĩa 5% rằng quảng cáo trên các Trang Vàng sẽ cải thiện
doanh số bán hàng không?
b Kiểm định để đảm bảo rằng (các) điều kiện yêu cầu của các kỹ thuật trên được thỏa mãn.
c Việc thực hiện thí nghiệm này với các mẫu độc lập có thuận lợi không? Giải thích lý do tại
sao và tại sao không.
Sử dụng một gói phần HOẶC Các số liệu thống kê sau đây được tính
mềm để giải quyết vấn toán từ dữ liệu. 11-40; -19,75; sp-30.63
đề này. Hoàn thành câu trả lời của bạn theo
cách thủ công.
11.46 Các nhà khoa học nghiên cứu tại một công ty dược phẩm gần đây đã phát triển một loại
thuốc ngủ không kê đơn mới. Họ quyết định kiểm định tính hiệu quả của nó bằng cách đo thời
gian mọi người chìm vào giấc ngủ sau khi uống thuốc. Phân tích sơ bộ chỉ ra rằng thời gian đi
vào giấc ngủ thay đổi đáng kể ở mỗi người. Do đó, họ tổ chức thí nghiệm theo cách sau. Một
mẫu ngẫu nhiên gồm 50 tình nguyện viên thường xuyên bị chứng mất ngủ được chọn. Mỗi
người được cấp một viên thuốc chứa loại thuốc mới được phát triển và một viên giả dược.
37
(Thuốc giả dược là một viên thuốc hoàn toàn không chứa thuốc.) Những người tham gia được
yêu cầu uống một viên vào một đêm và viên thứ hai vào một đêm một tuần sau đó. (Họ không
biết viên thuốc họ đang dùng là giả dược hay thật và thứ tự sử dụng là ngẫu nhiên.) Mỗi người
tham gia được gắn một thiết bị đo thời gian cho đến khi giấc ngủ xảy ra. Một số kết quả được
liệt kê bên dưới và tất cả dữ liệu được lưu trữ trong cột 1 và 2 của tệp XR11-46. Chúng ta có
thể kết luận rằng loại thuốc mới có hiệu quả không? (Sử dụng mức ý nghĩa 5%).
Tình nguyện viên: 1 2 3 4 . . . 48 49 50
Thuốc: 38.4 9.8 12.0 11.6 . . . 21.0 15.7 10.2
Giả dược: 39.2 25.0 26.2 28.6 . . . 27.2 24.5 27.7
Sử dụng một gói phần HOẶC Số liệu thống kê sau đây được tính
mềm để giải quyết vấn đề toán từ dữ liệu.
này.
Hãy hoàn thành câu trả lời của bạn

theo cách thủ công.
11.47 Những biến động trên thị trường chứng khoán khiến một số nhà đầu tư bán ra và chuyển
tiền của họ sang những khoản đầu tư ổn định hơn. Để xác định mức độ mà những biến động
gần đây ảnh hưởng đến quyền sở hữu, một mẫu ngẫu nhiên gồm 170 người xác nhận rằng họ
sở hữu một số cổ phiếu đã được khảo sát. Giá trị cổ phiếu được ghi nhận vào cuối năm ngoái
và cuối năm trước đó. Những dữ liệu này được lưu trữ trong tệp XR11-47. Chúng ta có thể suy
luận rằng giá trị cổ phần đã giảm?
Sử dụng một gói phần HOẶC Số liệu thống kê sau đây được tính toán
mềm để giải quyết vấn từ dữ liệu.
đề này.
Hãy hoàn thành câu trả lời của bạn theo

cách thủ công.
38
Phần 11.4 Kiểm tra sự khác biệt giữa hai tỷ lệ quần thể
Khi mục tiêu của bài toán là so sánh hai quần thể và loại dữ liệu là định tính, tham số cần kiểm
định là là sự khác biệt giữa hai tỷ lệ dân số. Có hai số liệu thống kê thử nghiệm khác
nhau cho tham số này; việc lựa chọn sử dụng cái nào phụ thuộc vào giả thuyết khống.
Kiểm định thống kê cho : Trường hợp 1
Nếu giả thuyết không chỉ ra rằng sự khác biệt giữa hai tỷ lệ dân số bằng 0
thì thống kê kiểm định là
đó là tiêu chuẩn phân phối bình thường.

Tỉ lệ mẫu là
(tỷ lệ thành công ở mẫu 1)
(tỷ lệ thành công ở mẫu 2)
(tỷ lệ thành công ở cả hai mẫu cộng lại)
Đại lượng được gọi là ước tính tỷ lệ gộp. Vì theo giả thuyết không, chúng tôi giả định rằng
hai tỷ lệ tổng thể bằng nhau nên chúng tôi có thể tạo ra một ước tính duy nhất về tỷ lệ đó được
sử dụng để ước tính độ lệch chuẩn. Như trường hợp khi chúng tôi tính toán ước tính phương
sai gộp ở Chương 9, tốt hơn là nên kết hợp dữ liệu từ hai mẫu nếu có thể. Lưu ý rằng trong
Trường hợp 2 (sau đây), không thể kết hợp dữ liệu mẫu để ước tính độ lệch chuẩn, vì ở đó
chúng tôi giả định rằng hai tỷ lệ tổng thể là khác nhau.
Kiểm định thống kê cho : Trường hợp 2
Nếu giả thuyết không cho rằng sự khác biệt giữa hai tỷ lệ dân số là một giá trị khác 0
, thì thống kê kiểm định là
39
đó là tiêu chuẩn phân phối bình thường.
Trong cả hai trường hợp, cỡ mẫu phải đủ lớn. Nghĩa là np, n n và n phải lớn hơn hoặc bằng 5.
ỨNG DỤNG TRONG TIẾP THỊ
Các nhà quản lý tiếp thị thường xuyên sử dụng thử nghiệm tiếp thị để đánh giá phản ứng của
người tiêu dùng trước sự thay đổi về đặc tính (chẳng hạn như giá cả hoặc bao bì) của sản phẩm
hiện có hoặc để đánh giá sở thích của người tiêu dùng đối với sản phẩm mới được đề xuất. Tiếp
thị thử nghiệm bao gồm việc thử nghiệm những thay đổi trong tổ hợp tiếp thị trong một thị
trường thử nghiệm nhỏ, hạn chế và đánh giá phản ứng của người tiêu dùng trên thị trường thử
nghiệm trước khi thực hiện những thay đổi tốn kém trong sản xuất và phân phối cho toàn bộ
thị trường.
Ví dụ 11.7. Tham khảo nghiên cứu về cơn đau tim do aspirin ở Ví dụ 9.6. Tính giá trị p của xét
nghiệm để xác định xem liệu những kết quả này có cho thấy aspirin có hiệu quả trong việc
giảm tỷ lệ mắc các cơn đau tim hay không.
Giải pháp
Mục tiêu của bài toán là so sánh hai quần thể. Đầu tiên là dân số nam giới dùng aspirin thường
xuyên và thứ hai là dân số nam giới không thường xuyên dùng aspirin. Dữ liệu mang tính định
tính vì chỉ có hai khả năng quan sát: 'người đàn ông bị đau tim' và 'người đàn ông không bị đau
tim'. Hai yếu tố này cho chúng ta biết rằng thông số cần kiểm định là sự khác biệt giữa hai tỷ
lệ dân số (trong đó p, tỷ lệ tất cả nam giới thường xuyên dùng aspirin bị đau tim và p,
tỷ lệ tất cả nam giới không dùng aspirin và những người bị đau tim). Bởi vì chúng ta muốn biết
liệu aspirin có hiệu quả trong việc làm giảm cơn đau tim hay không, giả thuyết thay thế là
Giả thuyết không ta có
H 0 : ( p1 − p2 ) = 0
cho chúng ta biết rằng đây là một ứng dụng của Trường hợp 1. Hơn nữa,
. Do đó, thống kê kiểm định là
40
Đây là bài kiểm tra hoàn chỉnh:
H 0 : ( 1 − 2 ) = 0
H A : ( 1 − 2 )  0
Thống kê kiểm định:
( x − x ) − ( 1 − 2 )
t= 1 2
1 1
s 2p  + 
 n1 n2 
Mức độ tin cậy:  (chưa biết)
Quy tắc quyết định: Bác bỏ H 0 nếu giá trị p   .
Giải thủ công
Giá trị của thống kê kiểm định và giá trị p:
104
p̂1 = = .009455
11000
189
p̂2 = = .01718
11000
104 + 189 293
p̂ = = = .01332
11000 + 11000 22000
z=
( ˆp1 − ˆp2 ) = ( .009455 − .01718) = −4.999
1 1  1 1 
ˆpqˆ  +  ( .01332 )( .98668)  + 
 n1 n2   11000 11000 
Vì vậy, giá trị p = P(z < -4.999) = 0
Chúng ta sử dụng một macro đã tạo trong Excel để tính giá trị của thống kê kiểm định
A B C D E
1 z-Test của sự khác biệt giữa hai tỷ lệ (Trường hợp 1)
3 Mẫu 1 Mẫu 2 z Stat -4.9989
4 Tỷ lệ mẫu 0.009455 0.017182 P(Z<=z) một phía 0.0000
z Một phía quan

5 Kích thước mẫu 11000 11000 1.6449
trọng
6 Alpha 0.05 P(Z<=z) hai phía 0.0000
z Hai phía quan

7 1.9600
trọng
41
Lưu ý: Chúng tôi không tạo tệp cho ví dụ này; các mẫu lớn và dung lượng đĩa bị hạn chế.
Để tạo thống kê kiểm tra để kiểm tra xem sự khác biệt giữa hai tỷ lệ có bằng một giá trị hay
không, hãy kích hoạt trang tính Z-Test of the Difference Between Two Proportions (Trường
hợp 1) trong sổ làm việc Test Statistics.
Kết luận: Với bất kỳ lựa chọn nào của   0, p − value = 0   , bác bỏ giả thuyết không.
Có nhiều bằng chứng để suy luận rằng aspirin làm giảm tỷ lệ đau tim ở nam giới. Trên thực tế,
bằng chứng mạnh mẽ đến nỗi thí nghiệm, ban đầu được lên kế hoạch chạy trong năm năm, đã
bị cắt ngắn chỉ sau ba năm để kết quả có thể được công bố. Hiệu quả đối với doanh số bán
aspirin trên toàn thế giới là khá ấn tượng.
Cần lưu ý rằng thí nghiệm này đã được tiến hành để cả các nhà khoa học và các đối tượng đều
không biết mỗi đối tượng đã uống viên thuốc nào. Loại thí nghiệm này được gọi là 'mù đôi' và
thường được sử dụng trong nghiên cứu y học vì nó được coi là đáng tin cậy hơn. Một trong
những sai sót trong nghiên cứu aspirin là tất cả các đối tượng đều là nam giới. Do đó, tác dụng
của việc dùng aspirin thường xuyên đối với phụ nữ vẫn chưa được biết. Tuy nhiên, các nhà
nghiên cứu y tế dường như hài lòng trong việc khuyên những người trung niên bao gồm cả
những phụ nữ không bị ảnh hưởng xấu bởi aspirin nên dùng aspirin thường xuyên. Hình 11.8
mô tả sự phân bố lấy mẫu của thống kê thử nghiệm.
Hình 11.8 Phân bố lấy mẫu, ví dụ 11.7
Ví dụ 11.8. Quá trình được sử dụng để sản xuất một thành phần phức tạp được sử dụng trong
các dụng cụ y tế thường dẫn đến tỷ lệ lỗi trong phạm vi 40%. Gần đây, hai quy trình sáng tạo
đã được phát triển để thay thế quy trình hiện có. Quy trình 1 có vẻ đầy hứa hẹn, nhưng nó đắt
hơn đáng kể để mua và vận hành so với quy trình 2. Sau khi phân tích kỹ lưỡng các chi phí,
ban quản lý quyết định rằng họ sẽ áp dụng quy trình 1 chỉ khi tỷ lệ các thành phần bị lỗi mà họ
sản xuất nhỏ hơn 8% so với quy trình 2. Trong một thử nghiệm để hướng dẫn quyết định, cả
hai quy trình đã được sử dụng để sản xuất 300 thành phần. Trong số 300 thành phần được sản
xuất theo quy trình 1, 33 thành phần bị lỗi, trong khi 84 trong số 300 thành phần được sản xuất
theo quy trình 2 bị lỗi. Sử dụng mức tin cậy là 10%, tiến hành kiểm tra để giúp quản lý đưa ra
quyết định.
GIẢI PHÁP
42
Mục tiêu của vấn đề là so sánh hai quần thể (các thành phần được tạo ra bởi hai quy trình) và
dữ liệu là định tính vì chúng tôi sẽ phân loại mỗi quan sát là 'khiếm khuyết' hoặc 'không bị lỗi'.
Theo đó, tham số cần kiểm tra là sự khác biệt giữa hai tỷ lệ quần thể p1 − p2 , trong đó p1 = tỷ
lệ của tất cả các thành phần được sản xuất bởi quy trình 1 bị lỗi và p2 = tỷ lệ của tất cả các
thành phần được sản xuất bởi quy trình 2 bị lỗi. Bởi vì ta muốn xác định xem có đủ bằng chứng
để chúng tôi suy luận rằng p1 nhỏ hơn 0,08 so với p2 hay không, giả thuyết thay thế là
H A : ( p1 − p2 )  .08
Nếu bạn gặp khó khăn khi thiết lập giả thuyết thay thế này, hãy thử điều này: chúng tôi muốn
biết liệu rằng p1 nhỏ hơn 8% so với p2 hay không, điều đó có nghĩa là chúng tôi muốn biết
liệu rằng p2 lớn hơn 8% so với p1 hay không. Chúng ta có thể thiết lập giả thuyết thay thế như
H A : ( p2 − p1 )  .08
Bởi vì chúng tôi thích chỉ định tham số là p1 − p2 , (thay vì p2 − p1 ), chúng tôi nhân bất đẳng
thức trong giả thuyết thay thế thứ hai với -1 để đưa ra giả thuyết thay thế đầu tiên.
Giả thuyết không tự động theo sau như sau:
H 0 : ( 1 − 2 ) = −.08
cho chúng ta biết rằng thử nghiệm này yêu cầu thống kê thử nghiệm được xác định trong
Trường hợp 2. Có thể dễ dàng xác minh rằng n1 ˆp1  5,n2 ˆp2  5,n1qˆ 1  5,n2qˆ 2  5 . Do đó, thống
kê kiểm định là
z=
( ˆp1 − ˆp2 ) − ( p1 − p2 )
ˆp1qˆ 1 ˆp2 qˆ 2
+
n1 n2
Đây là bài kiểm tra hoàn chỉnh.
H 0 : ( 1 − 2 ) = −.08
H A : ( p1 − p2 )  .08
Thống kê kiểm định:
z=
( ˆp1 − ˆp2 ) − ( p1 − p2 )
+
n1 n2

Quy tắc quyết định: Bác bỏ H 0 nếu z < -1.645.
Giải thủ công
43
33
p̂1 = = .11
300
84
p̂2 = = .28
300
z= 1
( ˆp − ˆp2 ) − ( p1 − p2 ) = ( .11 − .28) − ( −.08) = −2.85
+ ( .11)( .89 ) + ( .28)( .72 )
n1 n2 300 300

Macros đã được tạo để giải quyết vấn đề. Dữ liệu gồm 1s (thành công) và 0s (thất bại) được
lưu trữ ở cột 1 (mẫu 1) và 2 (mẫu 2).
Đầu ra Excel cho Ví dụ 11.
A B C
1 z-Test: Hai tỷ lệ
2
3 Quy trình 1 Quy trình 2
4 Tỷ lệ mẫu 0.11 0.28
5 Quan sát 300 300
6 Giả thuyết khác biệt -0.08.
7 t Stat -2.8484
8 P(T<=1) một phía 0.0022
10 P(T<=t) hai phía 0.0044.
Giá trị của thống kê thử nghiệm là -2.8484 và giá trị p của nó là .0022.
1 Nhập hoặc thêm dữ liệu vào hai cột liền kề. Mở tệp XM11-08
2 Nhấp Công cụ, Phân tích dữ liệu,… và z-Test:
Hai tỷ lệ (Trường hợp 2).
3 Chỉ rõ phạm vi biến 1 và phạm vi biến 2. A1:A301 và B1:B301
4 Chỉ rõ mã để thành công. 1
5 Chỉ rõ sự khác biệt giả thuyết. -0.08
6 Nhấp Biểu tượng, nếu thích hợp.
Kết luận: Vì z = −2.85  −1.645, không thể bác bỏ giả thuyết H 0 .

Có đủ bằng chứng để kết luận rằng tỷ lệ các thành phần khiếm khuyết được sản xuất bởi đổi
44
mới 1 nhỏ hơn 8% so với tỷ lệ các thành phần bị lỗi do đổi mới 2 tạo ra. Đánh giá từ độ lớn
của giá trị p, có vẻ như bằng chứng là áp đảo. Theo đó, công ty nên áp dụng đổi mới 1.
Các yếu tố quan trọng cho ta biết khi nào nên sử dụng kiểm định z của p1 − p2 như sau.
Các yếu tố xác định z-test của p1 − p2 .

2 Loại dữ liệu: Định tính (danh nghĩa)
45
CÁC LOẠI THUỐC ĐẮT TIỀN CÓ CỨU ĐƯỢC NHIỀU MẠNG SỐNG HƠN
KHÔNG?: GIẢI PHÁP

Mục tiêu của vấn đề là so sánh hai quần thể, kết quả của các phương pháp điều trị với t-PA và
với streptokinase. Dữ liệu là danh nghĩa vì chúng tôi chỉ ghi lại việc bệnh nhân sống hay chết.
Do đó, tham số là p1 − p2 , trong đó p1 = tỷ lệ tử vong với t-PA và p1 = tỷ lệ tử vong với
streptokinase. Chúng tôi muốn kiểm tra xem có bất kỳ sự khác biệt nào về tỷ lệ tử vong giữa
hai loại thuốc hay không. Chúng tôi sẽ sử dụng mức tin cậy 5%.
Giải thủ công

Tỷ lệ mẫu là
1497 1292
ˆp1 = = .0730; ˆp2 = = .0630
20500 20500
1497 + 1292
p̂ = = .06802
20500 + 20500
Bởi vì chúng tôi muốn biết liệu có bất kỳ sự khác biệt nào giữa tỷ lệ tử vong của hai nhóm hay
không, giả thuyết thay thế là
H A : ( p1 − p2 )  0
Giả thuyết vô hiệu phải là
H 0 : ( p1 − p2 ) = 0
cho chúng ta biết rằng đây là một ứng dụng của Trường hợp 1… Hơn nữa,
n1 ˆp1 = 1497  5, n2 ˆp2 = 1292  5, n1qˆ 1 = 19 003  5, n2qˆ 2 = 19 208  5 .
Vậy, giá trị của thống kê kiểm định:
z=
( ˆp1 − ˆp2 ) = ( .0730 − .0630 ) = 4.02
1 1  1 1 
ˆpqˆ  +  ( .0680 )( .932 )  + 
 1
n n2   20500 20500 
Do đó, giá trị p = 2P (z > 4.02) = 0 < ∝, chúng tôi bác bỏ giả thuyết vô hiệu rằng không có sự
khác biệt giữa tác dụng của hai loại thuốc.
BÀI TẬP
Học các kỹ thuật
11.48 Kiểm tra giả thuyết sau:
a. H 0 : ( p1 − p2 ) = 0
H A : ( p1 − p2 )  0
n1 = 100 n2 = 150  = 0.01 x1 = 50 x2 = 90
b. H 0 : ( p1 − p2 ) = 0.05
H A : ( p1 − p2 )  0.05
n1 = 500 n2 = 400  = 0.05 x1 = 200 x2 = 100
11.49 Kiểm tra giả thuyết sau:

46
H 0 : ( p1 − p2 ) = 0
H A : ( p1 − p2 )  0
n1 = 250 n2 = 400  = 0.01 p̂1 = 0.24 p̂2 = 0.17
11.50 Cho n1 = 40 , p̂1 = 0.25 , n2 = 50 , p̂2 = 0.32 kiểm tra để xác định xem có đủ bằng
chứng ở mức tin cậy 5% để chỉ ra rằng p2  p1 .
11.52 Một mẫu ngẫu nhiên của n1 = 1000 từ quần thể 1 có x1 = 500 và một mẫu ngẫu nhiên
của n2 = 1500 từ quần thể 1 có x2 = 500 . Chúng ta có thể kết luận với  = 0.10 rằng p1 vượt
quá p2 ít nhất 0.10 không?
11.53 Kiểm tra các giả thuyết sau:
H 0 : ( p1 − p2 ) = 0.25
H A : ( 1 − 2 )  0.25
n1 = 200 n2 = 500  = 0.01 x1 = 60 x2 = 50
11.54 Một mẫu ngẫu nhiên của n1 = 200 từ quần thể 1 có x1 = 50 và một mẫu ngẫu nhiên của
n2 = 100 từ quần thể 1 có x2 = 35 . Chúng ta có thể kết luận với  = 0.10 rằng p1 ≠ p2 ?
Áp dụng các kỹ thuật

11.55 Bài tập tự điều chỉnh. Trong một cuộc khảo sát dư luận, 60 trong số 100 cử tri có thu
nhập cao và 40 trong số 75 cử tri có thu nhập thấp ủng hộ việc đưa ra một loại thuế an ninh
quốc gia mới. Chúng ta có thể kết luận ở mức tin cậy 5% rằng tỷ lệ cử tri ủng hộ thuế an ninh
quốc gia mới khác nhau giữa cử tri có thu nhập cao và thấp không?
11.56 Một công ty dược phẩm đã sản xuất vắc-xin cúm. Trong một thử nghiệm về hiệu quả
của nó, 1000 người đã được chọn ngẫu nhiên; Trong số này, 500 người đã được tiêm vắc-xin
và 500 người còn lại không được điều trị. Số người trong mỗi nhóm bị cúm trong ba tháng tới
được tóm tắt trong bảng sau.
Số lượng người
Điều kiện Điều trị bằng vắc-xin Không được điều trị
Phát triển bệnh cúm 80 120
Không phát triển bệnh cúm 420 380
Những dữ liệu này có cung cấp đủ bằng chứng cho thấy vắc-xin có hiệu quả trong việc ngăn
ngừa bệnh cúm không? (Sử dụng  = 0.05 .)
11.57 Trong một mẫu ngẫu nhiên gồm 500 TV từ một dây chuyền sản xuất lớn, có 80 bộ bị
lỗi. Trong một mẫu ngẫu nhiên gồm 200 máy truyền hình từ dây chuyền sản xuất thứ hai, có
10 bộ bị lỗi. Những dữ liệu này có cung cấp đủ bằng chứng để xác định rằng tỷ lệ các bộ bị lỗi
từ dòng đầu tiên vượt quá tỷ lệ các bộ bị lỗi từ dòng thứ hai ít nhất 3% không? (Sử dụng
 = 0.05 .)
11.58 Một cuộc khảo sát để nghiên cứu tính hữu ích của Internet đã sử dụng một mẫu gồm
330 nhà quản lý, chuyên gia và giám đốc điều hành. Nhóm này bao gồm 132 người dùng
47
Internet, 102 người không sử dụng Internet và 96 người nói rằng họ sẽ bắt đầu sử dụng Internet
tương đối sớm. Khi được hỏi liệu truy cập Internet có làm tăng năng suất cá nhân hay không,
50% người không sử dụng và người dùng nói 'không', cũng như 25% người dùng. Chúng ta có
thể kết luận từ những dữ liệu này, ở mức tin cậy 1%, rằng người dùng và người không sử dụng
(bao gồm cả người đấu thầu) khác nhau về ý kiến của họ về tính hữu ích của Internet không?
11.59 Các cuộc khảo sát đã được sử dụng rộng rãi bởi các chính trị gia trên khắp thế giới như
một cách theo dõi ý kiến của cử tri. Sáu tháng trước, một cuộc khảo sát đã được thực hiện để
xác định mức độ ủng hộ đối với một chính trị gia của Đảng Quốc gia. Trong số 1100 mẫu,
56% cho biết họ sẽ bỏ phiếu cho chính trị gia này. Trong tháng này, một cuộc khảo sát khác
với 800 cử tri cho thấy 46% hiện ủng hộ chính trị gia này.
a. Ở mức tin cậy 5%, chúng ta có thể suy ra rằng sự nổi tiếng của chính trị gia đã giảm không?
b. Ở mức tin cậy 5%, chúng ta có thể suy ra rằng sự nổi tiếng của chính trị gia đã giảm hơn 5%
không?
c. Ước tính mức giảm tỷ lệ phần trăm hỗ trợ từ nay đến sáu tháng trước.
Máy tính / Giải quyết bằng tay

11.60 Một mẫu ngẫu nhiên của n1 = 1000 từ quần thể 1 và một mẫu ngẫu nhiên của n2 = 600
từ quần thể 1 có x2 = 500 . từ dân số 2 tạo ra dữ liệu trong cột 1 và 2, tương ứng, trong tệp
XR11-60. Kết quả là thành công (1) hoặc thất bại (0).
Kiểm tra ở mức tin cậy 1% để xác định xem chúng ta có thể suy ra rằng hai tỷ lệ dân số thành
công khác nhau hay không.
Sử dụng gói phần HOẶC Các phân bố tần số như sau:
mềm để giải quyết Cột 1: số 0s, 301; số 1s, 699
vấn đề này. Cột 2: số 0s, 156; số 1s, 444
Hoàn thành câu trả lời bằng cách tính thủ
công.
11.61 Dữ liệu được lưu trữ trong cột 1 và 2 trong tệp XR11-61 được rút ra từ các mẫu ngẫu
nhiên từ hai quần thể dữ liệu định tính trong đó 1 = thành công và 0 = thất bại.
a. Những dữ liệu này có cho phép chúng ta suy ra ở mức tin cậy 1% mà p2  p1 không?
b. Những dữ liệu này có cho phép chúng ta suy ra ở mức tin cậy 1% rằng p1 vượt quá p2 hơn
3% không?
thủ công.
11.62 Một công ty bảo hiểm đang suy nghĩ về việc giảm giá các hợp đồng bảo hiểm nhân thọ
của mình cho những người không hút thuốc. Là một phần của phân tích, nó chọn ngẫu nhiên
200 người đàn ông 60 tuổi và hỏi họ liệu họ có hút ít nhất một gói thuốc lá mỗi ngày hay không
và họ đã từng bị bệnh tim chưa. Kết quả được lưu trữ trong tệp XR11-62 theo định dạng sau.
Cột 1: mẫu người hút thuốc: 1 = bị bệnh tim; 0 = không bị bệnh tim
Cột 2: mẫu người không hút thuốc: 1 = bị bệnh tim; 0 = không bị bệnh tim
48
Công ty có thể kết luận ở mức tin cậy 5% rằng những người hút thuốc có tỷ lệ mắc bệnh tim
cao hơn những người không hút thuốc không?
thủ công.
11.63 Một nhà nghiên cứu thị trường được tuyển dụng bởi một chuỗi các trung tâm dịch vụ
cung cấp thay dầu và bộ lọc không chờ đợi muốn biết liệu nam giới và phụ nữ có khác nhau
trong việc sử dụng dịch vụ của công ty hay không. Thông tin như vậy sẽ hữu ích trong việc
thiết kế quảng cáo. Một mẫu ngẫu nhiên gồm 500 người đã được chọn và mỗi người được hỏi
liệu họ có thay dầu và bộ lọc tại trung tâm dịch vụ không chờ đợi hay không. Các câu trả lời
và giới tính của những người được hỏi đã được lưu trữ trong tệp XR11-63 theo cách sau.
Cột 1: nữ: 1 = sử dụng dịch vụ không chờ đợi; 0 = không sử dụng dịch vụ không chờ đợi
Cột 2: nam: 1 = sử dụng dịch vụ không chờ đợi; 0 = không sử dụng dịch vụ không chờ đợi
Chúng ta có thể kết luận ở mức tin cậy 5% rằng nam giới và phụ nữ khác nhau trong việc sử
dụng dịch vụ thay dầu này không?
thủ công.
49
Phần 11.5 Tóm tắt
Các kỹ thuật được sử dụng để kiểm tra sự khác biệt giữa hai quần thể đã được mô tả trong
chương này, khi kiểu dữ liệu là định lượng, tham số chúng tôi kiểm tra là 1 − 2 . Ba thống kê
thử nghiệm cho tham số này được liệt kê trong Bảng 11.1.
Khi hai phương sai quần thể được biết đến, hai quần thể là bình thường hoặc kích thước mẫu
lớn và hai mẫu độc lập, thống kê z được sử dụng. Khi hai phương sai quần thể không xác định,
hai quần thể là bình thường và hai mẫu độc lập, thống kê f cho phép chúng ta rút ra suy luận.
Nếu dữ liệu được phân phối thông thường được tạo ra từ một thử nghiệm cặp phù hợp, chúng
tôi ước tính và kiểm tra chênh lệch trung bình  D tương đương với 1 − 2 . Khi kiểu dữ liệu
là định tính, tham số quan tâm là p1 − p2 . Hai thống kê kiểm định được sử dụng cho tham số
này cũng được nêu ở Bảng 11.1.
Thuật ngữ quan trọng
Kiểm tra t với phương sai đồng đều của

Thống kê t
1 − 2
Kiểm tra t với phương sai không đồng đều của

Mẫu độc lập
1 − 2
Thử nghiệm cặp phù hợp Thống kê z
Ước tính tỉ lệ gộp Thống kê z của p1 − p2
Phương sai gộp Thống kê z của 1 − 2
50
Tóm tắt công thức
Bảng 11.1. Tóm tắt của thống kê kiểm định đối với 1 − 2 và p1 − p2
Thông số Thống kê kiểm định Điều kiện bắt buộc
 12 và  22 đã biết; x1 và x2
z=
( x1 − x2 ) − ( 1 − 2 ) phân phối thường hoặc
1 − 2  2
 2
n1  30 và n2  30 ; mẫu
1
+ 2
n1 n2
độc lập
t=
( x1 − x2 ) − ( 1 − 2 )
s12 s22  12 và  22 chưa biết và
+
1 − 2
n1 n2
(
khác nhau  12   22 ; x1 )
(s / n1 + s / n2 )
2 2 2
d.f. =
1 2
và x2 phân phối thường;
 ( s 2 / n )2 ( s 2 / n )2 
 1 1 + 2 2  mẫu độc lập
 n1 − 1 n2 − 1 
 
 12 và  22 chưa biết và
t=
( x1 − x2 ) − ( 1 − 2 )
1 − 2
1 1 (
bằng nhau  12 =  22 ; x1 )
s  + 
2
p
 n1 n2  và x2 phân phối thường;
d.f. = n1 + n2 − 2.
mẫu độc lập
xD = x1 − x2 là phân phối
x − D
t= D thường; mẫu không độc
D = 1 − 2 sD / nD
d . f . = nD − 1 lập; các mẫu là các cặp phù
hợp
z=
( ˆp1 − ˆp2 ) − ( p1 − p2 ) Giả thuyết không
p1 − p2 1 1 H 0 : ( p1 − p2 ) = 0;
ˆpqˆ  + 
 n1 n2  n1 ˆp1 ,n1qˆ 1 ,n2 ˆp2 ,n2 qˆ 2  5
Giả thuyết không

z=
( ˆp1 − ˆp2 ) − ( p1 − p2 )
p1 − p2 ˆp1qˆ 1 ˆp2 qˆ 2
+ H 0 : ( p1 − p2 ) = D,( D  0 )
n1 n2
n1 ˆp1 ,n1qˆ 1 ,n2 ˆp2 ,n2 qˆ 2  5
51
Bài tập bổ sung
11.64 Tham khảo Ví dụ 11.7.
a. Ở mức tin cậy 0.005, những kết quả này có chỉ ra rằng aspirin có hiệu quả trong việc giảm
tỷ lệ đau tim không?
b. Một nghiên cứu khác đã cố gắng nhân rộng kế hoạch nghiên cứu tương tự; Tuy nhiên, nó chỉ
sử dụng 5000 người đàn ông (2500 người dùng aspirin và 2500 người dùng giả dược). Giả sử
rằng tỷ lệ tương ứng của những người đàn ông bị đau tim là hoàn toàn giống nhau như nghiên
cứu ở phần (a). Liệu kết quả trên cho phép chúng ta đưa ra kết luận tương tự với  = 0.005
hay không? Nếu kết luận không giống ở cả hai nghiên cứu, hãy giải thích tại sao.
11.65 Hơn 50 năm qua, công chúng ngày càng chỉ trích hệ thống giáo dục. Trong một loạt các
cuộc khảo sát từ năm 1948 đến năm 1998, mọi người được hỏi: "Bạn có nghĩ rằng trẻ em ngày
nay đang được giáo dục tốt hơn hay được giáo dục kém hơn bạn không?" Kết quả được hiển
thị trong bảng sau.
Đánh giá hệ thống giáo dục (%)

Năm Tốt hơn Xấu Giống Không thể nói
1948 74 12 10 4
1971 63 20 12 5
1976 49 33 13 5
1981 47 38 9 6
1998 52 31 12 5
Giả sử rằng các cuộc khảo sát năm 1981 và 1998 đều dựa trên 1049 cuộc phỏng vấn, chúng ta
có thể kết luận rằng có sự khác biệt đáng kể về tỷ lệ những người trả lời 'Tốt hơn' giữa năm
1981 và 1998 không? (Sử dụng  = 0.10. )
11.66 Một nhà hàng nằm trong một tòa nhà văn phòng quyết định áp dụng một chiến lược
mới để thu hút khách hàng. Mỗi tuần nó quảng cáo trên báo thành phố. Trong 10 tuần ngay
trước chiến dịch quảng cáo, tổng doanh thu trung bình hàng tuần là $10.500, với độ lệch chuẩn
là $750. Trong tám tuần sau khi chiến dịch bắt đầu, tổng doanh thu trung bình hàng tuần là $12
000, với độ lệch chuẩn là $1000.
a. Giả sử rằng doanh thu hàng tuần thường được phân phối, chúng ta có thể kết luận, với
 = 0.10 , rằng chiến dịch quảng cáo đã thành công không?
b. Giả sử rằng lợi nhuận ròng là 20% tổng cộng. Nếu quảng cáo có giá 100 mỗi tuần, chúng tôi
có thể kết luận ở mức tin cậy 10% rằng quảng cáo đáng giá không?
11.67 Có phải mọi người đã dần không tin tưởng các nhà báo truyền hình và báo chí? Một
cuộc khảo sát đã được thực hiện vào năm 1997 để so sánh những gì mọi người nghĩ về báo chí
khi đó, so với những gì họ nói họ nghĩ vào năm 1987. Kết quả được hiển thị trong bảng sau.
52
Tỉ lệ phần trăm đồng ý (%)
Ý kiến đề xuất
1987 1997
1 Các báo cáo báo chí 'thường không chính xác' 34 48
Báo chí 'có xu hướng ủng hộ một phía' khi đưa

2 53 59
tin về các vấn đề chính trị và xã hội
Báo chí 'thường xuyên xâm phạm quyền riêng tư
3 73 78
của mọi người'
4 Đánh giá tin tức truyền hình 'rất thuận lợi' 25 18
5 Đánh giá báo hàng ngày 'rất thuận lợi' 25 21
Chúng ta có thể kết luận ở mức tin cậy 5% rằng mọi người đã trở nên không tin tưởng vào báo
cáo truyền hình và báo chí vào năm 1997 so với năm 1987 không? (Giả sử rằng số người trả
lời trong mỗi cuộc khảo sát là 400.)
11.68 Chủ sở hữu của hai nhà hàng thành phố (có khách hàng chủ yếu là nhân viên văn phòng
vào giờ nghỉ giải lao) mỗi nhà hàng tuyên bố phục vụ nhiều cà phê hơn nhà hàng kia. Để kiểm
tra tuyên bố của họ, số tách cà phê được bán trong năm ngày được chọn ngẫu nhiên tại Nhà
hàng 1 và năm ngày được chọn ngẫu nhiên khác trong Nhà hàng 2 đã được tính. Dữ liệu kết
quả được trình bày trong bảng sau. (Sau một số phân tích, người ta xác định rằng số lượng tách
cà phê thường được phân phối.) Chúng ta có thể kết luận rằng có một sự khác biệt giữa doanh
số bán cà phê trung bình của cả hai nhà hàng? (Sử dụng  = 0.10. )
Số tách cà phê bán ra

Nhà hàng 1 Nhà hàng 2
670 410
42.0 500
515 440
690 640
825 650
11.69 Trong nỗ lực giảm tình trạng vắng mặt, một công ty điện tử đã khởi xướng một chương
trình theo đó nhân viên có thể tham gia xổ số hàng tháng, với điều kiện họ phải tham dự đúng
giờ trong tháng. Giải thưởng tiền mặt trị giá $10 được trao cho người chiến thắng của mỗi lần
xổ số hàng tháng. Khoảng 80 nhân viên đã tham gia chương trình. Để đánh giá tác động của
chương trình, các so sánh đã được thực hiện giữa chi phí nghỉ ốm trong tám tháng được chọn
ngẫu nhiên trước và sáu tháng được chọn ngẫu nhiên sau khi hệ thống được thiết lập. Kết quả
được hiển thị trong bảng sau. Chúng ta có thể kết luận ở mức tin cậy 5% rằng chi phí nghỉ ốm
trung bình hàng tháng thấp hơn sau khi tổ chức chương trình không?
53
Chi phí hàng tháng trước ($) Đăng chi phí hàng tháng ($)
903 746
812 775
1012 596
855 767
826 469
814 670
755
690
Máy tính/Giải bằng bài tập thủ công
11.70 Mặc dù việc sử dụng dây an toàn được biết là cứu sống và giảm chấn thương nghiêm
trọng, nhiều người vẫn không đeo chúng khi họ đi du lịch trong xe hơi. Trong nỗ lực tăng
cường sử dụng dây an toàn, một cơ quan chính phủ đã tài trợ cho một nghiên cứu kéo dài hai
năm. Trong số các mục tiêu của nó là xác định xem có đủ bằng chứng để biện minh cho các
kết luận sau đây hay không.
a. Việc sử dụng dây an toàn đã tăng lên từ năm ngoái đến năm nay.
b. Cho đến nay, dây an toàn được phụ nữ sử dụng thường xuyên hơn nam giới.
Để kiểm tra những niềm tin này, một mẫu ngẫu nhiên các tài xế nam và nữ vào năm ngoái và
năm nay đã được lấy mẫu và hỏi liệu họ có luôn sử dụng dây an toàn hay không. Các câu trả
lời được lưu trữ trong tệp XR11-70 theo cách sau.
Cột 1: trả lời khảo sát năm ngoái, người trả lời nữ: 1 = thắt dây an toàn; 0 = Không thắt dây an
toàn
Cột 2: trả lời khảo sát năm ngoái, người trả lời nam: 1 = thắt dây an toàn; 0 = không thắt dây
an toàn
Cột 3: trả lời khảo sát năm nay, người trả lời là nữ; 1 = thắt dây an toàn; 0 = không thắt dây an
toàn
Cột 4: Đáp án khảo sát năm nay, nam trả lời: 1 = thắt dây an toàn; 0 = không thắt dây an toàn
Những kết luận nào có thể rút ra được từ kết quả? (Sử dụng mức tin cậy 5%.)
Cột 3: số 0s, 38; số 1s, 150
Cột 4: số 0s, 72; số 1s, 166
Hoàn thành câu trả lời bằng cách tính thủ
công.
11.71 Một thành phần quan trọng của chi phí sinh hoạt là số tiền chi cho nhà ở. Chi phí nhà ở
bao gồm tiền thuê nhà (cho người thuê nhà), thanh toán thế chấp và thuế tài sản ( đối với chủ
sở hữu nhà), sưởi ấm, điện và nước. Một nhà kinh tế đã thực hiện một nghiên cứu kéo dài năm
năm để xác định chi phí nhà ở đã thay đổi như thế nào. Năm năm trước, ông đã lấy một mẫu
ngẫu nhiên của 200 hộ gia đình và ghi lại tỷ lệ phần trăm tổng thu nhập chi cho nhà ở. Năm
54
nay, ông lấy một mẫu khác của 200 hộ gia đình. Dữ liệu được lưu trữ trong cột 1 (năm năm
trước) và 2 (năm nay) trong tệp XR11-71.
a. Tiến hành kiểm tra (với  = .10 ) để xác định xem nhà kinh tế có thể suy ra rằng chi phí nhà
ở theo tỷ lệ phần trăm của tổng thu nhập đã tăng trong năm năm qua hay không.
b. Sử dụng bất kỳ phương pháp thống kê nào bạn cho là phù hợp để kiểm tra (các) phép thử
được yêu cầu của thử nghiệm được sử dụng trong phần (a).
vấn đề này. n1 = 200; x1 = 32.42;s1 = 6.08
n2 = 200; x2 = 33.72;s2 = 6.75
thủ công.
11.72 Trong việc thiết kế các chiến dịch quảng cáo để bán tạp chí, điều quan trọng là phải biết
mỗi nhóm nhân khẩu học dành bao nhiêu thời gian để đọc tạp chí. Trong một nghiên cứu sơ
bộ, 40 người đã được chọn ngẫu nhiên. Mỗi người được hỏi họ dành bao nhiêu thời gian mỗi
tuần để đọc tạp chí; Ngoài ra, mỗi người được phân loại theo giới tính và theo mức thu nhập
(cao hoặc thấp). Dữ liệu được lưu trữ trong tệp XR11-72 theo cách sau: cột 1 = thời gian đọc
tạp chí mỗi tuần tính bằng phút cho tất cả người trả lời; cột 2 = giới tính (1 = nam và 2 = nữ);
Cột 3 = Mức thu nhập (1 = thấp và 2 = cao).
a. Có đủ bằng chứng ở mức tin cậy 5% để kết luận rằng đàn ông và phụ nữ khác nhau về lượng
thời gian đọc tạp chí không?
b. Có đủ bằng chứng ở mức 5% để kết luận rằng những người có thu nhập cao dành nhiều thời
gian để đọc tạp chí hơn những người có thu nhập thấp không?
c Có phải các điều kiện cần thiết cho các thử nghiệm trên được thỏa mãn?
vấn đề này. Nam: x = 39.75;s = 28.35
Nữ: x = 49.00;s = 27.08
Thu nhập thấp: x = 33.10;s = 16.69
Thu nhập cao: x = 56.84;s = 32.37
thủ công.
11.73 Trước khi quyết định nên mua loại nào trong hai loại máy dập, người quản lý nhà máy
của nhà sản xuất phụ tùng ô tô muốn xác định số lượng đơn vị mà mỗi loại sản xuất. Hai máy
khác nhau về chi phí, độ tin cậy và năng suất. Kế toán của công ty đã tính toán rằng máy A phải
sản xuất nhiều hơn 25 đơn vị không bị lỗi mỗi giờ so với máy B để đảm bảo mua máy A. Để
giúp quyết định, cả hai máy đã được vận hành trong 24 giờ. Tổng số đơn vị và số lượng đơn vị
không bị lỗi được sản xuất bởi mỗi máy mỗi giờ đã được ghi lại. Các dữ liệu này được lưu trữ
trong tệp XR11-73 (cột 1 = tổng số đơn vị do máy A sản xuất; cột 2 = số lỗi do máy A sản xuất;
55
cột 3 = tổng số đơn vị sản xuất bằng máy B; cột 4 = số lỗi do máy B sản xuất) và liệt kê như
sau. Xác định máy nên được mua. (Sử dụng mức tin cậy 5%).
Máy A Máy B
Tổng số đơn vị Số lượng khiếm Tổng số đơn vị mỗi Số lượng khiếm
mỗi giờ khuyết giờ khuyết
247 10 219 12
242 13 218 4
250 3 205 12
233 10 216 17
241 11 222 23
244 11 216 14
252 11 218 15
236 14 197 4
244 19 217 18
255 14 205 15
229 11 210 6
255 16 219 11
250 12 207 14
252 16 227 18
235 8 208 4
225 8 207 14
233 7 223 10
243 11 203 7
238 22 228 24
232 4 215 17
237 5 213 22
247 11 211 16
247 10 214 17
2.21 8 236 18
11.74 Mức quan trọng đối với sức khỏe của bạn là ngày lễ thường xuyên thế nào? Trong một
nghiên cứu, một mẫu ngẫu nhiên của đàn ông và phụ nữ được hỏi tần suất họ đi nghỉ. Những
người đàn ông và phụ nữ được chia thành hai nhóm mỗi nhóm. Các thành viên của nhóm 1 đã
bị đau tim; Các thành viên của nhóm 2 thì không. Số ngày nghỉ lễ năm ngoái được ghi nhận
cho mỗi người. Dữ liệu được lưu trữ trong tệp XR11-74. Chúng ta có thể suy luận rằng những
người đàn ông và phụ nữ bị đau tim có ít ngày nghỉ hơn những người không bị đau tim?
11.75 Hầu hết mọi người tập thể dục để giảm cân. Để xác định những cách tốt hơn để giảm
cân, một mẫu ngẫu nhiên những người tập thể dục nam và nữ được chia thành các nhóm. Nhóm
đầu tiên tập thể dục mạnh mẽ hai lần một tuần. Nhóm thứ hai tập thể dục vừa phải bốn lần mỗi
tuần. Việc giảm cân cho mỗi cá nhân được ghi lại và lưu trữ trong tệp XR11-75. Liệu có thể
suy luận rằng những người tập thể dục vừa phải thường xuyên giảm cân nhanh hơn không?
11.76 Sau khi quan sát kết quả của bài kiểm tra trong Bài tập 11.75, một nhà thống kê đã tổ
chức một thí nghiệm khác. Mọi người được kết hợp theo giới tính, chiều cao và cân nặng. Một
thành viên của mỗi cặp phù hợp sau đó tập thể dục mạnh mẽ hai lần một tuần và thành viên
còn lại tập thể dục vừa phải bốn lần mỗi tuần. Các tổn thất trọng lượng được lưu trữ trong tệp
XR11-76. Liệu có thể suy luận rằng những người tập thể dục vừa phải thường xuyên giảm cân
nhanh hơn không?
56
11.77 Nhiều nhà bán lẻ nhỏ quảng cáo trong khu phố của họ bằng cách gửi tờ rơi. Mọi người
giao những thứ này đến nhà và được trả tiền theo số lượng tờ rơi được giao. Mỗi người giao
hàng được cung cấp một số đường phố mà nhà của họ trở thành trách nhiệm của họ. Một trong
những cách các nhà bán lẻ sử dụng để kiểm tra hiệu suất của người giao hàng là lấy mẫu ngẫu
nhiên một số ngôi nhà và hỏi chủ nhà xem họ có nhận được tờ rơi hay không. Gần đây, một
nhóm sinh viên đại học đã bắt đầu một dịch vụ giao hàng mới. Họ đã hứa hẹn dịch vụ tốt hơn
với giá cả cạnh tranh. Một nhà bán lẻ muốn biết liệu tỷ lệ giao hàng của công ty mới có tốt hơn
so với công ty hiện tại hay không. Cô ấy đã nhờ cả hai công ty phát tờ rơi cho mình. Các mẫu
nhà ngẫu nhiên đã được rút ra và mỗi người được hỏi liệu họ có nhận được tờ rơi hay không (2
- có và 1 - không). Những dữ liệu này được lưu trữ trong tệp XR11-77. Nhà bán lẻ có thể kết
luận rằng công ty mới tốt hơn không? (Thử nghiệm với  = .10. .)
11.78 Hôn nhân có tốt cho sức khỏe của bạn không? Để trả lời câu hỏi này, các nhà nghiên
cứu tại một trường đại học Perth đã theo dõi 103 cặp vợ chồng, mỗi cặp có một người phối
ngẫu bị tăng huyết áp nhẹ (huyết áp cao nhẹ). Những người tham gia cũng hoàn thành một
bảng câu hỏi về cuộc hôn nhân của họ. Ba năm sau, huyết áp của người phối ngẫu tăng lên so
với huyết áp trước đó đã được đo. Việc giảm huyết áp cho những người trong cuộc hôn nhân
hạnh phúc được lưu trong cột 1 trong tệp XR11-78. Việc giảm bớt những người trong cuộc hôn
nhân không hạnh phúc được lưu trữ trong cột 2. Liệu có thể suy luận rằng vợ chồng trong hôn
nhân hạnh phúc có huyết áp giảm nhiều hơn những người có cuộc hôn nhân không hạnh phúc?
Trường hợp 11.1 Sinh viên thay thế trong nghiên cứu thị trường
Các nhà nghiên cứu trong cả thế giới kinh doanh và thế giới học thuật thường coi sinh viên đại
học là đại diện của dân số trưởng thành. Thực hành này làm giảm chi phí lấy mẫu rất nhiều,
nhưng hiệu quả của nó vẫn còn là câu hỏi. Một thí nghiệm đã được thực hiện để xác định sự
phù hợp của việc sử dụng người thay thế sinh viên trong nghiên cứu. Nghiên cứu sử dụng ba
nhóm người:
1 Đầu tiên bao gồm 59 người lớn (18 tuổi trở lên) được chọn để họ đại diện theo độ tuổi
và nghề nghiệp dân số trưởng thành.
2 Nhóm thứ hai bao gồm 42 sinh viên theo học một môn tiếp thị giới thiệu tại một trường
đại học. Nhiều sinh viên đã được đăng ký vào một chương trình kinh doanh, nhưng một số ít
là chuyên ngành tiếp thị.
3 Nhóm thứ ba bao gồm 33 sinh viên theo học một môn tiếp thị nâng cao, hầu hết tất cả
đều là chuyên ngành tiếp thị.
Thử nghiệm bao gồm hiển thị cho mỗi nhóm một chuỗi ba quảng cáo truyền hình dài 30 giây
liên quan đến các tổ chức tài chính. Mỗi người trả lời được yêu cầu đánh giá từng quảng cáo
trên cơ sở độ tin cậy và sự quan tâm. Các câu trả lời được ghi lại trên thang điểm đánh giá đồ
họa 10 điểm, trong đó xếp hạng cao hơn thể hiện độ tin cậy hoặc sự quan tâm lớn hơn. Giá trị
mẫu và độ lệch chuẩn sau đó được tính toán và chúng được hiển thị trong Bảng A và B.
57
Bạn có thể rút ra kết luận gì về sự phù hợp của việc sử dụng sinh viên làm người thay thế trong
nghiên cứu tiếp thị?
Bảng A So sánh câu trả lời của sinh viên tiếp thị giới thiệu, sinh viên tiếp thị nâng
cao và người lớn: Độ tin cậy của quảng cáo
Sinh viên marketing Sinh viên tiếp thị Người trưởng
nhập môn nâng cao thành
Quảng cáo x s x s x s
1 6.7 2.5 6.6 3.1 6.9 2.7
2 7.3 2.6 7.2 2.3 6.1 3.0
3 5.9 2.7 6.6 2.8 7.0 2.9
Bảng B So sánh câu trả lời của sinh viên tiếp thị giới thiệu, sinh viên tiếp thị nâng
cao và người lớn: Độ tin cậy của quảng cáo
Sinh viên marketing Sinh viên tiếp thị Người trưởng
nhập môn nâng cao thành
Quảng cáo x s x s x s
1 4.5 3.2 4.3 2.8 5.9 2.4
2 6.0 2.7 6.1 2.5 4.5 2.9
3 4.0 2.6 4.3 2.8 5.8 3.1
Trường hợp 11.2 Niềm tin của người tiêu dùng
Niềm tin của người tiêu dùng là một trong những chỉ số chính phản ánh tình trạng của nền kinh
tế. Nhiều doanh nghiệp, chính phủ và các nhà phân tích chính sách sử dụng xếp hạng niềm tin
của người tiêu dùng để sửa đổi các chính sách kinh tế và kinh doanh khác nhau. Sau đây là Xếp
hạng độ tin cậy Roy Morgan cho 4 câu hỏi thành phần trong các tháng được chọn trong năm
2002. Phân tích dữ liệu.
Phản ứng Kích

thước mẫu
Câu hỏi Tháng Khá giả hơn Tệ hơn Không thể nói
Câu Hỏi 1
Đánh giá cá nhân Tháng 1 34 26 40 1081
Tình hình tài chính Tháng 4 32 29 39 1116
trong năm qua Tháng 7 33 28 39 1166
Tháng 10 34 30 36 1122
Câu Hỏi 2 43 12 45 1081
Đánh giá cá nhân Tháng 1
Tình hình tài chính Tháng 4 44 14 42 1116
trong năm tới Tháng 7 45 14 41 1166
Tháng 10 43 12 45 1122
58
Câu Hỏi 3 37 24 39 1081
Dự kiến kinh tế Tháng 1
Điều kiện trên Tháng 4 39 20 41 1116
Năm tới Tháng 7 36 22 42 1166
Tháng 10 29 31 40 1122
Câu Hỏi 4 36 15 49 1081
Dự kiến kinh tế Tháng 1
Điều kiện trên Tháng 4 37 16 47 1116
Năm năm tới Tháng 7 37 16 47 1166
Tháng 10 32 20 48 1122
Ghi chú
1 Chuyển thể từ R. Kesevan, D.G. Anderson và o. Mascarenhas, 'Sinh viên thay thế trong
nghiên cứu quảng cáo', Phát triển trong Khoa học Tiếp thị, vol. 7, 1984, trang 438-41.
2 www.roymorgan.com.au (tháng 4 năm 2003).
59
PHỤ LỤC 11.A Hướng dẫn Excel
Thao tác dữ liệu

Để sử dụng Excel để kiểm tra p, - ụ2, dữ liệu phải được xếp chồng lên nhau. Giả sử rằng dữ
liệu được xếp chồng lên nhau theo cách sau: cột A lưu trữ các quan sát và cột 8 lưu trữ các chỉ
mục. Nếu dữ liệu bị xáo trộn (không theo thứ tự), hãy tiến hành các bước 1, 2 và 3 bên dưới.
Nếu không, hãy chuyển sang bước 4.
1 Đánh dấu cột A và B.
2 Nhấp vào Dữ liệu và Sắp xếp ...
3 Chỉ định cột B và Tăng dần. Bấm OK.
Dữ liệu bây giờ sẽ không bị xáo trộn — tất cả các quan sát từ mẫu đầu tiên sẽ chiếm các hàng
trên cùng của cột A và các quan sát từ mẫu thứ hai sẽ chiếm các hàng dưới cùng của cột A. Để
sắp xếp chồng lên nhau, hãy đưa ra các lệnh sau. (Hie làm theo các lệnh giả định rằng chỉ có
hai mẫu.)
4 Đánh dấu các hàng của cột A được lấy từ mẫu 2.
5 Nhấp vào Chỉnh sửa và cắt.
6 Làm cho tế bào Cl hoạt động.
7 Tôi chỉnh sửa và dán.
8 Xóa cột B.
Cột A và B bây giờ sẽ lưu trữ dữ liệu không xếp chồng.
Có một số quy trình thống kê được Excel thực hiện trong các chương sau yêu cầu dữ liệu
được xếp chồng lên nhau. Nếu dữ liệu được trình bày cho bạn ở dạng không xếp chồng, bạn
sẽ phải xếp chồng chúng. Giả sử rằng có hai bộ quan sát hiện được lưu trữ trong cột A và B.
Để xếp chồng các quan sát của A trên B, hãy tiến hành như sau.
1 Tô sáng các ô trong cột B.
2 Nhấp vào Chỉnh sửa và cắt.
3 Đặt ô trống đầu tiên trong cột A hoạt động. Nhấp vào Chỉnh sửa và dán.
4 Nhập mã vào cột B.
Cột A và B bây giờ sẽ chứa dữ liệu xếp chồng lên nhau — tất cả các quan sát trong cột A và
các mã xác định mẫu trong cột B.
60

Chương VIII P2. Kiểm Định Giả Thiết - So Sánh Hai Quần Thể

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Chương VIII P2. Kiểm Định Giả Thiết - So Sánh Hai Quần Thể

Uploaded by

Copyright:

Available Formats

Chương VIII P2.

Kiểm định giả thiết – So sánh

Phần 11.1 Giới thiệu

1 Nếu  12 và  22 đã biết, và quần thể thường phân bố hoặc n1 và n2 lớn

Thống kê kiểm định: z =

2 Nếu  12 và  22 chưa biết, và  12 ≠  22

Thống kê kiểm định: t =

Ba ví dụ tiếp theo minh họa quy trình kiểm định 1 − 2 .

Phần kiểm định hoàn chỉnh như sau:

Bước 2: Thống kê kiểm định: z =

Sử dụng máy tính:

Bước 6: Kết luận: Vì z = 1.86  1.645, bác bỏ giả thuyết H 0 .

Kết luận: Vì t = −2.31  −1.708, bác bỏ giả thuyết H 0 .

ỨNG DỤNG TRONG QUẢN LÍ HOẠT ĐỘNG

Giá trị của thống kê kiểm định:

Kết luận: Vì t = .93  2.010, không thể bác bỏ giả thuyết H 0 .

Hình 11.3. Phân bố lấy mẫu, ví dụ 11.3

có phân phối t với d.f. =

Kết luận: Vì t = 0.44  1.292, nên không bác bỏ giả thuyết H 0 .

Kiểm tra điều kiện cần thiết

Hình 11.5 Biểu đồ thời gian lắp ráp cho Thiết kế B

Vi phạm điều kiện bắt buộc

Bình ngưng loại A Bình ngưng loại B

Bài tập máy tính

Thống kê kiểm định

Sử dụng máy tinh

Các giả thuyết cần kiểm định là

có phân phối t với bậc tự do số với điều kiện là sự khác biệt

Do đó, giá trị của thống kê kiểm định là:

Các yếu tố xác định t-test và ước lượng

1 Mục tiêu của vấn đề: So sánh hai quần thể

Quan sát Mẫu 1 Mẫu 2

Biến phân tích XD

Biến phân tích XD

Hãy hoàn thành câu trả lời của bạn

Hãy hoàn thành câu trả lời của bạn theo

đó là tiêu chuẩn phân phối bình thường.

(tỷ lệ thành công ở mẫu 1)

(tỷ lệ thành công ở mẫu 2)

(tỷ lệ thành công ở cả hai mẫu cộng lại)

Giả thuyết không ta có

1 z-Test của sự khác biệt giữa hai tỷ lệ (Trường hợp 1)

3 Mẫu 1 Mẫu 2 z Stat -4.9989

4 Tỷ lệ mẫu 0.009455 0.017182 P(Z<=z) một phía 0.0000

z Một phía quan

6 Alpha 0.05 P(Z<=z) hai phía 0.0000

z Hai phía quan

Giải thích kết quả

Mức độ tin cậy:  = .10

Sử dụng máy tính

Kết luận: Vì z = −2.85  −1.645, không thể bác bỏ giả thuyết H 0 .

Các yếu tố xác định z-test của p1 − p2 .

Xác định kỹ thuật

Giải thủ công

11.49 Kiểm tra giả thuyết sau:

Áp dụng các kỹ thuật

Máy tính / Giải quyết bằng tay

Thuật ngữ quan trọng

Kiểm tra t với phương sai đồng đều của

Kiểm tra t với phương sai không đồng đều của

Thử nghiệm cặp phù hợp Thống kê z

Ước tính tỉ lệ gộp Thống kê z của p1 − p2

Phương sai gộp Thống kê z của 1 − 2