Professional Documents
Culture Documents
STATISTICS
12/10/2020
Định nghĩa 1
(Giả thiết thống kê) Giả thiết thống kê là một khẳng định về giá trị của một tham
số đơn (đặc trưng cho một phân phối xác suất) hoặc về hình dạng của phân phối
xác suất.
Định nghĩa 1
(Giả thiết thống kê) Giả thiết thống kê là một khẳng định về giá trị của một tham
số đơn (đặc trưng cho một phân phối xác suất) hoặc về hình dạng của phân phối
xác suất.
Ví dụ 1
Điểm trung bình môn XSTK năm 2020 của các bạn SV là 8.5.
Định nghĩa 1
(Giả thiết thống kê) Giả thiết thống kê là một khẳng định về giá trị của một tham
số đơn (đặc trưng cho một phân phối xác suất) hoặc về hình dạng của phân phối
xác suất.
Ví dụ 1
Điểm trung bình môn XSTK năm 2020 của các bạn SV là 8.5.
Xác suất rớt môn XSTK của các bạn SV năm 2020 là 0.01.
Định nghĩa 2
(Kiểm định giả thiết) Là phương pháp mà sử dụng dữ liệu mẫu để kết luận có từ
chối giả thiết không (giả thiết ban đầu) H0 hay không.
Định nghĩa 2
(Kiểm định giả thiết) Là phương pháp mà sử dụng dữ liệu mẫu để kết luận có từ
chối giả thiết không (giả thiết ban đầu) H0 hay không.
Định nghĩa 2
(Kiểm định giả thiết) Là phương pháp mà sử dụng dữ liệu mẫu để kết luận có từ
chối giả thiết không (giả thiết ban đầu) H0 hay không.
Định nghĩa 2
(Kiểm định giả thiết) Là phương pháp mà sử dụng dữ liệu mẫu để kết luận có từ
chối giả thiết không (giả thiết ban đầu) H0 hay không.
Định nghĩa 2
(Kiểm định giả thiết) Là phương pháp mà sử dụng dữ liệu mẫu để kết luận có từ
chối giả thiết không (giả thiết ban đầu) H0 hay không.
Chú ý 1
Giả thiết H0 bị bác bỏ khi các giá trị thống kê kiểm định nằm trong miền bác bỏ.
Có hai loại sai lầm thường gặp khi kiểm định giả thiết.
Định nghĩa 2
(Kiểm định giả thiết) Là phương pháp mà sử dụng dữ liệu mẫu để kết luận có từ
chối giả thiết không (giả thiết ban đầu) H0 hay không.
Chú ý 1
Giả thiết H0 bị bác bỏ khi các giá trị thống kê kiểm định nằm trong miền bác bỏ.
Có hai loại sai lầm thường gặp khi kiểm định giả thiết.
(i) Sai lầm loại I : Bác bỏ H0 khi H0 đúng.
Định nghĩa 2
(Kiểm định giả thiết) Là phương pháp mà sử dụng dữ liệu mẫu để kết luận có từ
chối giả thiết không (giả thiết ban đầu) H0 hay không.
Chú ý 1
Giả thiết H0 bị bác bỏ khi các giá trị thống kê kiểm định nằm trong miền bác bỏ.
Có hai loại sai lầm thường gặp khi kiểm định giả thiết.
(i) Sai lầm loại I : Bác bỏ H0 khi H0 đúng.
(ii) Sai lầm loại II : Không bác bỏ H0 khi H0 sai.
Nhận xét 1
Cho X1 , X2 , . . . , Xn là các biến ngẫu nhiên cùng phân phối chuẩn với trung bình
(µ) và độ lệch chuẩn (σ). Khi đó, X ∼ N(µ, σ 2 /n).
Nhận xét 1
Cho X1 , X2 , . . . , Xn là các biến ngẫu nhiên cùng phân phối chuẩn với trung bình
(µ) và độ lệch chuẩn (σ). Khi đó, X ∼ N(µ, σ 2 /n).
Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?
Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?
Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?
Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?
Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?
Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?
Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?
Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?
Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?
Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?
Ví dụ 3
Một máy cần đóng gói các sản phẩm có khối lượng 1(kg ). Nghi ngờ máy hoạt
động không bình thường, người ta chọn ra một mẫu 100 sản phẩm thì thấy như
sau.
Khối lượng (kg ) 0.95 0.97 0.99 1.01 1.03 1.05
Số gói 9 31 40 15 3 2
a. Với mức ý nghĩa α = 0.05, hãy kết luận nghi ngờ trên.
Ví dụ 3
Một máy cần đóng gói các sản phẩm có khối lượng 1(kg ). Nghi ngờ máy hoạt
động không bình thường, người ta chọn ra một mẫu 100 sản phẩm thì thấy như
sau.
Khối lượng (kg ) 0.95 0.97 0.99 1.01 1.03 1.05
Số gói 9 31 40 15 3 2
a. Với mức ý nghĩa α = 0.05, hãy kết luận nghi ngờ trên.
b. Người ta còn nghi ngờ máy hoạt động không bình thường và đóng gói sản
phẩm dưới 1(kg ). Từ mẫu số liệu, với mức ý nghĩa α = 0.05, hãy kiểm định
nghi ngờ trên.
Ví dụ 4
Glyxerol là thành phần chính trong quá trình lên men của rượu vang, góp phần
tăng độ ngọt, hương vị rượu. Người ta lấy 5 mẫu rượu và đo nồng độ (mg /ml)
Glyxerol, thu được kết quả.
Giả sử nồng độ Glyxerol mong muốn là 4, với mức ý nghĩa α = 0.05 xét xem nồng
độ Glyxerol có được như mong muốn không.
Kiểm định cỡ mẫu lớn liên quan đến tỉ lệ p là một trường hợp đặc biệt của quá
trình mẫu lớn nói chung. Đặt p là ước lượng không chệch của p và p có xấp xỉ
phân phối chuẩn. Khi đó,
Kiểm định cỡ mẫu lớn liên quan đến tỉ lệ p là một trường hợp đặc biệt của quá
trình mẫu lớn nói chung. Đặt p là ước lượng không chệch của p và p có xấp xỉ
phân phối chuẩn. Khi đó, Đặt giả thiết không H0 : p = p0 .
Kiểm định cỡ mẫu lớn liên quan đến tỉ lệ p là một trường hợp đặc biệt của quá
trình mẫu lớn nói chung. Đặt p là ước lượng không chệch của p và p có xấp xỉ
phân phối chuẩn. Khi đó, Đặt giả thiết không H0 : p = p0 .
Giá trị kiểm định thống kê:
p − p0
z=p .
p0 (1 − p0 )/n
Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?
Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?
Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?
Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?
Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?
Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?
Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?
Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?
Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?
BT1. Biết mức độ rò rỉ khí ga tại van bình ga GP đã nạp ga 50 lần là biến ngẫu
nhiên X có phân phối chuẩn, khảo sát mức độ rò rỉ khí ga tại van của 200 bình ga
GP đã nạp ga 50 lần ta thu được kết quả sau.
X (LEL) 0.07 0.08 0.11 0.13 0.15 0.17 0.19
Số bình 18 19 38 55 31 23 16
a. Tìm khoảng ước lượng với độ tin cậy 95% cho mức độ rò rỉ ga trung bình tại
van của bình ga GP đã nạp ga 50 lần.
b. Nếu mức độ rò rỉ ga trung bình tại van của bình ga GP đã nạp ga 50 lần vượt
quá 0.1(LEL) thì nhà sản xuất sẽ tiến hành thu hồi những bình ga. Ở mức ý
nghĩa 1% hãy cho biết nhà sản xuất có tiến hành việc thu hồi này không?
c. Nếu tỉ lệ bình ga có múc độ rò rỉ khí ga tại van vượt quá 0.1(LEL) trong
tổng số bình ga GP đã nạp ga 50 lần là trên 80% thì nhà sản xuất cần cải
tiến qui trình sản xuất. Ở mức ý nghĩa 1% hãy cho biết nhà sản xuất có tiến
hành cải tiến qui trình sản xuất hay không?
BT2. Một lô hàng các sản phẩm đóng gói có khối lượng 1(kg ). Nghi ngờ khối
lượng các sản phẩm không đúng, người ta chọn ra một mẫu 100 sản phẩm thì
thấy kết quả sau.
Với mức ý nghĩa α = 0.05, hãy kết luận nghi ngờ trên.
BT3. Một nhà máy sản xuất sản phẩm với tỉ lệ sản phẩm loại một lúc đầu là
20%. Sau khi áp dụng phương pháp sản xuất mới, kiểm tra ngẫu nhiên 500 sản
phẩm thấy có 150 sản phẩm loại một. Cho kết luận về tác dụng của phương pháp
sản xuất mới với mức ý nghĩa 1%.
Nhận xét 2
Cho các mẫu độc lập: X1 , X2 , . . . , Xm là các biến ngẫu nhiên cùng phân phối
chuẩn với trung bình (µ1 ) và độ lệch chuẩn (σ1 ) và Y1 , Y2 , . . . , Yn là các biến
ngẫu nhiên cùng phân phối chuẩn với trung bình (µ2 ) và độ lệch r chuẩn (σ2 ). Khi
σ12 σ2
đó, kỳ vọng E(X − Y) = µ1 − µ2 và độ lệch chuẩn σX −Y = + 2.
m n
Ví dụ 6
Phân tích 20 mẫu thép cán nguội để xem độ cứng của thép, ta thu được độ cứng
trung bình x = 29.8(ksi) và σ1 = 4.0. Xét một mẫu khác có cỡ mẫu n = 25 và
y = 34.7(ksi), σ2 = 5.0. Giả sử hai mẫu này đều có phân phối chuẩn và người ta
cho rằng độ cứng trung bình µ1 , µ2 khác nhau. Hãy kiểm định điều đó với mức ý
nghĩa 1%.
Ví dụ 6
Phân tích 20 mẫu thép cán nguội để xem độ cứng của thép, ta thu được độ cứng
trung bình x = 29.8(ksi) và σ1 = 4.0. Xét một mẫu khác có cỡ mẫu n = 25 và
y = 34.7(ksi), σ2 = 5.0. Giả sử hai mẫu này đều có phân phối chuẩn và người ta
cho rằng độ cứng trung bình µ1 , µ2 khác nhau. Hãy kiểm định điều đó với mức ý
nghĩa 1%.
Ví dụ 6
Phân tích 20 mẫu thép cán nguội để xem độ cứng của thép, ta thu được độ cứng
trung bình x = 29.8(ksi) và σ1 = 4.0. Xét một mẫu khác có cỡ mẫu n = 25 và
y = 34.7(ksi), σ2 = 5.0. Giả sử hai mẫu này đều có phân phối chuẩn và người ta
cho rằng độ cứng trung bình µ1 , µ2 khác nhau. Hãy kiểm định điều đó với mức ý
nghĩa 1%.
Ví dụ 6
Phân tích 20 mẫu thép cán nguội để xem độ cứng của thép, ta thu được độ cứng
trung bình x = 29.8(ksi) và σ1 = 4.0. Xét một mẫu khác có cỡ mẫu n = 25 và
y = 34.7(ksi), σ2 = 5.0. Giả sử hai mẫu này đều có phân phối chuẩn và người ta
cho rằng độ cứng trung bình µ1 , µ2 khác nhau. Hãy kiểm định điều đó với mức ý
nghĩa 1%.
Ví dụ 6
Phân tích 20 mẫu thép cán nguội để xem độ cứng của thép, ta thu được độ cứng
trung bình x = 29.8(ksi) và σ1 = 4.0. Xét một mẫu khác có cỡ mẫu n = 25 và
y = 34.7(ksi), σ2 = 5.0. Giả sử hai mẫu này đều có phân phối chuẩn và người ta
cho rằng độ cứng trung bình µ1 , µ2 khác nhau. Hãy kiểm định điều đó với mức ý
nghĩa 1%.
Ví dụ 6
Phân tích 20 mẫu thép cán nguội để xem độ cứng của thép, ta thu được độ cứng
trung bình x = 29.8(ksi) và σ1 = 4.0. Xét một mẫu khác có cỡ mẫu n = 25 và
y = 34.7(ksi), σ2 = 5.0. Giả sử hai mẫu này đều có phân phối chuẩn và người ta
cho rằng độ cứng trung bình µ1 , µ2 khác nhau. Hãy kiểm định điều đó với mức ý
nghĩa 1%.
Ví dụ 6
Phân tích 20 mẫu thép cán nguội để xem độ cứng của thép, ta thu được độ cứng
trung bình x = 29.8(ksi) và σ1 = 4.0. Xét một mẫu khác có cỡ mẫu n = 25 và
y = 34.7(ksi), σ2 = 5.0. Giả sử hai mẫu này đều có phân phối chuẩn và người ta
cho rằng độ cứng trung bình µ1 , µ2 khác nhau. Hãy kiểm định điều đó với mức ý
nghĩa 1%.
Ví dụ 6
Phân tích 20 mẫu thép cán nguội để xem độ cứng của thép, ta thu được độ cứng
trung bình x = 29.8(ksi) và σ1 = 4.0. Xét một mẫu khác có cỡ mẫu n = 25 và
y = 34.7(ksi), σ2 = 5.0. Giả sử hai mẫu này đều có phân phối chuẩn và người ta
cho rằng độ cứng trung bình µ1 , µ2 khác nhau. Hãy kiểm định điều đó với mức ý
nghĩa 1%.
trong đó,
2
s12 s2
+ 2
m n
v=
s12 s22
+
m2 (m − 1) n2 (n − 1)
N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 23 / 34
Kiểm định hai trung bình
Ví dụ 7
Báo cáo dữ liệu tóm tắt dưới đây về lượng calo tiêu thụ khi hoạt động thể thao 30
phút đối với người 56(kg ).
Môn thể thao Cỡ mẫu Trung bình mẫu ĐLCM hiệu chỉnh
Bơi lội 92 320 80
Chạy 10km/h 110 290 60
Từ mẫu số liệu, với mức ý nghĩa 0.01 có kết luận được lượng calo tiêu thụ trung
bình của bơi lội hơn chạy bộ 10km/h là 5(kcal) không?
X +Y
trong đó, p =
m+n
Giả thiết thay thế Miền bác bỏ kiểm định mức α.
(Giả thiết đối)
Ha : p1 − p2 > ∆0 z ≥ zα (kiểm định bên phải)
Ha : p1 − p2 < −∆0 z ≤ −zα (kiểm định bên trái)
Ha : p1 − p2 6= ∆0 |z| ≥ zα/2 (kiểm định hai bên)
Ví dụ 8
Nghiên cứu về dự định đăng ký thi đại học về khối ngành kỹ thuật học sinh phổ
thông ở thành thị và nông thôn tại TPHCM với câu hỏi "em có đăng ký vào khối
ngành kỹ thuật hay không?". Ta thu được bảng số liệu sau.
Khu vực trả lời "có" "trả lời không" tổng cộng
Thành thị 240 300 540
Nông thôn 185 200 385
Với mức ý nghĩa 5% hãy so sánh tỉ lệ học sinh dự thi đại học khối nghành kỹ
thuật giữa thành thị và nông thôn có bằng nhau không?
Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0
Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
240 4
p1 = = ,
540 9
Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
240 4 185 37
p1 = = , p2 = = ,
540 9 380 76
Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
240 4 185 37 240 + 185 17
p1 = = , p2 = = ,p = = ,
540 9 380 76 540 + 385 37
Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
240 4 185 37 240 + 185 17
p1 = = , p2 = = ,p = = ,
540 9 380 76 540 + 385 37
Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
240 4 185 37 240 + 185 17
p1 = = , p2 = = ,p = = ,
540 9 380 76 540 + 385 37
Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
240 4 185 37 240 + 185 17
p1 = = , p2 = = ,p = = ,
540 9 380 76 540 + 385 37
Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
240 4 185 37 240 + 185 17
p1 = = , p2 = = ,p = = ,
540 9 380 76 540 + 385 37
Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
240 4 185 37 240 + 185 17
p1 = = , p2 = = ,p = = ,
540 9 380 76 540 + 385 37
BT1. Một trại chăn nuôi chọn một giống gà để tiến hành nghiên cứu hiệu quả
của hai loại thức ăn A và B. Sau một thời gian nuôi thử nghiệm người ta chọn 50
con gà nuôi bằng thức ăn A thì thấy khối lượng trung bình là 2.2kg , độ lệch
chuẩn mẫu là 1.25kg . Chọn 40 con gà nuôi bằng thức ăn B thì thấy khối lượng
trung bình 1.2kg , độ lệch chuẩn mẫu 1.02kg . Hãy đánh giá hiệu quả của hai loại
thức ăn đó với mức ý nghĩa 1%.
BT2. Ban lãnh đạo một công ty cho rằng doanh số bán hàng tăng lên sau khi
thực hiện các biện pháp khuyến mãi. Chọn ngẫu nhiên 13 tuần trước đợt khuyến
mãi và 14 tuần sau đợt khuyến mãi. Doanh số trung bình và độ lệch chuẩn mẫu
trước đợt khuyến mãi là 1234 và 324 triệu đồng. Còn sau đợt khuyến mãi, các con
số này lần lượt là 1864 và 289 triệu đồng. Hãy kiểm định ý kiến trên với α = 0.05.
BT3. Để so sánh tỉ lệ trẻ em béo phì ở thành thị và vùng nông thôn người ta tiến
hành chọn ngẫu nhiên 200 em ở thành thị thấy có 20 em béo phì và chọn 220 em
ở nông thôn thấy có 5 em béo phì. Hãy kiểm định giả thiết cho rằng tỷ lệ béo phì
ở trẻ em thành thị và nông thôn là như nhau với mức ý nghĩa 1%.
Xét một dữ liệu gồm n cặp phân phối chuẩn độc lập
Xét một dữ liệu gồm n cặp phân phối chuẩn độc lập
Ví dụ 9
Đo chiều dài tay trái và tay phải của một số người được cho bởi bảng số liệu
Tay trái (cm) 60 61 61.5 62.8 63.2 63.3
Tay phải (cm) 61 63 62.1 61.9 61.1 62.1
Với mức ý nghĩa 1% hãy so sánh chiều dài trung bình của tay trái và tay phải.
Định nghĩa 3
Cho X và Y là hai biến ngẫu nhiên nhận các giá trị tương ứng x1 , x2 , . . . , xn và
y1 , y2 , . . . , yn . Ta tìm mối quan hệ giữa X và Y bằng mô hình hồi qui tuyến tính.
Ta định nghĩa phương trình hồi qui tuyến tính là y = ax + b, trong đó.
n
P
(xi − x)(yi − y )
Sxy i=1
a= = n
Sxx P
(x − x)2
i=1
và
n
P n
P
yi − a xi
i=1 i=1
b = y − ax = .
n
Định nghĩa 4
Hệ số tương quan của n cặp (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) được cho bởi công thức
Sxy
r=p .
Sxx Syy
Định nghĩa 4
Hệ số tương quan của n cặp (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) được cho bởi công thức
Sxy
r=p .
Sxx Syy
Chú ý 2
(i) r ∈ [−1; 1].
Định nghĩa 4
Hệ số tương quan của n cặp (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) được cho bởi công thức
Sxy
r=p .
Sxx Syy
Chú ý 2
(i) r ∈ [−1; 1].
(ii) Nếu r = 0 thì hai biến ngẫu nhiên không có tương quan.
Định nghĩa 4
Hệ số tương quan của n cặp (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) được cho bởi công thức
Sxy
r=p .
Sxx Syy
Chú ý 2
(i) r ∈ [−1; 1].
(ii) Nếu r = 0 thì hai biến ngẫu nhiên không có tương quan.
(iii) Mức độ phụ thuộc tuyến tính của hai biến ngẫu nhiên được cho bởi:
Yếu: |r | ≤ 0.5,
Vừa: 0.5 < |r | < 0.8,
Mạnh: |r | ≥ 0.8.
Ví dụ 10
Giả sử ta có bảng số liệu
X 28 37 44 36 47 35
Y 41 32 49 42 38 40
Lập phương trình hồi qui tuyến tính và tính hệ số tương quan giữa X và Y .