Professional Documents
Culture Documents
Câu 1 (3,5 điểm) Xác suất của một biến cố và các phép toán xác suất.
+ Tính xác suất của một biến cố.
+ Tính xác suất theo quy tắc cộng, quy tắc nhân, quy tắc Bayes, xác suất có điều kiện, định
lý xác suất đầy đủ.
Câu 2 (3,5 điểm) Biến ngẫu nhiên và một số phân phối xác suất thường gặp.
+ Tìm phân phối xác suất của biến ngẫu nhiên rời rạc một chiều hoặc hai chiều thường gặp:
phân phối nhị thức, phân phối siêu bội.
+ Các ứng dụng của phân phối chuẩn.
Câu 1 (2,5 điểm) Tính xác suất của một biến số và phân phối xác suất thường gặp.
+ Tính xác suất của một biến cố theo định nghĩa hoặc các phép toán xác suất.
+ Tìm phân phối xác suất các biến ngẫu nhiên thường gặp rời rạc và liên tục.
1
$1. CÁC KHÁI NIỆM CƠ BẢN VỀ XÁC SUẤT
I. PHÉP THỬ NGẪU NHIÊN, KHÔNG GIAN MẪU, BIẾN CỐ.
1. Phép thử là sự thực hiện một số điều kiện đặt ra để nghiên cứu một hiện tượng ngẫu
nhiên.
Tập hợp tất cả kết quả có thể của một phép thử được gọi là không gian mẫu, ký hiệu S hoặc
+ Mỗi kết quả trong không gian mẫu gọi là một điểm mẫu hoặc phần tử.
+ Cách mô tả không gian mẫu: liệt kê các phần tử (nếu hữu hạn) hoặc bằng một mệnh đề,
quy tắc (nếu có thuộc tính chung hoặc vô hạn). Có thể dùng sơ đồ cây liệt kê những phần
tử của không gian mẫu.
Ví dụ 1 Tung một đồng xu.
Ví dụ 2: Lấy ngẫu nhiên hai số x, y 0,2 .
Ví dụ 5 Một lô hàng có 6 sản phẩm, trong đó có 2 phế phẩm. Lấy ngẫu nhiên 3 sản phẩm.
Tìm không gian mẫu của phép thử.
Ví dụ 6 Một lô hàng có 6 sản phẩm, trong đó có 2 phế phẩm. Lấy ngẫu nhiên lần lượt 3 sản
phẩm. Tìm không gian mẫu của phép thử.
Cách tìm không gian mẫu: Đặt tên các loại phần tử có mặt hoặc các bước hình thành phép
thử. Sau đó mô tả điểm mẫu theo kết quả xẩy ra trong phép thử.
+ Một tập con của S không chứa bất kỳ một phần tử nào gọi là biến cố không thể, ký hiệu
.
+ Tập hợp là toàn bộ không gian mẫu S gọi là biến cố chắc chắc.
+ Mỗi điểm mẫu cũng là một biến cố, còn gọi là biến cố sơ cấp.
2
II. PHÉP TOÁN VÀ QUAN HỆ CÁC BIẾN CỐ
Phép toán các biến cố giúp ta nhận được thông tin về biến cố mới thông qua các biến cố
trong một phép thử. Giả sử A và B là hai biến cố trong một phép thử, hay là tập con của
không gian mẫu S.
1. Phần bù của một biến cố A trong S là tập con gồm tất cả những phần tử của S mà không
nằm trong A. Ký hiệu phần bù của A là A hoặc A' .
2. Giao của hai biến cố A và B, ký hiệu AB hoặc AB, là biến cố chứa tất cả những phần
tử chung của A và B
3. Hai biến cố A và B là xung khắc nếu AB=, tức là A và B không có phần tử chung
4. Hợp của hai biến cố A và B, ký hiệu là AB, là biến cố chứa tất cả những phần tử mà
thuộc A hoặc thuộc B hoặc thuộc cả hai.
Chú ý: Biểu đồ Venn để mô tả các phép
toán và quan hệ giữa 2 biến cố.
VD7 Cho A = {2, 4, 6} và B = {4, 5, 6} là các tập con của cùng không gian mẫu
A= , A A, A A S , AA
Ví dụ 10 Lấy 4 sản phẩm trong kho có nhiều phế phẩm, A là biến cố " có nhiều nhất một
phế phẩm", B là biến cố " có ít nhất một phế phẩm", Ci là biến cố có i phế phẩm trong 4 sản
phẩm lấy ra. Hãy biểu diễn các biến cố A, B qua Ci.
Ví dụ 11: xét phép thử " tung một con xúc xắc", A là biến cố " số chẫm xuất hiện là số
chẵn", B là biến cố "số chấm xuất hiện nhỏ hơn 4". Tìm các biến cố A B, A B , A B .
3
IV. ĐẾM CÁC ĐIỂM MẪU
1. Quy tắc nhân:
Nếu một công việc chia ra k giai đoạn, giai đoạn 1 có n1 cách , giai đoạn 2 có n2 cách ...
giai đoạn k có nk cách thực hiện, thì có n1n2…nk cách thực hiện xong công việc.
Ví dụ: Để đi từ nhà đến trường, An phải đi qua hợp tác xã. Từ nhà đến hợp tác xã có ba con
đường, từ hợp tác xã đến trường có 4 con đường. Hỏi có bao nhiêu con đường từ nhà đến
trường.
2. Qui tắc cộng:
Nếu một công việc được chia ra k trường hợp để thực hiện, trường hợp 1 có n1 cách, trường
hợp 2 có n2 cách ,..., trường hợp n có nk cách thực hiện và không có bất kỳ một cách thực
hiện nào ở trường hợp này lại trùng với cách thực hiện ở trường hợp khác, thì có n1 + n2
+…+ nk cách thực hiện xong công việc.
Định nghĩa: Một hoán vị là một sắp xếp của toàn bộ hoặc một bộ phận của một tập
phần tử.
Định lý:
Số hoán vị của n phần tử riêng biệt là Pn n ! .
Số hoán vị của k phần tử riêng biệt trong n phần tử ( gọi là chỉnh hợp chập k của n
n!
phần tử) là: Ank .
(n k )!
Số hoán vị của n phần tử phân biệt được sắp xếp theo mọt vòng tròn là (n-1)!.
Số hoán vị của n phần tử riêng biệt mà trong đó n1 phàn tử thuộc kiểu thứ nhất, n2
4
phần tử thuộc kiểu thứ hai,..., nk phần tử thuộc kểu thứ k là
n!
n1 !n2 !...nk !
Ví dụ:
1, Có 5 người xin làm hai việc A,B. Hỏi có bao nhiêu cách sắp xếp mỗi người một việc.
2, Có bao nhiêu số có 4 chữ số được tạo thành từ 1,2,3,4.
3, có bao nhiêu cách khác nhau để tạo thành mọt xâu đèn của cây thông noel có 3 bóng đỏ, 4
bóng xanh, 5 bóng vàng.
4. Phân hoạch
Khi ta sắp xếp n phần tử thành r tập con ( r ngăn), mà thứ tự bên trong một ngăn là không
quan trọng, các tập con này đôi một giao nhau bằng , còn hợp tất cả các tập con bằng tập
phần từ ban đầu thì ta gọi đó là một phân hoạch.
Khi đó số cách phân hoạch một tập hợp n phần tử thành r ngăn, trong đó n 1 phần tử thuộc
ngăn thứ nhất, n2 phần tử thuộc ngăn thứ hai...nr phần tử thuộc ngăn thứ r là
n!
Cnn1...nr (n1 n2 ... nr n)
n1 !n2 !...nr !
Chú ý: Nếu phân hoạch chỉ có hai ngăn, một ngăn chứ r phần tử, một ngăn chứa n-r phần tử
còn lại là tổ hợp. Số các tổ hợp của n phần tử phân biệt được tạo ra khi lấy r phần tử cùng
n!
một lúc là Crn
n!( n r )!
Ví dụ: Một đồn có 9 người, bố trí hai người trực, 3 người chốt ở điểm A, 4 người chốt ở
điểm B, hỏi có bao nhiêu cách phân công?
V. XÁC SUẤT CỦA MỘT BIẾN CỐ.
Ta chỉ xét những phép thử mà không gian mẫu có hữu hạn phần tử. Đối với mọi điểm trong
không gian mẫu, ta gán một xác suất sao cho tổng tất cả các xác suất bằng 1. Để tìm xác
suất của một biến cố A, ta lấy tổng tất cả những xác suất được gán cho các điểm mẫu trong
A, ký hiệu P(A).
Định nghĩa: Xác suất của biến cố A là tổng của khối lượng của toàn bộ điểm mẫu trong A.
Khi đó 0 P(A) 1, P() = 0, P(S) = 1.
Ví dụ: Tung một đồng xu đồng chất 2 lần. Xác suất để ít nhất một mặt ngửa xuất hiện là
bao nhiêu?
Ví dụ: Cho một con xúc xắc được đổ chì sao cho khả năn xuất hiện một chấm chẵn ấp 2 lần
khả năng xuất hiện một chấm lẻ. Tìm xác suất để số chấm nhỏ hơn 4 xuất hiện trong một lần
5
tung xúc xắc.
Định lý: Nếu phép thử có thể dẫn đến bất kỳ một trong N kết quả phân biệt đồng khả năng
có đúng n kết quả thuận lợi cho biến cố A, thì xác suất của biến cố A là
Hệ qủa 2 Nếu A1, … An xung khắc với nhau thì . P ( A1 ... An ) P ( A1 ) ... P( An ) .
Hệ quả 3 Nếu B1, … Bn là một phân hoạch của không gian mẫu S, thì:
. P ( B1 B2 ... Bn ) P ( B1 ) P( B2 ) ... P ( Bn ) P ( S ) 1 .
6
Định lý 1.5 Với 3 biến cố A, B, C ta có:
. P ( A B C ) P ( A) P( B ) P (C ) P( AB) P ( AC ) P( BC ) P ( ABC ) .
Chú ý: Trong trường hợp tính trực tiếp xác suất của biến cố A quá khó khăn ta có thể tính
7
(c) Xác suất để một máy bay đến đúng giờ, biết rằng nó đã khởi hành không đúng giờ
Định nghĩa: Hai biến cố A và B được gọi là độc lập với nhau khi và chỉ khi
P ( B | A) P( B) hoặc P ( A | B) P( A) . Trong trường hợp ngược lại ta nói A và B phụ
thuộc nhau.
III. QUY TẮC NHÂN
Định lý Nếu trong một phép thử, các biến cố A và B có thể cùng xảy ra thì
. P ( AB ) P ( A).P ( B | A) .
Định lý Hai biến cố A và B là độc lập với nhau khi và chỉ khi . P ( AB ) P ( A).P ( B ) .
Định lý Nếu trong một phép thử, các biến cố A1 , A2 ,..., Ak có thể xảy ra thì
Nếu các biến cố A1 , A2 ,..., Ak độc lập thì . P ( A1 A2 ... Ak ) P ( A1 ).P( A2 )...P ( Ak ) .
Ví dụ: Giả sử ta có một hộp chứa 20 chiếc cầu chì, trong đó có 5 chiếc bị hỏng. Nếu lấy
ngẫu nhiên lần lượt 2 chiếc theo phương thức không hoàn lại, thì xác suất để cả hai chiếc
đều bị hỏng là bao nhiêu?
VD Một thị trấn nhỏ có một chiếc máy cứu hỏa và một chiếc xe cấp cứu sẵn sàng dùng cho
những trường hợp khẩn cấp. Xác suất để chiếc máy cứu hỏa sẵn có để dùng cho những
trường hợp khẩn cấp là 0,98 và xác suất để chiếc xe cấp cứu khi được gọi là 0,92. Có một
người bị thương do một tòa nhà đang cháy, tìm xác suất để cả chiếc xe cấp cứu và cứu hỏa
đều sẵn sàng có thể dùng.
Ví dụ: Trong một kho hàng, xác suất lấy được sản phẩm loại A là 0,8. Lấy ngẫu nhiên 3 sản
phẩm lần lượt từng chiếc không hoàn lại. tính xác suất để 3 sản phẩm đều loại A.
Ví dụ: Hộp một chứa 2 bi xanh, 5 bi trắng. Hộp 2 chứa chứa 3 bi xanh, 3 bi trắng. từ mỗi
hộp lấy ra 1 viên bi. Tính xác suất để hai viên bi lấy ra là cùng màu.
IV. QUY TẮC BAYES
Định lý (Định lý xác suất đầy đủ) Nếu các biến cố B 1 ,B 2 , …, B k là một phân hoạch của
không gian mẫu S, trong đó P(B i ) 0 với mọi i = 1, 2, …, k thì với biến cố A bất kì của S
ta có:
k k
. P ( A) P ( Bi A) = P( Bi )P( A | Bi ) .
i 1 i 1
Định lý (Quy tắc Bayes) Nếu các biến cố B 1 , B 2 , …, B k là một phân hoạch của không
gian mẫu S, trong đó P(B i ) 0 với mọi i = 1, 2, …, k, thì với biến cố A bất kì của S mà
P ( A) 0 ta có
8
P ( Bi A)
. P ( Bi | A) , với i = 1, 2, …, k .
P ( A)
Ví dụ: Trong một dây chuyền sản xuất, ba máy B1, B2, và B3 tạo ra 30%, 45%, và 25% sản
phẩm tương ứng. Theo phép thử trước đây biết tỷ lệ phế phẩm được tạo bởi mỗi máy tương
ứng là 2%, 3% và 2%. Chọn ngẫu nhiên 1 sản phẩm.
(a) Tính xác suất để nó là phế phẩm.
(b) Nếu chọn ngẫu nhiên một sản phẩm và thấy nó bị lỗi, thì xác suất để sản phẩm đó thuộc
B3 là bao nhiêu?
VD Túi thứ nhất có 4 quả bóng trắng và 3 quả bóng đen, túi thứ hai có 3 quả bóng trắng và
5 quả bóng đen. Lấy ngẫu nhiên một quả bóng từ túi thứ nhất bỏ sang túi thứ hai. Tính xác
suất để một quả bóng được lấy ra từ túi thứ hai có màu đen.
Chú ý:
Dấu hiệu để nhận biết hệ biến cố {B1,B2,...,Bk} là phân hoạch ( hệ đầy đủ)
+ {B1,B2,...,Bk} là các biến cố xung khắc ( tách rời nhau)
+ P(B1)+P(B2)+ ...+P(Bk)=1.
Dấu hiệu nhận biết một số biến cố quan trọng
+ Biến cố giao thường diễn đạt bởi các từ: và, đồng thời
+ Biến cố hợp thường diễn đạt bởi các từ: hoặc, ít nhất...
+ Biến cố điều kiện thường diễn đạt bởi các từ: Biết rằng, với điều kiện....
9
Khi đó không gian mẫu S {CCC,CCP,CPC,PCC,CPP,PCP,PPC,PPP} .
Từ yêu cầu bài toán ta tự nhiên quan tâm tới số phế phẩm trong 3 sản phẩm kiểm tra là bao
nhiêu.
Điểm mẫu Số phế phẩm
CCC 0
CCP 1
CPC 1
PCC 1
CPP 2
PCP 2
PPC 2
PPP 3
Ta thấy mỗi điểm mẫu sẽ xác định một giá trị thực duy nhất 0,1,2,3. Ở đây nếu ta gọi X là
số phế phẩm có tronh ba sản phẩm thì X sẽ nhận các giá trị 0,1,2,3. Khi đó ta gọi X là biến
ngẫu nhiên
Định nghĩa: Biến ngẫu nhiên là một hàm số cho tương ứng mỗi phần tử trong không gian
mẫu với một số thực.
Ký hiệu: Biến ngẫu nhiên (bnn) X,Y,Z. Các giá trị của biến ngẫu nhiên x,y,z....
X :S
Khi đó
s X (s) x
trong đó s là một điểm mẫu của không gian mẫu.
Tập tất cả các số thực mà biến ngẫu nhiên X nhận được gọi là tập giá trị
Dựa vào đặc điểm của tập giá trị, người ta chia biến ngẫu nhiên thành 2 loại:
- biến ngẫu nhiên rời rạc: là bnn mà tập giá trị đếm được
- Biến ngẫu nhiên liên tục: là bnn mà tập giá trị là một khoảng thực ( tập không đếm
được).
II. PHÂN PHỐI XÁC SUẤT.
1. Phân phối xác suất rời rạc
a. Hàm phân phối xác suất
Định nghĩa: Hàm số f(x) là hàm phân phối xác suất của bnn rời rạc X nếu với mỗi kết cục
x ta có
1. f ( x ) 0, x
2. f ( x) 1
x
10
3. P ( X x) f ( x)
Ví dụ: Một hộp kẹo sô cô la có 8 chiếc: 3 chiếc kẹo nhân sữa, 5 chiếc kẹo nhân hạt điều.
Lấy ngẫu nhiên ra 4 chiếc. Lập bảng phân phối chỉ số kẹo nhân sữa lấy được.
Ví dụ:Một người bắn ba viên đạn độc lập nhau vào một mục tiêu với xác suất bắn một viên
trúng mục tiêu là 0,6.
a, Gọi X là số viên đạn bắn trúng mục tiêu. Tìm phân phối xác suất f(x) của X.
b, Gọi Y là số viên đạn đã bắn cho đến khi trúng mục tiêu hoặc hết đạn thì dừng lại. Tìm
phân phối xác suất của Y.
b, Hàm phân phối tích lũy
Định nghĩa: Bnn rời rạc X có phân phối xác suất f ( x ) . Khi đó hàm số
F ( x) P ( X x ) f (t ), x
t x
11
2. PHÂN PHỐI XÁC SUẤT LIÊN TỤC.
Mặc dù không thể trình bày phân phối xác suất của biến ngẫu nhiên liên tục dưới dạng bảng
nhưng chúng ta có thể mô tả nó bằng một công thức, đó là một hàm của các giá trị số của
biến ngẫu nhiên liên tục X mà ta kí hiệu là f ( x ) , được gọi là hàm mật độ xác suất hay đơn
giản là hàm mật độ của X. Do đó ta sử dụng diện tích mô tả xác suất và xác suất là một số
dương nên hàm mật độ phải nằm trên toàn bộ trục x . Hình sau là các hàm mật độ điển hình
và xác suất trên khoảng (a, b)
b
3. P (a X b) f ( x)dx
a
12
x 0 x 1
f ( x ) 2 x, 1 x 2
0, x 0,2
Tính xác suất để trong một năm, thời gian một gia đình cho chạy máy hút bụi của họ từ 50h
đến 150h.
b. Hàm phân phối tích lũy F(x) của biến ngẫu nhiên liên tục X với hàm mật độ f(x) là:
x
. F ( x ) P ( X x) f (t )dt , với - x .
dF ( x )
Hệ quả: . P( a < X < b ) = F(b) – F(a) và f ( x) (nếu đạo hàm tồn tại) .
dx
Ví dụ:
0 x 1
Cho bnn X có hàm phân phối tích lũy là F ( x) k
1 x3 , 1 x
13
của X được xác định như sau X được xác định như sau
E ( X ) xf ( x)
x . E( X ) xf ( x)dx
2. Ý Trong thực tiễn thì các giá trị biến ngẫu nhiên X luôn biến đổi nhưng giá trị
nghĩa: E ( X ) thường ổn định nên là giá trị đại diện cho X (E(X)) còn gọi là tâm phân
phối xác suất).
3. Định Cho X là bnn với phân phối xác suất Cho X là bnn với phân phối xác suất
lí : f ( x ) . Giá trị trung bình ( kỳ vọng) f ( x ) . Giá trị trung bình ( kỳ vọng) của
của g(x) được xác định như sau g(x) được xác định như sau
g ( x ) E g ( x) g ( x ) f ( x )
x g ( X ) E g ( x) g ( x) f ( x)dx
Ví dụ: Tung 3 đồng xu giống nhau. Gọi X là số mặt ngửa, ta có phân phối xác suất của X là
x 0 1 2 3
f(x) 1/8 3/8 3/8 1/8
Tính E ( X )
VD Một vị thanh tra chất lượng kiểm tra một lô hàng gồm 7 sản phẩm trong đó có chứa 4
chính phẩm và 3 phế phẩm. Ông ta lấy ra một mẫu gồm 3 sản phẩm.
a, Hãy tìm giá trị trung bình của số chính phẩm trong mẫu.
b, Biết giá tiền của một chính phẩm là 3 triệu, 1 phế phẩm là 0,2 triệu. Hãy tính số tiền trung
bình của mẫu lấy ra đó.
VD Gọi X là một biến ngẫu nhiên của tuổi thọ tính theo giờ của một thiết bị điện tử nào đó
20000
, x 100
có hàm mật độ xác suất là f ( x) x3 .
0 , x 100
Hãy tính tuổi thọ trung bình của thiết bị điện tử loại này.
x2
, x (1, 2)
Ví dụ: Cho X là bnn có hàm mật độ là f ( x ) 3
0 , x (1, 2)
Hãy tìm kỳ vọng của hàm g ( X ) 4 X 3
14
II. PHƯƠNG SAI .
BNN rời rạc BNN liên tục
1. Đn X là bnn với phân phối xs f ( x ) . X là bnn với phân phối xs f ( x ) . Phương
2 E ( X ) 2 ( x ) 2 f ( x) 2 E ( X ) 2 ( x ) 2 f ( x)
x x
Chú ý Phương sai là để đánh giá độ phân tán của bnn X xung quanh giá trị trun bình.
Nếu các giá trị của X tập trung quanh giá trị trung bình thì phương sai nhỏ, và
ngược lại. Trong thực tế phương sai thể hiện độ đồng đều, mức độ ổn định của
bnn.
Căn bậc hai của phương sai gọi là độ lệch chuẩn của bnn X, ký hiệu
2. Định 1. a2Xb a 2 X2 1. a2Xb a 2 X2
lý
2 E( X 2 ) 2 2 E( X 2 ) 2
2.
x 2 f ( x) 2 2.
x f ( x) 2
2
Ví dụ Gọi X là biến ngẫu nhiên biểu thị số xe ôtô được sử dụng cho mục đích kinh doanh
chính thức trong một ngày làm việc nào đó. Phân phối xác suất của X tại công ty A là
x 1 2 3
f(x) 0,3 0,4 0,3
và tại công ty B là
x 0 1 2 3 4
f(x) 0,2 0,1 0,3 0,3 0,1
Hãy chỉ ra rằng phương sai của phân phối xác suất tại công ty B là lớn hơn so với tại công ty
A.
VD Gọi X là biến ngẫu nhiên biểu thị số thiết bị hỏng trong một hệ thống gồm 3 thiết bị
được kiểm tra của một chiếc máy. Phân phối xác suất của X như sau. Hãy tính 2
x 0 1 2 3
f(x) 0,51 0,38 0,10 0,01
VD Nhu cầu hàng tuần đối với Pepsi, theo đơn vị 1000 lít, tại một chuỗi các cửa hàng ở
một địa phương nào đó, là một biến ngẫu nhiên liên tục X với hàm mật độ xác suất như sau
15
2( x 1), x (0; 2)
f ( x)
0, x (0; 2)
Hãy tìm giá trị trung bình và phương sai của X. Từ đó tìm kỳ vọng, phương sai, độ lệch
chuẩn của biến ngẫu nhiên g(X) = 3X-1.
Bài 5. PHÂN PHỐI CHUẨN. MỘT SỐ THỐNG KÊ MẪU QUAN TRỌNG.`
I. Phân phối chuẩn
Dạng phân phối xác suất quan trọng và phổ biến bậc nhất trong thực tế là dạng phân phối
chuẩn. Đồ thị của dạng phân phối này giống với hình quả chuông, gọi là đường cong chuẩn
Nó mô tả xấp xỉ nhiều hiện tượng xảy ra trong tự nhiên, trong công nghiệp và trong nghiên
cứu. Năm 1733, Abraham DeMoivre đã tìm ra phương trình toán học của đường cong
chuẩn, là đường cong phụ thuộc vào hai tham số, ký hiệu bởi và .
Định nghĩa
Biến ngẫu nhiên liên tục X với hàm mật độ phụ thuộc hai số và , như sau
1
e (1 / 2)[ x / ] , x
2
n( x ; , )
2
Với mỗi cặp giá trị và được cho, đường cong chuẩn hoàn toàn xác định.
Phân phối chuẩn cũng thường được nhắc đến như là phân phối Gauss, để tưởng nhớ
đến Karl Friedrich Gauss (1777 - 1855), người cũng tìm thấy phương trình của đường cong
chuẩn nhờ việc nghiên cứu các sai số trong việc lặp đi lặp lại các phép đo với một số lần
như nhau.
Qua việc khảo sát n( x ; , ) , ta có các tính chất của đường cong chuẩn:
1. Mode, là điểm trên trục hoành mà tại đó đường cong đạt giá trị lớn nhất, xảy ra tại x .
2.Đường cong có trục đối xứng là đường thẳng đứng đi qua .
3. Đường cong có hai điểm uốn tại x , lồi nếu X và lõm nếu ngược
lại.
4. Đường cong tiệm cận với trục hoành nếu chúng ta cho x di chuyển dần xa khỏi giá trị
trung bình.
16
5. Tổng diện tích của phần bên dưới đường cong và bên trên trục hoành bằng 1.
Định lý Kỳ vọng và phương sai của biến ngẫu nhiên chuẩn X với phân phối n( x ; , ) , lần
lượt là , 2
Phần này ta bàn về việc tính xác suất để biến ngẫu nhiên chuẩn X với phân phối n( x ; , )
nhận giá trị trong một khoảng (x1, x2) cho trước. Như ta đã biết
x2 1 x2 2
P( x1 X x2 ) n( x; , )dx e (1 / 2)[( x ) / ] dx
x1 2 x1
Thế nhưng, việc tính tích phân này khá khó khăn. Ta cần lập một bảng tra sẵn để tính cho
nhanh, vấn đề là không thể lập bảng tra cho các bộ và khác nhau. May thay, ta có thể
biểu diễn kết quả cần tính thông qua một tích phân dạng như trên với 0 1 bằng
phép đặt sau
X
Z .
Biến ngẫu nhiên Z là một biến ngẫu nhiên chuẩn với trung bình bằng 0 và phương sai bằng
1, đây là trường hợp đặc biệt quan trọng của dạng phân phối chuẩn. Ta gọi một biến ngẫu
nhiên chuẩn với trung bình bằng 0 và phương sai bằng 1 là biến ngẫu nhiên tiêu chuẩn và
phân phối của nó là phân phối tiêu chuẩn.
Bảng A.3 chỉ ra diện tích phần bên dưới đường cong tiêu chuẩn ứng với P( Z z ) , với giá
trị của z chạy từ -3.49 đến 3.49. Để minh họa cách dùng của bảng này, chúng ta sẽ tìm xác
suất để Z nhỏ hơn 1.74. Đầu tiên, chúng ta xác định giá trị của z bằng 1.7 trong cột bên trái,
rồi di chuyển theo hàng ngang tới cột bên dưới số 0.04, ở đó chúng ta sẽ gặp giá trị 0.9591.
Do đó, P( Z 1.74) 0.9591. Để tìm giá trị của z ứng với xác suất cho trước, chúng ta làm
ngược lại quá trình trên. Ví dụ, giá trị z ứng với phần diện tích 0.2148 nằm bên dưới đường
cong và ở bên trái số z được tìm thấy là - 0.79.
Ví dụ Cho phân phối tiêu chuẩn, tìm diện tích phần nằm bên dưới đường cong chuẩn
17
(a) ở bên phải số z = 1.84 và diện tích phần nằm bên dưới đường cong
Ví dụ Cho phân phối tiêu chuẩn, tìm giá trị của k sao cho
Nhiều khi chúng ta được yêu cầu tìm giá trị của z tương ứng với xác suất cho trước mà giá
trị này lại rơi vào giữa các giá trị trong Bảng A.3. Để cho tiện, chúng ta sẽ lựa chọn giá trị z
tương ứng với xác suất có sẵn trong bảng sao cho giá trị này gần nhất với giá trị đầu bài cho.
Tuy nhiên, nếu giá trị xác suất được cho rơi vào chính giữa hai giá trị xác suất ở trong bảng,
khi đó chúng ta sẽ chọn giá trị của z chính là giá trị nằm ở chính giữa hai giá trị tương ứng
của z ở hai đầu mút. Chẳng hạn, để tìm giá trị của z tương ứng với xác suất 0.7975, giá trị
này nằm ở giữa hai giá trị 0.7967 và 0.7995 trong Bảng A.3, chúng ta chọn z = 0.83, vì
0.7975 gần hơn với 0.7967. Còn với xác suất 0.7981, giá trị này nằm chính giữa 0.7967 và
0.7995 nên chúng ta lấy z = 0.835.
Ví dụ: Cho phân phối tiêu chuẩn, tìm gía trị của k sao cho
18
(a) P ( Z k ) 0,3015
Ví dụ: Cho phân phối chuẩn có 50, 10 . Tìm xác suất để X nhận giá trị trong khoảng
45 và 62.
3. Ứng dụng của phân phối chuẩn.
Ví dụ: Một loại pin có tuổi thọ trung bình là 3 năm và độ lệch chuẩn là 0,5 năm. Giả sử tuổi
thọ của pin có phân phối chuẩn, tìm xác suất để pin có tuổi thọ ít hơn 2,3 năm.
VD Một loại bóng đèn thắp sáng có tuổi thọ tuân theo phân phối chuẩn với trung bình bằng
800h và độ lệch chuẩn là 40h. Tìm xác suất để bóng đèn có tuổi thọ từ 778h đến 834h.
Giải: Gọi X là tuổi thọ của bóng đèn. Ta có X ~ N (800, 40 2 ) nên xác suất là:
Xi
a) Trung bình mẫu . X i 1
.
n
19
n
Chú ý thống kê X cho giá trị x xi / n khi X 1 nhận giá trị x1 , X 2 nhận giá trị x2 …
i 1
Ví dụ:
1). Số tàu nước ngoài đến cản biển phía đông vào 7 ngày được lự chọn ngẫu nhiên là
8,3,9,5,6,8 và 5. Tìm trung vị mẫu
2). Hàm lượng nicotil trong 6 điếu thuốc đc xác định là 2.3 ,2.7, 2.5 , 2.9 , 3.1, 1.9
Tìm trung vị mẫu.
3) Mode M là giá trị của mẫu mà xảy ra thường xuyên nhất hoặc có tần số lớn nhất
Mode có thể không tồn tại, khi tất cả các quan sát xảy ra cùng tần số và khi nó tồn tại
không nhất thiết là giá trị duy nhất khi có nhiều giá trị xảy ra cùng với tần số lớn nhất
n
( X i X )2
4) Phương sai mẫu . S2 i 1
.
n 1
n n
n X i2 ( X i ) 2
Định lý: . S2 i 1 i 1
.
n( n 1)
5) Độ lệch tiêu chuẩn mẫu ký hiệu bằng S là căn số bậc hai dương của phương sai mẫu.
mA
6) Tỉ lệ mẫu có tính chất A: . pˆ . với mA : tần số xuất hiện tính chất A, n : cỡ
n
mẫu.
Ý nghĩa: Hai tham số chính là μ và σ2, để đo tâm của vị trí và tính biến thiên của phân phối
xác suất. Đây là các tham số tổng thể không đổi và không bị ảnh hưởng hay tác động do các
kết quả của một mẫu ngẫu nhiên.
3. Các hàm phân phối xác suất của thống kê
a) Phân phối mẫu của giá trị trung bình
Định nghĩa: Phân phối xác suất của một thống kê được gọi là phân phối lấy mẫu.
Giả sử một biến nn của n quan sát được lấy từ một tổng thể tuân theo phân phối chuẩn có
giá trị trung bình và phương sai 2 . Mỗi quan sát X i sẽ có cùng phân phối chuẩn như
20
n
Xi
tổng thể. Nên từ công thức X i 1
ta có
n
... 2 2 ... 2 2
X và X2
n n2 n
b). Định lý giới hạn trung tâm
Nếu X là giá trị trung bình của một mẫu ngẫu nhiên có kích thước n lấy từ tổng thể có giá
X
trị trung bình và phương sai 2 khi đó giới hạn phân phối của thống kê Z là
/ n
phân phối chuẩn hóa N(z;0;1) khi n dần ra vô cùng.
Chú ý: Phép xấp xỉ chuẩn đối với X chỉ tốt khi n 30 . Nếu n<30 mức xấp xỉ sẽ chỉ tốt
nếu tổng thể không quá khác so với phân phối chuẩn.
Đặc biệt nếu nếu tổng thể có phân phối chuẩn thì ta khôn cần quan tâm tới cỡ mẫu.
Ví dụ:
1). Một công ty điện sản xuất các loại bóng điện có tuổi thọ theo phân phối chuẩn, với giá
trị trung bình bằng 800 và độ lệch chuẩn là 40.
a). Tìm xác suất của biến ngẫu nhiên 16 bóng đèn có tuổi thọ chưa đến 775 giờ.
b). tìm xác suất của biến nẫu nhiên tuổi thọ bóng đèn chưa đến 775 giờ
c. Phân phối mẫu của sự sai khác giữa hai giá trị trung bình.
Định lý: Nếu các mẫu độc lập có kích thước là n1, n2 được lấy nn từ hai tổng thể, rời rạc
haowcj liên tục, có các giá trị trung bình lần lượt là 1 , 2 , các phương sai 12 , 2 2 tương
ứng, khi đó phân phối của các thống kê mẫu của sự sai khác giữa hai giá trị trung bình,
X 1 X 2 được phân phối xấp xỉ chuẩn có ía trị trung bình và phương sai lần lượt là
X X 1 2 và 2
12
22
. khi đó thống kê Z
X 1
X 2 1 2
có
X1 X 2
1 2 n1 n2 12 22
n1 n2
Nếu n1 , n2 cùng lớn hơn 30 thì xấp xỉ phân phối chuẩn cho X 1 X 2 là rất tốt. Nếu một
trong hai n1 , n2 nhỏ hơn 30 thì phân phối tương đối tốt. Đặc biệt nếu cả hai ùng có phân
Ví dụ:
21
Thí nghiệm hai loại sơn khác nhau để so sánh thời gian khô; 50 mẫu sơn laoij A và 50 mẫu
sơn loại B. Ở cả hai trường hợp độ lệch chuẩn tổng thể là 1.0. Giả thiết thời gian khô trung
bình là bằng nhau với cả hai loại sơn. Tính P X A X B 1 .
4. TÍNH CÁC THỐNG KÊ MỘT CHIỀU BẰNG MÁY CASIO fx-500MS
4.1 Thống kê mẫu một chiều
SHIFT S SUM 1 x 2 , x, n
SHIFT S SUM 1 x 2 , x, n y 2 , y, xy
22
$6 BÀI TOÁN ƯỚC LƯỢNG TRUNG BÌNH CỦA MỘT MẪU
6.1 Giới thiệu
Chương trước ta đã tìm hiểu về thống kê và một số thống kê quan trọng với mục đích là xây dựng
nền tảng cho phép những người làm thống kê rút ra những kết luận về các tham số của tổng thể từ
số liệu thực nghiệm. Chẳng hạn, định lý giới hạn trung tâm cho ta biết về dạng phân phối của trung
bình mẫu X . Phân phối đó liên quan mật thiết đến trung bình của tổng thể . Do vậy bất kỳ một
kết luận gì về dựa trên mẫu, đều phải dựa vào trung bình mẫu. Tương tự cho phương sai mẫu của
tổng thể có phân phối chuẩn.
Chương này ta bắt đầu bằng việc chỉ rõ mục đích của suy luận thống kê. Sau đó, ta sẽ tìm hiểu về
bài toán ước lượng tham số của tổng thể.
Lý thuyết suy luận thống kê chứa đựng các phương pháp mà dựa vào đó ta có thể đưa ra những suy
luận hoặc những kết luận khái quát về tổng thể.
Suy luận thống kê được chia thành hai mảng chính: Ước lượng và kiểm định giả thuyết.
Ví dụ: Một ứng cử viên tổng thống muốn ước lượng tỉ lệ cử tri ủng hộ ông ta trên toàn quốc bằng
cách lấy ý kiến của 500 000 cử tri được chọn ngẫu nhiên và độc lập từ các vùng miền khác nhau. Tỉ
lệ cử tri trong mẫu ủng hộ ông ta làm cơ sở để đưa ra ước lượng về tỉ lệ ủng hộ ông ta trên toàn
quốc.
Đây là bài toán ước lượng tham số.
Khi ông ta tuyên bố tỉ lệ cử tri ủng hộ ông ta trên toàn quốc là 70%, thì vấn đề đặt ra đối với ứng cử
viên đối lập là cần tìm hiểu xem lời phát biểu trên có cơ sở hay không.
Ước lượng điểm của một tham số tổng thể nào đó là một giá trị cụ thể của thống kê
.
Ví dụ giá trị x của thống kê X , được tính từ một mẫu cỡ n, là một ước lượng điểm của trung bình
dùng để ước lượng tham số tổng thể với tính chính
tổng thể . Ta không mong đợi thống kê
xác tuyệt đối, thế nhưng cũng hy vọng rằng không quá xa .
23
Từ mẫu 2, 5, 11 ta thấy x = 6 còn trung vị mẫu x 5 , như thế thì
X cho tư ước lượng gần với
hơn so với X .
Tuy nhiên với mẫu 2, 6, 7 thì x = 5 còn x 6 tức là X lại cho ta ước lượng gần với tham số của
Định nghĩa2:
Trong số tất cả các ước lượng không chệch của tham số , ước lượng có phương sai nhỏ
nhất được gọi là ước lượng hiệu quả của .
Ngoài cách ước lượng điểm nói trên, người ta còn có thể dùng một khoảng của trục số thực
để ước chừng tham số chưa biết rơi vào khoảng đó.
6.4. ƯỚC LƯỢNG KHOẢNG
Đặt vấn đề: Cho X có dạng phân phối xác suất nào đó nhưng các tham số chung chưa
biết. Từ mẫu thực nghiệm kích thước n, ta muốn ước lượng với xác suất xẩy ra
(1 )100% khá lớn. Tức là cần xác định một khoảng (ˆL ,ˆU ) chứa được giá trị chưa biết
Khi cỡ mẫu tăng thì X2 2 / n giảm đi, và kết quả là ước lượng của chúng ta có thể gần
hơn đến tham số μ, vì khoảng sinh ra ngắn hơn. Nói chung là các mẫu khác nhau sẽ sinh ra
các giá trị ̂ khác nhau và vì thế có các giá trị khác nhau của ˆL và ˆU . Các điểm mút đó là
ˆ và
các giá trị của các biến ngẫu nhiên tương ứng ˆ sao cho P (
ˆ
ˆ ) 1
L U L U
Định nghĩa: Ta nói rằng khoảng (ˆL ,ˆU ) là khoảng tin cậy (khoảng ước lượng) của với
ước lượng của nên thường chọn khoảng (ˆL ,ˆU ) sao cho
| ˆU ˆL | nhỏ nhất, giúp ta xác định chính xác hơn tham số
24
cần tìm.
Hiệu | ˆU ˆL | gọi là độ dài của khoảng tin cậy.
Thật vậy, theo định lý giới hạn trung tâm thì X có phân phối xấp xỉ chuẩn với trung bình
X và độ lệch chuẩn là X / n . Đặt z / 2 là số sao cho xác suất để biến ngẫu nhiên
X
Ta có P(- zα/2< Z < zα/2) = 1 - , trong đó Z .
/ n
Như vậy, P X z / 2 X z / 2 1 .
n n
Tức là với một mẫu ngẫu nhiên cỡ n được chọn từ một tổng thể mà 2 đã biết và ta tính
được x , thì ta được một khoảng tin cậy (1 – )100% như trong phát biểu dưới đây.
* Khoảng tin cậy của μ, khi biết σ
Nếu x là trung bình của một mẫu ngẫu nhiên cỡ n được lấy từ tổng thể với 2 đã biết thì
khoảng tin cậy (1 )100% của μ , khi biết σ là . x z /2 x z /2 .
n n
trong đó z /2 được xác định bởi P(Z > z / 2 ) = / 2 .
Chú ý: Để tính giá trị z /2 ta tra bảng A.3 với giá trị diện tích là 1 .
2
Với n 30 và chưa biết hoặc không biết phân phối của tổng thể thì vẫn sử dụng công
thức trên bằn cách thay s cho .
Ví dụ Hàm lượng kẽm trung bình thu hồi được từ một mẫu các giá trị đo kẽm tại 36 điểm
đo khác nhau được xác định là 2,6g/ml. Xác định các khoảng tin cậy 95% cho mật độ kẽm
trung bình ở sông. Giả thiết độ lệch chuẩn tổng thể là 0,3 g/ml.
25
Định lý: Nếu x được sử dụng để ước lượng điểm cho thì với độ tin cậy (1 )100% ta
cho rằng sai số của ước lượng không quá x z /2
n
Định lý: Nếu x được sử dụng để ước lượng điểm cho thì với độ tin cậy (1 )100% để
2
sai số của ước lượng không quá khi đó cỡ mẫu tối thiểu là n z /2 ( n được làm
tròn đến số nguyên tiếp theo.
* Khoảng tin cậy của μ, khi chưa biết σ , cỡ mẫu nhỏ (n < 30).
X
Ta đã biết tổng thể có phân phối chuẩn, thì biến ngẫu nhiên T có phân phối
S/ n
Student với n-1 bậc tự do, trong đó S là độ lệch tiêu chuẩn. Ta dùng T để xây dựng khoảng
tin cậy với phương sai tổng thể chưa biết. ta có P t /2 T t /2 1
Định lý: Nếu x và s là số trung bình và độ lệch chuẩn của mẫu ngẫu nhiên được rút ra từ
biến ngẫu nhiên của chuẩn có phương sai σ2 chưa xác định, khoảng tin cậy (1 )100%
cho μ là:
s s
. x t /2 x t /2 .
n n
trong đó t /2 là giá trị t với v n 1 bậc tự do, sinh ra một diện tích bằng / 2 bên phía
phải.
Chú ý: Kết quả trên có giả thiết là phân phối chuẩn, tuy nhiên phân phối xấp xỉ chuẩn thì sử
dụng kết quả trên cũng khá tốt.
Ví dụ: Hàm lượng axit sulfuric (đơn vị lít) của 7 container là
26
9,8 10,2 10,4 9,8 10,0 10,2 9,6
Tìm khoảng tin cậy 95% cho hàm lượng axit sulfuric trung bình của các container đó, giả
sử ước lượng có phân phối chuẩn.
*Khoảng tin cậy của μ, khi chưa biết σ , cỡ mẫu lớn (n >=30).
Trường hợp này vì cỡ mẫu lớn nên ta coi s và đưa về trường hợp đã biết.
Nếu x1 và x2 là các giá trị trung bình của các mẫu ngẫu nhiên độc lập có kích thước n1 và
n2 từ các tổng thể có các phương sai đã biết 12 và 22 , khoảng tin cậy (1 )100% đối với
12 22 12 22
1 2 là . ( x2 x1 ) z /2 2 1 ( x2 x1 ) z /2 .
n1 n2 n1 n2
trong đó z /2 là giá trị của z sinh ra một diện tích / 2 về phía phải của nó
Chú ý: Nếu không giả thiết tính chuẩn tắc, các mẫu lớn hơn 30 sẽ cho phép sử dụng s1 và
s2 thay cho σ1 và σ2 với giá trị hữu tỷ s1 1 và s2 2
Ví dụ
Tiến hành thí nghiệm với hai loại động cơ A và B để so sánh sự tiêu thụ khí gas trên mỗi
gallon. Làm 50 thí nghiệm đối với loại động cơ A và 75 thí nghiệm cho động cơ B. Lượng
tiêu thụ trung bình đối với động cơ A là 36 dặm mỗi gallon và đối với loại máy B là 42 dặm
mỗi gallon. Xác định một khoảng tin cậy 96% trên B A , trong đó B và A là lượng tiêu
thụ chuẩn tổng thể đối với máy B và A. Giả thiết rằng độ lệch chuẩn tổng thể là 6 và 8 cho
lần lượt máy A và B.
1 1 1 1
. ( x1 x2 ) t /2 s p 1 2 ( x1 x2 ) t /2 s p .
n1 n2 n1 n2
VD Học viện bách khoa Virginia nghiên cứu độ chênh lệch lượng hóa chất orthophospho
được đo tại hai trạm khác nhau trên sông James. Lấy 15 mẫu được thu thập tại trạm 1 có
hàm lượng orthophospho trung bình là 3,84 mg/l và độ lệch chuẩn 3,07 mg/l. Lấy 12 mẫu
tại trạm 2 có hàm lượng trung bình 1,49 mg/l và độ lệch chuẩn 0,80 mg/l. Tìm một khoảng
tin cậy 95% cho độ lệch của các hàm lượng orthophospho trung bình tổng thể tại hai trạm
này, giả thiết rằng các quan sát lấy từ các tổng thể chuẩn có phương sai bằng nhau.
Ví dụ 2: Cho hai tổng thể A và B. Một mẫu từ A có cỡ mấu 12 cho ta giá trị trung bình mẫu
là 3.11 và độ lệch tiêu chuẩn là 0,771. Một mẫu từ B có cỡ là 10, cho ta gía trị trung bình là
2.04 và độ lệch tiêu chuẩn là 0.448. tìm khoảng tin cậy 90% cho hiệu A B giả sử hai
tổng thể có phân phối xấp xỉ chuẩn và có phương sai bằn nhau nhưng chưa biết.
II. ƯỚC LƯỢNG TỶ LỆ VỚI CỠ MẪU LỚN
1. Ước lượng một tỷ lệ.
Ta quan tâm đến tỷ lệ cá thể thành công p trong một tổng thể nào đó, nhưng p chưa biết. Vì
thế ta có thể dùng ước lượng điểm p để ước lượng cho p, p được xác định bằng thống kê
X
Pˆ , trong đó X là số cá thể thành công trong một mẫu ngẫu nhiên n. Cũng giống như
n
ước lượng cho kỳ vọng, chúng ta có thể xét khoảng tin cậy cho p bằng cách xét phân phối
mẫu P̂ .
Với cách xác định P̂ như trên, P̂ có được phân bố chuẩn với kỳ vọng là Pˆ E ( Pˆ ) p
pq Pˆ p
và phương sai P̂2 nên Z có phân phối chuẩn chuẩn hóa.
n pq / n
pq pq
Ta có: P ( z /2 Z z /2 ) 1 P( Pˆ z /2 p Pˆ z /2 ) 1
n n
Khi n lớn, rất ít sai số xảy ra, nên thay thế ước lượng điểm p̂ cho p thì:
ˆˆ
pq ˆˆ
pq
P ( Pˆ z /2 p Pˆ z /2 ) 1
n n
ˆˆ
pq ˆˆ
pq
. pˆ z /2 p pˆ z /2 .
n n
với p̂ là tỷ lệ của các thành công trong một mẫu ngẫu nhiên có kích thước n và qˆ 1 pˆ .
Định lý: Nếu dùng p̂ để làm ước lượng cho p, thì với độ tin cậy (1 )100% ta có thể
28
pq
khẳng định rằn sai số của ước lượng không vượt quá z /2
n
Định lý: Nếu dùng p̂ để làm ước lượng cho p, thì với độ tin cậy (1 )100% để sai số
z 2 /2
khoog vượt quá thì kích thước mẫu tối thiểu là n pq .
2
Hệ quả: Nếu dùng p̂ để làm ước lượng cho p, thì với độ tin cậy (1 )100% để sai số
z 2 /2
khoog vượt quá thì kích thước mẫu cần dùng là n . ( chưa có tỷ lệ cho trước)
4 2
Ví dụ Trong một mẫu ngẫu nhiên n=500 gia đình có ti vi tại thành phố Hamilton, Canada,
xác định được rằng x=340 đăng ký HBO.
(a). Tìm khoảng tin cậy khoảng tin cậy 95% cho tỷ lệ thật sự các gia đình trong thành phố
này đăng ký sử dụng HBO.
(b) Nếu độ tin cậy là 95% thì cần điều tra bao hiêu gia đình để sai số ước lượng nhỏ hơn
0.02
(c) Nếu không có mẫu sơ bộ nói trên thì cần lấy mẫu bao nhiêu để độ tin cậy 95% của sai số
ước lượng p nhỏ hơn 0.02.
Ví dụ:
Để nghiên cứu về lượng bò sữa của một giống bò sữa mới, người ta tiến hành điều tra một
cách nhẫu nhiên 100 con bò cho kết quả như sau
Số con bò 10 24 42 16 8
hãy ước lượng khoảng lượng sữa trung bình trong một này của con bò và tỉ lệ tổng thể của
số con bò cho trên 11 lít sữa trong một này với cùng độ tin cậy 98%.
2. Ước lượng sai khác giữa hai tỷ lệ với cỡ mẫu lớn.
Nếu p̂1 và p̂2 là tỷ lệ thành công trong các mẫu ngẫu nhiên có n1 và n2 tương ứng
qˆ1 1 pˆ1 và qˆ2 1 pˆ 2 , với độ tin cậy (1 )100% thì khoảng tin cậy cho sự sai khác
Ví dụ Trong quá trình sản xuất các linh kiện, các mẫu thu được sử dụng cả quá trình mới và
quá trình hiện tại để xác định liệu quá trình mới có hiệu quả hơn hay không. Nếu 75 trong
số 1500 linh kiện trong quy trình hiện tại được xác định có lỗi và 80 trong số 2000 linh kiện
29
của quá trình mới được xác định có lỗi, tìm khoảng tin cậy 90% cho sai số chân thực trong
phần các sản phẩm bị lỗi giữa quá trình hiện tại và quá trình mới.
+ Gọi ( 1 , 2 ) là trung bình của biến ngẫu nhiên X hoặc p ( p1 , p2 ) là tỷ lệ của tính chất
A nào đó của X.
+ Số liệu mẫu n, x , s hoặc n, x
+ Ta có giả thiết về độ tin cậy (1 )100% hoặc độ lệch chuẩn (nếu cho).
+ Bài toán yêu cầu ước lượng 1 trung bình (hiệu 2 trung bình, một tỷ lệ, hiệu 2 tỷ lệ) ,
trong trường hợp biết (hoặc chưa biết) phương sai , cỡ mẫu lớn (hoặc nhỏ)
+ Xác định công thức ước lượng và thay số liệu mẫu.
+ Kết luận
30
Gọi một giả thiết H 0 : 0 , các giả thiết khác 0 ( 0 , 0 ) gọi là đối thiết H1 .
Với dạng giả thiết H 0 : 0 , đối thiết H1 : 0 gọi là kiểm định hai phía
+ Nếu yêu cầu đề cập đến hướng như là lớn hơn, nhỏ hơn, tốt hơn, kém hơn... thì H1 sẽ
được phát biểu qua dấu bất đẳng thức
+ Nếu yêu cầu đề cấp đến hướng tới kép như là ít nhất, nhiều nhất, bằng hoặc lớn hơn,
không nhiều hơn thì dấu kép ( , ) được biểu diễn cho H 0 ( chỉ sử dụng dấu bằng) và H1
cho hướng ngược lại.
+ Cuối cùng nếu không hướng nào được đề cập đến thì H1 được phát biểu qua dấu không
bằng ( ).
Ví dụ:
(1) trong kiểm định một loại thuốc mới, ta muốn đưa ra chứng cớ rằng hơn 30% bệnh nhân
được chữa khỏi.
Vậy H1 : p 30% do đó giả thiết H 0 : p 30%
(2) Hãng sản xuất ngũ cốc muốn khẳng định lượng chất béo trung bình trong ngũ cốc không
vượt quá 1,5 miligram.
H 0 : 1.5
H1 : 1.5
Mặc dù phát biểu giả thiết với dấu bằng, cần hiểu nó bao ồm cả các giá trị không được nhắc
ới trong đối thiết. do vậy việc chấp nhận H0 không có nghĩa chính xác là 1.5
(3) Một đại lý nhà đất khẳng định rằng 60% số nhà riêng đang được xây dưng ngày nay là
có 3 phòng ngủ. Để kiểm tra kiểm tra khẳng định này, một lượng lớn căn nhà mới xây được
kiểm tra, tỉ lệ nhà có ba phòng ngủ dduwoj hi lại và sử dụng trong chỉ tiêu kiểm định. Phát
biểu giả thiết và đối thiết
Giả thiết : H 0 : p 0.6 đối thiết H1 : p 0.6 .
4. Các khả năng có thể xảy ra trong kiểm định giả thuyết.
H 0 đúng H 0 sai
31
+ Bác bỏ giả thiết đúng gọi là sai lầm loại I. Chấp nhận giả thiết sai gọi là sai lầm loại II.
Xác suất mắc phải sai lầm loại I, cũng được gọi là mức ý nghĩa, được ký hiệu là .
5. Miền bác bỏ và miền chấp nhận
Thủ tục để quyết định trong kiểm định giả thiết được xây dựng với khái niệm về xác suất
của quyết định sai lầm. Tức là việc chấp nhận một giả thuyết chỉ đơn thuần là dữ liệu
không cho đủ thông tin để bác bỏ nó. Nói cách khác, sự bác bỏ có nghĩa là có một xác
suất rất nhỏ để nhận được thông tin từ mẫu đã được quan sát mà theo đó, giả thuyết là
đúng. Với kết quả rủi ro nhỏ của quyết định sai lầm, dường như sẽ an toàn khi bác bỏ giả
thuyết. Cũng nhấn mạnh rằng việc chấp nhận giả thuyết sẽ không loại bỏ những khả năng
khác khi có mẫu khác.
Xác suất sai lầm loại I và loại II có liên quan đến nhau. Việc giảm xác suất mắc sai lầm này
sẽ làm tăng xác suất mắc sai lầm kia nên trong thực tiễn không thể đồng thời làm giảm xác
suất của cả 2 sai lầm đó trừ khi tăng cỡ mẫu n. Do sai lầm loại I dễ kiểm soát và dễ tính hơn
nên chọn trước số rất nhỏ như là một ngưỡng để xác định sai lầm loại I . Theo nguyên lý:
“Một biến cố có xác suất nhỏ thì coi như không xẩy ra trong một phép thử” nên kể cả
trường hợp giả thiết đúng mà bị bác bỏ thì khả năng đó hầu như không xảy ra.
6. Các bước của bài toán kiểm định giả thiết
Bước 1: Mô tả H0, chọn đối thiết H1 phù hợp.
Bước 2: Chọn thống kê tiêu chuẩn hợp lý ( chỉ tiêu kiểm định). Từ đó tính các giá trị thống
kê thông qua số liệu mẫu.
Bước 3: Chọn mức ý nhĩa, tìm miền bác bỏ
Bước 4: Kiểm tra xem chỉ tiêu kiểm định nằm trong miền chấp nhận hay bác bỏ.
Bước 5: Từ đó quyết định chấp nhận hay bác br giả thiết.
II. KIỂM ĐỊNH TRUNG BÌNH.
1. Kiểm định về một trung bình, đã biết phương sai
Giả thiết Đối thiết Chỉ tiêu kiểm Giá trị tới Miền bác bỏ
định hạn
H1 : 0 X 0 zth z /2 D , z /2 z /2 ,
Z
/ n
H 0 : 0 H1 : 0 zth z D z ,
x 0
H1 : 0 z zth z D , z
/ n
Ví dụ:
32
(1). Một nhà sản xuất đưa ra một loại dây câu mới, họ khẳng định trọng lượng trung bình
dây có thể chịu là 8 kg, với độ lệch chuẩn là 0,5 kg. Để kiểm định giả thuyết 8 kg , đối
thuyết 8 , người ta lấy 50 dây ngẫu nhiên kiểm tra thấy trọng lượng trung bình dây có
thể chịu là 7,8 kg. Hãy kiểm định khẳng định của nhà sản xuất với mức ý nghĩa 0,01.
(2). Một mẫu ngẫu nhiên gồm 100 giấy báo tử ở Mỹ cho thấy tuổi thọ trung bình hiện nay là
71.8 năm. Giả sử độ lệch chuẩn là 8.9 năm; có thể cho rằng tuổi thọ trung bình hiện nay là
hơn 70 năm được không? Cho mức ý nghĩa 0.05
2. Kiểm định về một trung bình, chưa biết phương sai và cỡ mẫu nhỏ.
Giả thiết Đối thiết Chỉ tiêu kiểm Giá trị tới Miền bác bỏ
định hạn
H1 : 0
X 0
tth t /2, n1
D , t /2, n 1 t /2, n 1 ,
T
s/ n
H 0 : 0 H1 : 0 tth t , n1 D t , n1 ,
x 0
t
H1 : 0 s/ n tth t , n1
D , t , n1
Ví dụ Một báo cáo khẳng định mỗi máy hút bụi tiêu thụ điện khoảng 46 kWh mỗi năm. Từ
một mẫu gồm 12 gia đình được nghiên cứu, cho thấy máy hút bụi tiêu thụ điện trung bình
42 kWh mỗi năm với độ lệch chuẩn 11,9 kWh. Liệu có thể nói, với mức ý nghĩa 0,05, mức
tiêu thụ điện trung bình của máy hút bụi tiêu thụ bằng 46 kWh mỗi năm hay không? Giả sử
mật độ của số kWh là chuẩn.
vÍ DỤ: Cơ thể người cần khoảng 220 miligram natri một ngày. Khảo sát 20 loại suất ăn của
một hãng ta có số liệu sau.
Natri(mg) 200 210 220 230 240 250 260
Số suất 2 3 4 4 2 3 2
Với mức ý nghĩa 0.05, có thể nói lượng natri trung bình trong các suất ăn của hãng này lớn
hơn 220mg không? Giả sử phân phối là chuẩn.
3. Kiểm định về một trung bình, khi chưa biết phương sai cỡ mẫu lớn
Trường hợp này vì cỡ mẫu lớn nên ta có thể coi s đưa về trường hợp đã biết phương
sai.
33
Bài 9: KIỂM ĐỊNH GIẢ THIẾT VỀ TRUNG BÌNH HAI MẪU VÀ TỈ LỆ
1. Kiểm định hai trung bình, biết phương sai
1. H 0 : 1 2 d 0 , H1 : 1 2 d 0 (hoặc 1 2 d 0 , 1 2 d 0 )
( X 1 X 2 ) d0 ( x1 x2 ) d 0
2. Chỉ tiêu kiểm định: . Z z .
/ n1 / n2
2
1
2
2 12 / n1 22 / n2
D z ,
nghĩa 0.05 có thể kết luận hai phương pháp cho trọng lượng gà khác nhau không. Giả sử
trọng lượng gà theo luật chuẩn với phương sai của phương pháp 1 và 2 lần lượt là
12 0.04 , 22 0.098 .
Ví dụ:
Một mẫu ngẫu nhiên n1 = 25 lấy từ tổng thể có phân phối chuẩn với độ lệch chuẩn 1 5 và
giá trị trung bình là x1 80 . Một mẫu nẫu nhiên thứ 2 có n2 = 6 lấy từ tổng thể có phân
phối chuẩn với độ lệch chuẩn 2 3 và giá trị trung bình x 2 75 . Kiểm định gải thiết khôn
có sự sai khác về chất lượng hai tổn thể với mức ý nghĩa 0.05.
4. Kiểm định hai trung bình, khi phương sai chưa biết nhưng bằng nhau
1. H 0 : 1 2 d 0 , H1 : 1 2 d 0 (hoặc 1 2 d 0 , 1 2 d 0 )
3. Mức ý nghĩa , suy ra miền bác bỏ D , t /2,n1 n2 2 t /2,n1 n2 2 , hoặc
D , t ,n1 n2 1 hoặc D t ,n1 n2 1 , .
Ví dụ Một thí nghiệm được thực hiện nhằm so sánh mức độ mài mòn của hai loại kim loại
34
khác nhau. Lấy 12 miếng kim loại 1 được kiểm tra bằng cách đưa vào máy đo độ mài mòn
và 10 miếng kim loại 2 được kiểm tra tương tự. Mẫu ứng với kim loại 1 có độ mài mòn
trung bình là 85 đơn vị và độ lệch mẫu bằng 4. Trong khi mẫu ứng với kim loại 2 có độ mài
mòn trung bình là 81 và độ lệch mẫu là 5. Có thể kết luận, với mức ý nghĩa 0,05, rằng mức
độ mài mòn của kim loại 1 hơn kim loại 2 là 2 đơn vị không? Giả sử các mật độ đều xấp xỉ
chuẩn với phương sai bằng nhau.
X np0
2. Chỉ tiêu kiểm định: . Z .
np0 q0
3. Với mức ý nghĩa ta suy ra giá trị tới hạn và miền bác bỏ
4. Kiểm tra và kết luận bài toán
VD Một loại thuốc an thần thường được dùng được tin là chỉ có tác động tới 60% người sử
dụng. Kết quả thử nghiệm loại thuốc mới trên 100 người trưởng thành cho thấy 70 người
nhận được tác dụng. Có thể tin được hay không rằng loại thuốc mới khác với loại thường
dùng với mức ý nghĩa 0,05.
Ví dụ:
Thống kê khối lượng X(g) của hộp sữa ta thu được bảng
m 11 60 117 62
Nhữn hộp sữa dưới 399 là sai quy cách. với mức ý nghĩa 2% hãy kiểm định giả thiết tỷ lệ
hộp sữa sai quy cách nhỏ hơn 5%.
2. Kiểm định về hai tỷ lệ bằng nhau với cỡ mẫu lớn.
pˆ1 pˆ 2 x1 x2
Chỉ tiêu kiểm định: . z . với pˆ là ước lượng gộp
ˆ ˆ[(1 / n1 ) (1 / n2 )]
pq n1 n2
36