Professional Documents
Culture Documents
Bài tập Thống kê thầy Cả
Bài tập Thống kê thầy Cả
1 2 3 4 5
0 1 2 3 4
Không thích Thích ít Thích vừa Khá thích Rất thích
• Thang đo khoảng → + , -
• Thang đo thứ bậc → so sánh hơn kém
• Thang đo Likert
x [50,60) 50 x 60
x [60,70) 60 x 70
1 5 6 + 7,5 + 5,5 + 8 + 20
x=
n i =1
xi =
5
= 9,4
X − 1
P ( − z X + z ) = P z 1 − 2 , z 1
z
1 1
• z = 2 : xi ( − 2, + 2) với tỷ lệ (xác suất) ít nhất là 1 − = 1 − = 0,75 = 75(%).
z2 22
1 1
• z = 3: xi ( − 3, + 3) với tỷ lệ (xác suất) ít nhất là 1 − 2 = 1 − 2 = 0,89 = 89(%).
z 3
1 1
• z = 4 : xi ( − 4, + 4) với tỷ lệ (xác suất) ít nhất là 1 − 2 = 1 − 2 = 0,9375 94(%).
z 4
P( B A) P( A B) P( AB)
P( B A) = = =
P( A) P( A) P( A)
P( AB) = P( A).P( B A)
P( ABC ) = P( A).P( B A).P(C AB)
P( ABC ) = P( AB).P(C AB) = P( A).P( B A).P(C AB)
Chỉnh hợp (không lặp):
Lấy không hoàn lại ra n phần tử:
1 2 - Thực hiện n lần lấy, mỗi lần ra 1 phần tử.
- Hoặc, thực hiện lấy cùng 1 lúc ra n phần tử.
… - Hoặc…
1 2 3 n
N N −1 N − 2 N − (n − 1)
( N − n).( N − n − 1)...1
PnN = N .( N − 1).( N − 2)....( N − n + 1) = N .( N − 1).( N − 2)....( N − n + 1)
n thua so
( N − n).( N − n − 1)...1
N!
=
( N − n)!
Hoán vị: Pn = Pnn = n! (Hoán vị của n phần tử = Chỉnh hợp chập n trong n = Cách sắp thứ tự của
n! n!
n phần tử). Ta có: Pnn = = = pn = n! 0! = 1
(n − n)! 0!
Cách tạo chỉnh hợp chập n trong N ( PnN ) bao gồm 2 bước:
• Bước 1: Lấy n phần tử trong N phần tử và không kể thứ tự, tức là tạo tổ hợp chập n trong
N (CnN ) .
• Bước 2: Hoán vị n phần tử vừa lấy ra, có n! cách.
PnN N!
Theo quy tắc nhân, ta có: P = n!C N N
C =
N
=
n! n!( N − n)!
n n n
Ac = A
VD:
• A = biến cố xuất hiện mặt chẵn.
A = biến cố không xuất hiện mặt chẵn = biến cố xuất hiện mặt lẻ.
• A = {1, 2}
P( A B C D) =
P( A B C ) = P ( A B) C = P( A B) + P(C ) − P ( A B)C
= P( A) + P( B) − P( AB) + P(C ) − P( AC BC )
P( AC BC ) = P( AC ) + P( BC ) − P( ACBC ) = P( AC ) + P( BC ) − P( ABC )
đpcm.
P( A B C D) = P( A) + P( B) + P(C ) + P( D)
− P( ABCD)
P( AB)
P( A B) = P( AB) = P( B).P( A B)
P( B)
P( BA) P( AB)
P( B A) = = P( AB) = P( A).P( B A)
P( A) P( A)
Ta có: P( A) = 1 − P( A)
Ta cũng có: P( A B) = 1 − P( A B)
Bài tập:
Một lớp học có 40 học sinh, trong đó có 25 em giỏi Toán, 20 em giỏi Văn và 10 em giỏi cả Toán
và Văn. Biết rằng giỏi ít nhất 1 môn thì được thưởng. Chọn ngẫu nhiên từ lớp ra 3 học sinh, tính
XS trong đó có 2 em được thưởng và 1 em không được thưởng.
LỜI GIẢI
• Số hs giỏi cả Toán và Văn: 10
• Số hs chỉ giỏi Toán: 25 – 10 = 15
• Số hs chỉ giỏi Văn: 20 – 10 = 10
• Số hs giỏi ít nhất 1 môn (được thưởng): 10 + 15 + 10 = 35
• Số hs không được thưởng: 40 – 35 = 5
Gọi A là biến cố trong 3 hs được chọn có 2 em được thưởng và 1 em không được thưởng.
C235 .C15
Ta có: P( A) = = 0,3011
C340
LS Clothiers:
A1 = A = biến cố Chính quyền địa phương chấp thuận dự án
• Các A1 , A2 ,..., An là một phân hoạch của không gian mẫu . Khi đó ta có công thức XS
đầy đủ:
n
P( B) = P( Ai ).P( B Ai )
i =1
P( Ak ).P( B Ak )
Công thức Bayes (XS hậu nghiệm): P( Ak B) = n
; k = 1,2,..., n
P( A ).P(B A )
i =1
i i
XS hậu nghiệm:
P( A1 ).P( B A1 ) 0,7 0, 2
P( A1 B) = = = 0,3415
P( B) 0, 41
P( A2 ).P( B A2 ) 0,3 0,9
Tương tự, có: P( A2 B) = = = 0,6585
P( B) 0, 41
P( B) = P( A).P( B A) + P( A).P( B A)
Ta có: P( B) = P( A).P( B A) + P( A).P( B A) = 0,05 0,99 + 0,95 0,02 = 0,0685 = 137 / 2000
Chú ý:
• X là biến NN rời rạc, thì ta có bảng PP xác suất:
X x1 x2 ... xK
P p1 p2 ... pK
K có thể là .
K
Ta có nguyên tắc: pi = 1 with pi = P( X = xi ).
i =1
K K
ni 1 K K
Kỳ vọng của X: = E( X ) = pi xi = xi = ni xi . Trong đó: n = ni → N
i =1 i =1 n n i =1 i =1
Phương sai của X: Var ( X ) = E X − E( X ) = E ( X − )2 = E( X 2 ) − 2
2
CASIO fx-570/580VNX (FX/ FX PLUS)
• SHIFT\ MENU (MODE)\ \ Statistics\ Frequency? 1: On; 2: Off (Làm 1 lần duy nhất)
• MENU (MODE)\ Statistics (Thống kê)\ 1-Variable (1-biến) (Làm 1 bài TK mới)
x Freq
1
2
3
Nhấn AC
KQ: OPTN (SHIFT\ 1) \ 1-Variable Calc (Var)
1: n 2: x
3: x 4 : sx
• Gọi X là số chấm xuất hiện của 1 con xúc xắc cân bằng. Ta có phân phối của X là:
X 1 2 3 4 5 6
P 1/6 1/6 1/6 1/6 1/6 1/6
Các đặc trưng số của X là:
E ( X ) = 3,5 = 7 / 2
( X ) = 1,7078
Var ( X ) = 2,9167 = 35 /12
3.1. Có 2 lô hàng, mỗi lô chứa 10 sản phẩm. Lô I có 4 sản phẩm loại A, lô II có 6 sản phẩm loại A.
Lấy từ lô I ra 2 sản phẩm, từ lô II ra 5 sản phẩm.
a) Tính xác suất lấy được 5 sản phẩm loại A.
b) Đem 7 sản phẩm lấy ra đi bán với giá sản phẩm loại A là 10 ngàn đồng, sản phẩm không phải
loại A là 6 ngàn đồng. Tìm số tiền thu được trung bình và phương sai của số tiền thu được.
Bài giải:
Gọi X là số SP loại A có trong n = 2 SP lấy ra từ lô I. X ~ H(N=10, M=4, n=2), X=0,1,2
Gọi Y là số SP loại A có trong n = 5 SP lấy ra từ lô II. Y ~ H(N=10, M=6, n=5), Y=1,2,3,4,5
C04 .C26 C56 .C04 C14 .C16 C46 .C14 C24 .C06 C36 .C24 25
= 10 10 + 10 10 + 10 10 =
C2 C5 C2 C5 C2 C5 126
Ví dụ:
Một bài thi TN có 10 câu hỏi, mỗi câu có 4 đáp án trả lời và chỉ có 1 đáp án đúng. Một SV làm
bài bằng cách chọn NN 1 trong 4 đáp án. Tìm XS để SV này thi đạt yêu cầu (ít nhất 5 câu đúng).
Giải:
Gọi X là số câu trả lời đúng trong số n = 10 câu. Ta có: X ~ B(n=10; p=0,25), X=0,1,…,10.
10
Ta có XS SV thi đạt: P( X 5) = P(5 X 10) = C10 x
x .0,25 .0,75
10− x
= 0,0781
x=5
Phương sai của số câu trả lời đúng: Var ( X ) = npq = 10 0, 25 0,75 = 1,875
b) Gọi X là số viên đạn bắn trúng bia trong số n viên bắn ra. Ta có: X ~ B(n; p=0,65),
X=0,1,2,…,n.
Tìm số viên đạn n cần bắn sao cho: P( X 1) = 0,99
Ta có: P( X 1) = 1 − P( X 1) = 1 − P( X = 0) = 0,99
X = 0,1,..., n X = 0,1,2,...,
E ( X ) = np E( X ) =
Var ( X ) = npq Var ( X ) = (q = 1 − p → 1)
np − q Mod ( X ) np − q + 1 − 1 Mod ( X )
k
pk = Ckn pk qn−k pk = e−
k!
Ta có: p = P( A) 0 A : biến cố hiếm.
Ví dụ:
Trong một quyển sách có 250 trang, người ta đếm thấy có 40 từ bị lỗi. Hãy tìm XS để có ít nhất 3
từ bị lỗi trên một trang sách.
Giải:
Gọi X là số từ bị lỗi trên 1 trang sách. Ta có số từ bị lỗi trung bình trên 1 trang sách là:
40
= E( X ) = = 0,16 (từ/trang), X = 0,1,2,...
250
2
0,16 x
P( X 3) = 1 − P(0 X 2) = 1 − e−0,16 = 1 − 0,9994 = 0,0006
x =0 x!
34
Ta có: P( X = 4) = e−3 = 0,1680
4!
Ví dụ:
Người ta quan sát thấy trong 1 giờ ở một trạm đổ xăng trung bình có 75 xe ghé trạm.
a) Tìm xác suất để trong 1 phút có ít nhất 5 xe ghé trạm đổ xăng.
b) Tìm xác suất để trong 1 phút có nhiều nhất 3 xe ghé trạm đổ xăng.
Giải:
a) Gọi X là số xe đến trạm đổ xăng trong 1 phút.
75
Ta có số xe đến trạm đổ xăng TB trong 1 phút là: = E ( X ) = = 1,25 (xe/phút)
60
Ta có: X ~ P( = 1, 25), X = 0,1, 2,...
4
1,25x
P( X 5) = 1 − P(0 X 4) = 1 − e−1,25 = 0,0091
x=0 x!
3 x
1,25
b) P(0 X 3) = e−1,25 = 0,9617
x =0 x!
Bài 5.
a) X là số lần xuất hiện mặt 6 khi tung con xúc xắc 6 lần. Ta có: X ~ B(n=6, p=1/6)
0 6 x 6− x
1 5 6
1 5
P( X 1) = 1 − P( X = 0) = 1 − C = Cx6
6
0 = 0,6651
6 6 x =1 6 6
b) Y là số lần xuất hiện mặt 6 khi tung con xúc xắc 12 lần. Ta có: Y ~ B(n=12, p=1/6)
0 12 1 11
1 5 1 5
P(Y 2) = 1 − P(Y = 0) − P(Y = 1) = 1 − C012 − C112
6 6 6 6
x 12− x
1 5
12
= C = 0,6187
12
x
x =2 6 6
c) Z là số lần xuất hiện mặt 6 khi tung con xúc xắc 18 lần. Ta có: Z ~ B(n=18, p=1/6)
P(Z 3) = 1 − P( Z = 0) − P( Z = 1) − P( Z = 2)
0 18 1 17 2 16
1 5 1 5 1 5
= 1 − C − C118 − C218
18
0
6 6 6 6 6 6
x 18− x
18
1 5
= C
18
x = 0,5973
x =3 6 6
= (
1 3
3
C1 .0,81.0, 22 + C13.0,91.0,12 + C13.0,71.0,32 ) = 0,104
1
P( A1 ).P( B A1 ) 3 0,096 4
P( A1 B) = = = = 0,3076
P( B) 0,104 13
CV
=
d
n
1 1
n! = nlim 1 + = e
→ n
n=0
Chú ý:
• X là biến NN rời rạc, thì ta có bảng PP xác suất:
X x1 x2 ... xK
P p1 p2 ... pK
K có thể là .
K
Ta có nguyên tắc: pi = 1 with pi = P( X = xi ).
i =1
K K
ni 1 K K
Kỳ vọng của X: = E( X ) = pi xi = xi = ni xi . Trong đó: n = ni → N
i =1 i =1 n n i =1 i =1
Phương sai của X: Var ( X ) = E X − E( X ) = E ( X − )2 = E( X 2 ) − 2
2
• X là biến NN liên tục, thì ta có hàm mật độ xác suất: f ( x), x (−, +)
+
Ta có nguyên tắc: f ( x)dx = 1
−
+
P(− X +) =
−
f ( x)dx = 1 X (−, +) là một bc chắc chắn.
P( X ) = P( X ) = f ( x)dx
Ta có: P( X = ) = 0
Bảng Laplace:
• z = 1,968 1,97 ( z ) (1,97) = 0, 4756
• z = 1,963 1,96 ( z ) (1,96) = 0, 4750
• (0) = 0
• () = 0,5
• z1 z2 ( z1 ) ( z2 )
• z 4 0,5 = (4) ( z) () = 0,5 ( z) = 0,5
Tính bằng Scientific Calculator:
3:R( 4: t
• Q(1.968) = 0.47547 = P(1.968) – 0.5 = 0.5 – R(1.968): Hàm Laplace
• Q(1.963) = 0.47518
• P(1.968) = 0.97547: XS tích lũy
• R(1.968) = 0.024534 = 1- P(1.968): XS bên phải
Tính bằng Excel:
=NORM.S.DIST(1.968,TRUE) = 0.975465981144829
1−
Trong đó: ( z /2 ) = 1 − = 2 ( z/2 )
2
Ta có: X ~ N ( = 15; 2 = 62 )
− 15 20 − 15
Ta phải tính: P( X 20) = P(20 X ) = −
6 6
= () − (0,8333) = 0,5 − 0, 29766 = 0, 20234
SD Excel:
P( X 20) = 1 − P( X 20)
a − 15
P(a X ) = 0,5 − 0,05
6
a − 15
0,5 − 0,05 = 0,45 = (1,645)
6
1,64 0, 4495
z= ( z ) =
1,65 0, 4505
1,64 + 1,65 0, 4495 + 0, 4505
z= = 1,645 ( z) = = 0, 45
2 2
a − 15
1,645 a 15 + 6 1,645 = 24,87 (gallons)
6
Ví dụ: Xấp xỉ chuẩn của nhị thức
Gọi X là số hóa đơn mắc lỗi trong số n = 100 hóa đơn được KT.
Ta có: X ~ B(n = 100; p = 0,1), X = 0,1,2,...,100
3.28. Tuổi thọ của một máy điện tử là một đại lượng ngẫu nhiên có phân phối chuẩn trung bình 4,2
năm và độ lệch chuẩn 1,5 năm. Bán một máy được lãi 140 ngàn đồng, song nếu máy phải bảo hành
thì lỗ 300 ngàn đồng. Vậy để tiền lãi trung bình khi bán một máy là 30 ngàn đồng thì phải qui định
thời gian bảo hành là bao lâu?
Giải:
Gọi X là tiền lãi (ngàn đồng) khi bán 1 máy. Ta có luật phân phối XS của X như sau:
X -300 140
P p 1–p
Trong đó: p là tỷ lệ máy phải bảo hành.
E( X ) = −300 p + 140(1 − p) = 30 p = 0,25
t − 4, 2
p = 0, 25 = P(Y t ) = P(− Y t ) = + 0,5
1,5
t − 4, 2 −t + 4, 2
− = = 0,5 − 0, 25 = 0, 25 = (0,675)
1,5 1,5
−t + 4,2
= 0,675 t = 4,2 − 1,5 0,675 = 3,1875
1,5
N −n 2
Tổng thể hữu hạn: Var ( X ) =
N −1 n
2
Tổng thể vô hạn: Var ( X ) =
n
N −n 2 2
Trường hợp n / N 0,05 thì Var ( X ) =
N −1 n n
2
Tổng thể X ~ N ( , 2 ) X ~ N , , n (giả sử kích thước tổng thể N rất lớn)
n
1 n 2
Hoặc: X = X i ⎯⎯⎯
n 30
→ N , (Bất kể tổng thể X có phân phối gì)
n i =1 n
Bài 7.
a) 0,0197
b) 0,9803
Bài 2. Một con xúc xắc cân đối được gieo 40 lần. Tìm xác suất để tổng số chấm xuất hiện lớn hơn
130.
Giải:
Gọi Xi là số chấm xuất hiện ở lần gieo thứ i, i=1,2,…,40.
40
Ta có tổng số chấm xuất hiện là: Y = X i . Ta phải tìm: P(Y > 130)???
i =1
Ta có các Xi độc lập với nhau và có cùng luật phân phối xác suất:
Xi 1 2 3 4 5 6
P 1/6 1/6 1/6 1/6 1/6 1/6
Ta có: E(Xi) = 3,5; Var(Xi) = 35/12, i=1,2,…,40
Do đó theo định lý giới hạn trung tâm, ta có: Y = X i ~ N ( = E (Y ), 2 = Var (Y ) ) (do n = 40 rất
40
i =1
lớn)
40 40
35 350
Ta có: = E(Y ) = E( X i ) = 40 3,5 = 140; 2 = Var (Y ) = Var ( X i ) = 40 =
i =1 i =1 12 3
2 2 80
2
Nhắc lại là 72% sinh viên tương lai nộp đơn vào Đại học St. Andrew’s muốn ở ký túc xá. Xác suất
để một mẫu ngẫu nhiên đơn giản gồm 30 ứng viên sẽ cho một ước lượng của tỷ lệ tổng thể ứng
viên muốn ở ký túc xá nằm trong vòng cộng trừ 0,05 so với tỷ lệ tổng thể thực sự là bao nhiêu?
Giải:
p = 0,72; n = 30
pq 0,72 0,28
Ta có: P ~ N p = 0,72; = = 0,0822 ; np, nq 5
n 30
6.7. Một mẫu ngẫu nhiên có kích thước n được rút ra từ tổng thể có phân phối chuẩn với trung bình
là µ và độ lệch chuẩn là 10. Hãy tìm n sao cho:
( )
a) P X − 10 = 0,9544
b) P ( X − 5) = 0,9544
c) P ( X − 2 ) = 0,9544
Giải:
2 102 X −
Ta có tổng thể: X ~ N ( , = 10 ) X ~ N ,
2 2
= Z = ~ N (0,1)
n n 10 / n
X − 2
( )
P X − 2 = 0,9544 P
10 / n 10 / n
= 0,9544
( )
P Z 0,2 n = 2(0,2 n ) = 0,9544 (0,2 n ) = 0,4772 = (2)
n = 102 = 100.
Cách khác:
( ) ( ) (
P X − 2 = P −2 X − 2 = P − 2 X + 2 = 0,9544 )
+2− −2−
−
10 / n
( ) ( ) (
= 0, 2 n − −0, 2 n = 2 0, 2 n = 0,9544
10 / n
)
(0,2 n ) = 0,4772 = (2) n = 102 = 100.
Bài 3. Tỉ lệ đậu tốt nghiệp trung học chung của cả nước là 80%. Vậy một trường có 900 em học
sinh thi tốt nghiệp thì phải có tối thiểu bao nhiêu em đậu mới được xem là bình thường. Kết luận
với xác suất 99%.
Giải:
Tỷ lệ tổng thể: p = 0,8.
m pq 0,8 0, 2
Tỷ lệ mẫu: P = ~ N p = 0,8; = = 0,01332 (n = 900)
n n 900
a − 0,8 −a + 0,8
P( P a) = 0,5 − = 0,99 = 0,99 − 0,5 = 0, 49 = (2,326)
0,0133 0,0133
a = 0,8 − 2,326 0,0133 = 0,7690642
Cách khác:
X là số hs đậu TN trong số n = 900 em. Ta có: X ~ B(n=900; p=0,8), X = 0,1,…,900.
np =7205
X ~ B(n = 900; p = 0,8) ⎯⎯⎯⎯
nq =1805
→ X ~ N ( = np = 720; 2 = npq = 144)
Khoảng tin cậy khi biết độ lệch chuẩn của tổng thể = Var ( X ) là:
1−
= E( X ) x z/2 with ( z/2 ) =
n 2
Khoảng tin cậy của thu nhập TB hàng năm của cư dân quanh địa điểm:
Giải:
Ta có: n = 16; x = 750; s = 55 và tổng thể X (số tiền thuê 1 căn hộ bất kỳ) có X ~ N (, 2 )
s 55
Ta có sai số biên (độ chính xác) của ước lượng: = t/2 (n − 1) = 2,1314 = 29,31
n 16
200 200
Số lượng cá trong hồ (tổng thể) là: N ; = (597;1.212) (con)
0,3349 0,1651
1−
Ta có: ( z /2 ) = = 0,5 − / 2 ( z ) = 0,5 −
2
z = z0,1 = 1,28
z = z0,04 = 1,75
H 0 : 0 = 12 H : = 0 = 12
Xét giả thuyết: 0
H a : 0 = 12 H a : 0 = 12
Ta có: n = 40 > 30 (mẫu lớn) và biết = 3,2 nên ta tính giá trị kiểm định:
x − 0 13,25 − 12
z= = = 2,4705
/ n 3,2 / 40
Vì z = 2,4705 > 1,645 = z nên ta bác bỏ H0. Vậy mục tiêu dịch vụ tối đa 12 phút là không đạt
được.
• Cách 2: Dùng p-value
Tính p − value = P(Z 2, 4705) = 1 − P(Z 2, 4705) = P( Z −2, 4705) = 1 − 0,99325 = 0,00675
Ta có: p-value = 0,00675 < 0,05 = α nên bác bỏ H0. Vậy mục tiêu dịch vụ tối đa 12 phút là không
đạt được.
0 = 6 là giá trị trọng lượng quy định của mỗi ống kem.
= E ( X ) là trọng lượng TB của mỗi ống kem trong thực tế, chưa biết.
H 0 : = 0 = 6
Xét giả thuyết:
H a : 0 = 6
Ta có: n = 30 (mẫu lớn) và biết = 0,2 nên ta tính giá trị kiểm định:
x − 0 6,1 − 6
z= = = 2,7386
/ n 0,2 / 30
Có |z| = 2,7386 > 2,17 = z/2 nên bác bỏ H0. Vậy quy trình SX không đạt yêu cầu về khối lượng
theo quy định, cần dừng lại để điều chỉnh.
• Cách 2: Dùng p-value
Tính p − value = 2.P( Z 2,7386) = 2.P(Z −2,7386) = 0,00617
Ta có: p-value = 0,00617 < 0,03 = α nên bác bỏ H0. Vậy quy trình SX không đạt yêu cầu về khối
lượng theo quy định, cần dừng lại để điều chỉnh.
Những khu vực mà H0 bị bác bỏ được cho là khu vực tốt nhất để đặt radar. Tại khu vực F, một mẫu
gồm 64 chiếc xe với vận tốc trung bình là 66.2 mph với độ lệch chuẩn mẫu 4.2 mph. Sử dụng α =
0.05 để kiểm định giả thuyết.
Giải:
Ta có: n = 64; x = 66, 2; s = 4, 2
H 0 : 0 = 65 H : = 0 = 65
Xét giả thuyết: 0
H a : 0 = 65 H a : 0 = 65
Do không biết = Var ( X ) nên ta tính giá trị thống kê kiểm định:
x − 0 66,2 − 65
t= = = 2,2857
s / n 4,2 / 64
• Cách 1: Dùng giá trị tới hạn
Với mức ý nghĩa = 0,05 t (n − 1) = t0,05 (63) = 1,6694
Có t = 2,2857 > 1,6694 = t (n − 1) nên bác bỏ H0. Vậy khu vực F nên được đặt radar.
Ta có: p-value = 0,012823 < 0,05 = α nên bác bỏ H0. Vậy khu vực F nên được đặt radar.
H 0 : p = p0 = 0,5
Xét giả thuyết:
H a : p p0 = 0,5
m 67
Tỷ lệ mẫu các vụ tai nạn do say rượu: p = = = 0,5583
n 120
p − p0 0,5583 − 0,5
Ta tính giá trị thống kê kiểm định: z = = = 1, 278
p0q0 0,5 0,5
n 120
Có |z| = 1,278 < 1,96 = z/2 nên không bác bỏ H0. Vậy tuyên bố của NSC là đúng.
Ta có: p-value = 0,20125 > 0,05 = α nên không bác bỏ H0. Vậy tuyên bố của NSC là đúng.
Ví dụ: Metro EMS (revisited)
Thời gian đáp ứng của một mẫu ngẫu nhiên gồm 40 tình huống y khoa khẩn cấp được cho trong
bảng. Trung bình mẫu là 13.25 phút. Độ lệch chuẩn tổng thể là 3.2 phút.
Giám đốc EMS muốn trình bày một kiểm định giả thuyết thống kê, với mức ý nghĩa 0.05, để xác
định xem mục tiêu dịch vụ nhỏ hơn hoặc bằng 12 phút là có đạt được hay không.
Giải:
Ta có: 0 = 12 phút là TG tối đa để mục tiêu dịch vụ đạt được.
H 0 : 0 = 12 H : = 0 = 12
Xét giả thuyết: 0
H a : 0 = 12 H a : 0 = 12
0 − 1
= 0,5 + z −
/ n
12 − 14
• TH giá trị đúng = 1 = 14 : = 0,5 + z0,05 −
3,2 / 40
12 − 14
= 0,5 + 1,645 − = 0,5 + (−2,3078) = 0,5 − (2,3078) = 0,01051
3,2 / 40
(2,3078) = P(0 Z 2,3078) = P( Z 2,3078) − 0,5 = 0,9895 − 0,5 = 0, 4895
8.2. Các bao gạo do một máy đóng bao làm ra có phân phối chuẩn với trọng lượng qui định là 20
kg. Người ta nghi ngờ máy hoạt động không bình thường làm thay đổi trọng lượng trung bình của
sản phẩm nên tiến hành cân thử 100 bao và thu được kết quả sau:
Trọng lượng 1 bao 19,6 19,8 20 20,2 20,4 20,6
Số bao 10 8 40 15 14 13
Với mức ý nghĩa 5% hãy kết luận về điều nghi ngờ trên. (Quyết định bằng p-value và giá trị tới
hạn).
Giải:
Gọi X là trọng lượng (kg) của 1 bao gạo bất kỳ, ta có số liệu mẫu:
xi 19,6 19,8 20 20,2 20,4 20,6
ni 10 8 40 15 14 13
Ta tính được: n = 100; x = 20,108; s = 0, 2891
H 0 : = 0 = 20
Xét giả thuyết:
H a : 0 = 20
Vì n = 100 > 30 (mẫu lớn) và không biết = Var ( X ) nên ta tính giá trị thống kê kiểm định:
x − 0 20,108 − 20
t= = = 3,7357
s / n 0, 2891/ 100
8.3. Các bao bột mì do một máy đóng bao sản xuất ra có phân phối chuẩn với trọng lượng qui định
là 25 kg và độ lệch chuẩn tổng thể là 1 kg. Lấy ngẫu nhiên ra 16 bao để kiểm tra ta tìm được trọng
lượng trung bình của mỗi bao là 24,6 kg. Với mức ý nghĩa 5% hãy xét xem máy có hoạt động bình
thường hay không? (Quyết định bằng p-value và giá trị tới hạn).
Giải:
Có: n = 16; x = 24,6; = 1
0 = 25 là giá trị trọng lượng quy định của mỗi bao bột mì.
= E ( X ) là trọng lượng TB của mỗi bao trong thực tế, chưa biết.
H 0 : = 25
Xét giả thuyết:
H a : 25
Ta có: n = 16 và biết = 1 nên ta tính giá trị kiểm định:
x − 0 24,6 − 25
z= = = −1,6
/ n 1/ 16
Có |z| = 1,6 < 1,96 = z/2 nên không bác bỏ H0. Vậy máy hoạt động bình thường.
• Cách 2: Dùng p-value
Tính p − value = 2.P( Z 1,6) = 2.P( Z −1,6) = 0,1096
Ta có: p-value = 0,1096 > 0,05 = α nên không bác bỏ H0. Vậy máy hoạt động bình thường.
8.5. Lô hàng đủ tiêu chuẩn xuất khẩu nếu tỉ lệ phế phẩm không quá 2%. Kiểm tra ngẫu nhiên 400
sản phẩm của lô hàng thì thấy có 10 phế phẩm. Với mức ý nghĩa 5% thì có cho phép lô hàng xuất
khẩu được không? (Quyết định bằng p-value và giá trị tới hạn).
Giải:
p0 = 0,02 là tỷ lệ phế phẩm tối đa cho phép.
H 0 : p p0 = 0,02 H : p = p0 = 0,02
Đặt giả thuyết: 0
H a : p p0 = 0,02 H a : p p0 = 0,02
m 10
Tỷ lệ mẫu các phế phẩm: p = = = 0,025
n 400
p − p0 0,025 − 0,02
Giá trị thống kê kiểm định: z = = = 0,7143
p0 q0 0,02 0,98
n 400
• Dùng giá trị tới hạn: Với mức ý nghĩa = 0,05 z = z0,05 = 1,645 . Vì z = 0,7143 <
1,645 = zα nên ta không bác bỏ H0. Vậy lô hàng được phép xuất khẩu.
• Dùng P-value: p − value = P(Z z ) = P(Z 0,7143) = P(Z −0,7143) = 0,23752 > 0,05
= α nên ta không bác bỏ H0. Vậy lô hàng được phép xuất khẩu.
8.6. Tỉ lệ phế phẩm của máy I là 3%. Đối với máy II, người ta cho sản xuất 200 sản phẩm thì thấy
có 10 phế phẩm. Với mức ý nghĩa 5% có thể xem tỉ lệ phế phẩm của 2 máy là như nhau không?
(Quyết định bằng p-value và giá trị tới hạn).
Giải:
p0 = 0,03 là tỷ lệ phế phẩm tổng thể của máy I.
H 0 : p = p0 = 0,03
Đặt giả thuyết:
H a : p p0 = 0,03
m 10
Tỷ lệ mẫu các phế phẩm do máy II làm ra: p = = = 0,05
n 200
p − p0 0,05 − 0,03
Giá trị thống kê kiểm định: z = = = 1,6581
p0 q0 0,03 0,97
n 200
• Dùng giá trị tới hạn: Với mức ý nghĩa = 0,05 z = z0,025 = 1,96 . Vì |z| = 1,6581 < 1,96
= zα/2 nên ta không bác bỏ H0. Vậy tỷ lệ phế phẩm của 2 máy là như nhau.
• Dùng P-value: p − value = 2.P(Z 1,6581) = 2.P( Z −1,6581) = 0,0973 > 0,05 = α nên ta
không bác bỏ H0. Vậy tỷ lệ phế phẩm của 2 máy là như nhau.
8.7. Tỉ lệ bệnh nhân hết bệnh S khi sử dụng thuốc A là 80%. Sử dụng thuốc B để chữa 500 người
mắc bệnh S thì thấy có 440 người hết bệnh. Với mức ý nghĩa 5% có thể cho rằng thuốc B hiệu quả
hơn thuốc A không? (Quyết định bằng p-value và giá trị tới hạn).
Giải:
p0 = 0,8 là tỷ lệ tổng thể hết bệnh S khi SD thuốc A.
H 0 : p p0 = 0,8 H : p = p0 = 0,8
Đặt giả thuyết: 0
H a : p p0 = 0,8 H a : p p0 = 0,8
m 440
Tỷ lệ mẫu các bệnh nhân hết bệnh S khi SD thuốc B: p = = = 0,88
n 500
p − p0 0,88 − 0,8
Giá trị thống kê kiểm định: z = = = 4,4721
p0 q0 0,8 0,2
n 500
• Dùng giá trị tới hạn: Với mức ý nghĩa = 0,05 z = z0,05 = 1,645 . Vì z = 4,4721 >
1,645 = zα nên ta bác bỏ H0. Vậy thuốc B hiệu quả hơn thuốc A trong điều trị bệnh S.
• Dùng P-value: p − value = P(Z 4,4721) = P(Z −4,4721) = 3,87.10−6 < 0,05 = α nên ta
bác bỏ H0. Vậy thuốc B hiệu quả hơn thuốc A trong điều trị bệnh S.
8.4. Điều tra ngẫu nhiên một số sinh viên học môn Toán ở 2 trường đại học ta có số liệu sau đây:
Trường Số SV Điểm trung bình Độ lệch chuẩn mẫu
A 40 7,6 1,1
B 50 7,3 0,8
Với mức ý nghĩa 5% có thể kết luận sinh viên trường A học Toán tốt hơn sinh viên trường B được
không? (Quyết định bằng p-value và giá trị tới hạn).
Giải:
X A là điểm toán của 1 SV trường A.
xA − xB 7,6 − 7,3
t= = = 1,4459
2 2
s s 1,12 0,82
A
+ B
+
nA nB 40 50
2
1,12 0,82
40 + 50
Bậc tự do df = 2 2
= 69,1 → 69
1 1,12 1 0,82
+
39 40 49 50
• Dùng giá trị tới hạn: Với mức ý nghĩa = 0,05 t (df ) = t0,05 (69) = 1,6672 . Vì
t = 1,4459 1,6672 = t (df ) nên ta không bác bỏ H0. Vậy SV 2 trường có học lực môn
Toán như nhau.
• Dùng P-value: p − value = P T (df = 69) 1, 4459 = 0,076366 0,05 = nên ta không
bác bỏ H0. Vậy SV 2 trường có học lực môn Toán như nhau.
8.8. Kiểm tra chất lượng sản phẩm ở 2 xí nghiệp cùng loại, ta có kết quả:
Xí nghiệp I II
Số SP được kiểm tra 400 500
Số phế phẩm 12 12
Với mức ý nghĩa 5% có thể xem tỉ lệ phế phẩm ở 2 xí nghiệp là như nhau không? (Quyết định
bằng p-value và giá trị tới hạn).
Giải:
p1 = M1 / N1 là tỷ lệ tổng thể các phế phẩm do XN I làm ra, chưa biết.
m2 12
Tỷ lệ mẫu các phế phẩm do XN II làm ra: p2 = = = 0,024.
n2 500
m1 + m2 12 + 12 2
Tỷ lệ mẫu gộp: p = = =
n1 + n2 400 + 500 75
p1 − p2 0,03 − 0,024
Giá trị thống kê kiểm định: z = = = 0,5552
1 1 2 73 1 1
pq + +
n1 n2 75 75 400 500
• Dùng giá trị tới hạn: Với mức ý nghĩa = 0,05 z /2 = z0,025 = 1,96 . Vì |z| = 0,5552 <
1,96 = zα/2 nên ta không bác bỏ H0. Vậy tỷ lệ phế phẩm của 2 XN là như nhau.
• Dùng P-value: p − value = 2.P( Z 0,5552) = 2.P( Z −0,5552) = 0,57876 > 0,05 = α nên
ta không bác bỏ H0. Vậy tỷ lệ phế phẩm của 2 XN là như nhau.
H 0 : µ1 µ2 H 0 : µ1 − µ2 0 H 0 : µ1 − µ2 = 0
H a : µ1 µ2 H a : µ1 − µ2 0 H a : µ1 − µ2 0
p − value = P(Z 6,49) = P(Z −6, 49) = 4,29182.10−11 < 0,01 = α Bác bỏ H0.
p − value = P T (df = 41) 4, 003 = 0,000128 0, 05 = Bác bỏ H0.
X1 : TG giao hàng (giờ) của UPX. 1 = E( X1 ) : TG giao hàng (giờ) TB của UPX.
X 2 : TG giao hàng (giờ) của INTEX. 2 = E( X 2 ) : TG giao hàng (giờ) TB của INTEX.
H 0 : 1 = 2 H : − = 0 H : = 0
Xét giả thuyết: 0 1 2 0 D
H a : 1 2 H a : 1 − 2 0 Ha : D 0
Trong đó: D = E( D) = E( X1 − X 2 ) = E( X1) − E( X 2 ) = 1 − 2 ; D = X1 − X 2
• Dùng p-value:
Ta có: df = n – 1 = 9 thì p − value = 2 P T (df = 9) 2,936 = 2 0,008297152 = 0, 0166
p − value = 0, 0166 0, 05 = nên bác bỏ H0. Vậy TG giao hàng TB của 2 DV là khác nhau.
• Dùng giá trị tới hạn:
Với mức ý nghĩa = 0,05 t/2 (n − 1) = t0,025 (9) = 2,2622
Ta có: |t| = 2,936 > 2,262 = t/2 (n − 1) nên bác bỏ H0. Vậy TG giao hàng TB của 2 DV là
khác nhau.
Kiểm định xem UPX có giao hàng chậm hơn INTEX không? KL với mức ý nghĩa 5%.
X1 : TG giao hàng (giờ) của UPX. 1 = E( X1 ) : TG giao hàng (giờ) TB của UPX.
X 2 : TG giao hàng (giờ) của INTEX. 2 = E( X 2 ) : TG giao hàng (giờ) TB của INTEX.
H 0 : 1 2 H : − 0 H : = 0
Xét giả thuyết: 0 1 2 0 D
H a : 1 2 H a : 1 − 2 0 Ha : D 0
Trong đó: D = E( D) = E( X1 − X 2 ) = E( X1) − E( X 2 ) = 1 − 2 ; D = X1 − X 2
• Dùng p-value:
Ta có: df = n – 1 = 9 thì p − value = P T (df = 9) 2,936 = 0,008297152 = 0, 0083
p − value = 0, 0083 0, 05 = nên bác bỏ H0. Vậy TG giao hàng của UPX thực sự chậm
hơn INTEX.
• Dùng giá trị tới hạn:
Với mức ý nghĩa = 0,05 t (n − 1) = t0,05 (9) = 1,8331
Ta có: t = 2,936 > 1,8331 = t (n − 1) nên bác bỏ H0. Vậy TG giao hàng của UPX thực sự
chậm hơn INTEX.
Ví dụ: Hiệp hội nghiên cứu thị trường
Hiệp hội nghiên cứu thị trường tiến hành nghiên cứu để đánh giá hiệu quả của một chiến dịch quảng
cáo mới của một khách hàng. Trước khi bắt đầu chiến dịch mới, một khảo sát qua điện thoại đối
với 150 hộ gia đình trong một khu vực, và kết quả chỉ ra rằng 60 hộ gia đình “nhận biết” về sản
phẩm của khách hàng.
Một chiến dịch quảng cáo mới được thực hiện trên TV và báo chí trong vòng 3 tuần. Một khảo sát
được tiến hành ngay lập tức sau chiến dịch quảng cáo, và thấy rằng 120 trên 250 hộ gia đình “nhận
biết” về sản phẩm của khách hàng.
Dữ liệu này có đáp ứng yêu cầu là chiến dịch quảng cáo đã làm tăng sự nhận biết về sản phẩm của
khách hàng?
Giải:
p1 = M1 / N1 là tỷ lệ tổng thể các hộ nhận biết SP trước quảng cáo, chưa biết.
p2 = M 2 / N2 là tỷ lệ tổng thể các hộ nhận biết SP ngay sau quảng cáo, chưa biết.
m1 60
Tỷ lệ mẫu các hộ nhận biết về SP trước quảng cáo: p1 = = = 0,4
n1 150
m2 120
Tỷ lệ mẫu các hộ nhận biết về SP ngay sau quảng cáo: p2 = = = 0, 48
n2 250
2) Ta có thể kết luận rằng, với mức ý nghĩa 0,05, tỷ lệ hộ gia đình nhận biết về sản phẩm tăng
lên sau khi tiến hành chiến dịch quảng cáo mới hay không?
H 0 : p2 p1 H : p − p = 0
Đặt giả thuyết: 0 2 1
H a : p2 p1 H a : p2 − p1 0
m1 + m2 60 + 120
Tỷ lệ mẫu gộp: p = = = 0,45
n1 + n2 150 + 250
p2 − p1 0,48 − 0,4
Giá trị thống kê kiểm định: z = = = 1,557
1 1 1 1
p.q + 0,45 0,55 +
n1 n2 150 250
• Cách 1: Dùng p-value
Ta có: p − value = P( Z 1,557) = P( Z −1,557) = 0, 0597
p − value = 0, 0597 0, 05 = Không bác bỏ H0. Vậy chiến dịch quảng cáo là không
hiệu quả.
• Cách 2: Dùng giá trị tới hạn
Ta có với mức ý nghĩa = 0,05 z = z0,05 = 1,645
Ta có: z = 1,557 < 1,645 = z nên không bác bỏ H0. Vậy chiến dịch quảng cáo là không
hiệu quả.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,8007608
R Square 0,6412178
Adjusted R Square 0,5899632
Standard Error 16,205819
Observations 9
ANOVA
df SS MS F Significance F
Regression 1 3285,6 3285,6 12,51044 0,00950792
Residual 7 1838,4 262,6286
Total 8 5124
Ta có phương trình hồi quy: Jobs(t ) = b0 + b1t = 334,867 + 7,4t with t = 3,4,...
Regression Statistics
Multiple R 0.993717276
R Square 0.987474024
Adjusted R Square 0.982776783
Standard Error 73.08607939
Observations 12
ANOVA
df SS MS F Significance F
Regression 3 3368786.067 1122929 210.2243 6.02781E-08
Residual 8 42732.6 5341.575
Total 11 3411518.667
Chi tiêu:
• Dưới 1,5 tr.đ
• Từ 1,5 tr.đ đến dưới 3,0 tr.đ
• Từ 3,0 tr.đ đến dưới 4,5 tr.đ
• Từ 4,5 tr.đ đến dưới 6,0 tr.đ
• Từ 6,0 tr.đ trở lên
Khoảng GT ni xi
< 1,5 3 0,75
1,5 – 3,0 7 2,25
3,0 – 4,5 15 3,75
4,5 – 6,0 50 5,25
>6 10 6,75