Professional Documents
Culture Documents
Chương 1. Phân phối mẫu
Chương 1. Phân phối mẫu
I. GIỚI THIỆU
Lý thuyết xác suất: là quá trình suy luận (diễn dịch) theo
dạng: “Cho trước một không gian xác suất, chúng ta có
Chương 1 thể suy luận gì về các đặc điểm của các kết quả của một
phép thử?”
PHÂN PHỐI MẪU Thống kê toán/ Thống kê suy diễn: là quá trình suy luận
thống kê (quy nạp) theo dạng: “Cho trước các đặc điểm
liên quan đến các kết quả của một phép thử, chúng ta có
thể suy luận gì về không gian xác suất?”
Một thống kê: là một hàm các biến ngẫu nhiên được
quan sát trong một mẫu và các hằng số đã biết.
Ví dụ: Với mẫu NN (X1,…,Xn). Ta có các thống kê sau:
𝑋= ∑ , 𝑆2 = ∑ 𝑋𝑖 − 𝑋 2 , …
1 2
3 4
1
6/8/2020
5 6
7 8
2
6/8/2020
II. TỔNG THỂ VÀ MẪU III. PHÂN PHỐI MẪU LIÊN QUAN ĐẾN PHÂN PHỐI CHUẨN
VÍ DỤ 1.1 Một con xúc xắc cân bằng được tung 3 lần. Đặt X1, X2, X3 lần Định lý:
lượt là số chấm xuất hiện ở lần tung 1, 2, 3. Giả sử ta quan tâm đến Cho mẫu NN (X1,X2,…,Xn) được rút từ tổng thể phân phối chuẩn
𝑋 = (𝑋1 + 𝑋2 + 𝑋3)/3 là số chấm trung bình xuất hiện trong mẫu có N(,2). Khi đó: 𝑋 = ∑ 𝑋𝑖 ~ 𝑁( = , = 2/n).
cỡ n = 3. Hãy tìm trung bình , phương sai , của 𝑋. Ta có thể tìm
phân phối mẫu của 𝑋 như thế nào? Z= = / ~ 𝑁(0,1)
Giải: Ta biết rằng = E(Xi) = 7/2; 2 = Var(Xi) = 35/12, i=1,2,3. Do X1, VÍ DỤ 1.2 Một máy đóng chai có thể được điều chỉnh để đổ vào trung
X2, X3 là các biến NN độc lập nên E(𝑋) = = 7/2; Var(𝑋) = 2/3 = 35/36 bình ounce mỗi chai. Biết rằng lượng chất làm đầy mỗi chai có phân
Để tìm phân phối của 𝑋, ta chú ý: W = X1 + X2 + X3 là biến NN có thể phối chuẩn với = 1,0 ounce. Một mẫu gồm n = 9 chai được chọn
nhận các giá trị 3, 4, …, 18 và 𝑋 = W/3. Do con xúc xắc là cân bằng nên NN. Tìm XS để TB mẫu nằm trong vòng 0,3 ounce so với TB thực sự .
biến NN 3 chiều (X1, X2, X3) có 63 = 216 trường hợp sơ cấp và đồng khả
năng có thể xảy ra. Tức là: P(X1=x1,X2=x2,X3=x3) = p(x1,x2,x3) = 1/216, Giải: Ta có trọng lượng (ounce) của quan sát thứ i: Xi ~ N(,2 = 1),
xi = 1,2,…,6 (i=1,2,3). i=1,…,9 𝑋 ~ 𝑁(, = 2/n = 1/9)
Do đó: P(𝑋 = 1) = P(W = 3) = p(1,1,1) = 1/216
P(𝑋 = 4/3) = P(W = 4) = p(1,1,2) + p(1,2,1) + p(2,1,1) = 3/216
...
Các xác suất P(𝑋 = i/3), i=5,6,…,18 được tính tương tự.
9 10
III. PHÂN PHỐI MẪU LIÊN QUAN ĐẾN PHÂN PHỐI CHUẨN III. PHÂN PHỐI MẪU LIÊN QUAN ĐẾN PHÂN PHỐI CHUẨN
Với cho trước, người ta có thể xác định z, sao cho: VÍ DỤ 1.3: Với dữ liệu trong ví dụ 1.1, có bao nhiêu quan sát nên được
đưa vào mẫu để 𝑋 nằm trong vòng 0,3 ounce so với , với XS 0,95?
Giải:
R command: pnorm(x0,,) = P(X x0): XS tích lũy/ hàm phân phối XS.
qnorm(p,,) = p: Phân vị thứ p, có: P(X p) = p.
Excel: NORM.DIST(x0,,) = P(X x0): XS tích lũy/ hàm phân phối XS.
NORM.INV(p,,) = p: Phân vị thứ p, có: P(X p) = p.
NORM.S.DIST(z) = 1 – Định lý:
NORM.S.INV(1 – ) = z Cho mẫu NN (X1,X2,…,Xn) được rút từ tổng thể phân phối chuẩn
N(,2). Khi đó: Zi = (Xi )/ là các biến NN chuẩn tắc, độc lập với
Scientific Calculator: Trong chế độ STAT\Distr, ta có:
nhau, i=1,…,n và:
P(x) = P(Z x): XS tích lũy. Q(x) = (x) = P(0 Z x): Hàm Laplace.
R(x) = P(Z > x): XS đuôi trên. R(x) = 1 – P(x)
Trong đó: Z ~ N(0,1)
11 12
3
6/8/2020
III. PHÂN PHỐI MẪU LIÊN QUAN ĐẾN PHÂN PHỐI CHUẨN III. PHÂN PHỐI MẪU LIÊN QUAN ĐẾN PHÂN PHỐI CHUẨN
Với cho trước, người ta có thể xác định (𝑑𝑓), sao cho: Định lý:
Cho mẫu NN (X1,X2,…,Xn) được rút từ tổng thể phân phối chuẩn
N(,2). Khi đó:
R command: pchisq(x0,df) = P(X x0): XS tích lũy/ hàm phân phối XS.
qchisq(p,df) = p: Phân vị thứ p, có: P(X p) = p. Ngoài ra, 𝑋 và S2 là các biến NN độc lập.
Excel: CHISQ.DIST.RT( ,df) = VÍ DỤ 1.5: Trong ví dụ lượng chất làm đầy mỗi chai có phân phối
CHISQ.INV(1 – ,df) = 𝑑𝑓 chuẩn với 2 = 1,0 trên đây. Một mẫu NN gồm 10 chai được chọn. Tìm
b1, b2 sao cho: P(b1 S2 b2) = 0,90.
VÍ DỤ 1.4: Cho Z1,Z2,…,Z6 là một mẫu rút từ tổng thể N(0,1), tìm b sao
cho: P(∑ 𝑍 𝑏) = 0,95. Giải: Chú ý rằng:
Giải:
13 14
III. PHÂN PHỐI MẪU LIÊN QUAN ĐẾN PHÂN PHỐI CHUẨN III. PHÂN PHỐI MẪU LIÊN QUAN ĐẾN PHÂN PHỐI CHUẨN
Giải: (tiếp theo) Với cho trước, người ta có thể xác định t(df), sao cho:
Một cách làm là tìm a2 cắt ra một miền 0,05 ở đuôi trên và a1 cắt 0,05
ở đuôi dưới (0,95 ở đuôi trên). Tra bảng 2 ta có: P(X > 16,919) = 0,05;
P(X > 3,325) = 0,95 P(a1 = 3,325 X a2 = 16,919) = 0,90. Từ đó suy
ra: b1 = 3,325/9 = 0,369 và b2 = 16,919/9 = 1,880. R command: pt(x0,df) = P(X x0): XS tích lũy/ hàm phân phối XS.
ĐỊNH NGHĨA qt(p,df) = p: Phân vị thứ p, có: P(X p) = p.
Cho Z ~ N(0,1), W ~ 2(df = k), Z và W độc lập. Khi đó: T = ~𝑇(𝑘) Excel: T.DIST.RT(t,df) =
/
T.INV(1 – ,df) = t(df)
Cho mẫu NN (X1,X2,…,Xn) được rút từ tổng thể phân phối chuẩn
VÍ DỤ 1.6: Độ bền kéo của một loại dây điện có phân phối chuẩn với
N(,2). Khi đó: Z = 𝑛 ~ 𝑁 0,1 và W = (n – 1)S2/2 ~ 2(n – 1)
và 2 không biết. Sáu đoạn dây được chọn NN từ một cuộn lớn; Xi là
độ bền kéo của đoạn thứ i, i=1,2,…,6. Trung bình tổng thể và
phương sai 2 có thể ước lượng bởi 𝑋 và S2, tương ứng. Vì = 2/n
nên có thể ước lượng bởi S2/n. Tìm xác suất để 𝑋 nằm trong
khoảng 2S/ 𝑛 so với trung bình tổng thể đúng .
15 16
4
6/8/2020
III. PHÂN PHỐI MẪU LIÊN QUAN ĐẾN PHÂN PHỐI CHUẨN III. PHÂN PHỐI MẪU LIÊN QUAN ĐẾN PHÂN PHỐI CHUẨN
Giải: Ta có: Với cho trước, người ta có thể xác định f(k1,k2), sao cho:
IV. ĐỊNH LÝ GIỚI HẠN TRUNG TÂM IV. ĐỊNH LÝ GIỚI HẠN TRUNG TÂM
Định lý (CLT = Central Limit Theorem): VÍ DỤ 1.8 Điểm thi tốt nghiệp của học sinh cả nước có trung bình là
60 và phương sai là 64. Một mẫu NN gồm n = 100 học sinh của một
Cho X1,X2,…,Xn là các biến NN độc lập và cùng phân phối xác suất nào
trường trung học lớn có điểm trung bình là 58. Có thể cho rằng học
đó (iid) với E(Xi) = , Var(Xi) = 2 < . Định nghĩa:
sinh trường này học kém hơn không? (Tính XS TB mẫu tối đa là 58).
Giải: Ta có: 𝑋 ~ N(,2/n), với 𝑋 là điểm số TB của mẫu NN cỡ n = 100
được rút từ tổng thể có = 60, 2 = 64. Do đó:
Khi đó hàm phân phối của Un hội tụ về hàm phân phối chuẩn tắc khi
n (thường n > 30 là thỏa mãn). Tức là:
Do XS này rất nhỏ, nên không chắc rằng mẫu từ trường quan tâm có
thể xem là mẫu NN rút từ tổng thể có = 60, 2 = 64. Bằng chứng cho
thấy điểm trung bình của trường trung học này là thấp hơn mức điểm
Ta có thể phát biểu: 𝑋 có phân phối tiệm cận chuẩn với trung bình trung bình chứng cả nước = 60.
và phương sai 2/n. Tức là: 𝑋 ~ N(,2/n) khi n khá lớn. Ví dụ trên minh họa việc sử dụng XS trong quá trình kiểm định các giả
thuyết, một kỹ thuật suy luận thống kê phổ biến sẽ được nghiên cứu
kỹ trong các chương sau.
19 20
5
6/8/2020
IV. ĐỊNH LÝ GIỚI HẠN TRUNG TÂM V. XẤP XỈ CHUẨN CHO PHÂN PHỐI NHỊ THỨC
VÍ DỤ 1.9: Thời gian phục vụ cho khách hàng đến quầy thanh toán Xét phân phối nhị thức X ~ B(n,p): Số thành công trong dãy n phép
của một cửa hàng bán lẻ là các biến ngẫu nhiên độc lập có trung bình thử độc lập, với XS thành công trong mỗi phép thử là p = P(A). Ta có
1,5 phút và phương sai 1,0. Hãy tình xấp xỉ xác suất 100 khách hàng thể viết: X = ∑ 𝑋𝑖 . Trong đó: Xi = 1, nếu lần thử thứ i thành công; Xi
có thể được phục vụ chưa đầy 2 giờ trong tổng thời gian phục vụ. = 0, nếu ngược lại. Tức là: Xi ~ B(p), i=1,2,…,n và các Xi độc lập.
Giải: Gọi Xi là thời gian (phút) phục vụ cho khách hàng thứ i, ta tính: Dễ dàng thấy rằng E(Xi) = p, Var(Xi) = pq, i=1,2,…,n (với q = 1 – p). Do
đó khi n lớn, ta có tỷ lệ thành công trong mẫu: = ∑ 𝑋𝑖 = 𝑋 có
phân phối mẫu xấp xỉ chuẩn với trung bình E(Xi) = p và phương sai
Do n lớn nên theo định lý giới hạn trung tâm 𝑋 có phân phối xấp xỉ Var(Xi)/n = pq/n.
chuẩn với trung bình = = 1,5 và phương sai = 2/n = 1/100. Như vậy, nếu X ~ B(n,p) thì khi n lớn ta có tỷ lệ mẫu X/n có phân phối
Từ đó: xấp xỉ với U, trong đó U có phân phối chuẩn với U = p, = pq/n.
Hoặc khi n lớn ta có X có phân phối xấp xỉ với W, trong đó W có phân
phối chuẩn với W = np, = npq. Trong TH xấp xỉ chuẩn, ta có:
Xác suất trên rất nhỏ cho nên hầu như không thể phục vụ được 100
khách hàng chỉ trong vòng 2 giờ.
21 22
V. XẤP XỈ CHUẨN CHO PHÂN PHỐI NHỊ THỨC V. XẤP XỈ CHUẨN CHO PHÂN PHỐI NHỊ THỨC
Theo kinh nghiệm, việc xấp xỉ chuẩn cho phân phối nhị thức sẽ thực VÍ DỤ 1.11: Cho X ~ B(n=25, p=0,4). Tìm XS chính xác mà X 8 và X = 8
hiện được khi p 3 𝑝𝑞/𝑛 (0,1), tức là nếu 0 < p – 3 𝑝𝑞/𝑛 và p + và so sánh chúng với các giá trị tương ứng bằng cách xấp xỉ chuẩn.
3 𝑝𝑞/𝑛 < 1, hay n > 9
{ , }
Giải: Tính chính xác:
{ , }
VÍ DỤ 1.10: Ứng viên A tin rằng có thể giành chiến thắng trong cuộc
bầu cử thành phố nếu kiếm được ít nhất 55% số phiếu trong khu vực
1. A cũng tin rằng khoảng 50% cử tri thành phố ủng hộ mình. Nếu n = Ta xét cách tính xấp xỉ chuẩn: X có phân phối xấp xỉ với W, trong đó W
100 cử tri xuất hiện để bỏ phiếu tại khu vực 1, xác suất mà A nhận là phân phối chuẩn với W = np = 10, = npq = 6. Ta có:
được ít nhất 55% số phiếu bầu của họ là bao nhiêu?
Giải: Gọi X là số cử tri tại khu vực 1 bỏ phiếu cho A. Nếu xem n = 100
cử tri ở khu vực 1 là một mẫu NN từ thành phố, khi đó X ~ B(n=100,
p=0,5). Theo CLT tỷ lệ cử tri ủng hộ A là: 𝑋 = X/n có phân phối xấp xỉ
chuẩn với TB p = 0,5 và phương sai pq/n = 0,52/100 = 0,052. Do đó:
Ta thấy các xác suất này rất gần với các giá trị đúng đã tính ở trên.
23 24
6
6/8/2020
25 26
27 28
7
6/8/2020
Bài 9*. Một quá trình sản xuất có hàm mật độ:
𝑄 = 100𝑙0,25𝑘0,5𝑒𝑉, 𝑉 ~ 𝑁 0; 0,04 .
a) Hàm mật độ xác suất của W = eV là gì?
b) Hàm mật độ xác suất của Q là gì?
c) Xác định E(Q).
d) Xác định Med(Q).
e) Cho mức lao động là 16 và mức vốn là 4, tìm E(Q) và Med(Q).
f) Với lao động và vốn ở câu e), tìm (Q).
g) Với lao động và vốn ở câu e), tìm P(Q > 425.000).
29