You are on page 1of 5

Tổng hợp công thức Xác suất - thống kê HK221

TỔNG HỢP CÔNG THỨC XÁC SUẤT - THỐNG KÊ HK221

1 PHẦN XÁC SUẤT


1.1 Các công thức xác suất
Công thức cộng và nhân xác suất:

• P (A+B) = P (A)+P (B)−P (A.B); P (A+B+C) = P (A)+P (B)+P (C)−P (A.B)−P (B.C)−P (A.C)+P (A.B.C)
n
X X X
• P (A1 + A2 + ... + An ) = P (Ai ) − P (Ai .Aj ) + P (Ai .Aj .Ak ) − ... + (−1)n−1 .P (A1 .A2 .A3 ...An )
i=1 i<j i<j<k
• P (AB) = P (A/B).P (B) = P (B/A).P (A). Nếu A, B độc lập thì P (AB) = P (A).P (B)
• P (A1 .A2 ...An ) = P (A1 ).P (A2 /A1 ).P (A3 /A1 .A2 )....P (An /A1 .A2 ...An−1 ).

Nếu A, B xung khắc thì P (A + B) = P (A) + P (B); Nếu A, B độc lập thì P (AB) = P (A).P (B)
Nếu A1 , A2 , ..., An xung khắc đôi một thì P (A1 + A2 + ... + An ) = P (A1 ) + P (A2 ) + ... + P (An )
Nếu A1 , A2 , ..., An độc lập toàn thể thì P (A1 .A2 ...An ) = P (A1 ).P (A2 )...P (An )
Công thức xác suất có điều kiện, công thức đầy đủ và công thức Bayes:
P (AB) P (A).P (B/A) P (AB) P (B).P (A/B)
• P (A/B) = = ; P (B/A) = =
P (B) P (B) P (A) P (A)
n
X
• P (A) = P (B1 ).P (A/B1 ) + P (B2 ).P (A/B2 ) + ... + P (Bn ).P (A/Bn ) = P (Bi ).P (A/Bi )
i=1
P (Bj .A) P (Bj ).P (A/Bj )
• P (Bj /A) = = n , i = 1, 2, 3, ..., n và P (A) 6= 0.
P (A) X
P (Bi ).P (A/Bi )
i=1
Các công thức khác:

• P (A.B) = 1 − P (A + B) ; P (A + B) = 1 − P (AB) ; P (A.B) = P (A) − P (AB) ; P (A.B) = P (B) − P (AB)

1.2 Biến ngẫu nhiên


X x1 x2 x3 ... xn−1
xn P
Bảng phân phối xác suất: ; với pi = 1
P p1 p2 p3 ... pn−1
pn


p1 , khi x = x1

...
Hàm xác suất (hay còn gọi là hàm khối xác suất): P (X = x) = f (x) =


pn , khi x = xn
0, khi x ∈
/ {x1 ; x2 ; ...xn }

R +∞ Rb
Hàm mật độ xác suất: f (x) ≥ 0, ∀x; −∞ f (x)dx = 1; P (X = xi ) = 0, ∀xi ; P (a ≤ X ≤ b) = a f (x)dx
Hàm phân phối xác suất: F (x) = P X (X ≤ x); 0 ≤ F (x) ≤ 1; F (−∞) = 0; F (∞) = 1.
Rx
Nếu X rời rạc thì F (x) = P (X ≤ x) = pi ; Nếu X liên tục thì F (x) = P (X ≤ x) = −∞ f (t)dt.
xi ≤x
Ra
Khi đó: f (x) = F 0 (x) ; P (a ≤ X ≤ b) = P (a < X < b) = F (b) − F (a); F (a) = P (X ≤ a) = −∞ f (x)dx
2
Các đặc trưng của biến p ngẫupnhiên: kỳ vọng (kí hiệu: E(X) hay µ), phương sai (kí hiệu: D(X); V (X) hay σ )
độ lệch chuẩn (kí hiệu: D(X), PV (X) hay σ), trung P vị (kí hiệu: med(X)), mốt (kí hiệu: mod(X))
• BNN rời rạc: µ = E(X) = xi .pi ; E(X 2 ) = x2i .pi và σ 2 = D(X) = E(X 2 ) − E(X)2
R +∞ R +∞
• BNN liên tục: µ = E(X) = −∞ x.f (x)dx; E(X 2 ) = −∞ x2 .f (x)dx và σ 2 = D(X) = E(X 2 ) − E(X)2
E(a) = a với a là hằng số; E(a.X + b.Y ) = a.E(X) + b.E(Y ); E(X.Y ) = E(X).E(Y ) khi X, Y độc lập.
P R +∞
Nếu X rời rạc thì E(Y ) = E[p(X)] = p(xi ).pi ; Nếu X liên tục thì E(Y ) = E[p(X)] = −∞ p(x).f (x)dx
D(X) ≥ 0, D(a) = 0, a là hằng số; D(a.X + b) = a2 .D(X); D(X + Y ) = D(X − Y ) = D(X) + D(Y ) khi X, Y độc lập.
D(aX + bY ) = a2 D(X) + b2 D(Y ) + 2abcov(X, Y ), trường hợp X, Y độc lập thì D(aX + bY ) = a2 D(X) + b2 D(Y )

1.3 Vectơ ngẫu nhiên


Điều kiện độc lập của X và Y: X và Y độc lập ⇔ P (X = xi , Y = yj ) = P (X = xX X= yj ) ∀i, j
i ).P (Y
Hàm phân phối xác suất đồng thời của (X, Y): F (x, y) = P (X ≤ x, Y ≤ y) = pij
xi ≤x yj ≤y

Biên soạn: Trương Đức An Trang 1


Tổng hợp công thức Xác suất - thống kê HK221

1.4 Các quy luật phân phối xác suất


Phân phối nhị thức, X ∼ B(n, p) : E(X) = np, D(X) = npq, np − q ≤ M od(X) ≤ np − q + 1 (M od(X) ∈ N)
k2
X
k k n−k
P (X = k) = Cn .p .q ; P (k1 ≤ X ≤ k2 ) = Cnk .pk .q n−k .
k1
TH n lớn, (p ≥ 5%) thì X ≈ N (µ = np, σ 2 = npq):
(k − np)2

   
1 2npq k2 + 0.5 − np k1 − 0.5 − np
P (X = k) = √ √ .e P (k1 ≤ X ≤ k2 ) = Φ √ −Φ √
npq. 2π npq npq
TH n lớn, p < 5% thì X ≈ P (λ = np):
k2
e−np .(np)k X e−np .(np)k
P (X = k) = P (k1 ≤ X ≤ k2 ) =
k! k!
k1
Lưu ý: Biến ngẫu nhiên chỉ số lần biến cố A xuất hiện trong n phép thử sẽ có phân phối Nhị thức.
N −n M
Phân phối siêu bội, X ∼ H(N, M, n): E(X) = np, D(X) = npq , với p = và q = 1 − p
N −1 N
Lưu ý: Biến ngẫu nhiên chỉ số sản phẩm A trong n sản phẩm lấy ra từ lô hàng (có M sp A và (N-M) sản phẩm B) sẽ
có phân phối Siêu bội.
Phân phối Poisson, X ∼ P (λ): E(X) = D(X) = λ, λ − 1 ≤ M od(X) ≤ λ (M od(X) ∈ N)
k2
e−λ .λk X e−λ .λk
P (X = k) = P (k1 ≤ X ≤ k2 ) =
k! k!
k1
Xi ∼ P (λi ), i = 1, 2,..., n độc lập thì ta có: Y = X1 + X2 + ... + Xn ∼ P (λ1 + λ2 + ... + λn )
Lưu ý: Biến ngẫu nhiên chỉ số sự kiện xảy  ra trong một đơn vị thời gian hoặc vùng quy ước sẽ có phân phối Poisson.
0, x<a
(b − a)2

x − a a+b
Phân phối đều, X ∼ U (a, b): F (x) = , a ≤ x ≤ b ; E(X) = med(X) = , D(X) =
b−a
 2 12
1, x>b

(
1 − e−λ.x , x ≥ 0 1 1 ln(2)
Phân phối mũ, X ∼ E(λ): F (x) = ; E(X) = , D(X) = 2 , mod(X) = 0, med(X) =
0, x<0 λ λ λ
Lưu ý: Biến ngẫu nhiên chỉ khoảng thời gian giữa 2 sự kiện liên tiếp nhau, biến ngẫu ngẫu nhiên chỉ thời gian để có
một sự kiện xảy ra sẽ có phân phối Mũ.
2 2
Phân phối chuẩn, X  ∼ N (µ,σ ): E(X)
 =M od(X) = M ed(X) = µ, D(X) = σ
k2 − µ k1 − µ
P (k1 ≤ X ≤ k2 ) = Φ −Φ ; Φ(+∞) = 1; Φ(−∞) = 0
σ σ
ε
P (|X − µ| < ε) = 2.Φ( ) − 1, ε > 0 (Tính xác suất biến ngẫu nhiên sai lệch so với kì vọng không quá ε).
σ
X1 ∼ N (µ1 , σ12 ) và X2 ∼ N (µ2 , σ22 ) độc lập thì ta có: Y = a.X1 +b.X2 ∼ N (µ, σ 2 ) với µ = a.µ1 +b.µ2 , σ 2 = a2 .σ12 +b2 .σ22
Xi ∼ N (µi , σi2 ), i = 1, 2,..., n độc lập thì ta có: Y = X1 + ... + Xn ∼ N (µ, σ 2 ) với µ = µ1 + ... + µn , σ 2 = σ12 + ... + σn2
Định lý giới hạn trung tâm: X1 , ..., Xn độc lập có E(Xi ) = µ và D(Xi ) = σ 2 , thì khi đó:
X1 + X2 + ... + Xn σ2
Nếu X = X1 + X2 + ... + Xn thì X ∼N (n.µ, n.σ 2 ) ; Nếu X = thì X ∼N (µ, ).
n n
Lưu ý: chỉ trường hợp X = X1 + X2 + ... + Xn , và Xi rời rạc, sử dụng công thức phân phối chuẩn đã hiệu chỉnh 0.5.

1.5 Một số bài toán thường gặp khác


Độ đo của miền A
Bài toán xác suất hình học: P (A) = .
Độ đo của miền Ω
Bài toán mạch điện: xác suất linh kiện hoạt động là p, xác suất linh kiện hỏng là q
Mắc nối tiếp: P(hoạt động) = p1 .p2 ; P(hỏng) = 1 − p1 .p2 ; Mắc song song: P(hoạt động) = 1 − q1 .q2 ; P(hỏng) = q1 .q2
Bài toán lá thư:
(−1)n
 
1 1 1
Số cách bỏ n lá thư cho n người mà không lá nào gửi đúng: n! − + − ... +
2! 3! 4! n!
Bài toán toa tàu tổng quát: Có n toa tàu, có k hành khách (k ≥ n), tính xác suất mỗi toa đều có hành khách.
C 1 .(n − 1)k − Cn2 .(n − 2)k + Cn3 .(n − 3)k − ... − (−1)n−2 .Cnn−1 .(n − n + 1)k + Cnn .(n − n)k
P =1− n .
nk
Bài toán xác định số phép thử thực hiện: P(có ít nhất một lần biến cố A xảy ra trong n phép thử) ≥ ε
⇔ 1 - P(biến cố A không xảy ra trong n phép thử) ≥ ε ⇔ 1 - q n ≥ ε ⇔ n ≥ logq (1 − ε) (n là số nguyên nhỏ nhất)
Bài toán tìm số phần từ mang dấu hiệu A của một nhóm n phần tử cho trước: Tính tỉ lệ phần tử mang
dấu hiệu A. Sau đó lấy tỷ lệ vừa tìm được nhân với n phần tử cho trước (làm tròn kết quả thành số nguyên quá bán)

Biên soạn: Trương Đức An Trang 2


Tổng hợp công thức Xác suất - thống kê HK221

2 PHẦN THỐNG KÊ
2.1 Khoảng tin cậy (ước lượng)
Bảng tóm tắt các bài toán tìm khoảng tin cậy: (Lưu ý: bài toàn tìm khoảng tin cậy cho M và N có liên quan
đến dạng ước lượng tỷ lệ, kết quả dạng toán này tròn số nguyên theo nguyên tắc quá bán)

Dạng Giả định Loại Ngưỡng p sai số Khoảng tin cậy


f.(1 − f )
Đối xứng ε = zα/2 . √ (f − ε; f + ε)
n
Tỷ lệ X ∼ B(1, p), n > 30 p
Bên trái f.(1 − f ) (f − ε; 1)
Bên phải ε = zα . √ (0; f + ε)
n
σ
Đối xứng ε = zα/2 . √ (x − ε; x + ε)
n
(1) Xi ∼ N (µ, σ 2 ), đã biết σ 2 σ
Bên trái ε = zα . √ (x − ε; +∞)
Bên phải n (−∞; x + ε)
s
Trung bình Đối xứng ε = tα/2;n−1 . √ (x − ε; x + ε)
n
(2) Xi ∼ N (µ, σ 2 ), chưa biết σ 2 , n < 30 s
Bên trái ε = tα;n−1 . √ (x − ε; +∞)
Bên phải n (−∞; x + ε)
s
Đối xứng ε = zα/2 . √ (x − ε; x + ε)
n
(3) Phân phối tuỳ ý, chưa biết σ 2 , n ≥ 30 s
Bên trái ε = zα . √ (x − ε; +∞)
Bên phải n (−∞; x + ε)

Bài toán tìm cỡ mẫu: (Lưu ý: chỉ duy nhất dạng toán này làm tròn lên số nguyên)

Dạng Điều kiện áp dụng Kích thước mẫu Lưu ý


p !2
0
zα/2 . f (1 − f )
đã biết f n = ε là sai số, độ chính xác
Tỷ lệ ε
 z 2
α/2
chưa biết f n0 = .0.25 2ε là độ dài khoảng tin cậy
ε σ 2
đã biết σ 2 n0 = zα/2 . chú ý đề hỏi cỡ mẫu hay cỡ mẫu cần khảo sát thêm
Trung bình ε
 s 2
chưa biết σ 2 n0 = zα/2 . nếu kết quả là số nguyên thì không cần làm tròn lên
ε

2.2 Anova: phân tích phương sai một nhân tố


1. Giả thuyết: H0 : µ1 = µ2 = ... = µk ; H1 : ∃µi 6= µj với i 6= j
2. Miền bác bỏ: RR = (Fα;k−1;N −k ; +∞)
3. Tính các trung bình: x1 , x2 , ..., xk ; x.
k
X
4. Tính các tổng bình phương: SSB = ni (xi − x)2 = [n1 (x1 − x)2 + n2 (x2 − x)2 + ... + nk (xk − x)2 ].
i=1
n1
X n2
X nk
X
2 2
SSW = SS1 + SS2 + ... + SSk = (x1j − x1 ) + (x2j − x2 ) + ... + (xkj − xk )2 . = (n1 − 1)s21 + ... + (nk − 1).s2k
j=1 j=1 j=1
k X
X n
SST = SSB + SSW hoặc ta có thể tính: SST = (xij − x)2 = (N − 1)s2 ; SSW = SST − SSB
i=1 j=1
SSB SSW SST
5. Tính các phương sai (trung bình bình phương): M SB = ; M SW = ; M ST =
k−1 N −k N −1
M SB
6. Tính thống kê kiểm định: F =
M SW
Lưu ý: k : số nhóm so sánh, ni : số quan sát trong mẫu thứ i, N : là tổng số quát sát trong toàn bộ các nhóm, s2i là
phương sai mẫu thứ i, s2 là phương sai mẫu của tổng số quan sát trong toàn bộ các nhóm.
Hệ số R2 : đo mức độ ảnh hưởng của yếu tố (định tính) đang xem xét đối với sự biến động của các giá trị của X
quanh giá trị trung bình của nó. R2 = SSB/SST.100(%)
So sánh bội sau khi q thực hiện anova: Giả thuyết H0 : µi = µj ; H1 : µi 6= µj ; i 6= j
Tính LSD = tα/2;N −k . M SW ( n1i + 1
nj ). Giả thuyết H0 bị bác bỏ khi: |xi − xj | > LSD.
Khoảng ước lượng LSD cho độ chênh lệch (µi − µj ): (xi − xj ) ± LSD

Biên soạn: Trương Đức An Trang 3


Tổng hợp công thức Xác suất - thống kê HK221

2.3 Kiểm định 1 mẫu


H0 H1 Tiêu chuẩn kiểm định Miền bác bỏ
Kiểm định tỷ lệ 1 mẫu
p 6= p0 f − p0 √ RR = (−∞; −zα/2 ) ∪ (zα/2 ; +∞)
p = p0 p < p0 zqs = p . n RR = (−∞; −zα )
p > p0 p0 (1 − p0 ) RR = (zα ; +∞)
(1) Kiểm định trung bình 1 mẫu (trường hợp tổng thể có phân phối chuẩn, đã biết σ 2 )
µ 6= µ0 x − µ0 RR = (−∞; −zα/2 ) ∪ (zα/2 ; +∞)
µ = µ0 µ < µ0 zqs = √ RR = (−∞; −zα )
σ/ n
µ > µ0 RR = (zα ; +∞)
(2) Kiểm định trung bình 1 mẫu (trường hợp tổng thể có phân phối chuẩn, chưa biết σ 2 ,n < 30)
µ 6= µ0 x − µ0 RR = (−∞; −tα/2;n−1 ) ∪ (tα/2;n−1 ; +∞)
µ = µ0 µ < µ0 tqs = √ RR = (−∞; −tα;n−1 )
s/ n
µ > µ0 RR = (tα;n−1 ; +∞)
(3) Kiểm định trung bình 1 mẫu (trường hợp tổng thể có phân phối tuỳ ý, chưa biết σ 2 , n ≥ 30)
µ 6= µ0 x − µ0 RR = (−∞; −zα/2 ) ∪ (zα/2 ; +∞)
µ = µ0 µ < µ0 zqs = √ RR = (−∞; −zα )
s/ n
µ > µ0 RR = (zα ; +∞)

2.4 Kiểm định 2 mẫu


H0 H1 Tiêu chuẩn kiểm định Miền bác bỏ
Kiểm định tỷ lệ 2 mẫu
p1 6= p2 f1 − f2 RR = (−∞; −zα/2 ) ∪ (zα/2 ; +∞)
zqs = q
p1 = p2 p1 < p2 f (1 − f )( n11 + 1
n2 ) RR = (−∞; −zα )
m1 +m2
p1 > p2 f= n1 +n2 RR = (zα ; +∞)
(1) Kiểm định trung bình 2 mẫu độc lập, X1, X2 có phân phối chuẩn, trường hợp đã biết σ12 , σ22
µ1 6= µ2 x1 − x2 RR = (−∞; −zα/2 ) ∪ (zα/2 ; +∞)
µ1 = µ2 zqs = q 2
µ1 < µ2 σ1 σ22 RR = (−∞; −zα )
n1 + n2
µ1 > µ2 RR = (zα ; +∞)
(2) Kiểm định trung bình 2 mẫu độc lập, X1, X2 có phân phối chuẩn, trường hợp chưa biết σ12 , σ22 , σ12 = σ22
µ1 6= µ2 x1 − x2 RR = (−∞; −tα/2;n1 +n2 −2 ) ∪ (tα/2;n1 +n2 −2 ; +∞)
tqs = q
S2 S2
µ1 < µ2 n1 + n2 RR = (−∞; −tα;n1 +n2 −2 )
µ1 = µ2 (n1 −1)s21 +(n2 −1)s22
2
µ1 > µ2 S = n1 +n2 −2 RR = (tα;n1 +n2 −2 ; +∞)
(3) Kiểm định trung bình 2 mẫu độc lập, X1, X2 có phân phối chuẩn, trường hợp chưa biết σ12 , σ22 , σ12 6= σ22
µ1 6= µ2 x1 − x2 RR = (−∞; −tα/2;v ) ∪ (tα/2;v ; +∞)
tqs = q 2
s1 s22
µ1 = µ2 µ1 < µ2 n1 + n2 RR = (−∞; −tα;v )
[(s21 /n1 ) + (s22 /n2 )]2
µ1 > µ2 v = (s2 /n )2 (s22 /n2 )2
RR = (tα;v ; +∞)
1
n1 −1 + n2 −1
1

(4) Kiểm định trung bình 2 mẫu độc lập, X1, X2 có phân phối bất kỳ, 2 mẫu có kích thước lớn
µ1 6= µ2 x1 − x2 RR = (−∞; −zα/2 ) ∪ (zα/2 ; +∞)
µ1 = µ2 zqs = q 2
µ1 < µ2 s1 s22 RR = (−∞; −zα )
n1 + n2
µ1 > µ2 RR = (zα ; +∞)
(5) Kiểm định trung bình 2 mẫu tương ứng theo cặp, X1, X2 có phân phối chuẩn, trường hợp chưa biết σ12 , σ22
µ1 6= µ2 RR = (−∞; −tα/2;n−1 ) ∪ (tα/2;n−1 ; +∞)
d √
µ1 = µ2 µ1 < µ2 tqs = n RR = (−∞; −tα;n−1 )
sD
µ1 > µ2 RR = (tα;n−1 ; +∞)

+ Đối với dạng bài kiểm định trung bình 2 mẫu độc lập chưa biết phương sai, X1 và X2 tuân theo phân phối chuẩn,
s1 s1 s1
ta tính tỉ số . Nếu ∈ [0.5; 2] thì ta xem σ12 = σ22 . Nếu / [0.5; 2] thì ta xem như σ12 6= σ22 .

s2 s2 s2

Biên soạn: Trương Đức An Trang 4


Tổng hợp công thức Xác suất - thống kê HK221

2.5 Hồi quy


STT Nội dung Kí hiệu Công thức
n
X
n n
( xi ) 2
X X i=1
1 Tổng bình phương Sxx Sxx = (xi − x)2 = x2i − = (n − 1).s2x
i=1 i=1
n
n
X n
X
n n
( xi ).( yi )
X X i=1 i=1
X
Sxy Sxy = (xi − x).(yi − y) = xi .yi − = xy − n.x.y
i=1 i=1
n
Xn

n n
( yi )2
X X i=1
Syy Syy = (yi − y)2 = yi2 − = (n − 1).s2y
i=1 i=1
n
2. Phương trình hồi quy Y theo X: yb = a + b.x
Sxy
Hệ số gốc b b=
Sxx
Hệ số chặn a a = y − b.x.
Sxy
3. Hệ số tương quan rXY rXY = p
Sxx .Syy
Khi |rXY | ≤ 0.3: X, Y không có mối quan hệ tuyến tính.
Khi 0.3 < |rXY | ≤ 0.5: X, Y có mối quan hệ tuyến tính rất yếu.
Khi 0.5 < |rXY | ≤ 0.8: X, Y có quan hệ tuyến tính trung bình.
Khi 0.8 < |rXY | : X, Y có quan hệ tuyến tính mạnh.
Khi r > 0: X, Y đồng biến, khi r < 0: X, Y nghịch biến
4 Tổng bình phương SST SST = Syy
SSR SSR = b.Sxy
SSE SSE = SST − SSR = Syy − b.Sxy
SSR SSE
5 Hệ số xác định R2 R2 = =1− 2
= rXY
SST SST
Hệ số R2 giải thích trong 100% sự biến động của Y so với trung bình của
nó thì có bao nhiêu % là do biến X gây ra.
r
SSE
6 Độ lệch chuẩn σ σ
b= (tên gọi khác: sai số chuẩn, kí hiệu khác: s)
n−2
b
SSE
7 Phương sai b2
σ b2 =
σ (tên gọi khác: trung bình bình phương sai số, kí hiệu khác: s2 )
n−2
8 Khoảng tin cậy cho các hệ số trong phương trình Y theo X
 r r 
SSE SSE
Hệ số gốc b − tα/2;n−2 . ; b + tα/2;n−2 .
 s(n − 2)Sxx s (n − 2)Sxx
2 2
Hệ số chặn a − tα/2;n−2 . x . SSE ; a + tα/2;n−2 . x . SSE .
Sxx n − 2 Sxx n − 2

2.6 Bài toán xác định sai số chuẩn


Dạng Công thức Dạng Công thức
p
f.(1 − f ) σ
Tỷ lệ (BT ước lượng) SE = √ Trung bình (BT ước lượng) SE = √ (đã biết σ)
n n
s
SE = √ (chưa biết σ)
p n
p0 .(1 − p0 ) σ
Tỷ lệ SE = √ Trung bình SE = √ (đã biết σ)
n n
s
(BT kiểm định 1 mẫu) (BT kiểm định 1 mẫu) SE = √ (chưa biết σ)
n
s
r
SSE x2 SSE
Hệ số gốc (BT ước lượng) SE = Hệ số chặn (BT ước lượng) SE = .
(n − 2)Sxx Sxx n − 2

Biên soạn: Trương Đức An Trang 5

You might also like