Professional Documents
Culture Documents
Bài giảng
LÝ THUYẾT XÁC SUẤT
&
THỐNG KÊ TOÁN
www.mfe.neu.edu.vn
2019
1
Thông tin học phần
▪ Tiếng Anh: Probability and Mathematical Statistics
▪ Số tín chỉ: 3 Thời lượng: 45 tiết
▪ Đánh giá:
• Điểm do giảng viên đánh giá: 10%
• Điểm kiểm tra giữa kỳ: 20%
• Điểm kiểm tra cuối kỳ (90 phút): 70%
▪ Không tham gia quá 20% số tiết không được thi
2 Trần T. F 20 C 9 …
3 Lê …. M 20 B 7
… … … … … …. ….
Tỷ lệ 43,6% 56,4%
So sánh với toàn quốc
So với Cao
TB TB
toàn Cao Thấp TB cao 33
cao thấp 8%
quốc TB thấp 78
18% 205
Thấp
Tần số 205 104 78 33 49%
104
25%
% 49% 25% 19% 8%
0
Cao TB cao TB thấp Thấp
19% 18%
13%
8%
5% 3% 1% 1%
1 2 3 4 5 6 7 8 9
Lệch trái (lệch âm) Đối xứng, Lệch phải (lệch dương)
Negatively skewed dạng chuông Positively skewed
Left skewed Right skewed
(Symmertrical)
Bất đối xứng / phân phối lệch
𝒘𝟏 𝒙𝟏 + 𝒘𝟐 𝒙𝟐 + ⋯ + 𝒘𝒌 𝒙𝒌 ∑𝒘𝒊 𝒙𝒊
ഥ=
𝒙 =
𝒘𝟏 + 𝒘𝟐 + ⋯ + 𝒘𝒌 ∑𝒘𝒊
▪ Ví dụ:
Giá bán (triệu / kg) 10 12 14 16
Số lượng (kg) 3 10 5 2
𝜎 𝑠
𝐶𝑉𝑡ổ𝑛𝑔 𝑡ℎể = × 100% 𝐶𝑉𝑚ẫ𝑢 = × 100%
𝜇 𝑥ҧ
Hệ số 𝐶𝑜𝑣 𝑋, 𝑌 𝐶𝑜𝑣 𝑋, 𝑌
tương quan 𝜌𝑋,𝑌 = 𝑟𝑋,𝑌 =
𝜎𝑋 𝜎𝑌 𝑠𝑋 𝑠𝑌
Correlation
▪ Ví dụ 2.2. Tung một đồng xu hai lần liên tiếp. Hãy tính
xác suất:
a) “Hai lần xuất hiện mặt sấp”
b) “Xuất hiện 1 lần mặt sấp, 1 lần mặt ngửa”
c) “Hai lần xuất hiện mặt ngửa”
▪ Các biến cố 𝐴1, 𝐴2, … , 𝐴𝑛 gọi là độc lập toàn phần nếu
mỗi biến cố độc lập với mọi tổ hợp bất kỳ của các biến
cố còn lại.
𝐴 𝐵
Ω
▪ 𝐴 + 𝐵 là tổng của các biến cố:
𝐴 ∙ 𝐵, 𝐴ҧ ∙ 𝐵 và 𝐴 ∙ 𝐵ത
P( Hi ).P( A | Hi )
P( Hi | A) = n
P(Hi ).P( A | Hi )
i =1
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 66
BÀI 3 – BIẾN NGẪU NHIÊN RỜI RẠC VÀ
QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA
BIẾN NGẪU NHIÊN
▪ 3.1. Khái niệm biến ngẫu nhiên
▪ 3.2. Bảng phân phối xác suất
▪ 3.3. Hàm phân phối xác suất
▪ 3.4. Các tham số đặc trưng
▪ 3.5. Phân phối Không-Một
▪ 3.6. Phân phối Nhị thức
▪ 3.7. Phân phối Poisson
𝑋 𝑥1 𝑥2 … 𝑥𝑘 … 𝑥𝑛
𝑃 𝑝1 𝑝2 … 𝑝𝑘 … 𝑝𝑛
n
0 pi 1, p
i =1
i =1
Bảng trên gọi là bảng phân phối xác suất của biến ngẫu
nhiên rời rạc
𝑋 0 1 2
𝑃 ? ? ?
𝑋 1 2 3 4 5
𝑃 0,1 0,4 0,25 0,2 0,05
Điểm lớp B 5 7 9
Số SV 40 20 40
Xác suất 0,4 0,2 0,4
𝜎𝑋 = 𝑉 𝑋
▪ Hàm phân phối xác suất( hàm tích lũy xác suất -
Cumulative Distribution Function) của biến ngẫu nhiên
𝑋 là: 𝐹 𝑥 = 𝑃 𝑋 < 𝑥 ,𝑥 ∈ ℝ
𝑓 𝑥 = 𝐹′(𝑥)
x
▪ 𝐹 𝑥 = −∞ f(t) 𝑑𝑡
+∞
▪ −∞ 𝑓 𝑥 𝑑𝑥 = 1
𝑏
▪ 𝑃 𝑎<𝑋<𝑏 = 𝑓 𝑎 𝑥 𝑑𝑥
▪ Mốt
Mốt, ký hiệu 𝑚𝑜 , là giá trị mà tại đó hàm mật độ xác suất
𝑓 𝑥 đạt giá trị cực đại.
Giá trị tới hạn mức 𝛼 của biến ngẫu nhiên X, ký hiệu 𝑥𝛼 , là
giá trị của 𝑋 thỏa mãn:
𝑃 𝑋 > 𝑥𝛼 = 𝛼
𝑎+𝑏
▪ 𝐸 𝑋 =
2
𝑏−𝑎 2
▪ 𝑉 𝑋 =
12
𝑑−𝑐
▪ 𝑃 𝑐<𝑋<𝑑 =
𝑏−𝑎
a c d b
0.025 0.025
0.02 0.02
0.015 0.015
0.01 0.01
0.005 0.005
0 0
1 7 131925313743495561677379859197 0 20 40 60 80 100
Khi tăng thì đồ thị của Khi 𝜎 tăng thì đồ thị của 𝑓(𝑥)
𝑓(𝑥) dịch sang phải thấp xuống và rộng ra
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 98
Phân phối Chuẩn hóa
▪ Biến ngẫu nhiên liên tục 𝑍 được gọi là có phân phối
Chuẩn hóa (Standardzied Normal Distribution), nếu 𝑍
có phân phối Chuẩn với 𝜇 = 0 và 𝜎 2 = 1.
𝑍 ∼ 𝑁 0; 1
▪ Hàm mật độ xác suất của 𝑍 có dạng:
𝑧2
1 −
𝜑 𝑧 = 𝑒 2
2𝜋
▪ Đồ thị hàm mật độ có dạng hình
quả chuông đối xứng qua trục tung.
▪ Tính chất: Φ −𝑥 + Φ 𝑥 = 1
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 100
Phân phối Chuẩn hóa
▪ Cho 𝑋 ∼ 𝑁 𝜇; 𝜎 2
𝑋−𝜇
Đặt 𝑍 =
𝜎
Khi đó: 𝑍 ∼ 𝑁 0; 1
• 𝑃 𝑍<𝑏 =Φ 𝑏
• 𝑃 𝑍 >𝑎 =1−Φ 𝑎
• 𝑃 𝑍 > −𝑎 = 𝑃 𝑍 < 𝑎 = Φ 𝑎
• 𝑃 𝑎 < 𝑍 < 𝑏 = Φ 𝑏 − Φ(𝑎)
▪ Ví dụ Tính
𝑃 𝑍 > 1,96
𝑃 −2 ≤ 𝑍 ≤ 2
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 101
Công thức tính xác suất
𝑋 ∼ 𝑁 𝜇; 𝜎 2
𝑋−𝑏 𝑏−𝜇
• 𝑃 𝑋<𝑏 =𝑃 <
𝜎 𝜎
𝑏−𝜇 𝑏−𝜇
=𝑃 𝑍< =Φ
𝜎 𝜎
𝑎−𝜇
• 𝑃 𝑋 >𝑎 =1−Φ
𝜎
𝑏−𝜇 𝑎−𝜇
• 𝑃 𝑎<𝑋<𝑏 =Φ −Φ
𝜎 𝜎
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 102
Ví dụ
Ví dụ 4.6: Lợi nhuận (đv: triệu) của một dự án là biến
ngẫu nhiên có phân phối Chuẩn, với trung bình bằng
500, phương sai bằng 400. Tính xác suất để:
a) Lợi nhuận cao hơn 540.
b) Lợi nhuận thấp hơn 570.
c) Lợi nhuận từ 480 đến 550.
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 103
Xác suất biến ngẫu nhiên sai lệch so với kì vọng
𝑋 ∼ 𝑁 𝜇; 𝜎 2
𝜀
𝑃 𝑋 – < = 2Φ −1
𝜎
Ba trường hợp riêng:
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 104
Tổ hợp của các BNN phân phối chuẩn
▪ 𝑋1 , 𝑋2 , … , 𝑋𝑛 độc lập
▪ 𝑋𝑖 ∼ 𝑁 𝜇𝑖 , 𝜎𝑖2 , 𝑖 = 1,2, … , 𝑛 thì:
▪ Thì: 𝑌 = ∑𝑛𝑖=1 𝑎𝑖 𝑋𝑖 ∼ 𝑁 𝜇𝑌 , 𝜎𝑌2
Trong đó:
𝑛 𝑛
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 105
Hội tụ của phân phối B(n;p) về Chuẩn
𝑋 ~ 𝐵 𝑛; 𝑝
▪ Khi n 100 thì 𝑋 ~ 𝑁 , 𝜎2
▪ Với = np và 𝜎 2 = 𝑛𝑝 1 – 𝑝
Ví dụ
Xác suất để một khách hàng vào siêu thị mua sản
phẩm của hãng A là 0,3. Tính xác suất để trong 200
khách vào siêu thị có:
a) Nhiều hơn 70 khách mua hàng của hãng A.
b) Từ 40 đến 50 khách mua hàng của hãng A.
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 106
Giá trị tới hạn chuẩn
▪ Giá trị tới hạn Chuẩn mức 𝛼, ký kiệu là 𝑧𝛼 , được xác
định bởi:
𝑃 𝑍 > 𝑧𝛼 = 𝛼
▪ Ví dụ
𝑃 𝑍 > 1,96 = 0.025
⇒ 𝑧0,025 = 1,96
▪ Tính chất:
𝑧1−𝛼 = −𝑧𝛼
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 107
4.7. PHÂN PHỐI KHÁC
▪ Phân phối Khi bình phương
▪ Phân phối Student
▪ Phân phối Fissher
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 108
Phân phối Khi bình phương
▪ BNN liên tục 𝜒 2 tuân theo quy luật Khi bình phương với
n bậc tự do (degree of freedom: df)
▪ Ký hiệu: 𝜒 2 ~𝜒 2 (𝑛)
▪ Tham số: 𝐸(𝜒 2 ) = 𝑛; 𝑉 𝜒 2 = 2𝑛
2(𝑛)
▪ Giá trị tới hạn mức 𝛼, kí hiệu 𝜒𝛼
2(𝑛)
𝑃 𝜒 2 (𝑛) > 𝜒𝛼 =𝛼
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 109
Phân phối Khi bình phương
▪ Bảng đầy đủ: phụ lục 7 giáo trình
▪ Bảng giản lược
α α
0.975 0.95 0.05 0.025 0.975 0.95 0.05 0.025
n n
1 0.001 0.004 3.841 5.024 20 9.591 10.85 31.41 34.17
2 0.051 0.103 5.991 7.378 24 12.40 13.85 36.42 39.36
3 0.216 0.352 7.815 9.348 30 16.79 18.49 43.77 46.98
4 0.484 0.711 9.488 11.14 39 23.65 25.70 54.57 58.12
5 0.831 1.145 11.07 12.83 50 32.36 34.76 67.50 71.42
10 3.247 3.940 18.31 20.48 99 73.36 77.05 123.2 128.4
15 6.262 7.261 25.00 27.49 120 91.57 95.70 146.6 152.2
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 110
Phân phối Student
▪ BNN liên tục T tuân theo quy luật Student với 𝑛 bậc tự
do, ký hiệu: 𝑇 ~ 𝑇(𝑛)
𝑛
▪ Tham số: 𝐸(𝑇) = 0; 𝑉 𝑇 =
𝑛−2
(𝑛)
▪ Giá trị tới hạn mức , kí hiệu: 𝑡𝛼
(𝑛)
𝑃 𝑇(𝑛) > 𝑡𝛼 = 𝛼
▪ Tính chất:
𝑛 (𝑛)
• 𝑡1−𝛼 = −𝑡𝛼
(𝑛)
• Với n > 30 thì 𝑡𝛼 ≈ 𝑢𝛼
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 111
Phân phối Student
▪ Bảng đầy đủ: phụ lục 8 giáo trình
▪ Bảng giản lược
α α
0.1 0.05 0.025 0.1 0.05 0.025
n n
10 1.372 1.812 2.228 17 1.333 1.740 2.110
11 1.363 1.796 2.201 18 1.330 1.734 2.101
12 1.356 1.782 2.179 19 1.328 1.729 2.093
13 1.350 1.771 2.160 20 1.325 1.725 2.086
14 1.345 1.761 2.145 24 1.318 1.711 2.064
15 1.341 1.753 2.131 30 1.310 1.697 2.042
16 1.337 1.746 2.120 1.282 1.645 1.960
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 112
Phân phối Fisher
▪ BNN liên tục F tuân theo quy luật Fisher-Snedecor (gọi
tắt là Fisher) với hai bậc tự do n1 và n2
▪ Ký hiệu: 𝐹 ~ 𝐹(𝑛1, 𝑛2)
(𝑛1 ,𝑛2 )
▪ Giá trị tới hạn mức 𝛼, kí hiệu: 𝑓𝛼
(𝑛1 ,𝑛2 )
𝑃 𝐹 𝑛1 , 𝑛2 > 𝑓𝛼 =𝛼
▪ Tính chất:
(𝑛 ,𝑛 ) 1
𝑓1−𝛼1 2 = (𝑛 ,𝑛 )
𝑓𝛼 2 1
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 113
Phân phối Fisher
▪ Bảng đầy đủ: phụ lục 9 giáo trình; Bảng giản lược:
n1
n2 24 39 59 99 120
α
0.025 2.27 2.15 2.08 2.03 2.01
24
0.05 1.98 1.90 1.84 1.80 1.79
0.025 2.02 1.89 1.82 1.75 1.74
39
0.05 1.80 1.70 1.65 1.60 1.58
0.025 1.94 1.81 1.73 1.66 1.65
49
0.05 1.74 1.64 1.58 1.53 1.52
0.025 1.89 1.75 1.67 1.60 1.59
59
0.05 1.70 1.60 1.54 1.49 1.47
0.025 1.79 1.65 1.56 1.49 1.46
99
0.05 1.63 1.52 1.45 1.39 1.38
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 114
BÀI 5 – BIẾN NGẪU NHIÊN HAI CHIỀU
▪ 5.1. Khái niệm biến ngẫu nhiên nhiều chiều
▪ 5.2. Bảng phân phối xác suất hai chiều
▪ 5.3. Tham số đặc trưng
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 115
5.1. KHÁI NIỆM BNN NHIỀU CHIỀU
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 116
Biến ngẫu nhiên hai chiều
▪ Hệ hai biến ngẫu nhiên 1 chiều được xét một cách
đồng thời tạo nên biến ngẫu nhiên 2 chiều.
▪ Kí hiệu: (𝑋, 𝑌)
▪ Ví dụ: Thu nhập và tiêu dùng của hộ gia đình; chiều dài
và chiều rộng của 1 sản phẩm.
▪ Phân loại
• BNN 2 chiều rời rạc: nếu 𝑋, 𝑌 đều rời rạc
• BNN 2 chiều liên tục: nếu 𝑋, 𝑌 đều liên tục
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 117
Ví dụ
▪ Ví dụ 5.1. Cho các biến ngẫu nhiên:
▪ 𝑋: Doanh thu (triệu), 𝑌: Chi quảng cáo (triệu)
𝑌 3 6 9
𝑋
100 0,1 0,02 0.01
200 0,16 0,12 0,08
300 0,2 0,17 ?
a) 𝑃(𝑋 = 200, 𝑌 = 6) =
b) 𝑃 𝑋 = 300 𝑌 = 9) =
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 118
5.2. BẢNG PHÂN PHỐI XÁC SUẤT
Y
y1 y2 … ym
X
x1 p11 p12 … p1m
x2 p21 p22 … p2m
… … … … …
xn pn1 pn2 … pnm
1
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 119
Bảng phân phối xác suất đồng thời
Y
y1 y2 … ym P(X)
X
x1 p11 p12 … p1m P(x1)
x2 p21 p22 … p2m P(x2)
… … … … … …
xn pn1 pn2 … pnm P(xn)
P(Y) P(y1) P(y2) … P(ym) 1
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 120
Bảng phân phối xác suất biên
▪ Bảng phân phối xác suất biên của 𝑋
𝑋 𝑥1 … 𝑥𝑖 … 𝑥𝑛
𝑃 𝑃(𝑥1) … 𝑃(𝑥𝑖) … 𝑃(𝑥𝑛)
▪ Bảng phân phối xác suất biên của 𝑌
𝑌 𝑦1 … 𝑦𝑗 … 𝑦𝑚
𝑃 𝑃(𝑦1) … 𝑃(𝑦𝑗) … 𝑃(𝑦𝑚)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 121
Bảng phân phối xác suất có điều kiện
▪ Bảng phân phối của (𝑋 | 𝑌 = 𝑦𝑗):
P ( xi , y j )
P ( xi | y j ) =
P( y j )
(𝑋 | 𝑌 = 𝑦𝑗) 𝑥1 𝑥2 … 𝑥𝑛
𝑃 𝑃(𝑥1 | 𝑦𝑗 ) 𝑃(𝑥2| 𝑦𝑗) … 𝑃(𝑥𝑛 | 𝑦𝑗)
▪ Bảng phân phối của (𝑌 | 𝑋 = 𝑥𝑖 )
(𝑌 | 𝑋 = 𝑥𝑖) 𝑦1 𝑦2 … 𝑦𝑚
𝑃 𝑃(𝑦1 | 𝑥𝑖) 𝑃(𝑦2| 𝑥𝑖) … 𝑃(𝑦𝑚 | 𝑥𝑖)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 122
5.3. THAM SỐ ĐẶC TRƯNG
▪ 5.3.1. Kì vọng
n n m
E ( X ) = xi P( xi ) = xi P( xi , y j )
i =1 i =1 j =1
m m n
E (Y ) = y j P( y j ) = y j P( xi , y j )
j =1 j =1 i =1
E (Y / X = xi ) = y j P( y j / xi )
j
E ( X / Y = y j ) = xi P( xi / y j )
i
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 124
Hiệp phương sai và hệ số tương quan
▪ Hiệp phương sai (covariance): 𝐶𝑜𝑣(𝑋, 𝑌)
Cov ( X ,Y ) = E ( X − E ( X ) Y − E (Y ) )
n m
= xi y j P ( x i , y j ) − E ( X ).E (Y )
i =1 j =1
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 125
Hiệp phương sai
▪ Tính chất của hiệp phương sai
• 𝐶𝑜𝑣(𝑋, 𝑌) = 𝐶𝑜𝑣(𝑌, 𝑋)
• 𝑋, 𝑌 độc lập 𝐶𝑜𝑣(𝑋, 𝑌) = 0
• 𝐶𝑜𝑣(𝑋, 𝑌) > 0 thì 𝑋, 𝑌 có “tương quan dương”
• 𝐶𝑜𝑣(𝑋, 𝑌) < 0 thì 𝑋, 𝑌 có “tương quan âm”
▪ Phương sai tổng hiệu tổng quát
• 𝑉(𝑎𝑋 𝑏𝑌) = 𝑎2 𝑉(𝑋) + 𝑏2 𝑉(𝑌) 2𝑎𝑏𝐶𝑜𝑣(𝑋, 𝑌)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 126
Hệ số tương quan
Tính chất của hệ số tương quan
▪ X,Y = Y,X
▪ –1 X,Y 1
▪ X,Y > 0: tương quan cùng chiều, X,Y < 0: ngược chiều
▪ X,Y = 0: không tương quan
▪ 𝑋, 𝑌 độc lập X,Y = 0
▪ X,Y = 1: 𝑋, 𝑌 có quan hệ hàm số bậc 1 với nhau
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 127
BÀI 6. LUẬT SỐ LỚN
▪ Tập trung Định lý giới hạn trung tâm
▪ Bất đẳng thức Trebusep (Chebyshev)
▪ Định lý Trebusep
▪ Định lý Bernoulli
▪ Định lý giới hạn trung tâm
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 128
Định lý giới hạn trung tâm
▪ Xét X1, X2,…, Xn là các BNN độc lập có cùng quy luật
phân phối xác suất, kỳ vọng và phương sai hữu hạn
n
Y − E (Y )
▪ Đặt Y = X i và U =
i =1 V (Y )
▪ Thì U sẽ hội tụ về quy luật N(0, 1) khi n →
▪ Trong ứng dụng, n ≥ 30 được coi là đủ lớn để áp dụng
quy luật Chuẩn (dù biến ngẫu nhiên gốc không phân
phối chuẩn)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 129
BÀI 7 – MẪU NGẪU NHIÊN
▪ 7.1. Các khái niệm
▪ 7.2. Trung bình mẫu
▪ 7.3. Phương sai mẫu
▪ 7.4. Tần suất mẫu
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 130
7.1. CÁC KHÁI NIỆM
▪ Tổng thể
▪ Tham số đặc trưng của tổng thể
▪ Mẫu ngẫu nhiên
▪ Mẫu cụ thể
▪ Thống kê (tham số đặc trưng mẫu)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 131
Tổng thể
▪ Tập hợp toàn bộ các phần tử đồng nhất theo một dấu
hiệu nghiên cứu định tính hay định lượng nào đó
được gọi là tổng thể (population)
▪ Kích thước tổng thể (population size): là số phần tử 𝑵
▪ Dấu hiệu lượng hóa được: 𝑿- Biến ngẫu nhiên gốc
▪ 𝑋 = {𝑥1, 𝑥2, … , 𝑥𝑁 }
▪ Các tham số đặc trưng của 𝑋 là tham số đặc trưng của
tổng thể
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 132
Mô tả tổng thể
▪ Nếu 𝑋 chỉ gồm k giá trị khác nhau: 𝑥1, 𝑥2, … , 𝑥𝑘
▪ Số lượng tương ứng là 𝑁1, 𝑁2, … , 𝑁𝑘
▪ 𝑁𝑖 gọi là tần số tổng thể của 𝑥𝑖
▪ Đặt 𝑝𝑖 = 𝑁𝑖 / 𝑁 gọi là tần suất tổng thể
0 N i N
Giá trị 𝑥1 𝑥2 … 𝑥𝑘 k
Tần số 𝑁1 𝑁2 … 𝑁𝑘 i =1 Ni = N
Tần suất 𝑝1 𝑝2 … 𝑝𝑘 0 pi 1
k
i =1 pi = 1
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 133
Tham số đặc trưng của tổng thể
▪ Trung bình tổng thể (population mean): m
1 N
m = xi
N i =1
• Chứng minh được: 𝑚 = 𝐸(𝑋)
▪ Phương sai tổng thể (population variance): σ2
1 N
σ = ( xi − m)2
2
N i =1
• Chứng minh được: 𝜎2 = 𝑉(𝑋)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 134
Tham số đặc trưng của tổng thể
▪ Độ lệch chuẩn tổng thể: σ
σ= σ 2
MA
p=
N
• Dễ thấy: 𝑝 = 𝑃(𝐴)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 135
Nhận xét
▪ Nghiên cứu Tổng thể: nghiên cứu về tham số đặc
trưng tổng thể, nghiên cứu toàn bộ các phần tử: gặp
nhiều khó khăn:
• Chi phí lớn, có thể không khả thi
• Sai sót khi thu thập, có thể phá hủy tập hợp
▪ Nghiên cứu một số phần tử đại diện: Mẫu
• Từ tổng thể rút n phần tử (mẫu kích thước n)
• Xác định tham số đặc trưng mẫu (thống kê)
• Rút ra kết luận liên quan đến tổng thể
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 136
Mẫu ngẫu nhiên
▪ Mẫu ngẫu nhiên kích thước n là tập hợp của n biến
ngẫu nhiên độc lập 𝑋1, 𝑋2, … , 𝑋𝑛 được thành lập từ
biến ngẫu nhiên gốc 𝑋 và có cùng quy luật phân phối
xác suất với 𝑋.
▪ Ký hiệu: 𝑊 = (𝑋1, 𝑋2, … , 𝑋𝑛)
▪ 𝐸(𝑋𝑖 ) = 𝐸(𝑋) = 𝑚
▪ 𝑉(𝑋𝑖 ) = 𝑉(𝑋) = 𝜎2 𝑖 = 1, 2, … , 𝑛
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 137
Mẫu cụ thể
▪ Gồm n quan sát (n con số): 𝑤 = (𝑥1, 𝑥2, … , 𝑥𝑛)
▪ Nếu chỉ gồm k giá trị khác nhau: 𝑥1, 𝑥2, … , 𝑥𝑘 với số lần
xuất hiện tương ứng : 𝑛1, 𝑛2, … , 𝑛𝑘
▪ 𝑛𝑖 là tần số mẫu của 𝑥𝑖 (frequency)
▪ Đặt pො i = 𝑛𝑖 / 𝑛 : tần suất mẫu (sample proportion)
Giá trị …
i =1 ni = n
𝑥1 𝑥2 𝑥𝑘 k
Tần số 𝑛1 𝑛2 … 𝑛𝑘 𝑘
Tần suất pො 1 pො 2 … pො k 𝑝Ƹ 𝑖 = 1
𝑖=1
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 138
Ví dụ
▪ Nghiên cứu về khối lượng sản phẩm (𝑋)
▪ Mẫu ngẫu nhiên kích thước n=10,
▪ 𝑊 = (𝑋1, 𝑋2, … , 𝑋10)
• 𝐸(𝑋1) = 𝐸(𝑋2) = ⋯ = 𝐸(𝑋10) = 𝐸(𝑋)
• 𝑉(𝑋1) = 𝑉(𝑋2) = ⋯ . = 𝑉(𝑋10) = 𝑉(𝑋)
▪ Mẫu cụ thể 𝑤 = ( 20,21,20,23,23,24,22,24,22,22)
Khối lượng (g) 20 21 22 23 24
Số sản phẩm 2 1 3 2 2
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 139
Thống kê đặc trưng mẫu
▪ Một hàm của các biến ngẫu nhiên Xi trong mẫu là một
thống kê (statistic)
𝐺 = 𝑓(𝑋1, 𝑋2, … , 𝑋𝑛)
▪ Vì mẫu ngẫu nhiên nên 𝐺 là ngẫu nhiên với phân phối
xác suất xác định
▪ Mẫu cụ thể: thống kê là số cụ thể, giá trị quan sát
𝐺𝑞𝑠 = 𝑔 = 𝑓(𝑥1, 𝑥2, … , 𝑥𝑛)
▪ Thống kê trong mẫu thường tương ứng với một tham
số trong tổng thể
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 140
7.2. TRUNG BÌNH MẪU
▪ Trung bình mẫu ngẫu nhiên (sample mean)
1 n
X = Xi
n i =1
▪ 𝑋ത là biến ngẫu nhiên:
2
σ σ
E(X ) = m; V (X ) = ; σX =
n n
𝜎2
▪ Nếu 𝑋 ~ 𝑁(𝜇, 𝜎2) thì: ሜ
𝑋~𝑁 𝜇,
𝑛
(𝑋ሜ − 𝜇) 𝑛
𝑍= ~𝑁(0,1)
𝜎
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 141
7.3. PHƯƠNG SAI MẪU
▪ Độ lệch bình phương trung bình (mean of squares)
𝑛
1
ሜ 2
𝑀𝑆 = (𝑋𝑖 − 𝑋)
𝑛
𝑖=1
▪ Phương sai mẫu (sample variance) S2
𝑛
1 n
𝑆2 = ሜ 2
(𝑋𝑖 − 𝑋) Hay S =2
MS
𝑛−1
𝑖=1
n−1
▪ Độ lệch chuẩn mẫu: 𝑺 = 𝑺𝟐
n−1 2
▪ Ta có : 𝐸(𝑆2) = 2 và E (MS ) = σ
n
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 142
7.4. TẦN SUẤT MẪU
▪ Trong mẫu kích thước n có XA phần tử có dấu hiệu
(biến cố) A
𝑋𝐴
▪ Tần suất mẫu: pො =
𝑛
𝑝(1 − 𝑝)
▪ Nếu 𝑃(𝐴) = 𝑝 thì: 𝐸 pො = 𝑝 𝑉(ොp) =
𝑛
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 144
8.1. ƯỚC LƯỢNG THAM SỐ TỔNG THỂ
▪ Trong tổng thể, X đã biết qui luật nhưng tham số
(tham số tổng thể) là chưa biết.
▪ Sử dụng thông tin từ mẫu ̶˃ ước lượng tham số
(parameter estimate) ̶˃ước lượng tham số tổng thể
▪ Mẫu ngẫu nhiên: xây dựng ước lượng ngẫu nhiên
(estimator)
▪ Mẫu cụ thể: tính được ước lượng cụ thể (estimate),
hay giá trị quan sát (observed value)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 145
8.2. ƯỚC LƯỢNG ĐIỂM
▪ Khái niệm
▪ Tính chất của ước lượng điểm
▪ Ước lượng hợp lý tối đa
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 146
Khái niệm
▪ Tham số tổng thể ( ) là chưa biết ̶˃ Cần ước lượng
▪ Sử dụng mẫu 𝑊 = (𝑋1, 𝑋2, … , 𝑋𝑛 ) ̶˃ xác định thống
kê 𝜃መ trên mẫu
▪ Dùng một giá trị của thống kê 𝜃መ để thay thế cho tham
መ là ước lượng điểm của 𝜽
số 𝜃, giá trị kí kiệu là 𝜃,
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 147
Tính chất của ước lượng điểm
▪ Tính không chệch (unbiased)
• 𝜃መ là ước lượng không chệch của 𝐸(𝜃) መ =
• Nếu 𝐸(𝜃) መ : ước lượng chệch
▪ Tính hiệu quả (efficient)
• 𝜃መ1 , 𝜃መ2 là ước lượng không chệch
• 𝑉(𝜃መ1 ) < 𝑉(𝜃መ2 ) thì 𝜃መ1 là ước lượng hiệu quả hơn 𝜃መ2
• 𝑉(𝜃መ1 ) là nhỏ nhất thì 𝜃መ1 là ước lượng hiệu quả
▪ Ước lượng không chệch, hiệu quả → ước lượng tốtnhất
▪ Tính vững (consistent): khi 𝑛 tiến đến vô cùng thì ước
lượng hội tụ đến tham số (theo nghĩa xác suất)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 148
Ví dụ
▪ Ví dụ 8.1.
▪ Tổng thể X có trung bình là m, phương sai là 2
▪ Với mẫu kích thước n = 3, trong các thống kê sau, đâu
là ước lượng không chệch, hiệu quả hơn cho m:
1 1 1 1 1 1
G1 = X 1 + X 2 + X 3 ; G2 = X 1 + X 2 + X 3
2 2 2 2 3 6
1 1 1 1 1 1
G3 = X 1 + X 2 + X 3 ; G4 = X 1 + X 2 + X 3
2 4 4 3 3 3
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 149
Bất đẳng thức Cramer - Rao
▪ Nếu BNN X có công thức tính xác suất hoặc hàm mật
độ là f(x, ) thì với mọi 𝜃መ là ước lượng không chệch
của , luôn có:
1
V (θˆ) 2
ln f ( x , θ )
nE
θ
▪ Do đó nếu 𝜃መ là ước lượng không chệch và có phương
∗
sai bằng vế phải bất đẳng thức thì nó là ước lượng
hiệu quả nhất
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 150
Một số kết luận
▪ Khi 𝑋~𝑁(𝜇, 𝜎2) thì
• 𝑋ത là ước lượng không chệch, hiệu quả của
• 𝑆2 là ước lượng không chệch của σ2
• 𝑀𝑆 là ước lượng chệch của σ2
▪ Khi 𝑋 ~ 𝐴(𝑝) thì 𝑝Ƹ là ước lượng không chệch, hiệu
quả của p.
▪ Cách thay thế tham số đặc trưng tổng thể , p, σ2 bởi
ഥ, 𝒑
thống kê 𝑿 ෝ, S2 tương ứng như trên là tìm ước
lượng điểm theo hàm ước lượng.
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 151
Ước lượng hợp lý tối đa
▪ Mẫu 𝑊 = (𝑋1, 𝑋2, … , 𝑋𝑛), tại giá trị cụ thể
(𝑥1, 𝑥2, … , 𝑥𝑛)
▪ Hàm hợp lý:
𝐿(𝑥1, 𝑥2, … , 𝑥𝑛, ) = 𝑓(𝑥1, ). 𝑓(𝑥2, ) … 𝑓(𝑥𝑛, )
▪ 𝐿 gọi là hàm hợp lý (likelihood function) của
▪ Giá trị 𝜃መ làm L đạt max gọi là ước lượng hợp lý tối đa
của (maximum likelihood estimator: MLE)
▪ Nếu hàm L không dễ tìm cực đại thì tính thông qua
hàm logarit của L (maximum log-likelihood)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 152
Một số kết luận
▪ Khi 𝑋 ~ 𝑁(𝜇, 𝜎2) thì
• 𝑋ത là ước lượng hợp lý tối đa của
• MS là ước lượng hợp lý tối đa của σ2
▪ Khi 𝑋 ~ 𝐴(𝑝) thì pො là ước lượng hợp lý tối đa của p
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 153
8.3. ƯỚC LƯỢNG BẰNG KHOẢNG TIN CẬY
▪ Các khái niệm
▪ Ước lượng trung bình tổng thể
▪ Ước lượng phương sai tổng thể
▪ Ước lượng tần suất tổng thể
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 154
Các khái niệm
▪ Với mẫu ngẫu nhiên, tìm khoảng ngẫu nhiên
(𝐺1, 𝐺2) để khả năng khoảng đó chứa bằng một
mức xác suất cho trước:
𝑃(𝐺1 < < 𝐺2) = 1 –
▪ Mức xác suất (1 – ) là độ tin cậy (confidence level)
▪ (𝐺1, 𝐺2) là khoảng tin cậy (confidence interval)
▪ 𝐼 = 𝐺2 – 𝐺1 là độ dài khoảng tin cậy
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 155
Xây dựng khoảng tin cậy
▪ Xét thống kê G liên kết giữa tham số và thống kê trong
mẫu, G có quy luật phân phối xác suất xác định
▪ Với 1 − 𝛼 ̶˃ xác định 𝛼1 và 𝛼2 : 𝛼1 + 𝛼2 = 𝛼
▪ Xác định giá trị tới hạn 𝑔𝛼1 và 𝑔𝛼2 sao cho:
𝑃 𝑔1−𝛼1 < 𝐺 < 𝑔𝛼2 = 1 − 𝛼
▪ Biến đổi sẽ thu được khoảng 𝐺1 , 𝐺2 thỏa mãn:
𝑃(𝐺1 < < 𝐺2) = 1 –
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 156
Ước lượng trung bình tổng thể
▪ 𝑋 ~ 𝑁(𝜇, 𝜎2) với chưa biết
▪ Ước lượng khoảng cho với độ tin cậy (1 − 𝛼)
▪ Ước lượng cũng là ước lượng trung bình tổng thể
trong qui luật chuẩn.
▪ Mẫu 𝑊 = (𝑋1, 𝑋2, … , 𝑋𝑛)
▪ Chia hai trường hợp:
• Khi 𝜎 là đã biết dùng thống kê 𝑍
• Khi 𝜎 là chưa biết Sử dụng S để thay, và dùng
thống kê ( X − μ) n
T= ~ T (n − 1)
S
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 157
Ước lượng khi biết σ2
𝑋ሜ − 𝜇
▪ Do 𝑍= ~𝑁(0,1) với 𝛼1 + 𝛼2 = 𝛼
𝜎/ 𝑛
ሜ
𝑋−𝜇
𝑃 𝑧1−𝛼1 < < 𝑧𝛼2 = 1-α
𝜎/ 𝑛
𝜎 𝜎
𝑃 𝑋ሜ − 𝑧𝛼2 < 𝜇 < 𝑋ሜ + 𝑧𝛼1 =1−𝛼
𝑛 𝑛
▪ Có 3 khoảng tin cậy thông dụng tương ứng với:
• (1) 𝛼1 = 𝛼, 𝛼2 = 0
• (2) 𝛼1 = 0, 𝛼2 = 𝛼
• (3) 𝛼1 = 𝛼2 = 𝛼/2
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 158
Ước lượng khi biết σ2
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 159
Ước lượng khi biết σ2
▪ Khoảng tin cậy đối xứng có dạng: 𝑋ത ± 𝜀 hay 𝑋ത ± 𝑀𝐸
▪ 𝜀 là sai số biên (ME: marginal error): 𝜀 = 𝑧𝛼/2 𝜎/ 𝑛
▪ Độ dài khoảng tin cậy: I = 2𝜀 = 2𝑧𝛼/2 𝜎/ 𝑛
▪ Xác định kích thước mẫu n0 thỏa mãn yêu cầu về sai
số hoặc độ dài khoảng tin cậy:
2
𝜎 2 𝑧𝛼/2
𝜀 ≤ 𝜀0 ⇔ 𝑛0 ≥
𝜀02
2
4𝜎 2 𝑧𝛼/2
𝐼 ≤ 𝐼0 ⇔ 𝑛0 ≥
𝐼02
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 160
Ước lượng khi không biết σ2
2( n−1)
σ 2
χ α /2 χ12−(nα−/21)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 164
Ước lượng tần suất tổng thể
▪ 𝑋 𝐴(𝑝) với p chưa biết
~
▪ Ước lượng khoảng cho p với độ tin cậy (1 − 𝛼)
▪ Ước lượng p cũng là ước lượng tần suất tổng thể.
▪ Sử dụng thống kê (ොp − 𝑝) 𝑛
𝑍= ~𝑁(0,1)
𝑝(1 − 𝑝)
▪ Với 𝛼1 + 𝛼2 = 𝛼
(ෝ
p−𝑝) 𝑛
P( 𝑧1−𝛼1 < < 𝑧𝛼2 ) = 1 − 𝛼
𝑝(1−𝑝)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 165
Ước lượng tham số p
pො (1 − pො ) pො (1 − pො )
pො − 𝑧𝛼/2 < 𝑝 < pො + 𝑧𝛼/2
𝑛 𝑛
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 166
Ước lượng tham số p
▪ Khoảng tin cậy đối xứng: pො ME hay pො
𝑀𝐸 = 𝜀 = 𝑧𝛼/2 pො (1 − pො )/ 𝑛
▪ Độ dài khoảng tin cậy:
𝐼 = 2𝑀𝐸 = 2𝜀 = 2𝑧𝛼/2 pො (1 − pො )/ 𝑛
▪ Xác định kích thước mẫu n0 thỏa mãn yêu cầu về sai
số hoặc độ dài KTC: 2
pො (1 − pො )𝑧𝛼/2
𝜀 ≤ 𝜀0 ⇔ 𝑛0 ≥
𝜀02
2
4ොp(1 − pො )𝑧𝛼/2
𝐼 ≤ 𝐼0 ⇔ 𝑛0 ≥
𝐼02
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 167
BÀI 9. KIỂM ĐỊNH GIẢ THUYẾT
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 168
9.1. KIỂM ĐỊNH THAM SỐ TỔNG THỂ
▪ Cặp giả thuyết, tiêu chuẩn kiểm định
▪ Các loại sai lầm
▪ Mức ý nghĩa và miền bác bỏ
▪ P-Value
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 169
Cặp giả thuyết, tiêu chuẩn kiểm định
▪ Giả thuyết thống kê: Mệnh đề về một vấn đề thống kê
nào đó về tổng thể.
▪ Kiểm định tham số: Kết luận về tính đúng / sai của một
giả thuyết thống kê đối với tham số tổng thể dựa vào
các bằng chứng thực nghiệm.
▪ Ví dụ:
➢ Thu nhập trung bình của người lao động là trên
2000 USD/năm
➢ Tỷ lệ khách quay lại mua hàng lần hai là 50%
➢ Độ dao động của giá vàng trên thị trường tư nhân
trong năm qua là chưa đến 30 USD
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 170
Cặp giả thuyết, tiêu chuẩn kiểm định
▪ Bài toán kiểm định giả thuyết thống kê so sánh giá trị
tham số (của tổng thể) và giá trị thực 0 cho trước:
H0 : θ = θ0 H0 : θ = θ0 H0 : θ = θ0
ቊ ቊ ቊ
H1 : θ > θ 0 H1 : θ < θ 0 H1 : θ ≠ θ 0
▪ Với mỗi cặp giả thuyết ta có một tiêu chuẩn kiểm định,
ký hiệu là 𝐺.
▪ Giá trị của tiêu chuẩn kiểm định G tính trên mẫu là 𝐺𝑞𝑠
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 171
Ví dụ
Viết cặp giả thuyết phù hợp cho các bài toán kiểm
định giả thuyết thống kê đối với các nhận định sau:
(a) Thu nhập trung bình của người lao động là trên
2000 USD/năm.
(a) Tỷ lệ khách quay lại mua hàng lần hai là 50%.
(b) Độ dao động của giá vàng trên thị trường trong
năm qua là chưa đến 30 USD phải không?
(c) Tỷ lệ nữ khách hàng trong ngày của một cửa hàng
là ít hơn nam.
(d) Mức độ biến động của giá vàng là quá 500 USD2.
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 172
Các sai lầm
▪ Sai lầm loại I: bác bỏ một điều đúng (type I error)
▪ Sai lầm loại II: chấp nhận một điều sai (type II error)
Quyết định Tình trạng trên tổng thể
𝐻0 đúng 𝐻0 sai
Chấp nhận 𝐻0 Đúng Sai lầm loại II
Xác suất=1-α Xác suất=β
Bác bỏ 𝐻0 Sai lầm loại I Đúng
Xác suất=α Xác suất=1-β
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 174
Quy tắc kiểm định
▪ Cặp giả thuyết 𝐻0 và 𝐻1
▪ Mẫu cụ thể thì tiêu chuẩn 𝐺 nhận giá trị cụ thể: 𝐺𝑞𝑠
▪ Mức ý nghĩa cho trước, tìm được miền bác bỏ 𝑊
❖ Nếu 𝐺𝑞𝑠 𝑊: bác bỏ 𝐻0 (reject 𝐻0), 𝐻0 là sai, 𝐻1 là
đúng
❖ Nếu 𝐺𝑞𝑠 𝑊: chưa có cơ sở bác bỏ 𝐻0 (not reject
𝐻0), 𝐻0 là đúng, 𝐻1 là sai
▪ Kết luận về mệnh đề đã nêu ra.
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 175
P-value
▪ P-value là “mức xác suất thấp nhất để bác bỏ 𝐻0”
▪ P-value thường được tính sẵn qua các phần mềm
chuyên dụng
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 176
9.2. KIỂM ĐỊNH THAM SỐ MỘT TỔNG THỂ
▪ Kiểm định trung bình tổng thể
▪ Kiểm định phương sai tổng thể
▪ Kiểm định tần suất tổng thể
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 177
Kiểm định trung bình tổng thể
▪ Tổng thể phân phối chuẩn 𝑋 ~ 𝑁 ( , 𝜎 2 )
▪ Tham số chưa biết, kiểm định so sánh với số 0
Ba cặp giả thuyết
H0 : μ = μ0 H0 : μ = μ0 H0 : μ = μ0
(1)ቊ (2) ൜ 3 ቊ
H1 : μ > μ 0 H1 : μ < μ 0 H1 : μ ≠ μ 0
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 178
Kiểm định khi biết σ2 (tự đọc)
ഥ −μ
X n
▪ Tiêu chuẩn chung 𝑍 = ~ N 0,1
σ
H0 : μ = μ0
(1) ቊ
H1 : μ > μ 0
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 179
Kiểm định khi biết σ2 (tự đọc)
ഥ −μ
X n
▪ Tiêu chuẩn chung 𝑍 = ~ N 0,1
σ
H0 : μ = μ0
(2) ቊ
H1 : μ < μ 0
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 180
Kiểm định khi biết σ2 (tự đọc)
ഥ −μ
X n
▪ Tiêu chuẩn chung 𝑍 = ~ N 0,1
σ
H0 : μ = μ0
(3) ቊ
H1 : μ ≠ μ 0
ഥ −μ 0 ) n
(X
𝑍= ~N 0,1
σ
𝑃( Z > z α/2 )=
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 181
P - value
▪ Với cặp giả thuyết cho trước, mẫu cụ thể
▪ Giá trị quan sát: 𝑍𝑞𝑠
▪ 𝑃- value của các cặp giả thuyết tính như sau:
H0 : μ = μ0
(1) ቊ 𝑃 = 𝑃(𝑍 > 𝑍 𝑞𝑠 )
H1 : μ > μ 0
H0 : μ = μ0
(2) ቊ 𝑃 = 𝑃(𝑍 < 𝑍 𝑞𝑠 )
H1 : μ < μ 0
H0 : μ = μ0
(3) ቊ 𝑃 = 2𝑃(𝑍 >∣ 𝑍 𝑞𝑠 ∣)
H1 : μ ≠ μ 0
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 182
Ví dụ
▪ Ví dụ 9.1. Biết kích thước sản phẩm là biến ngẫu
nhiên phân phối chuẩn với phương sai là 36mm2. Đo
ngẫu nhiên 50 sản phẩm tính được trung bình mẫu là
122mm. Với mức ý nghĩa 5%
a) Kiểm định giả thuyết kích thước trung bình là trên
120mm
b)* Tìm P-value của cặp giả thuyết trong câu (a)
c) Kiểm định giả thuyết kích thước trung bình chưa đến
123mm
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 183
Kiểm định khi chưa biết σ2
𝑋 ~ 𝑁( , 𝜎2) Cặp Miền bác bỏ
Tiêu chuẩn giả thuyết 𝑊
𝐻0: = 0
𝐻1: > 0
𝐻0: = 0
𝐻1: < 0
𝐻0: = 0
𝐻1: 0
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 184
Ví dụ
▪ Ví dụ 9.2. Cân ngẫu nhiên 25 sản phẩm khối lượng trung
bình là 25,32g và phương sai là 5,28g2. Giả sử khối lượng
phân phối chuẩn. Với mức ý nghĩa 5%
a) Kiểm định giả thuyết trung bình tổng thể lớn hơn 24g
b) Có thể nói khối lượng trung bình là chưa đến 26g hay
không? Nếu mức ý nghĩa là 10% thì sao?
c) Nhận xét ý kiến cho rằng khối lượng trung bình là khác
26,5g
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 185
Kiểm định phương sai tổng thể
𝑋 ~ 𝑁( , 𝜎2) Cặp Miền bác bỏ
Tiêu chuẩn giả thuyết 𝑊
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 186
Ví dụ
▪ Ví dụ 9.3. Tiêu chuẩn cho độ dao động của
khối lượng một loai quả đóng hộp là không
được vượt quá 5g. Kiểm tra ngẫu nhiên 50 quả
thu hoạch tại một vườn thấy phương sai mẫu
của khối lượng quả là 30g2.
Với mức ý nghĩa 5%, cho biết mức dao động của
khối lượng loại quả tại vườn này là đạt tiêu
chuẩn hay không? Giả thiết rằng khối lượng quả
là biến ngẫu nhiên phân phối chuẩn.
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 187
Kiểm định tần suất tổng thể
Tiêu chuẩn Cặp Miền bác bỏ
giả thuyết 𝑊
kiểm định: 𝐻 0: 𝑝 = 𝑝 0
p
ෝ − p0 n 𝐻 1: 𝑝 > 𝑝 0 Z: Z > z α
Z=
p0 1 − p0 𝐻 0: 𝑝 = 𝑝 0
𝑍~N 0,1 , 𝐻 1: 𝑝 < 𝑝 0 Z: Z < −z α
n ≥100 𝐻 0: 𝑝 = 𝑝 0
𝐻 1: 𝑝 ≠ 𝑝 0 Z: Z > z α/2
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 188
Ví dụ
▪ Ví dụ 9.4. Trong số 400 người vào cửa hàng thì có 224
nữ và 176 nam.
Trong 224 nữ có 108 người mua hàng; trong 176 nam có 94
người mua hàng. Với mức ý nghĩa 5%:
a) Có thể nói tỷ lệ nữ chiếm trên một nửa số người vào
cửa hàng hay không?
b) Có thể cho rằng tỷ lệ mua hàng của nữ là ít hơn của
nam hay không?
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - NEU – www.mfe.edu.vn 189
9.3. KIỂM ĐỊNH THAM SỐ HAI TỔNG THỂ
▪ Khái niệm mẫu độc lập và mẫu phụ thuộc
▪ Kiểm định trung bình hai tổng thể
▪ Kiểm định phương sai hai tổng thể
▪ Kiểm định tần suất hai tổng thể
▪ [1] Chương 8
▪ [2] Chapter 10
▪ [3] Chapter 10, 11, 12
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 190
Khái niệm mẫu độc lập – mẫu phụ thuộc
▪ Mẫu độc lập: quan sát thu được từ các đối tượng độc
lập hay khác nhau.
• Số quan sát có thể khác nhau
• Không quan trọng thứ tự các quan sát
▪ Mẫu phụ thuộc: là hai mẫu được chọn theo cách một
quan sát bất kì ở mẫu thứ nhất tương ứng duy nhất
với một quan sát ở mẫu thứ hai (quan hệ theo cặp)
• Số quan sát phải bằng nhau
• Thứ tự của các quan sát là cố định
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 191
Ví dụ
▪ Hai mẫu phụ thuộc ▪ Hai mẫu độc lập
Cửa Trước Sau Công ty A Công ty B
hàng quảng cáo quảng cáo 76 90
1 72 76 79 82
2 75 79 77 85
3 70 77 80 90
4 82 80 75 80
5 70 75 89 79
6 83 89 87
Quảng cáo thành công? 88
Doanh số của A và B có
sự khác biệt?
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 192
Kiểm định về trung bình hai tổng thể
▪ Hai tổng thể phân phối chuẩn:
𝑋1 ~𝑁 𝜇1 , 𝜎12 ; 𝑋2 ~𝑁(𝜇2 , 𝜎22 )
▪ Các tham số đều chưa biết
▪ Với X1, lấy mẫu W1, kích thước n1, có 𝑋ത1 và 𝑆12
▪ Với X2, lấy mẫu W2, kích thước n2, có 𝑋ത2 và 𝑆22
▪ Với mức ý nghĩa , kiểm định so sánh 1 và 2
▪ Hai trường hợp:
• Giả sử 𝜎12 ≠ 𝜎22
• Giả sử 𝜎12 = 𝜎22 : tự đọc trong giáo trình
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 193
Kiểm định trung bình hai tổng thể
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 194
Kiểm định phương sai hai tổng thể
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 195
Kiểm định phương sai hai tổng thể
▪ Giả thuyết 𝜎12 < 𝜎22 hoán vị thành 𝜎22 > 𝜎12
▪ Chỉ xét với 𝑆12 > 𝑆22 thì bảng quyết định:
𝑋1 ~𝑁 𝜇1 , 𝜎12 Cặp Miền bác bỏ
𝑋2 ~𝑁(𝜇2 , 𝜎22 ) giả thuyết W
𝑺𝟐𝟏 > 𝑺𝟐𝟐 H0: 𝜎12 = 𝜎22 𝐹: 𝐹 > 𝑓𝛼
(𝑛1 −1,𝑛2 −1)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 196
Ví dụ
▪ Ví dụ 9.5. Khảo sát ngẫu nhiên 40 khách hàng nam
và 40 khách hàng nữ thấy khách nam chi trung bình
là 230 nghìn và độ lệch chuẩn là 50 nghìn; khách nữ
chi trung bình là 205 nghìn và độ lệch chuẩn là 60
nghìn. Giả sử chi tiêu phân phối chuẩn.
▪ Với mức ý nghĩa 5%, kiểm định giả thuyết mức chi
trung bình của nam nhiều hơn nữ
▪ Với mức ý nghĩa 10%, mức chi của nam có đồng đều
như nữ không?
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 197
Kiểm định tần suất hai tổng thể
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 198
Ví dụ
▪ Ví dụ 9.6. Quan sát số khách hàng vào ba cửa hàng
A, B, C
A B C
Nữ 55 115 85
Nam 45 55 35
Tổng 100 170 120
a) Với mức ý nghĩa 5%, kiểm định giả thuyết “tỷ lệ khách
hàng là nữ ở hai cửa hàng A và B là như nhau”
b) Với mức ý nghĩa là 1% thì tỷ lệ khách hàng là nữ ở cửa
hàng B nhỏ hơn tỷ lệ khách hàng là nữ ở cửa hàng C?
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 199
9.4. KIỂM ĐỊNH PHI THAM SỐ
Kiểm định phi tham số được sử dụng trong những
trường hợp dữ liệu không có phân phối chuẩn hoặc
cho các mẫu nhỏ có ít quan sát.
▪ Kiểm định Jarques Berra (JB)
▪ Kiểm định tính độc lập
Tham khảo
▪ [1] Chương 9
▪ [3] Chapter 12
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 200
Kiểm định Jarques – Berra (JB)
𝐻0: Biến 𝑋 phân phối chuẩn
𝐻1: Biến 𝑋 không phân phối chuẩn
n
▪ Hệ số bất đối xứng: a3 =
i =1
( X i − X )3
/n
S3
n
▪ Hệ số nhọn: a4 =
i =1
( X i − X ) 4
/n
S4
a32 (a4 − 3)2
▪ Tiêu chuẩn: JB = n +
6 24
▪ Miền bác bỏ:
Wα = JB : JB χ α2(2)
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 201
Ví dụ
▪ Ví dụ 9.7. Với số liệu sau:
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 202
Kiểm định tính độc lập
▪ Hai dấu hiệu định tính A và B và bảng tiếp liên
• A gồm h phạm trù: 𝐴1, 𝐴2, … , 𝐴ℎ
• B gồm k phạm trù: 𝐵1, 𝐵2, … , 𝐵𝑘
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 203
Kiểm định tính độc lập
▪ Kiểm định cặp giả thuyết
• 𝐻0: A và B độc lập
• 𝐻1: A và B không độc lập
h k n 2
▪ Tiêu chuẩn χ = n
2 ij
− 1
i =1 j =1 ni m j
2((ℎ−1)×(𝑘−1))
▪ Miền bác bỏ: 𝑊𝛼 = 2 : 2 > 𝛼
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 204
Ví dụ
▪ Ví dụ 9.7. Với mức ý nghĩa 5%, kiểm định tính độc lập
giới tính và loại tốt nghiệp của các cử nhân
Loại
Trung
TN Khá Giỏi ∑
bình
Giới
Nữ 90 150 40
Nam 100 100 20
∑
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN – BỘ MÔN TOÁN KINH TẾ - www.mfe.neu.edu.vn 205