Professional Documents
Culture Documents
1 / 36 2 / 36
Khoa học về phân tích dữ liệu (bao gồm cả thu thập và xử Ước lượng tham số Ước lượng tham số
Ước lượng điểm I Thu thập, lưu trữ dãy số liệu: kết quả của việc đếm khi Ước lượng điểm
lý) nhằm thu thập thông tin chân thực về đối tượng nghiên Khoảng tin cậy Khoảng tin cậy
quan sát, của đo đạc nhờ các thiết bị đo, của tính toán
cứu với một độ tin cậy nhất định và rút ra những kết luận Khoảng tin cậy cho kỳ vọng
Khoảng tin cậy cho tỷ lệ
Khoảng tin cậy cho kỳ vọng
kiểm tra chất lượng sản phẩm, thăm dò dư luận, . . . Kiểm định về kỳ vọng Kiểm định về kỳ vọng
Kiểm định về tỷ lệ Kiểm định về tỷ lệ
Kiểm định hai kỳ vọng Kiểm định hai kỳ vọng
Kiểm định hai tỷ lệ Kiểm định hai tỷ lệ
3 / 36 4 / 36
Mẫu và tập đám đông Xác suất thống kê
Phương pháp chọn mẫu Xác suất thống kê
đông hay tập nền Ước lượng tham số Mẫu có tính đại diện tốt cho tập nền. Ước lượng tham số
I Nghiên cứu tập nền vô cùng khó khăn vì: Ước lượng điểm Ước lượng điểm
Khoảng tin cậy
1. Chọn mẫu ngẫu nhiên: mỗi phần tử của tập nền đã có Khoảng tin cậy
I Do nó quá lớn dẫn đến đòi hỏi quá nhiều chi phí vật Khoảng tin cậy cho kỳ vọng Khoảng tin cậy cho kỳ vọng
Khoảng tin cậy cho tỷ lệ
xác suất chọn xác định từ trước cả khi chọn mẫu Khoảng tin cậy cho tỷ lệ
5 / 36 6 / 36
I Chọn mẫu ngẫu nhiên đơn giản: mọi mẫu cùng kích cỡ Khái niệm Khái niệm
(cùng số phần tử) có cùng xác suất được chọn và mọi Mẫu và thống kê Giả sử từ một tập nền có N phần tử, ta chọn ra một mẫu có Mẫu và thống kê
mô tả mô tả
phần tử của tập nền có đồng khả năng lọt vào mẫu. Thống kê mô tả kích thước n, các phần tử của mẫu được ký hiệu là Thống kê mô tả
I Bốc thăm hoặc dùng bảng số ngẫu nhiên Mẫu và tập đám đông
xi , i = 1, n
Mẫu và tập đám đông
Mẫu ngẫu nhiên và các đặc Mẫu ngẫu nhiên và các đặc
I Chọn không hoặc có hoàn lại trưng mẫu trưng mẫu
I Có tính đại diện cao và tin cậy nhưng đòi hỏi phải biết Ước lượng tham số Mẫu đơn Ước lượng tham số
Ước lượng điểm Ước lượng điểm
toàn bộ tập nền ⇒ chi phí chọn mẫu khá lớn Khoảng tin cậy Tập n giá trị x1 , x2 , . . . , xn tạo ra một mẫu đơn. Nếu trong Khoảng tin cậy
Khoảng tin cậy cho kỳ vọng Khoảng tin cậy cho kỳ vọng
I Chọn mẫu phân nhóm: Chia tập nền thành các nhóm Khoảng tin cậy cho tỷ lệ mẫu có nhiều giá trị giống nhau: x1 , x2 , . . . , xk với k < n Khoảng tin cậy cho tỷ lệ
đối tương đối thuần nhất, sau đó từ mỗi nhóm trích ra Kiểm định giả Số liệu mẫu x1 x2 . . . xk Kiểm định giả
thuyết thuyết
một mẫu ngẫu nhiên. Tập hợp tất cả các mẫu đó cho Giả thuyết thống kê Số lượng n1 n2 . . . nk Giả thuyết thống kê
Quy tắc kiểm định Quy tắc kiểm định
ta một mẫu (ngẫu nhiên) phân nhóm. Kiểm định về kỳ vọng Kiểm định về kỳ vọng
I Dùng khi trong nội bộ tập nền có những sai khác lớn Kiểm định về tỷ lệ
Kiểm định hai kỳ vọng
Mẫu lớp Kiểm định về tỷ lệ
Kiểm định hai kỳ vọng
I Phải có hiểu biết nhất định về cấu trúc tập nền để phân Kiểm định hai tỷ lệ Số liệu mẫu [x0 , x1 ) [x1 , x2 ) ... [xk−1 , xk ] Kiểm định hai tỷ lệ
chia nhóm hợp lý ⇒ tính chủ quan khi phân chia nhóm Số lượng n1 n2 ... nk
I Chọn mẫu chùm: chọn một mẫu ngẫu nhiên của các tập
con của tập nền, được gọi là các chùm ⇒ sai số lớn hơn
7 / 36 8 / 36
Mẫu ngẫu nhiên Xác suất thống kê
Các đặc trưng mẫu cơ bản Xác suất thống kê
n k
1X 1X
Khái niệm I Trung bình mẫu: X̄ = xi , X̄ = ni xi Khái niệm
n n
Mẫu và thống kê i=1 i=1 Mẫu và thống kê
mô tả n mô tả
1 X
xik
Thống kê mô tả Thống kê mô tả
biết nhưng chưa biết tham số θ nào đó. Ta phải xác định giá Mẫu và tập đám đông Mẫu và tập đám đông
trị của θ dựa trên các thông tin thu được từ một mẫu quan
Mẫu ngẫu nhiên và các đặc
trưng mẫu Thống kê θ̂ được gọi là ước lượng không chệch của θ nếu Mẫu ngẫu nhiên và các đặc
trưng mẫu
sát x1 , x2 , . . . , xn của X . Ước lượng tham số E θ̂ = θ hay E (θ̂ − θ) = 0. Ước lượng tham số
Ước lượng điểm Ước lượng điểm
Quá trình đi xác định tham số θ chưa biết được gọi là quá Khoảng tin cậy I Trung bình mẫu là ước lượng không chệch của kỳ vọng Khoảng tin cậy
Khoảng tin cậy cho kỳ vọng Khoảng tin cậy cho kỳ vọng
trình ước lượng tham số. Khoảng tin cậy cho tỷ lệ (X̄ = µ̂) Khoảng tin cậy cho tỷ lệ
11 / 36 12 / 36
Ước lượng vững Xác suất thống kê
Ước lượng hiệu quả Xác suất thống kê
Nghĩa là ∀ε > 0 : lim P(|θ̂ − θ| < ε) = 1 Khoảng tin cậy Khoảng tin cậy
n→∞ Khoảng tin cậy cho kỳ vọng ước lượng không chệch có phương sai bé nhất. Khoảng tin cậy cho kỳ vọng
Khoảng tin cậy cho tỷ lệ Khoảng tin cậy cho tỷ lệ
I Trung bình mẫu là ước lượng vững của kỳ vọng Kiểm định giả I Trung bình mẫu là ước lượng hiệu quả của kỳ vọng Kiểm định giả
thuyết thuyết
I Phương sai mẫu hoặc phương sai mẫu hiệu chỉnh là ước Giả thuyết thống kê I Tần suất mẫu là ước lượng hiệu quả của tỷ lệ Giả thuyết thống kê
Quy tắc kiểm định Quy tắc kiểm định
lượng vững của phương sai Kiểm định về kỳ vọng Kiểm định về kỳ vọng
Kiểm định về tỷ lệ Kiểm định về tỷ lệ
I Tần suất mẫu là ước lượng vững của tỷ lệ Kiểm định hai kỳ vọng Kiểm định hai kỳ vọng
Kiểm định hai tỷ lệ Kiểm định hai tỷ lệ
13 / 36 14 / 36
Mẫu và thống kê
Phát biểu bài toán Mẫu và thống kê
mô tả
Thống kê mô tả
Để ước lượng tham số θ, phương pháp này chủ trương xây mô tả
Thống kê mô tả
Mẫu và tập đám đông dựng một thống kê nào đó có luật phân phối xác định không Mẫu và tập đám đông
Mẫu ngẫu nhiên và các đặc Mẫu ngẫu nhiên và các đặc
trưng mẫu
phụ thuộc θ (nhưng thống kê lại phụ thuộc). trưng mẫu
I Khi kích thước mẫu bé thì ước lượng điểm có thể sai Ước lượng tham số
Nếu dựa vào thống kê đó, ta tìm được khoảng giá trị Ước lượng tham số
Ước lượng điểm Ước lượng điểm
lệch rất nhiều so với tham số cần ước lượng Khoảng tin cậy
(θ1 , θ2 ) trong đó θ1 và θ2 phụ thuộc vào thống kê trên, sao Khoảng tin cậy
Khoảng tin cậy cho kỳ vọng Khoảng tin cậy cho kỳ vọng
I Không thể đánh giá được khả năng mắc sai lầm khi ước Khoảng tin cậy cho tỷ lệ cho với một xác suất cho trước, tham số θ rơi vào khoảng Khoảng tin cậy cho tỷ lệ
15 / 36 16 / 36
Khoảng tin cậy cho kỳ vọng Xác suất thống kê
Khoảng tin cậy cho kỳ vọng (TH1) Xác suất thống kê
Khái niệm
Trường hợp 1: phương sai σ 2 = σ02 đã biết Khái niệm
X̄ − µ √
Mẫu và thống kê
mô tả
Chọn thống kê Z = n ∼ N (0, 1) Mẫu và thống kê
mô tả
Thống kê mô tả
σ0 Thống kê mô tả
Mẫu và tập đám đông
Mẫu ngẫu nhiên và các đặc
1. Khoảng đối xứng: P(−zb < Z < zb ) = 1 − α Mẫu và tập đám đông
Mẫu ngẫu nhiên và các đặc
Tìm khoảng tin cậy cho EX = µ với độ tin cậy 1 − α cho Khoảng tin cậy cho tỷ lệ
0.2
Khoảng tin cậy cho tỷ lệ
1. Khoảng đối xứng: P(−zb < Z < zb ) = 1 − α Mẫu và tập đám đông
Mẫu ngẫu nhiên và các đặc
1. Khoảng đối xứng: P(−zb < Z < zb ) = 1 − α Mẫu và tập đám đông
Mẫu ngẫu nhiên và các đặc
σ0 σ0 trưng mẫu σ0 σ0 trưng mẫu
0.3 Khoảng tin cậy cho kỳ vọng 0.3 Khoảng tin cậy cho kỳ vọng
Khoảng tin cậy cho tỷ lệ Khoảng tin cậy cho tỷ lệ
0.2 0.2
Kiểm định giả Kiểm định giả
thuyết thuyết
0.1 0.1
Giả thuyết thống kê Giả thuyết thống kê
Quy tắc kiểm định Quy tắc kiểm định
0 0
−6 −4 −2 0 2 4 6 Kiểm định về kỳ vọng −6 −4 −2 0 2 4 6 Kiểm định về kỳ vọng
Kiểm định về tỷ lệ Kiểm định về tỷ lệ
Tra bảng xác định zb : Kiểm định hai kỳ vọng Tra bảng xác định zb : Kiểm định hai kỳ vọng
1−α Rx t2
Kiểm định hai tỷ lệ
1−α Rx t2
Kiểm định hai tỷ lệ
2 − α với Φ0 (x) = 2π 0
e dt 2 − α với Φ0 (x) = 2π 0
e dt
Rx 2 Rx 2
I Φ(zb ) = 1 − α với Φ(x) = √1 − t2 I Φ(zb ) = 1 − α với Φ(x) = √1 − t2
2π −∞
e dt 2π −∞
e dt
19 / 36 19 / 36
0.1 Ước lượng tham số 1. Khoảng tin cậy đối xứng: tb = tn−1,1− α2 Ước lượng tham số
0
Ước lượng điểm s s Ước lượng điểm
σ0
Khoảng tin cậy cho kỳ vọng n n Khoảng tin cậy cho kỳ vọng
Khoảng tin cậy cho tỷ lệ Khoảng tin cậy cho tỷ lệ
1. Khoảng phải: µ > X̄ − √ zb 2. Khoảng tin cậy phải: tb = tn−1,1−α
n Kiểm định giả Kiểm định giả
thuyết s thuyết
σ0 µ > X̄ − √ tb
2. Khoảng trái: µ < X̄ + √ zb Giả thuyết thống kê
Quy tắc kiểm định n
Giả thuyết thống kê
Quy tắc kiểm định
n Kiểm định về kỳ vọng Kiểm định về kỳ vọng
Tra bảng xác định zb : Kiểm định về tỷ lệ 3. Khoảng tin cậy trái: tb = tn−1,1−α Kiểm định về tỷ lệ
t2
Kiểm định hai kỳ vọng
s Kiểm định hai kỳ vọng
I Φ0 (zb ) = 1
− α với Φ0 (x) = √1
Rx
e − 2 dt
Kiểm định hai tỷ lệ
µ < X̄ + √ tb Kiểm định hai tỷ lệ
2 2π
Rx
0
2
n
I Φ(zb ) = 1 − α với Φ(x) = √1 − t2
2π −∞
e dt x.xỉ
Kích thước mẫu lớn (n > 30): T ∼ N (0, 1) ⇒ đưa về
trường hợp 1 với σ0 chưa biết được thay bằng s
19 / 36 20 / 36
Khoảng tin cậy cho tỷ lệ Xác suất thống kê
Kiểm định giả thuyết Xác suất thống kê
f =m
mô tả là các giả thuyết, chúng có thể đúng và có thể sai. Vấn đề mô tả
n . Tìm khoảng tin cậy cho p với độ tin cậy 1 − α cho Thống kê mô tả Thống kê mô tả
trước. Mẫu và tập đám đông xác định đúng sai của một giả thuyết được gọi là kiểm định. Mẫu và tập đám đông
2 , Φ(zb ) = 1 − 2 Quy tắc kiểm định Nghiên cứu thu nhập của cư dân một thành phố nào đó. ta Quy tắc kiểm định
Kiểm định về kỳ vọng Kiểm định về kỳ vọng
có thể đưa ra nhiều giả thuyết khác nhau.
r
f (1 − f ) Kiểm định về tỷ lệ Kiểm định về tỷ lệ
Nguyên tắc chung của kiểm định giả thuyết thống kê là dựa
Khái niệm Khái niệm
trên: Mẫu và thống kê Tiêu chuẩn Mẫu và thống kê
I nguyên lý xác suất nhỏ: một sự kiện có xác suất xuất mô tả
Thống kê mô tả
Tiêu chuẩn được xây dựng rõ ràng phải đơn giản và dựa trên mô tả
Thống kê mô tả
hiện khá bé thì có thể coi rằng nó không xảy ra khi Mẫu và tập đám đông
Mẫu ngẫu nhiên và các đặc
các thông tin mẫu x1 , x2 , . . . , xn . Thông thường người ta Mẫu và tập đám đông
Mẫu ngẫu nhiên và các đặc
thực hiện một phép thử có liên quan đến sự kiện đó. trưng mẫu
chọn một thống kê K = K (x1 , x2 , . . . , xn ) có thể phụ thuộc trưng mẫu
xem A không thể xảy ra trong một phép thử về biến cố này.
Kiểm định về tỷ lệ
Kiểm định hai kỳ vọng
Với α bé cho trước và với điều kiện H0 đúng có thể tìm Kiểm định về tỷ lệ
Kiểm định hai kỳ vọng
Nếu trên một mẫu cụ thể quan sát được mà biến cố A xuất
Kiểm định hai tỷ lệ
được miền Wα : P(K ∈ Wα |H0 ) = α Kiểm định hai tỷ lệ
hiện thì điều này trái với nguyên lý xác suất nhỏ ⇒ H0 sai và α được gọi là mức ý nghĩa của kiểm định và Wα gọi là miền
bác bỏ nó. Còn nếu A không xảy ra thì ta chưa có cơ sở để bác bỏ giả thuyết H0 với mức ý nghĩa α
bác bỏ H0 .
23 / 36 24 / 36
Quy tắc kiểm định Xác suất thống kê
Các dạng miền bác bỏ Xác suất thống kê
I Sai lầm loại II: chấp nhận một giả thuyết sai Mẫu ngẫu nhiên và các đặc
trưng mẫu
Mẫu ngẫu nhiên và các đặc
trưng mẫu
H0 : θ = θ0 , H1 : θ 6= θ0
β = P(Ktn ∈ / Wα | H0 sai) Ước lượng tham số Ước lượng tham số
Ước lượng điểm Ước lượng điểm
Khoảng tin cậy Khoảng tin cậy
Quyết định Khoảng tin cậy cho kỳ vọng Khoảng tin cậy cho kỳ vọng
Thực tế H0 H1
Khoảng tin cậy cho tỷ lệ H0 : θ = θ0 , H1 : θ < θ0 Khoảng tin cậy cho tỷ lệ
Quy tắc Kiểm định hai kỳ vọng Kiểm định hai kỳ vọng
Kiểm định hai tỷ lệ Kiểm định hai tỷ lệ
Lựa chọn trước α như là một ngưỡng để xác suất phạm sai
lầm loại I luôn nhỏ hơn α đủ bé đó. Trong các giá trị α đó,
chọn giá trị để việc xác suất phạm sai lầm loại II nhỏ nhất
có thể.
25 / 36 26 / 36
Khái niệm Trường hợp 1: Phương sai σ 2 = σ02 đã biết Khái niệm
27 / 36 28 / 36
Kiểm định về kỳ vọng (TH1) Xác suất thống kê
Kiểm định về kỳ vọng (TH1) Xác suất thống kê
Trường hợp 1: Phương sai σ 2 = σ02 đã biết Khái niệm Trường hợp 1: Phương sai σ 2 = σ02 đã biết Khái niệm
0.2 Khoảng tin cậy cho tỷ lệ 0.2 Khoảng tin cậy cho tỷ lệ
H1 : µ 6= µ0 ⇒ Wα = (−∞, −zb ) ∪ (zb , +∞) Kiểm định hai tỷ lệ H1 : µ 6= µ0 ⇒ Wα = (−∞, −zb ) ∪ (zb , +∞) Kiểm định hai tỷ lệ
28 / 36 28 / 36
0.2 Mẫu ngẫu nhiên và các đặc 0.2 Mẫu ngẫu nhiên và các đặc
trưng mẫu trưng mẫu
I Đối thuyết: H1 : µ > µ0 Quy tắc kiểm định I Đối thuyết: H1 : µ > µ0 Quy tắc kiểm định
Kiểm định về kỳ vọng Kiểm định về kỳ vọng
Miền bác bỏ: Wα = (zb , +∞) với Kiểm định về tỷ lệ Miền bác bỏ: Wα = (zb , +∞) với Kiểm định về tỷ lệ
Kiểm định hai kỳ vọng Kiểm định hai kỳ vọng
Φ0 (zb ) = 12 − α, Φ(zb ) = 1 − α Kiểm định hai tỷ lệ Φ0 (zb ) = 12 − α, Φ(zb ) = 1 − α Kiểm định hai tỷ lệ
29 / 36 29 / 36
Kiểm định về kỳ vọng (TH1) Xác suất thống kê
Kiểm định về kỳ vọng (TH1) Xác suất thống kê
0.2 Mẫu ngẫu nhiên và các đặc 0.2 Mẫu ngẫu nhiên và các đặc
trưng mẫu trưng mẫu
I Đối thuyết: H1 : µ > µ0 Quy tắc kiểm định I Đối thuyết: H1 : µ > µ0 Quy tắc kiểm định
Kiểm định về kỳ vọng Kiểm định về kỳ vọng
Miền bác bỏ: Wα = (zb , +∞) với Kiểm định về tỷ lệ Miền bác bỏ: Wα = (zb , +∞) với Kiểm định về tỷ lệ
Kiểm định hai kỳ vọng Kiểm định hai kỳ vọng
Φ0 (zb ) = 12 − α, Φ(zb ) = 1 − α Kiểm định hai tỷ lệ Φ0 (zb ) = 12 − α, Φ(zb ) = 1 − α Kiểm định hai tỷ lệ
29 / 36 29 / 36
I Kiểm định hai phía: H1 : µ 6= µ0 . Ước lượng tham số I Kiểm định hai phía: H1 : p 6= p0 . Ước lượng tham số
Ước lượng điểm Ước lượng điểm
Miền bác bỏ: Wα = (−∞, −tb ) ∪ (tb , +∞) với Khoảng tin cậy
Miền bác bỏ: Wα = (−∞, −zb ) ∪ (zb , +∞) với Khoảng tin cậy
Khoảng tin cậy cho kỳ vọng Khoảng tin cậy cho kỳ vọng
tb = tn−1,1− α2 Khoảng tin cậy cho tỷ lệ Φ0 (zb ) = 1−α
2 , Φ(zb ) = 1 − 2
α Khoảng tin cậy cho tỷ lệ
30 / 36 31 / 36
So sánh hai kỳ vọng Xác suất thống kê
So sánh hai kỳ vọng Xác suất thống kê
Giả sử có hai tập nền với hai biến gốc tương ứng Bài toán 2: σ12 và σ22 chưa biết
X ∼ N (µ1 , σ12 ) và Y ∼ N (µ2 , σ22 ) và hai tập mẫu tương Khái niệm Khái niệm
Chỉ xét trường hợp hai biến gốc có phương sai giống nhau
ứng x1 , x2 , . . . , xn1 và y1 , y2 , . . . , yn2 . Mẫu và thống kê Mẫu và thống kê
mô tả σ1 = σ2 mô tả
Người ta đưa ra giả thuyết H0 : µ1 = µ2 . Thống kê mô tả
(X̄ − Ȳ ) − (µ1 − µ2 )
Thống kê mô tả
Mẫu và tập đám đông Mẫu và tập đám đông
Bài toán 1: σ12 và σ22 đã biết Mẫu ngẫu nhiên và các đặc Chọn tiêu chuẩn K = q Mẫu ngẫu nhiên và các đặc
trưng mẫu
(n1 −1)s12 +(n2 −1)s22 1 trưng mẫu
(X̄ − Ȳ ) − (µ1 − µ2 ) Ước lượng tham số n1 +n2 −2 ( n1 + n12 ) Ước lượng tham số
Chọn tiêu chuẩn K = q 2 Ước lượng điểm
H0 đúng ⇒ K ∼ t(n1 + n2 − 2) Ước lượng điểm
Miền bác bỏ: Wα = (−∞, −zb ) ∪ (zb , +∞) với Quy tắc kiểm định Quy tắc kiểm định
Kiểm định về kỳ vọng
I Kiểm định một phía: H1 : µ1 < µ2 Kiểm định về kỳ vọng
Φ0 (zb ) = 1−α
2 , Φ(zb ) = 1 − 2
α Kiểm định về tỷ lệ Kiểm định về tỷ lệ
Kiểm định hai kỳ vọng
Kiểm định hai tỷ lệ
Miền bác bỏ: Wα = (−∞, −tb ) với tb = tn1 +n2 −2,1−α Kiểm định hai kỳ vọng
Kiểm định hai tỷ lệ
I Kiểm định một phía: H1 : µ1 < µ2 ⇒ Wα = (−∞, −zb )
I Kiểm định một phía: H1 : µ1 > µ2
với Φ0 (zb ) = 12 − α, Φ(zb ) = 1 − α
Miền bác bỏ: Wα = (tb , +∞) với tb = tn1 +n2 −2,1−α
I Kiểm định một phía: H1 : µ1 > µ2 ⇒ Wα = (zb , +∞)
Khi n1 và n2 đủ lớn (≥ 30): đưa về bài toán 1 với σ12 , σ22
với Φ0 (zb ) = 12 − α, Φ(zb ) = 1 − α được thay bằng s12 , s22
32 / 36 33 / 36
H0 đúng, n1 , n2 khá lớn ⇒ K ∼ N (0, 1) Khoảng tin cậy cho tỷ lệ Khoảng tin cậy cho tỷ lệ
I Kiểm định một phía: H1 : p1 < p2 ⇒ Wα = (−∞, −zb ) Kiểm định hai tỷ lệ Kiểm định hai tỷ lệ
Khái niệm
Mẫu và thống kê
mô tả
Thống kê mô tả
Mẫu và tập đám đông
Mẫu ngẫu nhiên và các đặc
trưng mẫu
36 / 36