You are on page 1of 70

THỐNG KÊ ỨNG DỤNG

TRONG KINH TẾ VÀ KINH DOANH

Anderson Sweeney Williams


Slides by
John Loucks
St. Edward’s University

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
1
or duplicated, or posted to a publicly accessible website, in whole or in part.
Chương 7
Lấy mẫu và Phân phối Mẫu
 Chọn một mẫu
 Ước lượng điểm
 Giới thiệu phân phối mẫu
 Phân phối mẫu của x
 Phân phối mẫu của p
 Các tính chất của ước lượng điểm
 Các phương pháp lấy mẫu khác

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
2
or duplicated, or posted to a publicly accessible website, in whole or in part.
Giới thiệu

Một phần tử là thực thể trên đó dữ liệu được thu thập.

Một tổng thể là một tập hợp của tất cả các phần tử
quan tâm

Một mẫu là một tập con của tổng thể.

Tổng thể được lấy mẫu là tổng thể từ đó mẫu được rút ra .

Một dàn chọn mẫu là một danh sách các phần tử mà


mẫu sẽ được chọn từ đó.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
3
or duplicated, or posted to a publicly accessible website, in whole or in part.
Giới thiệu

Lý do chúng ta chọn một mẫu là thu thập dữ liệu để


trả lời một câu hỏi nghiên cứu về một tổng thể.

Các kết quả mẫu chỉ cung cấp các ước lượng về các giá
trị của các đặc điểm tổng thể.

Lý do đơn giản là mẫu chỉ chứa một phần của tổng


thể.

Với các phương pháp lấy mẫu thích hợp, các kết quả
mẫu có thể cung cấp các ước lượng “tốt” các đặc điểm
tổng thể.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
4
or duplicated, or posted to a publicly accessible website, in whole or in part.
Chọn mẫu
 Lấy mẫu từ một tổng thể hữu hạn
 Lấy mẫu từ một tổng thể vô hạn

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
5
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lấy mẫu từ một tổng thể hữu hạn
 Tổng thể hữu hạn thường được định nghĩa bằng các
danh sách như :
• Bảng phân công các thành viên của tổ chức
• Các số tài khoản thẻ tín dụng
• Bảng kê số sản phẩm
 Một mẫu ngẫu nhiên đơn giản cỡ n từ một tổng thể hữu
hạn kích thước N là một mẫu được chọn sao cho mỗi mẫu
cỡ n như vậy có cùng khả năng được lựa chọn.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
6
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lấy mẫu từ một tổng thể hữu hạn

 Trả lại mỗi phần tử đã được lấy mẫu trước khi lựa chọn
các phần tử sau được gọi là lấy mẫu có hoàn lại.

 Lấy mẫu không hoàn lại là thủ tục thường được sử dụng.

 Trong các dự án lấy mẫu lớn, các số ngẫu nhiên do


máy tính tạo ra thường được sử dụng để tự động hóa
quá trình chọn mẫu.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
7
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lấy mẫu từ một tổng thể hữu hạn
 Ví dụ : Đại học St. Andrew’s
Đại học St. Andrew’s đã nhận 900 đơn xin vào học
năm tới từ các sinh viên tương lai. Các ứng viên đã
được đánh số, từ 1 đến 900, khi đơn của họ nộp vào.
Trưởng ban tuyển sinh muốn chọn một mẫu ngẫu
nhiên đơn giản gồm 30 ứng viên.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
8
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lấy mẫu từ một tổng thể hữu hạn
 Ví dụ : Đại học St. Andrew’s
Bước 1: Gắn một số ngẫu nhiên cho mỗi ứng viên
trong 900 ứng viên nói trên.

Các số ngẫu nhiên được tạo bởi hàm ngẫu


nhiên của Excel theo phân phối xác suất
đều giữa 0 and 1.
Bước 2: Chọn 30 ứng viên tương ứng với 30 số
ngẫu nhiên nhỏ nhất.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
9
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lấy mẫu từ một tổng thể vô hạn

 Đôi khi chúng ta muốn chọn một mẫu, nhưng nhận


thấy không thể có được một danh sách gồm tất cả các
phần tử trong tổng thể.
 Kết quả, chúng ta không thể xây dựng một dàn chọn mẫu
cho tổng thể.
 Do đó, chúng ta không thể sử dụng thủ tục chọn số
ngẫu nhiên.
 Hầu hết tình huống này xảy ra trong các trường hợp
tổng thể vô hạn.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
10
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lấy mẫu từ một tổng thể vô hạn

 Tổng thể thường được tạo ra bằng một quá trình xảy ra
hiện thời ở đó không có giới hạn trên đối với số lượng
đơn vị có thể được tạo ra.
 Vài ví dụ về quá trình xảy ra hiện thời, với các tổng thể
vô hạn, là :
• các bộ phận đang được sản xuất trên một dây chuyền
sản xuất
• các giao dịch đang xảy ra tại một ngân hàng
• các cuộc gọi điện thoại đang đến ở một tổ hỗ trợ
kỹ thuật
• các khách hàng đang đi vào một cửa hàng

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
11
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lấy mẫu từ một tổng thể vô hạn

 trong trường hợp một tổng thể vô hạn, chúng ta phải


chọn một mẫu ngẫu nhiên để thực hiện các suy diễn
thống kê có căn cứ về tổng thể từ mẫu được lấy.

 Một mẫu ngẫu nhiên từ một tổng thể vô hạn là một mẫu
được chọn sao cho các điều kiện sau đây thỏa mãn.

• Mỗi phần tử được chọn đến từ tổng thể quan tâm.


• Mỗi phần tử được chọn một cách độc lập.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
12
or duplicated, or posted to a publicly accessible website, in whole or in part.
Ước lượng điểm

Ước lượng điểm là một dạng của suy diễn thống kê.

Trong ước lượng điểm chúng ta sử dụng dữ liệu từ mẫu


để tính toán giá trị của một thống kê mẫu, rồi dùng nó
như một ước lượng của tham số tổng thể.

Chúng ta xem x như ước lượng điểm của trung bình


tổng thể .

s là ước lượng điểm của độ lệch chuẩn tổng thể .

p là ước lượng điểm của tỷ lệ tổng thể p.


© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
13
or duplicated, or posted to a publicly accessible website, in whole or in part.
Ước lượng điểm
 Ví dụ : Đại học St. Andrew’s
Nhắc lại là Đại học St. Andrew’s đã nhận 900 đơn
của các sinh viên tương lai. Mẫu đơn chứa nhiều thông
tin bao gồm điểm kiểm tra năng lực học tập (SAT)
và có hay không mong muốn ở ký túc xá.

Tại một cuộc họp trong vài giờ, Trưởng ban tuyển
sinh muốn công bố điểm SAT trung bình và tỷ lệ ứng
viên muốn sống ở ký túc xá của trường, trong tổng thể
900 ứng viên.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
14
or duplicated, or posted to a publicly accessible website, in whole or in part.
Ước lượng điểm
 Ví dụ : Đại học St. Andrew’s
Tuy nhiên, dữ liệu cần thiết về các ứng viên chưa
được đưa vào trong cơ sở dữ liệu máy tính của
trường. Vì vậy, Trưởng ban quyết định ước lượng giá
trị của các tham số tổng thể quan tâm dựa vào thống
kê mẫu. Mẫu gồm 30 ứng viên được chọn bằng cách
sử dụng các số ngẫu nhiên do máy tính tạo ra.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
15
or duplicated, or posted to a publicly accessible website, in whole or in part.
Ước lượng điểm
 x là Ước Lượng Điểm của 
x
 x

32,910
i
 1097
30 30
 s là Ước Lượng Điểm của 

s
 i
( x  x ) 2


163, 996
 75.2
29 29
 p là Ước Lượng Điểm của p
p  20 30  0.68
Lưu ý: Các số ngẫu nhiên khác sẽ nhận dạng một mẫu
khác mà sẽ dẫn đến các ước lượng điểm khác.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
16
or duplicated, or posted to a publicly accessible website, in whole or in part.
Ước lượng điểm

Khi tất cả dữ liệu của 900 ứng viên được đưa vào cơ sở
dữ liệu của trường, giá trị các tham số tổng thể quan
tâm được tính toán.
 Trung bình tổng thể của điểm SAT

 xi
 1090
900
 Độ lệch chuẩn tổng thể của điểm SAT


 i( x   )2

 80
900
 Tỷ lệ tổng thể muốn ở ký túc xá
648
p  .72
900
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
17
or duplicated, or posted to a publicly accessible website, in whole or in part.
Bảng tóm tắc các Ước Lượng Điểm có được từ
một mẫu ngẫu nhiên đơn giản

Tham số Giá trị Tham số Ước lượng


Tổng thể Tham số Ước lượng điểm Điểm
m = Điểm SAT trung 1090 x = Điểm SAT 1097
bình tổng thể trung bình mẫu

s = Độ lệch chuẩn 80 s = Độ lệch chuẩn 75.2


tổng thể cho mẫu cho
điểm SAT điểm SAT

p = Tỷ lệ tổng thể .72 p = Tỷ lệ mẫu .68


muốn ở muốn ở
ký túc xá ký túc xá

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
18
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lời khuyên thực hành

Tổng thể đích là tổng thể mà chúng ta muốn


thực hiện các suy diễn về nó.

Tổng thể lấy mẫu là tổng thể mà từ đó mẫu được lấy.

Bất kỳ khi nào một mẫu được sử dụng để suy diễn


một tổng thể, chúng ta nên chắc chắn tổng thể đích
và tổng thể lấy mẫu là gần giống nhau.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
19
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của x
 Quá trình suy diễn thống kê

Tổng thể Một mẫu ngẫu nhiên


có trung bình đơn giản cỡ n phần tử
m=? được chọn từ tổng thể.

Giá trị của x được Dữ liệu mẫu cung


sử dụng để suy diễn cấp một giá trị cho
về giá trị của m. trung bình mẫu x.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
20
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của x

Phân phối mẫu của x là phân phối xác suất


của tất cả các giá trị có thể có của trung bình mẫu x.

• Giá trị kỳ vọng của x

E( x ) = 

Ở đó :  = trung bình tổng thể


Khi giá trị kỳ vọng của tham số ước lượng điểm bằng
tham số tổng thể, chúng ta nói tham số ước lượng
điểm là không chệch.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
21
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của x
• Độ lệch chuẩn của x
Chúng ta sẽ sử dụng ký hiệu sau đây để định nghĩa
độ lệch chuẩn của phân phối mẫu của x .

sx = độ lệch chuẩn của x


s = độ lệch chuẩn của tổng thể
n = cỡ mẫu
N = kích thước tổng thể

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
22
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của x
• Độ lệch chuẩn của x
Tổng thể hữu hạn Tổng thể vô hạn

N n  
x  ( ) x 
N 1 n n
• Một tổng thể hữu hạn được xử lý như vô hạn
nếu n/N < 0.05.
• ( N  n ) / ( N  1) là hệ số hiệu chỉnh tổng
thể hữu hạn .
•  x được xem như sai số chuẩn của trung
bình mẫu.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
23
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của x

Khi tổng thể có phân phối chuẩn, thì phân phối


mẫu của x có phân phối chuẩn với mọi
cỡ mẫu.

Trong đa số ứng dụng, phân phối mẫu của x


có thể được xấp xỉ bằng một phân phối chuẩn
bất cứ khi nào cỡ mẫu từ 30 trở lên.

Trong các trường hợp mà tổng thể bị lệch nhiều


hay các giá trị bất thường xuất hiện, các mẫu cỡ 50
có lẽ cần thiết.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
24
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của x

Phân phối mẫu của x có thể được sử dụng để cung


cấp thông tin xác suất về trung bình mẫu x gần như
thế nào với trung bình tổng thể m .

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
25
or duplicated, or posted to a publicly accessible website, in whole or in part.
Định Lý Giới Hạn Trung Tâm

Khi tổng thể mà từ đó chúng ta chọn ra một mẫu


ngẫu nhiên không có phân phối chuẩn, định lý giới
hạn trung tâm là hữu ích trong việc nhận biết hình
dạng của phân phối mẫu của x .

ĐỊNH LÝ GIỚI HẠN TRUNG TÂM


Khi chọn các mẫu ngẫu nhiên cỡ n từ một
tổng thể, phân phối mẫu của trung bình mẫu x có
thể xấp xỉ một phân phối chuẩn khi cỡ mẫu đủ lớn
lớn.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
26
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của x
 Ví dụ : Đại học St. Andrew’s

Phân phối
mẫu của x  80
đối với các x    14.6
n 30
điểm SAT

x
E( x )  1090

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
27
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của x
 Ví dụ : Đại học St. Andrew’s
Xác suất mà một mẫu ngẫu nhiên đơn giản gồm 30
ứng viên sẽ cho một ước lượng của điểm SAT trung
bình tổng thể ở trong vòng +/-10 so với trung bình
tổng thể thực sự  là bao nhiêu ?
Nói cách khác, xác suất x nằm giữa 1080 và 1100
là bao nhiêu?

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
28
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của x
 Ví dụ : Đại học St. Andrew’s
Bước 1: Tính giá trị z tại điểm trên của khoảng

z = (1100 - 1090)/14.6= 0.68


Step 2: Tìm diện tích dưới đường cong về bên trái của
điểm trên.
P(z < 0.68) = 0.7517

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
29
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của x
 Ví dụ : Đại học St. Andrew’s

Xác suất tích lũy đối với


Phân Phối Chuẩn chuẩn hóa
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
. . . . . . . . . . .
.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
. . . . . . . . . . .

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
30
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của x
 Ví dụ : Đại học St. Andrew’s

Phân phối
Mẫu  x  14.6
của x
đối với
điểm SAT

Diện tích
= 0.7517
x
1090 1100

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
31
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của x
 Ví dụ : Đại học St. Andrew’s
Bước 3 : Tính giá trị z tại điểm dưới của khoảng

z = (1080 - 1090)/14.6= -0.68


Bước 4: Tìm diện tích dưới đường cong về bên trái của
điểm dưới.
P(z < -0.68) = 0.2483

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
32
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của x đối với các điểm SAT
 Ví dụ : Đại học St. Andrew’s

Phân phối
Mẫu  x  14.6
của
đối với
điểm SAT

Diện tích
= 0.2483
x
1080 1090

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
33
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của x đối với các điểm SAT
 Ví dụ : Đại học St. Andrew’s
Bước 5: Tính diện tích dưới đường cong giữa các điểm
trên và dưới của khoảng.
P(-0.68 < z < 0.68) = P(z < 0.68) - P(z < -0.68)
= 0.7517 - 0.2483
= 0.5034
Xác suất để trung bình mẫu của điểm SAT sẽ nằm
giữa 1080 và 1100 là:

P(1080 < x < 1100) = 0.5034

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
34
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của x đối với các điểm SAT
 Ví dụ : Đại học St. Andrew’s

Phân phối
Mẫu  x  14.6
của x
đối với
điểm SAT Diện tích
= 0.5034

x
1080 1090 1100

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
35
or duplicated, or posted to a publicly accessible website, in whole or in part.
Mối Quan Hệ Giữa Cỡ Mẫu
và Phân Phối Mẫu của x
 Ví dụ : Đại học St. Andrew’s
• Giả sử chúng ta chọn một mẫu ngẫu nhiên đơn giản
gồm 100 ứng viên thay vì 30 như ban đầu.
• E(x) = m bất chấp cỡ mẫu. Trong ví dụ của chúng ta,
E(x ) vẫn là 1090.
• Bất cứ khi nào cỡ mẫu tăng lên, sai số chuẩn của
trung bình  x giảm xuống. Với mẫu tăng lên thành
n = 100, sai số chuẩn của trung bình giảm xuống
từ 14.6 thành :
 80
x    8.0
n 100

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
36
or duplicated, or posted to a publicly accessible website, in whole or in part.
Mối Quan Hệ Giữa Cỡ Mẫu
và Phân Phối Mẫu của x
 Ví dụ : Đại học St. Andrew’s

Với n = 100,
x  8

Với n = 30,
 x  14.6

x
E( x )  1090
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
37
or duplicated, or posted to a publicly accessible website, in whole or in part.
Mối Quan Hệ Giữa Cỡ Mẫu
và Phân Phối Mẫu của x
 Ví dụ : Đại học St. Andrew’s
• Nhắc lại là khi n = 30, P(1080 < x < 1100) = 0.5034.
• Chúng ta theo các bước giống hệt khi n = 30
để giải tìm P(1080 < x < 1100) khi n = 100.

• Giờ đây, với n = 100, P(1080 < x < 1100) = 0.7888.


• Vì phân phối mẫu với n = 100 có sai số chuẩn nhỏ
hơn nên các giá trị của x có ít biến thiên hơn và có
khuynh hướng gần với trung bình tổng thể hơn
các giá trị của x với n = 30.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
38
or duplicated, or posted to a publicly accessible website, in whole or in part.
Mối Quan Hệ Giữa Cỡ Mẫu
và Phân Phối Mẫu của x
 Ví dụ : Đại học St. Andrew’s

Phân phối x  8
Mẫu
của x
đối với
điểm SAT
Diện tích
= 0.7888

x
1080 1090 1100
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
39
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của p
 Thực hiện các suy diễn về Tỷ Lệ Tổng Thể

Tổng thể Một mẫu ngẫu nhiên gồm


với tỷ lệ n phần tử được chọn
p=? từ tổng thể.

Giá trị của p được dùng Dữ liệu mẫu


để suy diễn về Cung cấp một giá trị
giá trị của p. cho tỷ lệ mẫu p

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
40
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của p

Phân hối mẫu của p là phân phối xác suất của tất cả
các giá trị có thể có của tỷ lệ mẫu p .

• Giá trị kỳ vọng của p

E ( p)  p

Trong đó:
p = tỷ lệ tổng thể

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
41
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của p
• Độ lệch chuẩn của p
Tổng thể hữu hạn Tổng thể vô hạn

N n p (1  p) p(1  p )
p  p 
N 1 n n

•  p được xem như sai số chuẩn của tỷ lệ.

• ( N  n ) / ( N  1) là hệ số hiệu chỉnh tổng thể


hữu hạn.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
42
or duplicated, or posted to a publicly accessible website, in whole or in part.
Dạng Phân Phối Mẫu của p

Phân phối mẫu của p có thể xấp xỉ một phân phối


chuẩn bất cứ khi nào cỡ mẫu đủ lớn để thỏa mãn
hai điều kiện:

np > 5 và n(1 – p) > 5

. . . Vì khi các điều kiện này thỏa mãn, phân phối


xác suất của x trong tỷ lệ mẫu,p = x/n, có thể xấp xỉ
phân phối chuẩn (và vì n là một hằng số).

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
43
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của p
 Ví dụ : Đại học St. Andrew’s
Nhắc lại là 72% sinh viên tương lai nộp đơn vào đại
Học St. Andrew’s muốn ở ký túc xá.
Xác suất để một mẫu ngẫu nhiên đơn giản gồm
30 ứng viên sẽ cho một ước lượng của tỷ lệ tổng thể
ứng viên muốn ở ký túc xá nằm trong vòng cộng
trừ 0.05 so với tỷ lệ tổng thể thực sự là bao nhiêu?

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
44
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của p
 Ví dụ : Đại học St. Andrew’s
Ví dụ của chúng ta, với n = 30 và p = 0.72, phân phối
chuẩn là một xấp xỉ có thể chấp nhận được vì:

np = 30(0.72) = 21.6 > 5



n(1 - p) = 30(0.28) = 8.4 > 5

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
45
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của p
 Ví dụ : Đại học St. Andrew’s

Phân Phối .72(1  .72)


Mẫ u p   .082
30
của p

p
E( p )  .72

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
46
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của p
 Ví dụ : Đại học St. Andrew’s
Bước 1: Tính giá trị z tại điểm trên của khoảng.

z = (0.77 - 0.72)/0.082 = 0.61


Bước 2: Tìm diện tích dưới đường cong về bên trái
điểm trên.
P(z < 0.61) = 0.7291

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
47
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của p
 Ví dụ : Đại học St. Andrew’s
Xác suất tích lũy với
Phân Phối Chuẩn chuẩn hóa
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
. . . . . . . . . . .
.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
. . . . . . . . . . .

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
48
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của p
 Ví dụ : Đại học St. Andrew’s

Phân Phối  p  .082


Mẫ u
của p

Diện tích
= 0.7291

p
0.72 0.77

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
49
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của p
 Ví dụ : Đại học St. Andrew’s
Bước 3: Tính giá trị z tại điểm dưới của khoảng.

z = (0.67 - 0.72)/0.082 = - 0.61


Bước 4: Tìm diện tích dưới đường cong về bên trái
điểm dưới.
. P(z < - 0.61) = 0.2709

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
50
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của p
 Ví dụ : Đại học St. Andrew’s

Phân Phối  p  .082


Mẫ u
của p

Diện tích
= 0.2709

p
0.67 0.72

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
51
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của p
 Ví dụ : Đại học St. Andrew’s
Bước 5: Tính diện tích dưới đường cong giữa các điểm
trên và dưới của khoảng.
P(-0.61 < z < 0.61) = P(z < 0.61) - P(z < -0.61)
= 0.7291 - 0.2709
= 0.4582
Xác suất tỷ lệ mẫu của các ứng viên muốn ở ký túc xá sẽ
nằm trong vòng +/- 0.05 so với tỷ lệ tổng thể thực sự :

P(0.67 < p< 0.77) = 0.4582

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
52
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân Phối Mẫu của p
 Ví dụ : Đại học St. Andrew’s

Phân Phối  p  .082


Mẫ u
của p

Diện tích
= 0.4582

p
.67 .72 .77

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
53
or duplicated, or posted to a publicly accessible website, in whole or in part.
Các Tính Chất của các Ước Lượng Điểm
 Trước khi sử dụng một thống kê mẫu như một tham số
ước lượng điểm, các nhà thống kê cần kiểm tra để biết
thống kê mẫu có các tính chất sau đây gắn liền với các
tham số ước lượng điểm tốt hay không.
• Tính không chệch
• Tính hiệu quả
• Tính vững

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
54
or duplicated, or posted to a publicly accessible website, in whole or in part.
Các Tính Chất của các Ước Lượng Điểm
 Không chệch
Nếu giá trị kỳ vọng của thống kê mẫu bằng với
tham số tổng thể đang được ước lượng, thống kê mẫu
được gọi là một tham số ước lượng không chệch của
tham số tổng thể.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
55
or duplicated, or posted to a publicly accessible website, in whole or in part.
Các Tính Chất của các Ước Lượng Điểm
 Tính hiệu quả
Giả sử cần lựa chọn hai tham số ước lượng điểm
không chệch của cùng tham số tổng thể, chúng ta sẽ
thích sử dụng tham số ước lương điểm có độ lệch
chuẩn nhỏ hơn, vì nó có xu hướng cho ra các ước
lượng gần với tham số tổng thể hơn.
Tham số ước lương điểm có độ lệch chuẩn nhỏ hơn
được gọi là có tính hiệu quả tương đối lớn hơn tham số
còn lại.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
56
or duplicated, or posted to a publicly accessible website, in whole or in part.
Các Tính Chất của các Ước Lượng Điểm
 Tính vững
Một tham số ước lượng điểm là vững nếu các giá
trị của ước lượng điểm có xu hướng trở nên gần hơn
tham số tổng thể khi cỡ mẫu trở nên lớn hơn.
Nói cách khác, cỡ mẫu lớn có xu hướng cho một
ước lượng điểm tốt hơn một cỡ mẫu nhỏ.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
57
or duplicated, or posted to a publicly accessible website, in whole or in part.
Các Phương Pháp Lấy Mẫu Khác
 Lấy mẫu phân tầng
 Lấy mẫu cụm (cả khối)
 Lấy mẫu hệ thống
 Lấy mẫu thuận tiện
 Lấy mẫu phán đoán

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
58
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lấy Mẫu Ngẫu Nhiên Phân Tầng

Đầu tiên tổng thể được chia thành các nhóm phần tử
gọi là các tầng.

Mỗi phần tử trong tổng thể thuộc một và chỉ một tầng.

Các kết quả tốt nhất đạt được khi các phần tử trong
mỗi tầng tương tự càng nhiều càng tốt
(nghĩa là, phần tử trong cùng nhóm thì thuần nhất).

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
59
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lấy Mẫu Ngẫu Nhiên Phân Lớp

Một mẫu ngẫu nhiên đơn giản được lấy từ mỗi tầng.

Các công thức có sẵn kết hợp các kết quả mẫu tầng
thành một ước lượng tham số tổng thể.

Thuận lợi : Nếu các tầng thuần nhất, phương pháp này
“chính xác ” như lấy mẫu ngẫu nhiên đơn giản nhưng
với cỡ mẫu nhỏ hơn.

Ví dụ : Cơ sở để thành lập tầng có thể là bộ phận, vị trí,


tuổi tác, ngành công nghiệp …

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
60
or duplicated, or posted to a publicly accessible website, in whole or in part.
Mẫu Cụm (khối)

Đầu tiên tổng thể được chia thành các nhóm riêng lẻ
gồm các phần tử gọi là các cụm.
Một cách lý tưởng, mỗi cụm là một phiên bản qui mô
nhỏ đại diện của tổng thể (nghĩa là nhóm không
thuần nhất).
Một mẫu nhiên đơn giản gồm các cụm được lấy.

Tất cả các phần tử nằm trong mỗi cụm được chọn


tạo nên mẫu.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
61
or duplicated, or posted to a publicly accessible website, in whole or in part.
Mẫu Cụm (khối)

Ví dụ: Một ứng dụng cơ bản là lấy mẫu theo vùng,


ở đó các cụm là các khối nhà thành phố hay các
vùng xác định khác.

Ưu điểm: Các phần tử ờ gần nhau có thể là hiệu quả


về chi phí (nghĩa là, nhiều quan sát trong mẫu có thể
có được trong thời gian ngắn)

Nhược điểm: Phương pháp này nói chung yêu cầu cỡ


mẫu lớn hơn mẫu ngẫu nhiên đơn giản hay phân tầng.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
62
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lấy Mẫu Hệ Thống

Nếu một mẫu cỡ n được yêu cầu từ một tổng thể chứa
N phần tử, chúng ta có thể lấy mẫu một phần tử cho
mỗi n/N phần tử trong tổng thể.

Chúng ta chọn ngẫu nhiên một phần tử trong N/n


phần tử đầu tiên từ danh sách tổng thể.

Sau đó chúng ta chọn mỗi phần tử thứ N/n


tiếp theo trong danh sách tổng thể.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
63
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lấy Mẫu Hệ Thống

Phương pháp này có các tính chất của một mẫu ngẫu
nhiên đơn giản, đặc biệt nếu danh sách các phần tử
tổng thể là một sự sắp xếp ngẫu nhiên.

Ưu điểm: Mẫu này thường dễ xác định hơn mẫu sử


dụng phương pháp lấy mẫu ngẫu nhiên.

Ví dụ: Chọn mỗi số điện thoại thứ 100 trong danh


bạ điện thoại sau khi số điện thoại ngẫu nhiên
đầu tiên được chọn.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
64
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lấy Mẫu Thuận Tiện

Đó là một kỹ thuật lấy mẫu phi xác suất. Các phần tử


được bao gồm trong mẫu không biết xác suất được
chọn là bao nhiêu.

Mẫu được xác định cơ bản bằng sự thuận tiện.

Ví dụ: Một giáo sư đang hướng dẫn nghiên cứu có thể


sử dụng các sinh viên tình nguyện để thiết lập một mẫu.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
65
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lấy Mẫu Thuận Tiện

Ưu điểm: Việc chọn mẫu và dữ liệu thu thập tương đối


dễ dàng.

Nhược điểm : Không thể xác định được mẫu đại diện
như thế nào cho tổng thể.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
66
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lấy Mẫu Phán Đoán

Người hiểu biết nhiều nhất về vấn đề nghiên cứu chọn


các phần tử của tổng thể mà người ấy cảm thấy là
đại diện nhiều nhất cho tổng thể.

Nó là một kỹ thuật lấy mẫu phi xác suất.

Ví dụ : Một phóng viên có thể lấy mẫu ba hay bốn


thượng nghị sĩ, xét đoán họ như đang phản ánh ý kiến
chung của thượng viện.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
67
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lấy Mẫu Phán Đoán

Ưu điểm: Nó là cách chọn mẫu tương đối dễ.

Nhược điểm: Chất lượng của các kết quả mẫu


phụ thuộc vào sự phán đoán của người chọn mẫu.

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
68
or duplicated, or posted to a publicly accessible website, in whole or in part.
Lời khuyên

Người ta khuyên dùng các phương pháp lấy mẫu


xác suất (ngẫu nhiên, phân lớp, cụm, hệ thống).

Đối với các phương pháp này, các công thức có sẵn
để đánh giá “tính tốt” của mẫu dẫn đến các điều kiện
để các kết quả gần với các tham số tổng thể đang
được ước lượng.

Sự đánh giá về tính tốt không thể thực hiện với


phương pháp lấy mẫu phi xác suất (thuận tiện
hay phán đoán).

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
69
or duplicated, or posted to a publicly accessible website, in whole or in part.
Hết Chương 7

© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
70
or duplicated, or posted to a publicly accessible website, in whole or in part.

You might also like