You are on page 1of 25

Một số khái niệm về mẫu

1. Tổng thể
Tập hợp tất cả các phần tử để nghiên cứu theo 1 dấu hiệu nào đó
gọi là tổng thể.
Số lượng phần tử của tổng thể được gọi là kích thước của tổng
thể. Ký hiệu: N.
Đại lượng ngẫu nhiên đặc trưng cho dấu hiệu nghiên cứu (định
tính hoặc định lượng) gọi là ĐLNN gốc X.
2. Mẫu
Từ tổng thể lấy ngẫu nhiên ra n phần tử để nghiên cứu được gọi
là lấy 1 mẫu kích thước n.
Mẫu được chọn ngẫu nhiên một cách khách quan được gọi là
mẫu ngẫu nhiên.
TS. Nguyễn Văn Quang
11/17/2021 1
Đại học Công nghệ - ĐHQGHN
Một số khái niệm về mẫu
Tiến hành n quan sát độc lập về ĐLNN X ta được tập giá trị
𝑥1 , 𝑥2 , … , 𝑥𝑛 . Số n gọi là cỡ mẫu (kích thước mẫu).
Có thể coi mẫu ngẫu nhiên cỡ n là n ĐLNN độc lập, cùng phân
bố với ĐLNN X và 𝑥1 , 𝑥2 , … , 𝑥𝑛 là giá trị cụ thể mà các ĐLNN
𝑋1 , 𝑋2 , … , 𝑋𝑛 nhận được. Việc coi như vậy để có thể áp dụng
định lý giới hạn trung tâm trong một số bài toán kiểm định, ước
lượng.
• Mẫu định tính: mẫu chỉ quan tâm đến các phần tử của nó có
tính chất A nào đó hay không.
• Mẫu định lượng: mẫu quan tâm đến các yếu tố về lượng (như
chiều cao, cân nặng…) của các phần tử có trong mẫu.

TS. Nguyễn Văn Quang


11/17/2021 2
Đại học Công nghệ - ĐHQGHN
Các phương pháp mô tả mẫu
1. Bảng phân bố tần số mẫu
Từ 1 mẫu cụ thể của mẫu ngẫu nhiên kích thước n, ta sắp xếp các
giá trị của mẫu cụ thể theo thứ tự tăng dần, giả sử giá trị xi xuất
hiện với tần số ni , i = 1,…,k.

X x1 x2 … xk
Tần số ni n1 n2 … nk

k
x1  x2   xk ;  ni  n
i 1

TS. Nguyễn Văn Quang


11/17/2021 3
Đại học Công nghệ - ĐHQGHN
Các phương pháp mô tả mẫu
ai  bi
Chú ý:  ai , bi   xi  (1 khoảng tương ứng với trung
2
điểm của nó).
Ví dụ: Đo chiều cao X (cm) của 100 người ta có số liệu ở dạng
khoảng như sau:
X 148-152 152-156 156-160 160-164 164-168
ni 5 20 35 25 15
Bảng phân bố tần số mẫu có dạng:
X 150 154 158 162 166
ni 5 20 35 25 15

TS. Nguyễn Văn Quang


11/17/2021 4
Đại học Công nghệ - ĐHQGHN
Các phương pháp mô tả mẫu
Chú ý: Đối với trường hợp số liệu được cho dưới dạng liệt kê thì
ta sắp xếp lại ở dạng bảng tần số.
Ví dụ: Theo dõi mức nguyên liệu hao phí để sản xuất ra 1 đơn vị
sản phẩm ở 1 nhà máy, ta thu được số liệu sau (đơn vị: gam):
20 22 21 20 22 22 20 19 20 22 21
19 19 20 18 19 20 20 18 19 20 20
21 20 18 19 19 21 22 21 21 20 19
Xắp xếp số liệu trên dưới dạng bảng tần số:
X 18 19 20 21 22
ni 3 8 11 6 5
TS. Nguyễn Văn Quang
11/17/2021 5
Đại học Công nghệ - ĐHQGHN
Các phương pháp mô tả mẫu
2. Bảng phân bố tần suất mẫu
 ni
Tần suất xuất hiện giá trị xi là fi = ni/n , i = 1,…,k.  fi  n
X x1 x2 … xk  k
 f i  1
Tần suất fi f1 f2 … fk  i 1
Ví dụ: Giá trị quan sát của 1 mẫu ngẫu nhiên được biểu diễn
bằng bảng phân bố tần số mẫu:
X 31 34 35 36 38 40 42 44 
ni 10 20 30 15 10 10 5 20 120
Bảng phân bố tần suất mẫu tương ứng:
X 31 34 35 36 38 40 42 44 
fi 1/12 1/6 1/4 1/8 1/12 1/12 1/24 1/6 1
TS. Nguyễn Văn Quang
11/17/2021 6
Đại học Công nghệ - ĐHQGHN
Các đặc trưng của mẫu
Giả sử dấu hiệu nghiên cứu X có   EX , 2  DX .
1. Trung bình mẫu
Xét mẫu ngẫu nhiên W   X 1 , X 2 ,.., X n  của ĐLNN X.
Trung bình của mẫu W là biến ngẫu nhiên có dạng:
1 n 1 k k
X   X i 
mau cu the
 x   ni  xi ;  ni  n
n i 1 n i 1 i 1

1 n n
Tính chất: EX   EX i     EX
n i 1 n
1 n n 2  2 DX
DX  2  DX i  2  
n i 1 n n n
TS. Nguyễn Văn Quang
11/17/2021 7
Đại học Công nghệ - ĐHQGHN
Các đặc trưng của mẫu
2. Phương sai mẫu
Xét mẫu ngẫu nhiên W   X 1 , X 2 ,.., X n  của ĐLNN X.
Phương sai của mẫu W là biến ngẫu nhiên có dạng:
n
S   Xi  X 
ˆ 2 1 2

n i 1

n
Tính chất: S   X i   X  
1
ˆ  sˆ  x   x 
2 2 2 mau cu the 2 2 2

n i 1
1 k k
  ni  xi2   x  ;  ni  n
2

n i 1 i 1

TS. Nguyễn Văn Quang


11/17/2021 8
Đại học Công nghệ - ĐHQGHN
Các đặc trưng của mẫu

n ˆ2
Phương sai mẫu hiệu chỉnh: S  2
S
n 1

 
Tính chất: E S 2   2  DX
Cho mẫu cụ thể  x1 ,..., xn  , phương sai mẫu hiệu chỉnh:
n 2
s 
2

n 1

sˆ  sˆ 2 : độ lệch mẫu.

s  s 2 : độ lệch mẫu hiệu chỉnh.


TS. Nguyễn Văn Quang
11/17/2021 9
Đại học Công nghệ - ĐHQGHN
Các đặc trưng của mẫu
2. Tỷ lệ mẫu

Xét mẫu ngẫu nhiên W   X 1 , X 2 ,.., X n  của ĐLNN 𝑋~𝐵 𝑝 .

1, khi phan tu co tinh chat A


 Xi B  p , Xi  
0, khi phan tu khong co tinh chat A

X1   Xn
Tỷ lệ phần tử A của mẫu là: F 
n
p 1  p 
Tính chất: E  F   p ; D  F  
n

TS. Nguyễn Văn Quang


11/17/2021 10
Đại học Công nghệ - ĐHQGHN
Liên hệ giữa đặc trưng của mẫu và tổng thể
Định nghĩa: Giả sử có mẫu ngẫu nhiên  X 1 , X 2 ,.., X n  lấy từ đại
lượng ngẫu nhiên gốc X.

Hàm số T  X 1 , X 2 ,.., X n  được gọi là thống kê hay đại lượng


thống kê.
Do đó, thống kê T cũng là ĐLNN tuân theo quy luật phân bố xác
suất nhất định, có các tham số đặc trưng như E(T), D(T).
Khi mẫu ngẫu nhiên nhận giá trị cụ thể  x1 , x2 ,.., xn  thì thống kê
T cũng nhận giá trị cụ thể, gọi là giá trị quan sát tqs  T  x1 , x2 ,.., xn 
Tính chất: Các đặc trưng mẫu X , S 2 , F là các thống kê dùng để
nghiên cứu các đặc trưng  ,  , p tương ứng của tổng thể. Từ
2

luật số lớn ta có: X   , S 2   2 , F  p (theo xác suất).


TS. Nguyễn Văn Quang
11/17/2021 11
Đại học Công nghệ - ĐHQGHN
Phân bố xác suất của trung bình mẫu
Gọi  X 1 , X 2 ,.., X n 
là mẫu ngẫu nhiên lấy từ ĐLNN X.

1. X
 
N   ,  : X N   ,  
2
2
  X   n
N  0,1
 n  
Chú ý: Trong trường hợp chưa biết 𝜎 2 thì:
X   n
T  n  1 : Phân bố Student với (n-1) bậc tự do
S

2. Mẫu cỡ lớn n  30 : X
 2 
N  ,  
 X   n
N  0,1
 n  

Chú ý: Trong trường hợp chưa biết 𝜎2 thì:


 X   n
N  0,1
S
TS. Nguyễn Văn Quang
11/17/2021 12
Đại học Công nghệ - ĐHQGHN
Phân bố xác suất của trung bình mẫu

W1  X 11 , X 12 ,.., X 1n
 
Xét 2 mẫu ngẫu nhiên 
1


W2  X 21 , X 22 ,.., X 2 n2 

của 2 ĐLNN gốc: X 1 N 1 , 1 , X 2 N 2 , 2
2
 2
 
Tính chất: 1. Mọi tổ hợp tuyến tính của các ĐLNN có phân bố
chuẩn cũng tạo nên ĐLNN có phân bố chuẩn.
 12  22
 
2. E X 1  X 2  1  2 , D X 1  X 2    n1

n2

3.
 X 1 
 X 2   1  2 
N  0,1
 2
 2
1
 2
n1 n2
TS. Nguyễn Văn Quang
11/17/2021 13
Đại học Công nghệ - ĐHQGHN
Phân bố xác suất của trung bình mẫu
4. Khi  12   22 (chưa biết):

X 1 
 X 2   1  2 
T  n1  n2  2 
 n1  1 S1  n2  1 S
2

1 1

2
2

n1  n2  2 n1 n2

Mẫu cỡ lớn n1  30, n2  30 :

X 1 
 X 2   1  2 
N  0,1
 n1  1 S 1
2
  n2  1 S

2
1 1
2

n1  n2  2 n1 n2
TS. Nguyễn Văn Quang
11/17/2021 14
Đại học Công nghệ - ĐHQGHN
Phân bố xác suất của trung bình mẫu
Ví dụ: Chiều cao X của các nam SV là ĐLNN có phân bố
chuẩn với trung bình 163cm, độ lệch chuẩn 3cm. Lấy 80 mẫu
của mẫu ngẫu nhiên 25 SV.
a. Tính kỳ vọng, phương sai của trung bình mẫu.
b. Có bao nhiêu mẫu trong số 80 mẫu lấy giá trị trung bình
trong khoảng từ 161.86cm đến 163.3cm.
c. Có bao nhiêu mẫu trong số 80 mẫu lấy giá trị trung bình nhỏ
hơn 161.4cm.

2
32
a. Ta có: E  X     163 , D  X     0.36
n 25
b. Ta có:
 X  163 25
N  0,1
3
TS. Nguyễn Văn Quang
15
11/17/2021 Đại học Công nghệ - ĐHQGHN
Phân bố xác suất của trung bình mẫu
Do đó: P 161.86  X  163.3 
 163.3  163 25   161.86  163 25 
 0     0  
 3 3
   
  0  0.5    0  1.9    0  0.5    0 1.9   0.6628
Số mẫu: 80  0.6628  53.024  53 mẫu.
 161.4  163 25 
c. P  X  161.4   0.5   0  
 3
 
 0.5   0  2.67   0.5   0  2.67   0.0038

Số mẫu: 80  0.0038  0.304  1, không có mẫu nào.


TS. Nguyễn Văn Quang
16
11/17/2021 Đại học Công nghệ - ĐHQGHN
Phân bố xác suất của tần suất mẫu
Xét mẫu ngẫu nhiên W   X 1 , X 2 ,.., X n  của ĐLNN 𝑋~𝐵 𝑝 .

1, khi phan tu co tinh chat A


Xi B  p , Xi  
0, khi phan tu khong co tinh chat A
X1   Xn
Tỷ lệ phần tử A của mẫu là: F 
n
Với mẫu có kích thước lớn, khi đó:
 p 1  p    np  5, n(1  p)  5
F N  p,  khi 
 n   np(1  p)  20

Hay:
 F  p n
N  0,1
p(1  p)
TS. Nguyễn Văn Quang
11/17/2021 17
Đại học Công nghệ - ĐHQGHN
Phân bố xác suất của tần suất mẫu

W1  X 11 , X 12 ,.., X 1n
 
Xét 2 mẫu ngẫu nhiên 
1


W2  X 21 , X 22 ,.., X 2 n2 
của 2 ĐLNN gốc: X 1 B  p1  , X 2 B  p2 
p1q1 p2 q2
Tính chất: E  F1  F2   p1  p2 , D  F1  F2   
n1 n2
Với 2 mẫu có kích thước 𝑛1 ≥ 30, 𝑛2 ≥ 30, khi đó:
 p1 1  p1  p2 1  p2  
F1  F2 N  p1  p2 ,  
 n1 n 2 
 F1  F2    p1  p2  N  0,1
Hay:
p1 (1  p1 ) p2 (1  p2 )

n1 n2
TS. Nguyễn Văn Quang
11/17/2021 18
Đại học Công nghệ - ĐHQGHN
Phân bố xác suất của tần suất mẫu
Ví dụ: Gieo 120 lần đồng xu cân đối, đồng chất.
a. Tính xác suất tỷ lệ mặt sấp xuất hiện trong khoảng từ 0.4
đến 0.6.
b. Tính xác suất tỷ lệ mặt sấp xuất hiện lớn hơn hoặc bằng 5/8.
c. 1 nhóm 500 người, mỗi người gieo 120 lần đồng xu. Có bao
nhiêu người có kết quả tỷ lệ mặt sấp xuất hiện trong khoảng từ
0.4 đến 0.6.
Giải: Mỗi lần gieo đồng xu là việc thực hiện phép thử Bernoulli
với sự thành công chính là việc xuất hiện mặt sấp. Xác suất thành
công là 0.5. Mặt sấp xuất hiện là ĐLNN X  X B  0.5  .
Gieo 120 lần là lấy mẫu ngẫu nhiên kích thước 120 của ĐLNN
gốc X. Do đó tỷ lệ mặt sấp xuất hiện: F   X 1   X 120  120.
TS. Nguyễn Văn Quang
19
11/17/2021 Đại học Công nghệ - ĐHQGHN
Phân bố xác suất của tần suất mẫu
Ta có: n  120, np  nq  60  5.

Do đó:
 F  p n
N  0,1
p(1  p)
 0.6  0.5   0.4  0.5 
a. P  0.4  F  0.6    0    0  
 0.046   0.046 
  0  2.174    0  2.174   2   0  2.174   0.97

5   5 8  0.5 
b. P   F   0.5   0  
 8   0.046 
 0.5   0  2.72   0.0033

c. Số người: 500  0.97  485 người.


TS. Nguyễn Văn Quang
20
11/17/2021 Đại học Công nghệ - ĐHQGHN
Giá trị tới hạn
1. Giá trị tới hạn của chuẩn bố chuẩn tắc N(0,1)
Cho ĐLNN Z có phân bố chuẩn tắc Z N  0,1 .

Giá trị tới hạn chuẩn mức 𝛼 là z : P  Z  z   

Suy ra: P   z /2  Z  z /2   1  

TS. Nguyễn Văn Quang


11/17/2021 21
Đại học Công nghệ - ĐHQGHN
Giá trị tới hạn
 z   z1

Tính chất:  1 1
 0  z /2   2 ;  0  z   2  
Ví dụ: Cách tra bảng tìm z /2 , z :

1  0.05
 0  z0.05/2    0.475 tra bang
z0.05/2  1.96
2
1
 0  z0.05    0.05  0.45  tra bang
z0.05  1.65
2
Tương tự: z0.1/2  1.645 ; z0.1  1.285
z0.01/2  2.575 ; z0.01  2.325
TS. Nguyễn Văn Quang
11/17/2021 22
Đại học Công nghệ - ĐHQGHN
Bảng giá trị của hàm Φ0 𝑢

TS. Nguyễn Văn Quang


11/17/2021 23
Đại học Công nghệ - ĐHQGHN
Giá trị tới hạn
2. Giá trị tới hạn của phân bố Student T(n)
Cho ĐLNN T có phân bố Student với n bậc tự do.
Giá trị tới hạn mức 𝛼 với n bậc tự do là 𝑡𝛼,𝑛 : P T  t ,n   

 
Suy ra: P t /2,n  T  t /2,n  1   Giá trị tới hạn của
phân bố Student
Tính chất: t ,n  t1 ,n được tra trong bảng.

𝑡𝛼,𝑛
TS. Nguyễn Văn Quang
11/17/2021 24
Đại học Công nghệ - ĐHQGHN
Giá trị tới hạn 𝑡𝛼,𝑛 của phân bố Student
Ví dụ: 𝑡0.1,9 = 1.383

TS. Nguyễn Văn Quang


11/17/2021 25
Đại học Công nghệ - ĐHQGHN

You might also like