You are on page 1of 48

NỘI DUNG HỌC PHẦN

 Bài 1. Khái niệm cơ bản


 Bài 2. Thống kê mô tả
 Bài 3. Phân phối Mẫu
 Bài 4. Ước lượng điểm
 Bài 5. Ước lượng khoảng
 Bài 6. Kiểm định giả thuyết một tham số
 Bài 7. Suy diễn trên hai mẫu
 Bài 8. Phân tích phương sai
 Bài 9. Kiểm định phi tham số
 Bài 10. Giới thiệu thống kê Bayes
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 1
BÀI 3. PHÂN PHỐI MẪU
 3.1. Tổng thể
 3.2. Mẫu ngẫu nhiên
 3.3. Thống kê
 3.4. Trung bình mẫu
 3.5. Phương sai
 3.6. Phương sai mẫu
 3.7. Mẫu nhiều chiều

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 2


3.1. TỔNG THỂ
 Đồng nhất dấu hiệu trong Tổng thể với một biến
ngẫu nhiên, gọi là biến ngẫu nhiên gốc.
 BNN gốc , nghiên cứu qua phân phối xác suất
 Phân phối xác suất hoặc
 Tham số đặc trưng
• Kỳ vọng: : trung bình tổng thể
• Phương sai: : phương sai tổng thể

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 3


Ví dụ
 Tổng thể về số chấm khi gieo xúc xắc

 Phân phối xác suất

 Tham số:

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 4


Hai trường hợp quan trọng
Trường hợp 1: Dấu hiệu Tổng thể: biến định tính, biến
Nhị phân: “Không” và “Có”
 Biến nhị phân
 Biến ngẫu nhiên gốc , tham số
 với
 ;
Tham số là:
– Xác suất, kỳ vọng,
– Trung bình tổng thể
– Tỉ lệ tổng thể (population proportion)

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 5


Hai trường hợp quan trọng
Trường hợp 2: Dấu hiệu Tổng thể là biến định lượng
phân phối Chuẩn

 : Trung bình tổng thể


 : Phương sai tổng thể
 : Độ lệch chuẩn tổng thể

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 6


Tham số tổng thể
Phân Tham số của Tham số đặc trưng tổng thể
Phối BNN gốc

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 7


3.2. MẪU NGẪU NHIÊN
Bài 3  Mẫu xây dựng trên lý
3.1. Tổng thể thuyết: Mẫu ngẫu nhiên
3.2. Mẫu ngẫu nhiên (random sample)
3.3. Thống kê  Đã thu thập thông tin, quan
3.4. Trung bình mẫu sát mẫu (observed sample):
3.5. Phương sai mẫu cụ thể, số liệu (data).
3.6. Phương sai mẫu
 Bắt đầu từ mẫu ngẫu nhiên,
3.7. Mẫu nhiều chiều
kết quả tính là Ngẫu nhiên.
 Thay số cụ thể được giá trị
quan sát.
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 8
Mẫu ngẫu nhiên (một chiều)
Biến ngẫu nhiên gốc
Định nghĩa: Mẫu ngẫu nhiên kích thước lập từ biến
ngẫu nhiên gốc là một biến ngẫu nhiên chiều

trong đó là các biến ngẫu nhiên độc lập và cùng quy


luật phân phối xác suất với biến ngẫu nhiên gốc
(i.i.d : independent and identically distributed)
Kí hiệu hoặc

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 9


Mẫu ngẫu nhiên
Đặt và :


Mỗi điểm là một quan sát mẫu, hay một mẫu cụ thể
(observed sample)
 Con số là giá trị quan sát của BNN
 Quan sát mẫu kích thước có n quan sát ( số).
Không gian mẫu: tập hợp các quan sát mẫu có thể có

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 10


Ví dụ
 Gieo xúc sắc: BNN gốc

Mẫu ngẫu nhiên Mẫu cụ thể

Min
TB

XS

XS

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 11


Ví dụ
Ví dụ 3.1. Biến ngẫu nhiên gốc là số chấm xuất hiện khi
gieo con xúc sắc đối xứng đồng chất
(a) Phân phối xác suất, tham số của ?
(b) Xác định quan sát mẫu, không gian mẫu, phân phối
xác suất với mẫu ngẫu nhiên kích thước
(c) Lập bảng phân phối xác suất của tổng hai giá trị thành
phần mẫu với mẫu ngẫu nhiên kích thước .
(d) Xác định không gian mẫu với mẫu ngẫu nhiên kích
thước

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 12


Phân phối xác suất Mẫu
BNN gốc rời rạc  Mẫu là BNN chiều rời rạc
Hàm khối lượng xác suất đồng thời

BNN gốc thuần liên tục  Mẫu là BNN chiều thuần


liên tục, có hàm mật độ xác suất đồng thời

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 13


3.3. THỐNG KÊ
Bài 3  Mẫu chứa thông tin của
3.1. Tổng thể Biến ngẫu nhiên gốc
3.2. Mẫu ngẫu nhiên  Chưa biết toàn bộ thông
3.3. Thống kê tin về , xét một cách lý
3.4. Trung bình mẫu thuyết qua mẫu (hay );
3.5. Phương sai
3.6. Phương sai mẫu
3.7. Mẫu nhiều chiều

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 14


Định nghĩa
Thống kê trên mẫu ngẫu nhiên là một hàm thực
trên mẫu đó.
Ký hiệu hàm là , Thống kê là

Thống kê với mẫu ngẫu nhiên là Biến ngẫu nhiên


 là BNN có quy luật phân phối xác suất
Với mẫu quan sát, Thống kê là Giá trị quan sát, giá
trị bằng số
Với quan sát mẫu thì

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 15


Ví dụ
 Ví dụ 2.2. : số chấm khi gieo xúc sắc,
 :;
 là ngẫu nhiên;
 Quan sát thì

2 3 4 5 6 7 8 9 10 11 12

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 16


Thống kê ngẫu nhiên
 Trung bình mẫu:
 Trung vị mẫu:
 Phương sai mẫu:
 Độ lệch chuẩn mẫu:

 Phân biệt với giá trị quan sát: là các con số cụ thể
tương ứng với mẫu cụ thể

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 17


Tính chất cần có của thống kê
 Khi dùng thống kê (trong mẫu) dùng để phản ánh về
Tham số (của tổng thể):
 (1) (Thống kê) = Tham số
 (2) (Thống kê) càng nhỏ càng tốt
 (3) Thống kê  Tham số khi kích thước mẫu  
 (4) (Thống kê)  rất nhỏ khi kích thước mẫu  
 (5) Phân phối liên hệ giữa Thống kê và Tham số được
xác định rõ ràng

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 18


3.4. TRUNG BÌNH MẪU
Bài 3  Biến ngẫu nhiên gốc .
3.1. Tổng thể  Mẫu ngẫu nhiên:
3.2. Mẫu ngẫu nhiên
3.3. Thống kê  Trung bình mẫu
3.4. Trung bình mẫu
3.5. Phương sai
3.6. Phương sai mẫu
3.7. Mẫu nhiều chiều
 Trung bình mẫu là biến ngẫu
nhiên

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 19


Kỳ vọng và phương sai của
 BNN gốc (Tổng thể) có: thì:

 gọi là Sai số chuẩn (Standard Error, SE) của trung


bình mẫu
 Kích thước mẫu càng lớn thì phương sai trung
bình mẫu càng nhỏ

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 20


Phân phối xác suất
 Nếu :

 Và hay

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 21


Ví dụ
Ví dụ 3.3
 Tiền lương pp Chuẩn, TB 200$, độ lệch chuẩn 40$
 (a) Tính xác suất Tiền lương TB của một mẫu lớn hơn
210, với
 (b) Với xác suất 0,9 tính mức lớn nhất của tiền lương
TB của 16 người
 (c) Với xác suất 0,9 tìm các khoảng để tiền lương TB
16 người rơi vào
 (d) Tổng quát hóa với , mẫu kích thước , mức xác suất

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 22


Ví dụ
 Phân phối của Trung bình mẫu
𝒏=𝟒 𝒏=𝟏𝟔

𝒏=𝟐𝟓

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 23


Phân phối xác suất

( ( ))
𝟐
𝝈
𝑿 𝑵 𝝁,
√𝒏

Z ~ N(0,1)

α α
1–α 1–α
 b = 0 zα

Cần nhớ: ; ;
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 24
Phân phối xác suất
 Nếu :
 : trung bình mẫu = tần suất mẫu

 Nếu thì:

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 25


Ví dụ
Ví dụ 3.4. Khả năng để một người mua hàng là 0.3.
(a) Mẫu , số người, tỉ lệ mua hàng phân phối?
(b) XS trong 400 người có hơn 124 người mua?
(c) XS trong 400 người có 118 đến 122 người mua?
(d) Với XS 0.95, tỉ lệ mua trong 400 người tối đa bao nhiêu?
(e) Với XS 0.95 tìm một khoảng để tỉ lệ mua trong 1000 người
rơi vào, vây quanh con số 0,3 ở trên.
(f) Xây dựng công thức tổng quát cho câu (d) với mọi khả
năng , kích thước mẫu , mức XS
(g) Với xác suất 0.9 tỉ lệ mua nhiều hơn 30% tối đa bao nhiêu?
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 26
Phân phối xác suất
 bất kỳ,
 Theo Định lý giới hạn trung tâm, Chuẩn
 Trong thực hành:

Ví dụ 2.5 Tổng thể phân phối Poisson với trung bình là


25. Tính xác suất trung bình của mẫu kích thước 100 là
nhỏ hơn 22.

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 27


2.5. PHƯƠNG SAI
Bài 3  Biến ngẫu nhiên gốc , có .
3.1. Tổng thể  Mẫu ngẫu nhiên:
3.2. Mẫu ngẫu nhiên
3.3. Thống kê  Phương sai
3.4. Trung bình mẫu
3.5. Phương sai  Phương sai là BNN
3.6. Phương sai mẫu
3.7. Mẫu nhiều chiều

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 28


Kỳ vọng và phương sai
 Phương sai là biến ngẫu nhiên
 Nếu BNN gốc :
 Momen trung tâm bậc là:

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 29


Phân phối xác suất
 Nếu thì

 Và : tỉ lệ với phân phối Khi-bình phương

Ví dụ 3.6. BNN gốc phân phối chuẩn phương sai bằng


16. Với xác suất 0,95 thì phương sai của mẫu kích
thước 25 tối đa bao nhiêu?
 Công thức tổng quát cho mọi , , xác suất

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 30


3.6. PHƯƠNG SAI MẪU
Bài 3  Biến ngẫu nhiên gốc .
3.1. Tổng thể
3.2. Mẫu ngẫu nhiên  Trung bình mẫu
3.3. Thống kê  Phương sai
3.4. Trung bình mẫu
3.5. Phương sai
3.6. Phương sai mẫu
3.7. Mẫu nhiều chiều
 Phương sai là biến ngẫu
nhiên

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 31


Trung bình bình phương sai lệch
 Mean of Squares

 Khi đó

 Dùng phản ánh cho sẽ bị “chệch xuống”

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 32


Phương sai mẫu
 Sample Variance

 Khi đó

 Mẫu cụ thể

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 33


Phân phối xác suất
 Nếu tổng thể phân phối Chuẩn

 tỉ lệ với phân phối Khi-bình phương

 Và

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 34


Tổng thể phân phối Chuẩn:
Biết Không biết
Biết Suy luận về qua:

Không Suy luận về qua


biết

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 35


Ví dụ
Ví dụ 3.7. BNN gốc phân phối chuẩn với phương sai 16.
(a) Với xác suất 0.95 thì phương sai mẫu S2 của mẫu kích
thước 25 tối đa bao nhiêu? Của mẫu kích thước 16 tối thiểu
bao nhiêu?
(b) Xây dựng công thức tổng quát giá trị tối đa, tối thiểu
của phương sai mẫu với mọi phương sai , kích thước
mẫu , xác suất
(c) Với xác suất 0.9 và mẫu kích thước 40 thì phương sai mẫu
lớn gấp tối đa bao nhiêu lần phương sai tổng thể?
(d) Với xác suất 0.99 và mẫu kích thước 60 thì phương sai
mẫu nhỏ nhất bằng bao nhiêu lần phương sai tổng thể?
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 36
2.7. MẪU NHIỀU CHIỀU
 Biến NN hai chiều
Bài 3
 Mẫu hai chiều kích thước
3.1. Tổng thể
rút từ BNN 2 chiều
3.2. Mẫu ngẫu nhiên
3.3. Thống kê
3.4. Trung bình mẫu Hay
3.5. Phương sai
3.6. Phương sai mẫu
3.7. Mẫu nhiều chiều

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 37


Thống kê trên mẫu hai chiều
 Thống kê thành phần
 Hiệp phương sai

 Hệ số tương quan

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 38


Mẫu nhiều chiều
 Biến ngẫu nhiên gốc chiều
 Mẫu ngẫu nhiên chiều kích thước

 Các trung bình thành phần


 Các phương sai thành phần
 Hiệp phương sai

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 39


Ma trận hiệp phương sai và tương quan
 Kí hiệu
 Ma trận

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 40


Số liệu mẫu hai chiều
 BNN gốc hai chiều , mẫu
 Dạng 1: Liệt kê:
 Dạng 2: Nếu nhóm theo các cặp giá trị có thể có với
số lượng tương ứng , có bảng phân phối tần số theo
cặp



THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 41


Số liệu mẫu hai chiều
 Dạng 3: Nếu có giá trị khác nhau ;
 có giá trị khác nhau ,
 Tần số tương ứng với cặp là ; dạng này gọi là bảng
tiếp liên (contingency table)

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 42


Ví dụ
Ví dụ 3.8. X, Y là điểm Microeconomics, Macroeconomics.
 Tính trung bình, phương sai mẫu của ;
 Hiệp phương sai, hệ số tương quan;
 Trung bình và phương sai của khi
5 6 7 8 9
6 5 8 6
7 10 12 4
8 10 8 5
9 6 5

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 43


Tóm tắt mẫu một chiều
BNN gốc Tham Mẫu Quan Quy luật Giá trị
(T. thể) số ngẫu sát liên hệ tới hạn
nhiên mẫu

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 44


Tóm tắt về Suy diễn thống kê
 , với mức xác suất
 Suy diễn cho trung bình mẫu

 Suy diễn cho phương sai mẫu

 Suy diễn cho tần suất mẫu

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 45


Thực hành Excel và R
Giá trị Excel R
norm.dist pnorm
Phân vị norm.inv qnorm
Tới hạn norm.inv qnorm
norm.dist dnorm)
norm.dist pnorm)
Phân vị norm.inv qnorm)
Tới hạn norm.inv qnorm
t.dist pt
Phân vị t.inv qt
Tới hạn t.inv qt
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 46
Thực hành Excel và R
Giá trị Excel R
chisq.dist pchisq
Phân vị chisq.inv qchisq
Tới hạn chisq.inv qchisq
f.dist pf)
Phân vị f.inv qf)
Tới hạn f.inv qf
binom.dist dbinom
binom.dist pbinom
poisson.dist dp
poisson.dist pp

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 47


Ví dụ: Sử dụng Excel và R
Ví dụ 2.9. Tính các giá trị và suy ra các liên quan

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 48

You might also like