You are on page 1of 30

THỐNG KÊ TOÁN

(Mathematical Statistics)
Bui Duong Hai
Faculty of Mathematical Economics - NEU
haitkt@gmail.com
www.mfe.edu.vn/buiduonghai

1
STATISTICS FOR MANAGEMENT– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai
Tài liệu
 TÀI LIỆU
[1] Phạm Ngọc Hưng, Bùi Dương Hải (2022), Thống kê
toán, NXB ĐHKTQD.
[2] Nguyễn Cao Văn, Trần Thái Ninh, Ngô Văn Thứ
(2012), Giáo trình Lý thuyết xác suất và Thống kê
toán, NXB ĐHKTQD.
[3] Bùi Dương Hải (2016), Hướng dẫn sử dụng phần
mềm Microsoft Excel thực hành Xác suất thống kê,
tài liệu nội bộ.
[4] Bài tập hỗ trợ

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 2


Thực hành
 Phần mềm:
• Microsoft Excel - Data Analysis Toolpak
• R
• IBM SPSS Package

 Máy tính bấm tay


 Tài liệu và nguồn: www.mfe.edu.vn/buiduonghai :
*Program* > *Class*

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 3


NỘI DUNG HỌC PHẦN
 Bài 1. Khái niệm cơ bản
 Bài 2. Thống kê mô tả
 Bài 3. Phân phối Mẫu
 Bài 4. Ước lượng điểm
 Bài 5. Ước lượng khoảng
 Bài 6. Kiểm định giả thuyết một tham số
 Bài 7. Suy diễn trên hai mẫu
 Bài 8. Phân tích phương sai
 Bài 9. Kiểm định phi tham số
 Bài 10. Giới thiệu thống kê Bayes
THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 4
BÀI 1. KHÁI NIỆM CƠ BẢN
 Thống kê (Statistics) là gì?
Ý kiến (Opinion) Thống kê (Statistics)
Trong trường KTQD, có vẻ Trong số 16,000 sinh viên
số sinh viên nữ đông hơn KTQD, có 10,000 nữ (62.5%)
nam và 6,000 nam (37.5%).

Nhìn chung, khách càng


lớn tuổi thì chi cho đồ Tuổi 20-29 30-39 40+
công nghệ cao càng ít đi Chi bình
35 28 23
quân

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 5


Why statistics ?
Vấn đề (Problem) Thống kê (Statistics)
Có nên đầu tư vào ngành Return (%)
công nghệ cao, hơn là đầu Retail
Manufaturing
tư vào ngành khác? High-tech
Construction
0% 2% 4% 6% 8% 10% 12% 14% 16%

Năm 2022, liệu thị trường http://ptkt.vietstock.vn/


chứng khoán khả năng
phục hồi?

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 6


Thống kê có phải là sự thật?
 Có, và không!
 Thông tin đầu vào cho thống kê?
 Có thể bị chệch (biased)
 Khi chưa kiểm định đánh giá tính đúng đắn của thống
kê, kết luận có thể sai
 Cần quan tâm:
 Dữ liệu có chính xác?
 Phươưng pháp có phù hợp?

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 7


Thống kê
 Thu thập dữ liệu
 Xử lý dữ liệu
 Trình bày dữ liệu
 Phân tích dữ liệu để có thông tin có ý nghĩa hơn
 Suy diễn về thông tin

Thông tin Thông tin đã


ban đầu Thống kê phân tích
(Data) (kết quả)

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 8


Hai nhánh của Thống kê
 Thống kê mô tả (Descriptive Statistics): hệ thống, tổ
chức, sắp xếp thông tin, trình bày dưới các dạng phù
hợp và mang tính thông tin cao.
 Thống kê suy diễn (Inferential Statistics): phân tích,
ước lượng, dự đoán, kiểm định, đánh giá

Descriptive Inferential
Data Probability
Statistics Statistics

Normal Statistics Mathematical Statistics

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 9


Nguồn dữ liệu
 Dữ liệu sơ cấp (Primary data): do người nghiên cứu
thu thập, điều tra. Dữ liệu thô cần xử lý.
 Ưu: phù hợp mục đích, linh hoạt…
 Nhược: tốn kém, quy mô nhỏ, có thể sai số, bất khả
thi…
 Dữ liệu thứ cấp (Secondary data): từ các khảo sát đã
có, nguồn chính phủ, cơ quan có uy tín, mua.
 Ưu: quy mô lớn, các sai số đã được điều chỉnh
 Nhược: có thể không phù hợp mục đích, không khảo
sát được thêm

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 10


Tổng thể và Mẫu
 Tổng thể (Population): tập hợp
tất cả các đối tượng quan tâm 
 Kích thước: N, có thể vô hạn 
 Kết quả tính toán: tham số 

(parameter) 
×
 × ×
 × × ×
 Mẫu (Sample): bộ phận của  × × ×
tổng thể
   × × ×
 Kích thước: n, hữu hạn    × × ×
   × × ×
 Kết quả: thống kê (statistic)

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 11


Dữ liệu (Data) truyền thống
 Quan sát (observation) – Biến (variable) – Giá trị (value)

Biến
English Maths
No. Name Sex Age …
Mark Score
Qu 1 Anderson M 19 A 8 …
an
sát 2 Becky F 20 C 9 …

3 Charles M 20 B 7

… … … … … …. ….

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 12


Phân loại biến
 Định tính và Định lượng (Qualitative & Quantitative)
 Định tính (tiêu thức: categorical): gồm Định danh và
Thứ bậc
• Định danh (Nominal): Không thể so sánh giá trị
• Thứ bậc (Ordinal): Có thể so sánh giá trị nhưng
khoảng cách giá trị không xác định
• Riêng: Nhị phân (Binary) : chỉ có 2 giá trị

 Biến định tính có thể mã hóa thành con số

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 13


Phân loại biến
 Định lượng (Quantitative) hay thang đo (Scale):
• Rời rạc & Liên tục (Discrete vs Continuous)
 Rời rạc: Liệt kê được các giá trị
 Liên tục: không thể liệt kê
• Khoảng & Tỉ lệ (Interval vs Ratio):
 Khoảng: chỉ cộng trừ
 Tỉ lệ: nhân chia

 Liên tục và rời rạc có thể xấp xỉ qua nhau

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 14


Phân loại biến

Định tính Định lượng

Định danh Thứ bậc Rời rạc Liên tục


Liệt kê, phân Liệt kê, Khoảng Tỉ lệ
nhóm phân nhóm,
so sánh, Liệt kê, phân nhóm, xếp hạng
xếp hạng Tính toán: ±, , ÷, …

Mã hóa thành con số Sử dụng để xếp hạng

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 15


Phân loại biến: các mức độ đo lường

Có hơn 2 giá trị Nhị phân


No
Yes

So sánh được ? Định danh


No
Yes
Tính toán được Thứ bậc
No
Yes

Định lượng

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 16


NHẮC LẠI VỀ XÁC SUẤT
 Không gian biến cố sơ cấp (sample space)
 Biến cố (event) và độ đo xác suất (probability, prob.)
 ;
 Xác suất có điều kiện
 Tính độc lập:
• Độc lập toàn phần:
 Tính xung khắc:
• Xung khắc toàn phần:

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 17


Nhắc lại: Biến ngẫu nhiên
 Biến ngẫu nhiên một chiều X (random variable)
 BNN rời rạc: hàm khối lượng XS hay
 BNN nhiên liên tục: hàm mật độ xác suất
 Hàm phân phối (tích lũy) xác suất
 với BNN liên tục

 PMF: Probability mass function; PDF : Prob. density


function; CDF: Cumulative distribution function

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 18


Nhắc lại: Tham số đặc trưng
 Kì vọng toán:
 Phương sai:

 Độ lệch chuẩn:
 Mô-men bậc :
 Hiệp phương sai:

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 19


Nhắc lại: Tham số đặc trưng

 độc lập thì

 Hệ số tương quan

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 20


Nhắc lại: Một số phân phối xác suất
Phân phối Công thức tính xác suất
Bernoulli

Nhị thức

Poisson

Hình học

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 21


Nhắc lại: Một số phân phối xác suất
Phân phối Hàm mật độ
Đều

Chuẩn

Chuẩn hóa

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 22


Hội tụ của phân phối xác suất

 Tần suất:

 , độc lập:
 :
 :

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 23


Giá trị tới hạn mức
 Tới hạn Chuẩn :

 Tới hạn Student

 Tới hạn Khi-bình phương:


 Tới hạn Fisher:

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 24


Nhắc lại: Định lý Giới hạn trung tâm
Central Limit Theorem (CLT)
 độc lập cùng phân phối:
 i.i.d (identical independent distribution)

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 25


Nhắc lại: Phân phối Chuẩn
𝑓 (𝑥) X~N(,2) 𝑓 (𝑧) Z ~ N(0,1)

P(X < b) P(Z < b*)


 b b*
𝐹(𝑥) 𝐹(𝑧)
1

0.5
F(b) ∗
𝐹 𝑍 (𝑏 )
0
0
THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 26
Nhắc lại: Phân phối Chuẩn

𝟐
𝑿 𝑵 (𝝁 , 𝝈 ) 𝒁 𝑵 (𝟎,𝟏)

α α
1–α 1–α
 b = 0 zα

 Cần nhớ: ; ;

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 27


Ví dụ 1.1
 Giả thiết Nhiệt độ là biến ngẫu nhiên phân phối chuẩn,
với trung bình 100 (oC), phương sai 16 (oC)2.
 (a) Tính xác suất nhiệt độ nhỏ hơn 104 oC
 (b) Với xác suất 0,95 thì nhiệt độ tối đa bao nhiêu?
 (c) Với xác suất 0,9 thì nhiệt độ tối thiểu bao nhiêu?
 (d) Tìm ba khoảng để XS nhiệt độ rơi vào đó là 0,95
 (e) Trong số các khoảng có thể tìm trong câu (d),
khoảng nào có độ dài ngắn nhất
 (f) Tổng quát hóa câu (d) với giá trị trung bình là ,
phương sai , xác suất
THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 28
Bài tập về nhà
 Tra các giá trị tới hạn và viết xác suất tương ứng

Căn cứ vào bảng phân phối Chuẩn hóa, tìm

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 29


Hàm trong Excel và R
PP Giá trị Excel 2016 R
Norm.dist) dnorm
Norm.dist pnorm
Norm.inv qnorm
Norm.inv qnorm
dnorm,…
Chisq.dist pchisq
Chisq.inv qchisq
t.dist pt
t.inv qt
f.dist pf
f.inv qf

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 30

You might also like