Professional Documents
Culture Documents
Chương 1
Hoàng Trọng
Thống kê là gì?
• Tại sao phải “thống kê”
• Thống kê để làm gì?
• Thống kê là số liệu?
• Thống kê là phương pháp?
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 1
Hai lĩnh vực thống kê
• Thống kê mô tả:
– Thu thập số liệu
– Tính toán các đặc trưng đo lường
– Mô tả, trình bày dữ liệu
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 2
Ứng dụng của thống kê
• Kinh doanh
– Quy mô thị trường, phân khúc
– Nhu cầu, giá cả, phân phối,
– Đo lường cạnh tranh
– Đo lường kết quả kinh doanh, tiếp thị
– Dự báo kinh doanh…
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 3
Một số KN thường dùng trong thống kê
• Tổng thể (population): tập hợp các đơn vị/phần tử cần phân
tích/nghiên cứu
• Đơn vị tổng thể (unit): phần tử nhỏ nhất tạo thành tổng thể
• Mẫu: một phần của tổng thể được chọn ra để thu thập thông tin
• Tiêu thức, tiêu chí, biến: đặc điểm của đơn vị tổng thể dùng để
quan sát hay thu thập dữ liệu
– Tiêu thức/tiêu chí định tính: đặc điểm biểu hiện không phải là số
– Tiêu thức/tiêu chí định lượng: đặc điểm biểu hiện là các trị số, có
thể rời rạc hay liên tục
• Chỉ tiêu: trị số phản ảnh đặc điểm/tính chất trong điều kiện thời
gian và không gián xác định
– Chỉ tiêu khối lượng: biểu hiện quy mô khối lượng
– Chỉ tiêu chất lượng: biểu hiện tính chất, mức độ phổ biến
Xử lý số liệu:
Tập hợp, sắp xếp số liệu.
Chọn các phần mềm xử lý số liệu.
Phân tích thống kê sơ bộ.
Lựa chọn các phương phápphân tích thống kê
thích hợp.
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 4
Các loại thang đo
10
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 5
Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế
(Applied Statistics for Business & Economics)
Chương 2
Hoàng Trọng
Đi làm thêm
12
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 6
Dữ liệu định tính và dữ liệu định lượng
• Dữ liệu định tính: thu thập từ thang đo danh nghĩa và thứ bậc
-> không tính được trị trung bình
• Dữ liệu định lượng: thu thập từ thang đo khoảng cách và tỉ lệ
-> tính được trị trung bình
Döõ lieäu
14
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 7
Dữ liệu thứ cấp và dữ liệu sơ cấp
• Dữ liệu thứ cấp: nguồn có • Dữ liệu sơ cấp: thu thập
sẵn, đã được tổng hợp, xử trực tiếp, ban đầu, từ đối
lý tượng nghiên cứu
• Điểm mạnh: có sẵn, nhanh, • Điểm mạnh: phong phú, đáp
ít tốn kém ứng đúng nhu cầu nghiên
cứu
• Điểm yếu: ít chi tiết, ít đáp
ứng đúng nhu cầu nghiên • Điểm yếu: cần thời gian, tốn
cứu thống kê kém
15
16
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 8
Nguồn dữ liệu thứ cấp
• Nhiều dữ liệu thứ cấp đã được nhiều cơ quan chính phủ, các tổ
chức, các đơn vị nghiên cứu, các doanh nghiệp, trường học …
đưa lên mạng internet và người nghiên cứu có thể tìm thấy tại
các trang web của các đơn vị này hay tại các cơ sở dữ liệu trên
mạng internet.
• Dùng các máy tìm kiếm (search engine) như google, yahoo …
và các từ khóa (keywords) phù hợp dò tìm và chọn lọc các
nguồn tài liệu trên mạng internet.
• Để định vị nguồn dữ liệu thứ cấp hiệu quả, cần xác định rõ vấn
đề và mục tiêu của cuộc nghiên cứu để quyết định từ khóa phù
hợp. Từ khóa cần chi tiết và phản ảnh chính xác điều người
nghiên cứu cần tìm kiếm.
17
5. Báo cáo kết quả thực hiện tìm kiếm dữ liệu thứ cấp
18
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 9
Nguồn dữ liệu thứ cấp
Chính Phủ http://www.chinhphu.vn
Bộ Công Thương http://www.moi.gov.vn
Bộ Giáo Dục và Đào Tạo http://www.moet.gov.vn
Bộ Lao động - Thương binh – Xã hội http://www.molisa.gov.vn
Bộ Tư Pháp http://www.moj.gov.vn
Bộ Xây Dựng http://www.moc.gov.vn
Tổng Cục Thống Kê http://www.gso.gov.vn
Tổng Cục Thuế http://www.gdt.gov.vn
Ngân Hàng Nhà Nước http://www.sbv.gov.vn
TP Hà Nội http://www.hanoi.gov.vn
TP Hải Phòng http://www.haiphong.gov.vn
TP Đà Nẵng http://www.danang.gov.vn
Tỉnh Đồng Nai http://www.dongnai.gov.vn
Tỉnh Bình Dương http://www.binhduong.gov.vn
Tỉnh Bà Rịa-Vũng Tàu http://www.baria-vungtau.gov.vn
TP Cần Thơ http://www.cantho.gov.vn
TP Hồ Chí Minh http://www.hochiminhcity.gov.vn 19
20
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 10
Nguồn dữ liệu thứ cấp
Trang web về thống kê của Ủy Ban Kinh Tế Xã Hội http://www.unescap.org/stat/
Châu Á-Thái Bình Dương thuộc Liên Hiệp Quốc
Trang web của ủy ban Thống Kê của Liên Hợp Quốc http://unstats.un.org/unsd/default.htm
Trang web data của Liên Hợp Quốc http://data.un.org/
Trang web của IMF http://www.imf.org/external/index.htm
Trang web của World Bank http://www.worldbank.org/
Trang web của Ngân hàng phát triển Châu Á http://www.adb.org/
Trang web của Hiệp hội Bất Động Sản Canada http://www.crea.ca/
Trang web hội các nhà phát triển BDS Singapore http://www.redas.com/
Trang web Trung tâm thương mại quốc tế ITC http://www.macmap.org/
(www.intracen.org) là trang web chứa một cơ sở dữ http://www.investmentmap.org/
liệu chuyên sâu phục vụ cho công tác nghiên cứu thị http://www.p-maps.org/
trường, đặc biệt là công tác XTTM, thông tin thu thập
từ trên 180 quốc gia và vùng lãnh thổ.
Trang web của Business Monitor International http://www.businessmonitor.com
Trang web của EuroMonitor International http://www.euromonitor.com
Trang web của RNCOS Industry Rerearch http://www.rncos.com
Solutions 21
Dữ liệu sơ cấp
• Dữ liệu sơ cấp được thu thập qua các cuộc điều tra khảo sát
• Điều tra thường xuyên, điều tra không thường xuyên
• Điều tra toàn bộ, điều tra không toàn bộ
22
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 11
Dữ liệu sơ cấp
23
Dữ liệu sơ cấp
24
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 12
Dữ liệu sơ cấp
25
Dữ liệu sơ cấp
26
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 13
Dữ liệu sơ cấp
27
28
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 14
Kế hoạch điều tra thống kê
• Mục đích điều tra thống kê
• Xác định đối tượng điều tra và đơn vị điều tra
• Nội dung điều tra
• Thời điểm, thời kỳ, thời hạn điều tra
• Biểu điều tra, bản giải thích cách ghi biểu
• Đọc thêm:
– VHLSS 2010 (Điều tra mức sống hộ gia đình VN 2010)
– Viet Pay (Khảo sát thanh toán điện tử)
29
30
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 15
Thực hành điều tra thống kê
Bài tập nhóm:
Tiếp theo bài tập tìm dữ liệu thứ cấp, mỗi nhóm dựa trên các dữ
liệu thứ cấp đã thu thập, xác định rõ hơn vấn đề cần nghiên cứu
thống kê của nhóm, cụ thể
– Mục đích nghiên cứu điều tra thống kê
– Xác định đối tượng điều tra và đơn vị điều tra
– Nội dung điều tra
– Thời điểm, thời kỳ, thời hạn điều tra
– Biểu điều tra, bản giải thích cách ghi biểu
– Tiến hành thu thập dữ liệu
31
Chương 3
Hoàng Trọng
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 16
Lý thuyết phân tổ
Khái niệm
– Xác định số tổ
33
Lý thuyết phân tổ
Số người có thu nhập trong hộ gia đình
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 17
Lý thuyết phân tổ
Phương pháp nhánh và lá
Các dữ liệu thu thập được sẽ được tách thành hai phần: phần
nhánh và phần lá. Việc phân chia này có thể linh hoạt
Lý thuyết phân tổ
1 |
Xác định
2 |
3 nhánh
3 |
1 | 9 Biểu đồ nhánh lá
2 | 834122016759715869927 ban đầu
3 | 09173052
1 | 9
Biểu đồ nhánh lá
2 | 011122234556677788999 hoàn chỉnh
3 | 00123579
36
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 18
Bảng kết hợp
QTân Bình Q6 Q11
Công việc của chủ hộ Tần % Tần Tần Tần Tần
số cột số số số số
Có hoạt động
kinh tế Làm việc trong nhà máy 18 14,3 91 10,5 5 11,6
Làm nghề tự do 39 31,0 187 21,5 11 25,6
Làm việc trong các CQNN 2 1,6 30 3,5 2 4,7
làm việc trong các CH 3 2,4 22 2,5 1 2,3
Làm việc trong VP 2 0,2
Buôn bán nhỏ 4 3,2 39 4,5 1 2,3
Bán hàng rong 5 4,0 45 5,2 1 2,3
Làm việc tại nhà 10 7,9 88 10,1 7 16,3
Tự kinh doanh 8 6,3 37 4,3
Tổng 89 70,6 541 62,3 28 65,1
Không hoạt
động kinh tế Thu nhập từ nguồn khác 6 4,8 41 4,7
Không việc làm 31 24,6 286 32,9 15 34,9
Tổng 37 29,4 327 37,7
Tổng 126 100,0 868 100,0 43 100,0
37
Biểu đồ thống kê
Dùng số kết hợp với hình vẽ, đường nét và màu sắc để trình bày
Theo nội dung phản ánh của đồ thị thống kê, có các loại:
• Đồ thị kết cấu.
• Đồ thị phát triển
• Đồ thị hoàn thành kế hoạch hoặc định mức
• Đồ thị liên hệ
• Đồ thị so sánh
• Đồ thị phân phối
38
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 19
Biểu đồ thống kê
39
Bản đồ thống kê
Dùng màu sắc thể hiện
phân loại và độ đậm nhạt
để thể hiện mức độ
Chuù giaûi
32.683 ñeán 98.717
98.718 ñeán 206.741
206.742 ñeán 337.631
337.632 ñeán 678.006
678.007 ñeán 2,907.789
40
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 20
Thực hành
• Tiến hành thu thập dữ liệu của đề tài nhóm
• Dùng phần mềm thống kê, nhập liệu vào
• Chạy ra bảng và vẽ biểu đồ thống kê
• Trình bày kết quả (mỗi nhóm tối đa 10 phút)
41
Chương 4
MÔ TẢ DỮ LIỆU BẰNG
CÁC ĐẶC TRƯNG ĐO LƯỜNG
Hoàng Trọng
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 21
Số tuyệt đối
• Số tuyệt đối là chỉ tiêu biểu hiện qui mô, khối lượng của
hiện tượng kinh tế - xã hội trong điều kiện thời gian và địa
điểm cụ thể.
• Ví dụ: Theo kết quả sơ bộ của cuộc Tổng điều tra dân số thì
Tổng số dân của nước ta có lúc 0 giờ 1/4/2009 là 85.789.573,
tăng 9,47 triệu người so với năm 1999 là 76.324.753 người.
43
Số tuyệt đối
• Số tuyệt đối thời điểm: phản ánh qui mô, khối lượng của
hiện tượng tại một thời điểm nhất định.
• Số tuyệt đối thời kỳ: phản ánh qui mô, khối lượng của hiện
tượng trong một khoảng thời gian nhất định.
• Đơn vị tính số tuyệt đối:
– Đơn vị hiện vật: cái, chiếc, con, trái, củ, người, căn …
– Đơn vị hiện vật quy đổi: lương thực quy ra lúa
– Đơn vị hiện vật quy ước: mét, mét vuông, mét khối, lít , kg,
…
– Đơn vị tiền tệ: đồng, USD …
– Đo vị thời gian lao động: giờ công, ngày công, …
44
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 22
Số tương đối
• chỉ tiêu biểu hiện quan hệ so sánh (tỷ số) giữa hai mức độ
của hiện tượng nghiên cứu.
• Các loại số tương đối:
– Động thái: phản ảnh thay đổi qua thời gian
– Kế hoạch:
• Nhiệm vụ kế hoạch: so mức kế hoạch (nhiệm vụ) với mức đạt
ở lần trước
• Thực hiện kế hoạch: so mức thực hiện được với mức kế hoạch
đề ra
– Kết cấu: mức độ bộ phận so với toàn bộ, phản ảnh tỷ trọng
– Cường độ: so giữa hai mức độ của 2 hiện tượng (chỉ tiêu) khác
nhau
– Không gian: so sánh giữa các không gian khác nhau
45
Coefficient of
Variation
Cha p 3-46
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 23
Đo lường khuynh hướng tập trung
Tìm ra mức độ đại diện theo một tiêu thức/biến.
∑X
i =1
i Trung bình hình hoïc
X =
n
N GM = n x1x2x3...xn
∑X
i =1
i
µ=
N
47
∑ x i
x = i=1 Tính từ dữ liệu gốc
n
k
∑ x if i
x = i= 1 Tính từ dữ liệu đã phân tổ
k
∑ i =1
f i
∑ i= 1
m i f i
Tính từ dữ liệu đã phân tổ
x = k
có khoảng cách tổ
∑
i= 1
f i
48
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 24
Đo lường khuynh hướng tập trung
1. Trung bình cộng
• Trung bình tổng thể
∑ x i
µ = i=1 Tính từ dữ liệu gốc
N
k
∑
i= 1
x if i Tính từ dữ liệu đã phân tổ
µ =
N
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
50
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 25
Đo lường khuynh hướng tập trung
2. Trung vị (median)
• Tính trung vị
x n + x n
Số quan sát chẵn +1
2 2
M e =
2
n
Tính từ tài liệu phân tổ − SMe−1
Me = x Me(min) + h Me 2
f Me
51
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Me = 5 Me = 5
52
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 26
Đo lường khuynh hướng tập trung
3. Mốt (mode)
• Mode không chịu ảnh hưởng bởi các giá trị đột biến
53
0 1 2 3 4 5 6
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
fM0 − fM0 −1
Mode= xMo(min) + hM0
(fM0 − fM0 −1) + (fM0 − fM0 +1)
54
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 27
Đo lường khuynh hướng tập trung
4. Trung bình nhân/ trung bình hình học (geometric mean)
• Áp dụng cho các trị số có quan hệ tích số
• Dùng để tính tốc độ phát triển trung bình từ các số tương
đối động thái
x = n x 1. x 2 . x 3 ... x n
55
Other Measures of
Location
Percentiles Quartiles
Phân vị Tứ phân vị
56
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 28
Các thước đo vị trí khác
Phân vị (percentile)
p
i= (n + 1)
100
57
Q1 Q2 Q3
58
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 29
Các thước đo vị trí khác
Biểu đồ hộp và râu (Box and whisker plot)
Là công cụ đồ học thể hiện 5 số trị số tóm tắt :
Minimum -- Q1 -- Median -- Q3 -- Maximum
59
Same center,
different variation
60
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 30
Đo lường độ phân tán/biến thiên
Variation
Sample Sample
Variance Standard
Deviation
61
Biến thiên
62
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 31
Đo lường độ phân tán/biến thiên
1. Khoảng biến thiên: R = xmax − xmin
2. Độ trải giữa: RI = Q3 - Q1
2 n
∑ (x
N
N n −1
n
4. Độ lệch chuẩn:
∑ (x i − x )2
σ = σ2 s= i =1
n −1
5. Hệ số biến thiên: s
σ CV = 100 %
CV = . 100 %
µ x
Sử dụng CV khi so sánh 2 tập dữ liệu có đơn vị tính khác nhau hay trung bình
chênh lệch nhau nhiều 63
Data A
Mean = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 3.338
Data B
Mean = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = .9258
Data C
Mean = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 4.57
64
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 32
Đo lường độ phân tán/biến thiên
Quy tắc thực nghiệm
• Đối với những tổng thể lớn, phân phối của các giá trị có dạng gần
giống hình chuông cân đối (có thể dùng đồ thị Histogram để xem
xét), phân phối chuẩn được sử dụng để mô tả hình dáng của phân
phối.
65
66
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 33
Hình dáng phân phối của tập dữ liệu
Diễn tả dữ liệu được phân phối như thế nào
Đối xứng hay lệch
Mean < Median < Mode Mean = Median = Mode Mode < Median < Mean
(Longer tail extends to left) (Longer tail extends to right)
Cha p 3-67
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
68
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 34
Chuẩn hóa dữ liệu
Chuyển các dữ liệu với đo vị đo lường thực tế về đơn vị đo lường
là độ lệch chuẩn.
Khi có nhiều biến số có đơn vị tính khác nhau, chuẩn hóa dữ liệu
giúp so sánh được biến thiên của chúng
x −µ
Với dữ liệu của tổng thể: z=
σ
69
Chương 5
Hoàng Trọng
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 35
Ước lượng điểm & ước lượng khoảng
• Ước lượng điểm: ước lượng bằng 1 trị số
• Ước lượng khoảng: ước lượng bằng 1 khoảng trị số, gọi là
khoảng tin cậy, có thêm thông tin về khả năng biến thiên
Lower Upper
Confidence Confidence
Point Estimate
Limit Limit
Width of
confidence interval
71
Chúng ta có thể ước lượng tham số tổng thể với 1 trị số của mẫu (UL điểm)
Trung bình μ x
Tỷ lệ p p
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 36
Ước lượng khoảng
• Ước lượng khoảng có tính tới biến thiên của tham số mẫu từ
mẫu này so với mẫu khác.
• Chỉ dựa vào một mẫu quan sát
• Cho biết thông tin về tham số tổng thể có thể có trị số trong
khoảng ước lượng, và không bao giờ chắc chắn được 100%
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 37
Ước lượng khoảng
• Ước lượng khoảng tham số của 1 tổng thể
Confidence
Intervals
Population Population
Mean Proportion
σ Known σ Unknown
σ s p(1 − p )
x ± zα/2 x ± t α/2 p ± z α/2
n n n
Difference
Mean Proportion
difference difference
independent paired
samples samples
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 38
Ước lượng khoảng
• Ước lượng khoảng khác biệt tham số giữa 2 tổng thể
Difference
Mean Proportion
difference difference
independent paired
samples samples
2 2
σ 2x σ y σ 2x σy
(x − y) − z α / 2 + ≤ µx − µ y ≤ (x − y) + z α / 2 +
nx n y nx ny
sd sd
d - t n-1,α / 2 ≤ µ x - µ y ≤ d + t n -1,α / 2
n n
Difference
Mean Proportion
difference difference
independent paired
samples samples
pˆ x (1 − pˆ x ) pˆ y (1 − pˆ y ) pˆ x (1 − pˆ x ) pˆ y (1 − pˆ y )
( pˆ x − pˆ y ) − z + ≤ Px − Py ≤ ( pˆ x − pˆ y ) + z +
α /2 nx ny α /2 nx ny
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 39
Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế
(Applied Statistics for Business & Economics)
Chương 6
Hoàng Trọng
Điều chúng ta muốn chứng minh là đúng được đặt làm giả thuyết đối
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 40
Hai loại sai lầm
Possible Hypothesis Test Outcomes
State of Nature
Decision H0 True H0 False
Do Not
No error Type II Error
Key: Reject
(1 - α ) (β)
H0
Outcome
(Probability) Reject Type I Error No Error
H0 ( α) (1-β)
Sai lầm loại I và sai lầm loại II không thể xảy ra cùng 1 lúc
Sai lầm loại I chỉ xảy ra nếu H0 đúng
Sai lầm loại II chỉ xảy ra nếu H0 sai
Nếu xác suất phạm sai lầm loại I error probability ( α ) tăng lên thì
xác suất phạm sai lầm loại II ( β ) giảm
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 41
Kiểm định GT về trung bình tổng thể
Hypothesis
Tests for µ
σ Known σ Unknown
Large Small
Samples Samples
σ Known σ Unknown
Large Small
x −µ Samples Samples
z=
σ
n
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 42
Kiểm định GT về trung bình tổng thể
Hypothesis
Tests for µ
σ Known σ Unknown
σ Known σ Unknown
Large Small
x −µ Samples Samples
tn −1 =
s
n (The population must be
approximately normal)
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 43
Kiểm định GT về trung bình tổng thể
Quy tắc quyết định:
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 44
Kiểm định GT về tỷ lệ tổng thể
• Dùng cho các dữ liệu phân loại, có 2 khả năng:
– “thành công” nếu có đặc điểm
– “thất bại” nếu không có đặc điểm
• Tỷ lệ thành công trong tổng thể được ký hiệu là p
• Tỷ lệ thành công trong mẫu được ký hiệu là ̂ hay ̅
x so thanh cong trong mau
p= =
n co mau
µP = p p(1 − p)
σp =
n
p −p
z=
Phân phối của ̅ là bình thường nên p(1 − p)
đại lượng kiểm định là đại lượng z n
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 45
Kiểm định GT về khác biệt hai TB
Đại lượng quyết định:
Difference
Mean Proportion
difference difference
independent paired
samples samples
x − y − D0 x − y − D0
t= z=
1 1 2
σ2x σ y
s2 ( + ) +
nx ny n x ny
Ho : µx - µy = D0 hoặc Ho: µx - µy ≥ D0
H1 : µx - µy < D0 t < - t n + n − 2, α
x y
Ho : µx - µy = D0 hoặc Ho: µx - µy ≤ D0
t n x + n y − 2, α
H1 : µx - µy > D0 t>
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 46
Kiểm định GT về khác biệt hai tỷ lệ
Đại lượng quyết định:
Difference
Mean Proportion
difference difference
n x p̂ x + n y p̂ y
p̂o =
nx + n y
H1 : px - py ≠ 0 Hay z > z α / 2
H1 : px - py < 0
Ho : px - py = 0 hoặc Ho: px - py ≤ 0 z > zα
H1 : px - py > 0
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 47
Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế
(Applied Statistics for Business & Economics)
Chương 7
Hoàng Trọng
96
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 48
Sai số trong ĐTCM
• sai số phi chọn mẫu
• sai số chọn mẫu (margin of error):
– Khi ước lượng trung bình tổng thể, sai số chọn mẫu trung bình
(statndard error) là: 2
σ σ
σx = =
n n
• Khi ước lượng trung bình tổng thể, sai số chọn mẫu là:
σ
εx = z α / 2σx = z α / 2
n
• Khi ước lượng tỷ lệ sai số trung bình là
p(1 - p )
ε p = z α / 2σ P̂ = z α / 2
n
98
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 49
Quy trình nghiên cứu bằng ĐTCM
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 50
Xác định cỡ mẫu
Khi nghiên cứu để ước lượng trung bình:
Chọn hoàn lại Chọn không hoàn lại
2 2
z α/ 2 σ z α2 / 2σ2 N
n= n=
ε 2
x
ε 2x N + z α2 / 2σ2
zα2 / 2 pq z α2 / 2 pqN
n= n= 2
ε 2p ε p N + z 2α / 2 pq
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 51
Chọn mẫu ngẫu nhiên đơn giản
• Mỗi đơn vị của tổng thể được chọn với sự ngẫu nhiên như nhau (được
chọn vào mẫu với cơ hội/ xác suất bằng nhau)
• Phải có danh sách các đơn vị của tổng thể cần nghiên cứu và khảo sát
(khung mẫu hay dàn chọn mẫu, sampling frame). Các đơn vị này có thể
được sắp xếp theo một trật tự nào đó, ví dụ như theo vần ABC, theo
quy mô, theo địa chỉ … và được gán cho một số thứ tự từ đơn vị thứ 1
đến đơn vị cuối cùng.
• Có thể thực hiện việc lấy đơn vị mẫu ra bằng nhiều cách như bốc thăm,
quay số, hay dùng số ngẫu nhiên, hàm ngẫu nhiên trong Excel nếu số
lượng đơn vị tổng thể ít, khung lấy mẫu ngắn. Khi có quá nhiều đơn vị,
cần có dưới dạng file và dùng phần mềm thống kê để chọn.
• Cho kết quả tốt nếu giữa các đơn vị của tổng thể không có khác biệt
nhiều. Nếu tổng thể có kết cấu phức tạp thì chọn theo phương pháp
này sẽ khó đảm bảo tính đại biểu.
• Ước lượng theo công thức cơ bản như Chương ước lượng
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 52
Chọn mẫu phân tầng
• Sử dụng khi các đơn vị quá khác nhau về tính chất liên quan đến
vấn đề cần nghiên cứu và khảo sát.
• Tổng thể nghiên cứu được chia thành các tầng lớp, mục tiêu là
để các giá trị của các đối tượng tổng thể ta quan tâm thuộc cùng
một tầng càng ít khác nhau càng tốt. Sau đó các đơn vị mẫu
được chọn từ các tầng này theo các phương pháp lấy mẫu xác
suất thông thường như lấy mẫu ngẫu nhiên đơn giản hay lấy
mẫu hệ thống.
• Đặc điểm dùng để phân tầng phải có liên quan đến nội dung bạn
cần nghiên cứu khảo sát.
• Số đơn vị mẫu trong từng tầng lớp có thể: bằng nhau, theo tỉ lệ
của từng class hay phân bổ tối ưu (vừa theo quy mô của tầng
lớp và theo mức độ đồng đều của các đơn vị trong cùng một
tầng lớp).
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 53
Chọn mẫu phân tầng
Ước lượng trung bình khi chọn mẫu phân tầng:
∑wn s
K 2 2
Lúc đó s 2x = (1 - f ) i i
i =1 i
Lúc đó s 2p̂ = (1 − )
N i=1
∑
n K w 2i p i (1 - p i )
ni -1
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 54
Chọn mẫu cả khối
• Chọn mẫu trong đó số đơn vị mẫu được rút ra để điều tra không
phải là từng đơn vị mà là từng khối gồm nhiều đơn vị.
• Trước hết tổng thể chung được chia thành các khối, sau đó chọn
ngẫu nhiên một số khối để điều tra tất cả các đơn vị trong khối.
• Các khối có thể được chọn ngẫu nhiên đơn giản hay chọn hệ
thống
• Áp dụng khi không có danh sách các phần tử mà chỉ có danh
sách các khối. Ví dụ không có danh sách các hộ gia đình, nhưng
có danh sách của các tổ dân phố hay các khối nhà.
∑n
x= m
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 55
Chọn mẫu phi ngẫu nhiên
• Khi không có điều kiện về thời gian, thông tin (số lượng đơn vị
tổng thể, cơ cấu tổng thể và khung lấy mẫu) và chi phí để thực
hiện lấy mẫu ngẫu nhiên.
• Các cách chọn mẫu thông dụng: lấy mẫu thuận tiện, lấy mẫu
định mức,
• Nhược điểm: giá trị suy rộng thấp. Thực tế cố gắng sử dụng
chọn mẫu phi ngẫu nhiên một cách khách quan, mô phỏng chọn
mẫu ngẫu nhiên càng giống càng tốt.
• Cỡ mẫu được xác định bằng công thức tính cỡ mẫu trong
trường hợp chọn ngẫu nhiên và nhân thêm hệ số tăng để bù đắp
cho khả năng sai số chọn mẫu lớn hơn vì tính đại diện kém hơn.
• Lấy mẫu định mức: tương tự lấy mẫu xác suất phân tầng ở chỗ
đầu tiên người nghiên cứu phải phân chia tổng thể nghiên cứu
thành các tầng (tổng thể con). Nhưng điểm khác biệt cơ bản là
trong từng tổng thể con những người phỏng vấn được chọn mẫu
tại hiện trường theo cách thuận tiện hay phán đoán, trong khi
trong mỗi tầng của chọn mẫu phân tầng thì các đơn vị mẫu được
chọn ra theo kiểu xác suất từ dàn chọn mẫu..
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 56
Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế
(Applied Statistics for Business & Economics)
Chương 8
Hoàng Trọng
• Trong nghiên cứu, ANOVA được dùng như một công cụ để xem
xét ảnh hưởng của một yếu tố nguyên nhân (biến định tính) đến
một yếu tố kết quả (biến định lượng)
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 57
ANOVA 1 yếu tố ảnh hưởng
• Giả sử rằng muốn so sánh trung bình của k tổng thể có phương
sai bằng nhau dựa trên những mẫu ngẫu nhiên độc lập
• n1, n2, ..., nk : quan sát từ k tổng thể có phân phối chuẩn
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 58
ANOVA 1 yếu tố ảnh hưởng
Bước 2: tính các tổng bình phương
n1
• nội bộ từng nhóm SS1 = ∑ ( x 1 j − x1 ) 2
j=1
k ni
• Toàn bộ mẫu SST = ∑∑ ( x ij − x ) 2 = SSW + SSG
i=1 j=1
Biến thiên toàn bộ
biến kết quả x
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 59
ANOVA 1 yếu tố ảnh hưởng
Bảng kết quả phân tích phương sai
SSW
Within- groups SSW n-k MSW =
n−k
Total SST n-1
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 60
ANOVA 1 yếu tố ảnh hưởng
Ví dụ: Đi làm thêm kết quả học tập
H0: = = ⋯ =
SUMMARY
Groups Count Sum Average Variance
ít 7 46.9 6.7 0.11333
TB 7 45.5 6.5 0.32667
nhieàu 8 46.8 5.85 0.23143
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 3.0036 2 1.5018 6.6983 0.0063 3.5219
Within Groups 4.26 19 0.224211
Total 7.2636 21
KL: bác bỏ Ho, Mức độ làm thêm có ảnh hưởng đến KQHT
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 61
Trường hợp các tổng thể có phân phối bất kỳ
ANOVA với kiểm định F chỉ có thể áp dụng khi các nhóm (tổng thể)
so sánh có phân phối chuẩn và phương sai bằng nhau
=> chuyển đổi dữ liệu yếu tố kết quả từ dạng định lượng về dạng
định tính (dữ liệu thứ bậc) và áp dụng một kiểm định phi tham số là
Kruskal – Wallis. Kiểm định này không yêu cầu dữ liệu phải thỏa
điều kiện các tổng thể (nhóm) so sánh phải có phân phối chuẩn.
Các trị số quan sát được sắp xếp một cách liên tục từ nhỏ đến lớn,
nếu trị số quan sát trùng nhau thì cho hạng giống nhau bằng cách
dùng số trung bình cộng các hạng của chúng để chia đều.
R1, R2, ...., Rk là tổng của các hạng ở từng mẫu được xếp theo thứ tự của
k mẫu, H0: = = ⋯ =
12 k
Ri2
Đại lượng kiểm định: W = ∑ − 3(n + 1)
n(n + 1) i =1 ni Giá trị giới hạn tra
từ bảng phân phối
Giả thuyết Ho bị bác bỏ khi: W > χ 2k−1,α Chi square
Xếp hạng các dữ liệu về điểm trung bình học tập của sinh viên
TG làm Hạng TG làm thêm Hạng TG làm thêm Hạng
thêm ít TB nhiều
12 k
R i2 12 ( 50 ,5 ) 2 ( 69 , 0 ) 2 (133 , 5 ) 2
W =
n ( n + 1)
∑ ni
− 3( n + 1) =
22 ( 22 + 1 ) 7
+
7
+
8
i =1
- 3(22 + 1) = 8,6
W = 8,6 > χ 22;0, 05 = 5,99 nên giả thuyết H0 bị bác bỏ ở mức ý nghĩa 0,05
KL: Mức độ làm thêm có ảnh hưởng đến kết quả học tập của sinh viên.
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 62
Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế
(Applied Statistics for Business & Economics)
Chương 9
Hoàng Trọng
Mục tiêu
• Dự đoán định lượng có hai loại: phân tích các mức độ qua thời
gian và phân tích liên hệ nguyên nhân - kết quả. Phương pháp
dự đoán bằng phân tích các mức độ qua thời gian liên quan đến
việc tính toán các giá trị tương lai của yếu tố nghiên cứu dựa
trên toàn bộ các quan sát có được ở quá khứ và hiện tại
• Phân tích các mức độ qua thời gian được dựa trên giả định cơ
bản là các yếu tố ảnh hưởng đến biến động của hiện tượng
trong quá khứ và hiện tại sẽ còn tiếp tục tồn tại với tính chất, đặc
điểm, cường độ như vậy đối với biến động của hiện tượng trong
tương lai.
• Do đó, mục tiêu chính của phân tích dãy số thời gian là nhận ra
và tách riêng các yếu tố ảnh hưởng này phục vụ cho mục đích
dự đoán cũng như cho việc kiểm soát và hoạch định trong quản
lý.
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 63
Mục tiêu
Định nghĩa
• Dãy số thời gian là một dãy các giá trị của hiện tượng
nghiên cứu được sắp xếp theo thứ tự thời gian.
• Dạng tổng quát:
ti t1 t2 .... tn
yi y1 y2 .... yn
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 64
Định nghĩa
• Dãy số thời kỳ: các trị số là số thời kỳ, thể hiện biến động qua
từng thời kỳ
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
GDP theo giá
thực tế (tỷ đồng) 481,295 535,762 613,443 715,307 839,211 974,264 1,143,715 1,485,038 1,658,389 1,980,914
trong đó: Dịch vụ 185,922 206,182 233,032 271,699 314,708 365,864 430,979 555,959 635,195 748,363
• Dãy số thời điểm: các trị số là số thời điểm, thể hiện biến động
qua các thời điểm
Ngày 23/7 24/7 25/7 26/7 27/7 28/7
Giá vàng 1.317,0 1.316,5 1.310,0 1.307,5 1.294,0 1.294,0
(Ngàn đồng /chỉ)
Time-Series
y i = Ti .Si .C i .I i
http://www.youtube.com/watch?v=ptDezc0ZojM
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 65
Các thành phần của dãy số thời gian
Thành phần
xu hướng Sales
Time
Sales Sales
Time Time
Downward linear trend Upward nonlinear trend
Sales
Summer
Winter
Spring Fall
Time (Quarterly)
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 66
Các thành phần của dãy số thời gian
Thành phần Chu kỳ dài hạn, hơn 1 năm
chu kỳ Số liệu theo năm
1 Cycle
Sales
Year
Sales
Year
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 67
Các chỉ tiêu mô tả dãy số thời gian
1. Mức độ trung bình theo thời gian:
n n
Dãy số thời điểm, khoảng cách đều:
y1 + y 2 y 2 + y3 y + yn y1 y
+ + ... + n−1 + y 2 + ... + y n−1 + n
y= 2 2 2 = 2 2
n −1 n −1
y=
y1t1 + y2 t 2 + ... + y n t n
=
∑y t i i
t1 + t 2 + ... + t n ∑t i
∑δ i
∆n y − y1
Trung bình: δ= i =2
= = n
n −1 n −1 n −1
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 68
Các chỉ tiêu mô tả dãy số thời gian
3. Tốc độ phát triển:
yi
Liên hoàn: ti =
yi −1 k
Mối quan hệ: TK = Π t i
i=2
y
Định gốc:
Ti = i
y1
n yn
Trung bình: t = n −1 t 2 t 3...t n = n −1 Π ti = n −1 Tn = n −1
1= 2 y1
y i − y i −1
Liên hoàn: ai = = ti − 1
y i −1
Định gốc: yi − y1
Ai = = Ti − 1
y1
Trung bình: a = t −1
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 69
Các chỉ tiêu mô tả dãy số thời gian
5. Trị tuyệt đối của 1% tăng (giảm):
1% tăng hay giảm tương ứng với trị tuyệt đối là bao nhiêu
δi y i − y i−1
gi = =
a i (%) y i − y i−1
× 100
y i−1
y i−1
=
100
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 70
PP biểu hiện xu hướng biến động
2. Hàm xu thế:
Hàm tuyến tính đường thẳng: ŷ t = a 0 + a1 t
Dùng PP bình phương bé nhất tìm các hệ số hồi qui, được hệ PT:
∑ y = na 0 + a1 ∑ t
∑ yt = a 0 ∑ t + a1 ∑ t
2
Vì t là thứ tự thời gian, đổi biến sao cho ∑ t = 0 , hệ PT chỉ còn là:
∑ y = na 0 ∑ y , a = ∑ yt
a0 =
∑ yt = a1 ∑ t ∑t
2 1 2
n
∑ y i = na 0 + a1 ∑ t i + a 2 ∑ t i
2
i =1 i =1 i= 1
n n n n
∑ i i 0∑ i 1∑ i 2 ∑ ti
2 3
y t = a t + a t + a
i =1 i=1 i =1 i =1
n n n n
∑ i i 0∑ i 1∑ i 2 ∑ ti
2 2 3 4
y t = a t + a t + a
i =1 i= 1 i =1 i=1
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 71
PP biểu hiện xu hướng biến động
3. Hàm số mũ: khi hiện tượng có tốc độ phát triển tương đối ổn
định t
ŷ t = a 0a 1
Dùng PP bình phương bé nhất tìm các hệ số hồi qui, được hệ PT:
n n
n lg a 0 + lg a 1∑ i t = ∑ lg y i
i =1 i =1
n n n
lg a
0 ∑ 1∑ i ∑ t i lg yi
2
t i + lg a t =
i =1 i =1 i =1
Đổi biến sao cho ∑ t = 0 để đơn giản hóa tính toán, hoặc dùng
phần mềm thống kê để tìm các hệ số hồi qui.
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 72
Phân tích các thành phần của dãy số TG
y i = Ti .Si .Ci .I i
2. Tách thành phần T bằng PP hồi quy
Dãy số gốc TSCI (y) có quá nhiều biến thiên bên trong, dùng hàm
xu thế tìm phương trình thể hiện xu hướng và tính ra T thì sai số rất
lớn. Sau khi tách được yếu tố S, lấy TSCI chia cho S ta được TCI.
Từ dãy số TCI, dùng PP hồi qui sẽ tìm được hàm xu thế và tính ra
các trị số của thành phần T.
Sơ đồ tính toán như sau:
Cuối cùng lấy SI chia cho S ra thành phần bất thường I. Thành
phần I bao gồm các số ngẫu nhiên không theo quy luật biến thiên
nào
Sơ đồ tính toán như sau:
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 73
Phân tích các thành phần của dãy số TG
Ví dụ:
1. xem sách giáo trình NLTKKT 2010, trang 303 - 313
2. Xem file Excel có tên GT NLTKKT mo hinh nhan TSCI
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 74
Dự đoán biến động của dãy số TG
Dựa vào tốc độ phát triển trung bình
yi
Áp dụng khi tốc độ phát triển liên hoàn khá đồng đều ti =
y i −1
y
Bước 1: tính tốc độ phát triển trung bình t = n −1 n
y
1
Bước 1: tìm các phương trình biểu diễn xu thế biến động
Bước 2: thay giá trị t ứng với thời gian muốn dự đoán vào PT
) )
Có xu hướng tăng giảm y = a 0 + a1t yn +l = a0 + a1 (t n + l )
khá rõ ràng gần như thẳng
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 75
Dự đoán biến động của dãy số TG
Vấn đề biến động thời vụ (biến động mùa)
Trong trường hợp có biến động thời vụ, vấn đề dự báo cho cả năm
và cho từng tháng trong năm cần phải tính chỉ số mùa
Bước 1: Tính chỉ số mùa đơn giản bằng cách lấy mức độ ở từng
tháng/quý cùng tên chia cho mức độ trung bình chung tất cả các
tháng/quý. y Mức độ TB của các tháng/quý giống nhau
I = i ×100% yi qua các năm
si
y Mức độ TB của tất các các các tháng/quý
y qua các năm
Bước 2: Sau khi có dự báo theo năm (bằng các PP trước), đưa ra
dự báo chi tiết cho từng tháng/quý hay tuần theo công thức
) ) )
) y ) y ) y
y i = n + l × I si y i = n + l × I si y i = n + l × I si
12 4 52
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 76
Dự đoán bằng PP san bằng mũ
San bằng mũ đơn giản
Thường được sử dụng trong dự đoán ngắn hạn đối với dãy
số thời gian không có xu hướng hoặc biến động thời vụ rõ rệt.
Ở thời gian t nào đó, dựa vào các giá trị thực tế đã biết để
ước lượng giá trị hiện tại (thời gian t) của hiện tượng và dùng
giá trị hiện tại này để dự đoán giá trị tương lai (thời gian t+1).
Không phải tất cả các giá trị quá khứ đều có ảnh hưởng
ngang nhau đến việc dự đoán giá trị tương lai, mà các giá trị
càng “mới”, càng gần với thời gian dự đoán thì giá trị thông tin
mới càng cao và do vậy càng có ảnh hưởng đến giá trị dự
đoán, tức là các giá trị càng gần với thời gian dự đoán thì
được gán cho trọng số càng lớn
yˆ t +1 = S t (12.37)
yˆ t +1 : giaù trò döï ñoaùn cuûa hieän töôïng ôû thôøi gian t + 1
S t : trung bình coù troïng soá cuûa caùc giaù trò thöïc teá y t , y t −1 , y t − 2 ,...,y 1
Theo phöông phaùp san baèng muõ ñôn giaûn, ta co ù:
yˆ t +1 = w( y t ) + w(1 − w)( y t −1 ) + w(1 − w) 2 ( yt −2 ) + ...
hay yˆ t +1 = w( y t ) + (1 − w )( yˆ t )
yˆ t +1 = ( y t ) + (1 − w)( yˆ t − y t ) (12.38)
trong ñoù: w troïng soá 1
(haèn g soá san baèng muõ) vaø 0 < w < 1
2
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 77
Dự đoán bằng PP san bằng mũ
San bằng mũ đơn giản
• Chênh lệch càng nhỏ tức là dự đoán càng chính xác.
Chênh lệch này là nhỏ nhất khi đường biểu diễn dự đoán
gần sát nhất với đường biểu diễn dãy số thực tế. Ta có thể
dùng các đại lượng: trung bình bình phương sai số dự
đoán (MSE) hay trung bình độ lệch tuyệt đối của sai số dự
đoán (MAD), căn bậc hai của trung bình bình phương sai
số dự đoán (RMSE) hoặc trung bình của các trị tuyệt đối
của phần trăm sai số (MAPE).
• Mean square error
• Mean absolute deviation
• Root mean square error
• Mean absolute percent error
n n
∑ ( yt − yˆ t ) 2 ∑y t − yˆ t
MSE = t =1
(12.40) ; MAD = t =1
( 12.41)
n n
n n
yt − yˆ t
∑ ( yt − yˆ t ) 2 ∑ yt
(12.42) ; MAPE = × 100% (12.43)
t =1 t =1
RMSE =
n n
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 78
Dự đoán bằng PP san bằng mũ
San bằng mũ Holt-Winters: Biến động có tính xu hướng và hoặc
thời vụ
Giaû söû ta coù daõy soá thôøi gian y1 , y 2 ,..., y n vôùi bieán ñoäng coù tính xu höôùng.
Ñaët S 2 = y 2 vaø T2 = y 2 − y1
Ta coù: S t = α ( y t ) + (1 − α )( S t −1 + y t −1 ) vôùi 0 < α , β < 1 (12.44)
Tt = β (S t − S t −1 ) + (1 − β )(Tt −1 ) t = 3,4, . . . ,n (12.45)
α , β : caùc haèng soá san baèng muõ
Muoán döï ñoaùn giaù trò cuûa hieän töôïng ôû thôøi ñieåm n + h, duøng coâng thöùc:
yˆ n+ h = S n + hTn vôùi h = 1,2,3, . . . (12.46)
a.Thoâng qua soá trung bình di ñoäng y1 ñeå xaùc ñònh caùc giaù trò S t , Tt , Ft ñaàu
*
tieân
y t − s / 2 + 2 ( y t − (s / 2 )+1 + ... + y t + ( s / 2) −1 ) + yt + s / 2
Vôùi y1* = (12.47)
2s
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 79
Dự đoán bằng PP san bằng mũ
San bằng mũ Holt-Winters: Biến động có tính xu hướng
b. Baét ñaàu ôû thôøi kyø thöù [5(s/2) +1], caùc giaù trò S t , Tt , Ft ñöôïc xaùc ñònh nhö
sau:
yt
S t = (1 − α )(S t −1 + Tt −1 ) + α (0 < α < 1) (12.48)
Ft − s
Tt = (1 − β )Tt −1 + β ( S t − S t −1 ) (0 < β < 1) (12.49)
yt
Ft = (1 − γ ) Ft − s + γ (0 < γ < 1) (12.50)
St
ÔÛ thôøi ñieåm n, muoán döï ñoaùn giaù trò hieän töôïng ôû thôøi ñieåm n + h:
yˆ n+ h = ( S n + hTn ) Fn + h− s (h = 1,2, . . . , s) (12.51)
hay yˆ n+ h = ( S n + hTn ) Fn+ h − 2 s ( h = s +1, s + 2, . . . , 2s)
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 80
Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế
(Applied Statistics for Business & Economics)
Chương 10
Chỉ số
Hoàng Trọng
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 81
Chỉ số cá thể
• Là loại chỉ số đơn giản nhất, thể hiện sự biến động của từng
phần tử, từng đơn vị cá biệt trong một tổng thể phức tạp. Về cơ
bản thì chỉ số cá thể chính là số tương đối
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 82
Chỉ số tổng hợp
• Chỉ số tổng hợp giá cả:
n
∑p i ( 1) q i( 0 )
∑p q
CS Laspayres 1 0
Ip = i =1
x100% Ip = x100 %
n
CS Paasche: Ip =
∑p q 1 1
x100%
∑p q 0 1
Ip =
∑p q1 0
x100% =
123,5
x100% = 121,08%
∑p q0 0 102
Ip =
∑p q1 1
× 100 % =
148 ,3
× 100 % = 121 %
∑p q0 1 122 ,56
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 83
Chỉ số tổng hợp
• Chỉ số tổng hợp giá cả - Fisher:
Ip =
∑ p q × ∑p q
1 0 1 1
∑ p q ∑p q
0 0 0 1
Ip =
∑ p1q 0 × ∑ p1q1 =
123,5 148,3
× = 1,2104
∑ p 0 q 0 ∑ p0 q1 102 122,56
CS Laspayres Iq =
∑q p 1 0
x100%
∑q p 0 0
Iq =
∑q p 1 1
x100%
CS Paasche:
∑q p 0 1
CS Fisher Iq =
∑q p × ∑q p
1 0 1 1
∑q p ∑q p
0 0 0 1
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 84
Chỉ số tổng hợp
• Chỉ số tổng hợp khối lượng:
CS Laspayres: Iq =
∑q p
1 0
× 100% =
122,56
× 100% = 120,16%
∑q p
0 0 102
CS Paasche: Iq =
∑q p
1 1
× 100% =
148,3
× 100% = 120,08%
∑q p
0 1 123,5
CS Fisher Iq =
∑ q1p0 × ∑ q1p1 = 120,16 *120,08 = 120,12%
∑ q 0 p 0 ∑ q 0 p1
CS Laspayres: Ip =
∑p q1 0
x100 %
∑p q0 0
Ip = ∑p q1 1
x100 %
CS Paasche:
∑p q0 1
CS Paasche: Iq =
∑q p 1 1
x100%
∑q p 0 1
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 85
Hệ thống chỉ số
• kết hợp các chỉ số riêng lẻ lại thành hệ thống chỉ số
Ip x Iq =Ipq
Chỉ số giá theo Paasche và chỉ số khối lượng theo Laspeyres
∑ p1q1 ∑ q1p 0 = ∑ p1q1
∑ p 0q 1 ∑ q 0 p 0 ∑ p 0 q 0
chỉ số giá theo Laspeyres và chỉ số khối lượng theo Paasche
∑p q ∑q p = ∑ p q
1 0 1 1 1 1
∑p q ∑ q p ∑ p q
0 0 0 1 0 0
Hệ thống chỉ số
• hệ thống chỉ số liên hoàn và định gốc
Naêm 0 1 2 3 4 5
Daõy caùc chæ soá lieân
hoaøn , quyeàn soá -
∑ p1q1 ∑ p2 q2 ∑ p3q3 ∑ p4 q4 ∑pq 5 5
ñònh ∑p q 0 0 ∑pq 1 0 ∑p q 2 0 ∑p q3 0 ∑p q
4 0
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 86