You are on page 1of 56

Moân : THỐNG KÊ ỨNG DỤNG ĐÁNH GIÁ ĐIỂM QUÁ TRÌNH

Gồm các tiêu chí sau


Số tín chỉ : 3
Số tiết : 45 1) Điểm chuyên cần
2) Bài tập, phát biểu
Hình thức đánh giá môn học
Điểm quá trình (40%) 3) Kiểm tra
Điểm kết thúc học (60%)
Điểm học phần = (Điểm quá trình + Điểm kết thúc học)

Giảng viên : ThS. Nguyễn Trung Đông


Mail : nguyendong@ufm.edu.vn
1 2

NỘI DUNG MÔN HỌC TÀI LIỆU THAM KHẢO


1) Basic Statistics for Business and Economics,
Chương 1. Những vấn đề cơ bản của thống kê
Doughlas A. Lind, William G. Marchal, Samuel A.
Chương 2. Thu thập và trình bày dữ liệu
Wathen, Mc Graw Hill, 2008, Thư viện Đại học
Chương 3. Một số đặc trưng đo lường của TK
Huflit.
Chương 4. Uớc lượng các tham số tổng thể
2) Thống kê ứng dụng trong quản trị, kinh doanh
Chương 5. Kiểm định giả thuyết
và nghiên cứu kinh tế, Trần Bá Nhẫn – Đinh Thái
Chương 6. Phân tích phương sai
Hoàng, N B Thống Kê, 2006, Thư viện Đại học
Chương 7. Phân tích chỉ số
Huflit.
Chương 8. Phân tích dãy số thời thời gian
3) Excel ứng dụng trong kinh tế, Chương trình
3 giảng dạy kinh tế Fulbright. 4

1
Bài Giảng Chương 1. Những vấn đề
Thống kê ứng dụng cơ bản của thống kê

Chương 1. Những vấn đề  Chức năng của thống kê


cơ bản của thống kê  Các khái niệm căn bản

GV: ThS. Nguyễn Trung Đông


nguyentrungdong144@gmail.com 1 2

1. Chức năng của thống kê 1. Chức năng của thống kê


Thống kê (statistics) là ngành khoa học liên Thống kê được chia ra làm 2 lĩnh vực, đó
quan đến việc thu thập, tổ chức, tổng kết, phân là: thống kê mô tả và thống kê suy luận (suy diễn).
tích và đưa ra các kết luận từ dữ liệu. Do đó, mỗi lĩnh vực có riêng 1 chức năng của nó,
Một bài toán thống kê thường được thực hiện tổng hợp 2 chức năng của hai lĩnh vực này ta sẽ
với các bước sau: được chức năng của thống kê.
+) Xác định vấn đề cần giải quyết. Thống kê mô tả (Descriptive statistics):
+) Tiến hành thu thập dữ liệu. là các phương pháp liên quan đến việc thu thập
+) Tổng kết các dữ liệu thu thập được. số liệu, tóm tắt, trình bày, tính toán và mô tả các
+) Phân tích dữ liệu, giải thích ý nghĩa các đặc trưng khác nhau để phản ánh một cách tổng
phân tích và đưa ra kết luận. 3 quát đối tượng nghiên cứu. 4

1. Chức năng của thống kê 2. Các khái niệm căn bản


Thống kê suy luận (Inferential statistics): Tổng thể và đơn vị tổng thể: là tập hợp các
là bao gồm các phương pháp ước lượng các đơn vị thuộc hiện tượng nghiên cứu, cần quan
đặc trưng của tổng thể, phân tích mối liên hệ sát, thu thập và phân tích mặt lượng của chúng
giữa các hiện tượng nghiên cứu, dự đoán hoặc theo một hoặc một số tiêu thức nào đó.
ra quyết định trên cơ sở thu thập thông tin từ Mỗi đơn vị cá biệt cấu thành tổng thể đó được
kết quả quan sát mẫu. gọi chung là đơn vị tổng thể.
Mẫu: là tập con của tổng thể được lựa chọn để
phân tích.
5 6

1
2. Các khái niệm căn bản 2. Các khái niệm căn bản
Ví dụ. Một lớp học tại TĐT  Tiêu thức là đặc điểm của đơn vị tổng thể
có 100 SV, trong đó 60 Nam và 40 nữ. được lựa chọn để phục vụ cho mục đích
nghiên cứu.
Tiêu thức thuộc tính: phản ánh tính chất hay
Tổng thể lớn Tổng thể nhỏ
( 1 ĐĐ chung) (nhiều ĐĐ chung) loại hình của đơn vị tổng thể, không có biểu
hiện trực tiếp bằng con số.
 Tiêu thức số lượng: Là tiêu thức biểu hiện
ĐV tổng thể ĐV tổng thể
1 sinh viên 1 sinh viên Nam đặc trưng của các đơn vị tổng thể bằng con số
hoặc Nữ cụ thể qua cân, đo, đong, đếm được. 8

2. Các khái niệm căn bản 2. Các khái niệm căn bản
 Lượng biến (xi) là các trị số cụ thể khác  Tần số (fi ): là số lần xuất hiện giá trị (xi)
nhau của tiêu thức số lượng. trong dãy số liệu đã cho.
 Lượng biến rời rạc: Giá trị có thể nhận một  Tần suất của giá trị xi : Tần suất xuất hiện
trị số cụ thể, có thể đếm được. Ví dụ: Số lượng biến cố trong n phép thử là tỷ số giữa số phép
học sinh trong 1 lớp, số người trong gia đình...
thử trong đó biến cố xuất hiện và tổng số
 Lượng biến liên tục: Giá trị có thể có của nó
phép thử được thực hiện.
có thể lấp đầy một khoảng trên trục số. Ví dụ:
Chiều cao, cân nặng của các bạn trong lớp...
9 10

2. Các khái niệm căn bản 2. Các khái niệm căn bản
Ví dụ: Điều tra năng suất lúa đông xuân (tạ/ha)
của 10 tỉnh khu vực phía bắc năm 2014-2015 cho Thang đo trong thống kê: Thang đo là khái
thấy kết quả như bảng số liệu sau: niệm dùng để đo lường các mức độ của hiện
Năng suất lúa Tần số Tần suất tượng kinh tế xã hội, trên cơ sở đó mà có thể
(tạ/ha) (fi) (%) phân loại, phản ánh mối quan hệ của các đơn
xi
453 7 35% vị tổng thể.
484 4 20% Thống kê sử dụng 4 loại thang đo sau:
761 3 15%
529 4 20%
1.116 2 10%
Tổng 20 100%

2
2. Các khái niệm căn bản 2. Các khái niệm căn bản
 Thang đo định danh (Nominal Scale): Là  Thang đo thứ bậc (Ordinal Scale): Là
đánh số các biểu hiện cùng loại của tiêu thang đo định danh nhưng giữa các biểu hiện
thức. của tiêu thức có quan hệ hơn kém.
 Đặc điểm: Các con số không có quan hệ  Đặc điểm: Sự chênh lệch giữa các biểu hiện
hơn kém. của tiêu thức không nhất thiết phải bằng
Ví dụ: Giới tính, nghề nghiệp. nhau.
Ví dụ: Mức độ hài lòng với sản phẩm…

13 14

2. Các khái niệm căn bản


 Thang đo tỷ lệ (Ratio Scale): Là thang đo
khoảng với một điểm 0 tuyệt đối (điểm
gốc).
 Đặc điểm: Có thể thực hiện được tất cả các
phép tính với trị số đo.
Ví dụ : Tiền lương, chi phí,…

15

3
Chương 2. Thu thập và
Bài Giảng
trình bày dữ liệu
Thống kê ứng dụng
 Phân loại và thu thập dữ liệu
Chương 2  Trình bày dữ liệu: bảng và các loại
Thu thập và trình bày dữ liệu biểu đồ thống kê: Biểu đồ hình tròn,
biểu đồ hình thanh, biểu đồ tần số,
GV: ThS. Nguyễn Trung Đông
biểu đồ hộp,…
nguyentrungdong144@gmail.com
1
 Phương pháp nhánh và lá 2

1. Phân loại và thu thập dữ liệu 1.1. Phương pháp chọn mẫu ngẫu nhiên
Đây là phương pháp mà mỗi đối tượng trong
1.1. Chọn mẫu ngẫu nhiên. tổng thể được gán một con số, sau đó các con
1.2. Chọn mẫu theo hệ thống. số được lựa chọn một cách ngẫu nhiên. Thông
thường các nhà nghiên cứu có thể dùng bảng
1.3. Chọn mẫu phân tầng.
ngẫu nhiên để chọn phần tử cho mẫu.
1.4. Chọn mẫu theo khối.
+) Ưu điểm: Đơn giản nếu có 1 khung mẫu đầy đủ.
+) Nhược điểm: Khó khả thi khi tổng thể lớn.
Ví dụ 1. Chọn 100 sinh viên trong 1000 sinh viên
3 4

1.1. Phương pháp chọn mẫu ngẫu nhiên 1.2. PP chọn mẫu ngẫu nhiên có hệ thống
Theo phương pháp này, toàn thể đối tượng trong tổng
thể được liệt kê theo thứ tự định trước. Sau đó tùy vào quy
mô mẫu và tổng thể mà quyết định khoảng cách các đối
được được lựa chọn. Đây là phương pháp sử dụng phổ biến
hơn phương pháp ngẫu nhiên đơn giản.
+) Ưu điểm: không cần khung mẫu hoàn chỉnh.
+) Nhược điểm: Mẫu sẽ bị lệch khi khung mẫu xếp theo
chu kỳ và tần số bằng với bước nhảy.
Ví dụ 2. Dựa vào danh sách bầu cử tại một thành phố, ta
có danh sách theo thứ tự vần của tên chủ hộ, bao gồm
240000 hộ. Ta muốn chọn ra một mẫu có 2000 hộ. Vậy
khoảng cách chọn là: k= 240000/2000 = 120, có nghĩa là cứ
cách 120 hộ thì ta chọn một hộ vào mẫu. 6

1
1.2. PP chọn mẫu ngẫu nhiên có hệ thống 1.3. Phương pháp chọn mẫu phân tầng
Khi mẫu tương đối nhỏ, việc lựa chọn ngẫu nhiên
theo hai phương pháp trên có thể dẫn tới một số
đối tượng có tỷ lệ quá cao hoặc quá thấp trong
mẫu. Phương pháp chọn mẫu phân tầng giúp giải
quyết vấn đề này. Theo phương pháp này, các đối
tượng được chia theo nhóm. Sau đó đối được
được chọn ngẫu nhiên trong từng nhóm theo tỷ tệ
tương ứng với tổng thể.
+) Phân tầng ngẫu nhiên theo tỷ lệ: Số phần tử
trong mỗi tầng tỷ lệ với quy mô của mỗi tầng trong
tổng thể 8

1.3. Phương pháp chọn mẫu phân tầng 1.3. Phương pháp chọn mẫu phân tầng
+) Phân tầng ngẫu nhiên không theo tỷ lệ: Sử dụng khi
độ phân tán các phần tử trong mỗi tầng khác nhau đáng
kể. Số phần tử trong mỗi tầng được chọn phụ thuộc vào
độ phân tán của biến quan sát trong các tầng.
Ví dụ 3. Một tòa soạn báo muốn tiến hành nc trên một
mẫu 1000 DN trên cả nước về sự quan tâm của họ đối
với tờ báo nhằm tiếp thị việc đưa thông tin quảng cáo
trên báo. Tòa soạn có thể căn cứ vào các tiêu thức: vùng
địa lý (miền Bắc, miền Trung, miền Nam); hình thức sở
hữu (quốc doanh, ngoài quốc doanh, công ty 100% vốn
nước ngoài,…) để quyết định cơ cấu của mẫu nc.
9

1.4. Phương pháp chọn mẫu theo khối 1.4. Phương pháp chọn mẫu theo khối
Khái niệm: là việc chọn một tập hợp các mẫu liên
tục trong một dãy nhất định.
Phần tử đầu tiên trong khối đã được chọn thì phần
còn lại cũng được chọn tất yếu. Mẫu chọn có thể là
một khối hoặc nhiều khối.
Ví dụ 4. Chẳng hạn có thể chọn một dãy liên tục tới
100 nghiệp vụ chỉ tiêu trong một tuần cuối tháng
10. Mẫu 100 nghiệp vụ này cũng có thể lấy 5 khối
với 20 khoản mục với mỗi khối.
11

2
2. Trình bày dữ liệu 2.1. Bảng thống kê
2.1. Bảng thống kê : là hình thức biểu
mẫu thông dụng nhất, được thiết kế với
một số cột, một số hàng để trình bày các
kết quả tổng hợp số liệu thống kê theo
từng nội dùng riêng biệt nhằm phục vụ
cho yêu cầu của quá trình nghiên cứu
thống kê.
13 14

2. Trình bày dữ liệu Một số đồ thị phổ biến hiện nay


2.2. Đồ thị thống kê: là hình thức trình bày có Biểu đồ thanh: là biểu đồ có chiều cao
tính quy ước các tài liệu thống kê dưới dạng của các thanh đại diện cho tần số hoặc
các hình vẽ hay các đường nét hình học. tần suất lần lượt của các thuộc tính
Một số đồ thị phổ biến hiện nay
Biến thuộc tính: Biểu đồ thanh (Bar chart), biểu
đồ quạt (pie chart), biểu đồ pareto (pareto
diagram).
Biến số lượng: Biểu đồ đường (line chart), biểu
đồ nhánh và lá (stem and leaf display) 15 16

Một số đồ thị phổ biến hiện nay 3. Phương pháp nhánh - lá (STEM & LEAF)
Mỗi giá trị của tập dữ liệu được tách làm 2 phần:
Biểu đồ hình quạt phần nhánh và phần lá

Phần nhánh 12 34 Phần lá


Các chữ số bên
• Phần nhánh trái dữ liệu

Các chữ số còn


• Phân lá lại bên phải của
17 dữ liệu 18

3
3. Phương pháp nhánh - lá (STEM & LEAF) 3. Phương pháp nhánh - lá (STEM & LEAF)

Ví dụ. Một sinh viên đã đạt được số 86, 79, 92, 84, 69, 88,
điểm sau trong mười hai câu hỏi kế 91, 83, 96, 78, 82, 85
toán trong học kỳ này: Leaf
Split Stem Bây giờ, hãy liệt kê các
86, 79, 92, 84, 69, 88, 9 điểm số ‘lá’ còn lại!
6
69 6
91, 83, 96, 78, 82, 85. 8 9
7
78 7
Xây dựng biểu đồ nhánh và lá để minh
82
8 8 2 3 4 5 6 8
họa kết quả trên.
91
9 9 1 2 6
Tất cả 12 điểm

3. Phương pháp nhánh - lá (STEM & LEAF)

Điểm của một bài kiểm tra thống kê cho


một mẫu gồm 40 sinh viên như sau :
Nhánh Lá
3 68
4 1278
5 0125589
6 01112578889
7 0025667
8 46889
9 0246

4
Bài Giảng Chương 3. Một số đặc trưng
do lường của thống kê
Thống kê ứng dụng
Các đặc trưng đo lường sự
Chương 3. Một số đặt trưng tập trung
đo lường của thống kê  Các đặc trưng đo lường độ
phân tán
GV: ThS. Nguyễn Trung Đông
nguyentrungdong144@gmail.com
1 2

1. Các đặc trưng đo lường độ tập trung 1. Các đặc trưng đo lường độ tập trung
1.1. Trung bình cộng (Arithmetic mean)
+) Số bình quân gia quyền (weighted mean)
Là mức độ đại diện điển hình cho 1 tiêu
n n
thức nào đó của tổng thể mà các đơn vị của
 x if i n i xi
tổng thể biểu hiện nhiều mức độ khác nhau x i 1
n
 i 1
n
+) Số trung bình cộng đơn giản f
i 1
i i 1
ni
1 n
x  xi
n i1
3 4

1. Các đặc trưng đo lường độ tập trung 1. Các đặc trưng đo lường độ tập trung

Nếu dãy số lượng biến có khoảng cách +) Số trung bình điều hòa (harmonic
tổ, để tính toán cần tìm một trị số đại mean) Là số bình quân được tính từ các
diện, gọi là trị số giữa đại lượng nghịch đảo của các lượng
biến n n
x max  x min  x if i  M i
Trò soá giöõa= x  i 1
 i 1

2 n
x if i n
Mi

i 1 xi

i 1 xi
5 6

1
VD. Tình hình doanh số bán của 3 loại gạo tại 1 cửa hàng
gạo như sau: Tính đơn giá trung bình 1kg gạo bán ra 1. Các đặc trưng đo lường độ tập trung
Đơn giá TB
Loại Đơn giá Doanh thu xifi = Mi
gạo (ngàn/kg) (trđ) Tổng doanh thu 1.2. Mốt (Mode), ký hiệu M0
ĐGTB=
Loại 1 10 xi 24.000 Tổng khối lượng Mốt là biểu hiện của một tiêu thức
x
Loại 2 8 24.000 n
x được gặp nhiều nhất trong tổng thể. Đối
Loại 3 6 24.000 n
1
Mi bằng nhau 
i 1 x
với một dãy số lượng biến, mốt là lượng
i
biến có tần số lớn nhất.
24000  24000  24000 3
x   7,66
24000 24000 24000 1 1 1
   
10 8 6 10 8 6 7 8

1. Các đặc trưng đo lường độ tập trung 1. Các đặc trưng đo lường độ tập trung
Cách xác định mốt
Cách xác định mốt
+) Lượng biến có khoảng cách tổ
+) Lượng biến rời rạc: Mốt là lượng
Bước 1: Xác định tổ chứa mốt, là tổ có mật
biến có tần số lớn nhất.
độ phân phối lớn nhất.
Mật độ phân phối là tỷ số giữa các tần số
và trị số khoảng cách tổ tương ứng
Taàn soá f
Maät ñoä phaân phoái =  i (i 1,n)
Trò soá khoaûng caùch toå di
9 10

1. Các đặc trưng đo lường độ tập trung 1. Các đặc trưng đo lường độ tập trung
VD: Năng suất lao động của công nhân
Bước 2. Tính trị số Mốt gần đúng theo CT
trong một phân xưởng sau:
FM0  FM01 Phân tổ công nhân Trị số Số công Mật Độ
M 0  x M0 (min)  d M0 theo mức năng suất lao Khoảng nhân Phân
(FM0  FM01 )  (FM0  FM01 ) động (tạ/người) Cách Tổ (di) (người fi) Phối(f/d)
20-22 2 5 2.5
• X Mo(min): giới hạn dưới của khoảng cách tổ có Mốt
22-24 2 10 5
• dMo Trị số khoảng cách tổ có Mốt 24-26 2 20 10
• FMo Mật độ phân phối của tổ có Mốt 26-28 2 15 7.5
• FMo-1 Mật độ phân phối của tổ đứng trước tổ có Mốt 28-30 2 5 2.5
10  5
• FMo+1 Mật độ phân phối của tổ đứng sau tổ có Mốt11 M 0  24  (26  24)  25, 33 12
(10  5)  (10  7, 5)

2
1. Các đặc trưng đo lường độ tập trung 1. Các đặc trưng đo lường độ tập trung
1.3. Số trung vị (Median), ký hiệu Me 1.3. Số trung vị (Median), ký hiệu Me
Là lượng biến của đơn vị tổng thể ở vị trí Đối với dãy số lượng biến rời rạc
giữa trong dãy số lượng biến. Số trung vị +) Trường hợp số đơn vị tổng thể lẻ
chia dãy số lượng biến thành hai phần, mỗi (n=2m+1) Số trung vị sẽ là lượng biến ở đơn
phần có số đơn vị tổng thể bằng nhau vị thứ m + 1: M  X
e m 1

Ví dụ: Có mức năng suất lao động của năm


công nhân trong một tổ là 20, 22, 25, 27, 29
13 tạ/người. Me = 25 tạ/ người 14

1. Các đặc trưng đo lường độ tập trung 1. Các đặc trưng đo lường độ tập trung
1.3. Số trung vị (Median), ký hiệu Me 1.3. Số trung vị (Median), ký hiệu Me
Đối với dãy số lượng biến rời rạc Đối với dãy số lượng biến rời rạc
+) Trường hợp số đơn vị tổng thể chẵn Ví dụ: Có mức năng suất lao động của
(n =2m). Số trung vị sẽ là lượng biến giữa năm công nhân trong một tổ là:
lượng biến m và m + 1. 20, 22, 25, 27, 29, 30 tạ/người.
X m  X m1 Ta có: Me = 26 tạ/ người
Me 
2
15 16

1. Các đặc trưng đo lường độ tập trung 1. Các đặc trưng đo lường độ tập trung
1
1.3. Số trung vị (Median), ký hiệu Me
2
 fi  SMe1
M e  X Me (min)  d Me
Đối với dãy số có lượng biến là khoảng f Me
cách tổ
• X Me(min): giới hạn dưới của tổ chứa trung vị
Bước 1. Xác định số tổ chứa trung vị là số
• dMe : Trị số khoảng cách tổ chứa trung vị
tổ có tần số tích lũy bằng hoặc lớn hơn một • f i
: Tổng tần số
nửa tổng các tần số • SMe-1 : Tần số tích lũy của tổ đứng trước tổ chứa
Bước 2. Xác định giá trị gần đúng của trung vị.
trung vị 17 • fMe : Tần số của tổ chứa trung vị. 18

3
1. Các đặc trưng đo lường độ tập trung
PHÂN PHỐI ĐỐI XỨNG
Ví dụ : Về mức lương của công nhân trong
một phân xưởng của xí nghiệp X như sau:
• zero skewness
Mức lương 1 công nhân Số công nhân Tần số
(triệu đồng / người) (người)
mode = median = mean
Tích lũy
2.7 – 2.9 5 5
2.9 – 3.1 10 15
3.1 – 3.3 20 35
3.3 – 3.5 15 50
3.5 – 3.7 5 55
55 : 2  15
M e  3,1  0, 2  3, 225 19
20 20

Right Skewed Distribution Left Skewed Distribution


Mean and Median are to the right of Mean and Median are to the
the Mode left of the Mode
Positively skewed
Negatively skewed

Mode< Median< Mean

21 Mean < Median < Mode 22

2. Các đặc trưng đo lường độ phân tán 2. Các đặc trưng đo lường độ phân tán
2.1. Độ biến thiên tiêu thức là chỉ tiêu, dùng
để đánh giá tính chất đồng đều của dãy số 2.2. Khoảng biến thiên
lượng biến của một tiêu thức nào đó và qua đó (toàn cự) – Range: là hiệu số giữa
đánh giá tính chất đại biểu của số bình quân.
lượng biến lớn nhất và lượng biến nhỏ
Ví dụ: Mức năng suất lao động của công nhân
ở hai tổ như sau: (tạ/ người) nhất của tiêu thức nghiên cứu.
Tổ 1: 20 25 30 35 40
Tổ 2: 28 29 30 31 32 R  X max  X min
NSLD bình quân là 30 tạ/người, nhưng NSLD
của công nhân trong từng tổ thì khác nhau. 23 24

4
2. Các đặc trưng đo lường độ phân tán 2. Các đặc trưng đo lường độ phân tán

2.3. Độ lệch tuyệt đối bình quân 2.4. Phương sai (variance): Là số bình
(Mean absolute deviation) quân số học của bình phương các độ
chênh lệch giữa các lượng biến với số
1 n
MD   xi  x
n i1
bình quân số học của các biến đó.

1 n
s2  
n  1 i1
(x i  x)2
25 26

2. Các đặc trưng đo lường độ phân tán 2. Các đặc trưng đo lường độ phân tán

2.5. Độ lệch chuẩn (Standard deviation) 2.6. Hệ số biến thiên (Coefficient of


là căn bậc 2 của phương sai, hay nói cách variation) là số tương đối, biểu hiện
khác là số bình quân toàn phương của các quan hệ so sánh độ lệch tuyệt đối bình
độ lệch giữa các lượng biến với số bình quân (hoặc độ lệch chuẩn) với số bình
quân số học của chúng. quân số học
s
s  s2 cv 
x
(100 %)
27 28

2. Các đặc trưng đo lường độ phân tán 2. Các đặc trưng đo lường độ phân tán
2.7. Phân vị thứ p (0 ≤ p ≤ 100)
Trong một dãy số đã sắp xếp theo thứ tự
tăng dần là một giá trị chia dãy số làm hai
phần, phần một gồm p% số đơn vị có giá
trị nhỏ hơn hoặc bằng giá trị của phân vị
thứ p. Công thức xác định phân vị thứ p
p
i (n  1)
29 100 30

5
2. Các đặc trưng đo lường độ phân tán 2. Các đặc trưng đo lường độ phân tán
Cách xác định tứ phân vị
Tứ phân vị (Quartiles) Tài liệu phân tổ không có khoảng cách tổ
Tứ phân vị chia dãy số thành 4 phần, mỗi Q1 : Tứ phân vị thứ 1 là giá trị đứng ở vị trí
phần có số đơn vị bằng nhau. (n+1)/4, là phân vị thứ 25.
Q2 : Tứ phân vị thứ 2 chính là trung vị Me
đứng ở vị trí (n+1)/2, là phân vị thứ 50.
Q3 : Tứ phân vị thứ 3 là giá trị đứng ở vị trí
31 3(n+1)/4, là phân vị thứ 75. 32

5 5 6 7 8 8 9 2. Các đặc trưng đo lường độ phân tán


Q1 = 5 Q2 = Me =7 Q3 = 8 Cách xác định tứ phân vị
Nếu (n+1) không chia hết cho 4 thì tứ phân vị Tài liệu phân tổ có khoảng cách tổ
được xác định bằng cách cộng thêm vào n 1
Tổ chứa tứ phân vị thứ i có tần số tích lũy  i
Tiền lương của 8 công nhân như sau 4
1
3600 3800 4000 4200 4400 5000 5400 5600  f  SQ11
Tứ phân vị thứ 1: Q1  XQ  dQ 4
1min 1
fQ
Q1 = 3800 +(4000 – 3800)/4= 3850 1

3
Q2 = Me= (4200 + 4400)/2 = 4300
4
 f  SQ31
Tứ phân vị thứ 3 : Q3  XQ  dQ
Q3 = 5000+ (5400 – 5000) 3/4 = 5300 3min 3
fQ
33 3 34

2. Các đặc trưng đo lường độ phân tán


Ví dụ: Box Plots
Doanh thu (tr.đ) Cửa hàng (fi) Tần số tích lũy
…is a graphical display, based on quartiles, that helps to
200-400 8 8 picture a set of data
400-500 12 20
500-600 25 45
600-800 25 70
800-1000 9 79
Tổng 79
79 : 4  8 (3 : 4)79  45
Q1  400  100  497, 92; Q3  600  200  714
12 25 35 36

6
Box Plots Box Plots

37 38

7
Bài Giảng Chương 4. Ước lượng tham số
Thống kê ứng dụng
 Lý thuyết mẫu
Chương 4.  Ước lượng điểm
Ước lượng tham số
 Ước lượng khoảng
GV: ThS. Nguyễn Trung Đông
nguyentrungdong144@gmail.com
1 2

1. Lý thuyết mẫu 1. Lý thuyết mẫu


Tổng thể: Là tập hợp tất cả các phần tử có
Một số đặc trưng của tổng thể:
mang một tính chất nào đó mà chúng ta
N
quan tâm. 1
Kích thước tổng thể (N): Là số phần tử của
Trung bình của tổng thể:  
N X
i 1
i

tổng thể. N
1
Mẫu: Là một tập con bất kỳ của tổng thể.
Mỗi phần tử của mẫu gọi là một quan
Phương sai của tổng thể: 2 
N  (X  )
i 1
i
2

sát. M
Tỷ lệ tổng thể: p 
Cỡ mẫu (n): Là số phần tử của mẫu. 3
N 4

1. Lý thuyết mẫu 1. Lý thuyết mẫu


Thống kê: là một biểu thức theo mẫu Mẫu đơn: X1 , X 2 ,..., X n
gồm X1 , X 2 ,..., X n và không phụ thuộc 1
n

vào tham số chưa biết. Ký hiệu


Trung bình của mẫu: X 
n X
i 1
i

T  T  X1 , X 2 ,..., X n  Phương sai của n


1
Các đặc trưng của mẫu: Trung bình
mẫu có hiệu chỉnh: S2X 
n 1  (X  X)
i 1
i
2

mẫu, phương sai mẫu, tỷ lệ mẫu k


Tỷ lệ mẫu: f 
5
n 6

1
1. Lý thuyết mẫu 1. Lý thuyết mẫu
Mẫu kép:

Cỡ mẫu: n  n1  n 2  ...  n k
k
Trung bình của mẫu: X  1 n X i i
n i 1
Phương sai của k
1
mẫu có hiệu chỉnh: S2X 
n 1  n (X  X) i i
2

Tỷ lệ mẫu: f  k
i 1

7
n 8

1. Lý thuyết mẫu 2. Ước lượng điểm


Ước lượng điểm tốt nhất của trung bình tổng
thể,  , là trung bình mẫu, X.
Ước lượng điểm tốt nhất của phương sai
tổng thể,  2 , là phương sai mẫu có hiệu
chỉnh mẫu, S2X .
Ước lượng điểm tốt nhất của tỷ lệ tổng thể, p
, là tỷ lệ mẫu, f .
9 10

3.1. Định lý Lindeberg - Levy


3. Ước lượng khoảng
Cho X1 , X 2 ,..., X n là một mẫu độc lập,
 Định lý Lindeberg - Levy
có phân phối chuẩn, Xi  N  ;  2 .
 Ước lượng trung bình tổng thể Ta có
 2 
i) X  N  , 
 Ước lượng phương sai tổng thể  n 
(n  1)S2X
ii)  2 (n  1)
 Ước lượng tỷ lệ tổng thể 2
11 12

2
3.1. Định lý Lindeberg - Levy 3.2. Ước lượng trung bình tổng thể
Xét X1 , X 2 ,..., Xn là một mẫu độc lập, X i  N  ;  2 
Từ i) đặt Z  
X   n
thì Z  N(0,1)
 a) Biết phương sai tổng thể
20
2
(n  1)S Ta dùng thống kê:
Từ ii) đặt Y  X
  2 (n  1)
2
Z
 X   n
 N  0;1
 X    n  St(n  1) 0
Ta suy ra T  Z 1 
 Với mức ý nghĩa:   0  C  
Y SX 2
n 1
13 14

3.2. Ước lượng trung bình tổng thể 3.2. Ước lượng trung bình tổng thể
Ví dụ 3. Phân tích Vitamin của 17 mẫu, ta
a) Biết phương sai tổng thể 20
tính được lượng Vitamin trung bình là
Khoảng ước lượng (đối xứng) trung 20mg. Biết rằng lượng Vitamin có phân
bình tổng thể  phối chuẩn với độ lệch chuẩn là 3,98 mg.
a) Hãy ước lượng lượng Vitamin trung
   
   X  C 0 ;X  C 0  bình với độ tin cậy 95%.
 n n
b) Nếu muốn sai số ước lượng không quá
0
Sai số ước lượng:   C 1mg ở độ tin cậy 95% thì phải quan sát ít
n
15
nhất mấy trường hợp. 16

3.2. Ước lượng trung bình tổng thể 3.2. Ước lượng trung bình tổng thể

17 18

3
3.2. Ước lượng trung bình tổng thể 3.2. Ước lượng trung bình tổng thể
2
a) Biết phương sai tổng thể  0 Ví dụ 4. Tuổi thọ của bóng đèn là biến
ngẫu nhiên có phân phối chuẩn với độ
KUL một phía của TB tổng thể 
1  2
lệch chuẩn là 36 giờ. Từ một lô bóng
Với mức ý nghĩa   0  C   đèn mới sản xuất kiểm tra ngẫu nhiên
2
100 bóng đèn và tính được tuổi thọ
  
   ; X  C 0  Phía trái trung bình là 3000 giờ. Với độ tin cậy
 n
95% hãy ước lượng tuổi thọ tối đa và
  
 X  C 0 ;   Phía phải ước lượng tuổi thọ tối thiểu của loại
 n 
19
bóng đèn nói trên 20

3.2. Ước lượng trung bình tổng thể 3.2. Ước lượng trung bình tổng thể
b) Chưa biết phương sai tổng thể  2
Ta dùng thống kê:

T
X   n
 St(n  1)
SX

Với độ tin cây:  suy ra


  1    C  t n 1
2
21 22

3.2. Ước lượng trung bình tổng thể 3.2. Ước lượng trung bình tổng thể
2
b) Chưa biết phương sai tổng thể  Ví dụ 5. Kiểm tra tuổi thọ tính bằng giờ của 50
Khoảng ước lượng (đối xứng) trung bóng đèn do một nhà máy sản xuất ra, ta có

bình tổng thể 


S S  GS rằng tuổi thọ của bóng đèn có pp chuẩn.

  X  C X ; X  C X  a) Hãy ước lượng tuổi thọ trung bình của loại bóng
 n n
đèn do nhà máy trên sản xuất với độ tin cậy 95%.
SX b) Nếu yêu cầu ước lượng phải đạt độ chính xác 50
Sai số ước lượng:   C
n giờ và độ tin cậy 95% thì cần phải kiểm tra ít
nhất bao nhiêu bóng đèn?
23 24

4
3.2. Ước lượng trung bình tổng thể 3.2. Ước lượng trung bình tổng thể

25 26

3.2. Ước lượng trung bình tổng thể 3.2. Ước lượng trung bình tổng thể
b) Chưa biết phương sai tổng thể 2 Ví dụ 6. Khảo sát 365 hộ gia đình của địa
phương B về mức thu nhập (X), ta tính được
KUL (một phía) trung bình tổng thể  thu nhập trung bình là 32,58 triệu đồng/tháng
Với mức ý nghĩa   C  t n 1 và độ lệch chuẩn mẫu có hiệu chỉnh là 5,35
 S  triệu đồng/tháng. Hãy ước lượng mức thu
   ; X  C X  Phía trái (UL tối đa)
 n nhập tối đa và mức thu nhập tối thiểu của địa
 S  phương này với độ tin cậy 95%.
   X  C X ;    Phía phải (UL tối thiểu)
 n 
27 28

3.2. Ước lượng trung bình tổng thể 3.3. Ước lượng phương sai tổng thể
Xét X1 , X 2 ,..., X n là một mẫu độc lập,
Xi  N  ;  2 

a) Biết trung bình tổng thể  0


n 2

Ta dùng TK: Y   
Xi  0 
  2 (n)
i 1
2

Độ tin cây:   a   2  (n); b   2 (n)


1
29 2 2 30

5
3.3. Ước lượng phương sai tổng thể 3.3. Ước lượng phương sai tổng thể
a) Biết trung bình tổng thể  0 b) Chưa biết trung bình tổng thể 
Khoảng ước lượng phương sai tổng thể 2 Ta dùng thống kê:
n n (n  1)S2X
1 2 1 2  Y   2 (n  1)
2
 
b

X    X   
i 1
i 0 ;
a i 1
i 0 

 2

Độ tin cây:     1  
a   2  (n  1); b   2 (n  1)
1
2 2

31 32

3.3. Ước lượng phương sai tổng thể 3.3. Ước lượng phương sai tổng thể
Ví dụ 7. Khảo sát chỉ tiêu X của 1 loại sản phẩm,
b) Chưa biết trung bình tổng thể 
người ta quan sát một mẫu và có kết quả sau
Khoảng ước lượng phương sai tổng thể 2

 (n  1)S2X (n  1)SX2  Giả sử X có phân phối chuẩn. Hãy ước lượng


2   ; 
 b a  phương sai của X với độ tin cậy 95% trong các
trường hợp sau
a) Biết trung bình tổng thể X là 25cm.
b) Chưa biết trung bình tổng thể của X.
33 34

3.3. Ước lượng phương sai tổng thể 3.3. Ước lượng phương sai tổng thể

35 36

6
3.4. Ước lượng tỷ lệ tổng thể p 3.4. Ước lượng tỷ lệ tổng thể p
Xét X1 , X 2 ,..., X n là một mẫu độc lập, Với mức ý nghĩa   0  C  
1 
2
X i  B 1;p  . Đặt
Khoảng ước lượng (đối xứng) tỷ lệ tổng
X  X 2  ...  X n
f 1 thể p
n

Ta dùng thống kê:  f (1  f ) f (1  f ) 


pf  C ;f  C 
 n n 
(f  p) n
Z  N(0,1)
f (1  f )
37 38

3.4. Ước lượng tỷ lệ tổng thể p 3.4. Ước lượng tỷ lệ tổng thể p
Ví dụ 8. Để ước lượng tỷ lệ bệnh sốt rét ở Đồng
f (1  f ) Bằng Sông Cửu Long.
Với sai số ước lượng   C
n 1) Nếu muốn sai số ước lượng không quá 2% ở
độ tin cậy 95% thì cần quan sát ít nhất bao nhiêu
Bài toán tìm cỡ mẫu (n) người.
f (1  f ) 2) Ta quan sát ngẫu nhiên 200 người, thấy có 24
Nếu biết f:   0  n  C2 người mắc bệnh sốt rét.
02
a) Tìm khoảng ước lượng của tỷ lệ tổng thể p
C2 với độ tin cậy 95%.
Nếu f chưa biết: n 
4 02 b) Nếu muốn sai số ước lượng không quá 2% ở
độ tin cậy 95% thì cần quan sát ít nhất mấy người.
39 40

3.4. Ước lượng tỷ lệ tổng thể p 3.4. Ước lượng tỷ lệ tổng thể p

41 42

7
3.4. Ước lượng tỷ lệ tổng thể p 3.4. Ước lượng tỷ lệ tổng thể p
1  2
Với mức ý nghĩa   0  C  
 f 1  f  f 1  f   2
p  f  C ;f  C    0,075; 0,165.
n n  Khoảng UL (một phía) tỷ lệ tổng thể p
 
 f (1  f )  Phía trái
p   0;f  C 
 n  (UL tối đa)
 f (1  f )  Phía phải
pf  C ;1
 n  (UL tối thiểu)
43 44

3.4. Ước lượng tỷ lệ tổng thể p 3.4. Ước lượng tỷ lệ tổng thể p
Ví dụ 9. Điều tra 365 hộ gia đình ở địa
phương B, ta thấy có 183 hộ có thu nhập
trên 30 triệu đồng/tháng. Hãy ước lượng
tối đa và ước lượng tối thiểu cho tỷ lệ hộ
gia đình có mức thu nhập trên 30 triệu
đồng/tháng với độ tin cậy 95%.

45 46

8
9/4/2021

Bài Giảng Chương 5.


Thống kê ứng dụng Kiểm định giả thuyết
Chương 5.  Các khái niệm
Kiểm định giả thuyết
 Kiểm định tham số
GV. ThS : Nguyễn Trung Đông
nguyentrungdong144@gmail.com 1 2

1. Các khái niệm 1. Các khái niệm


a) Mô hình bài toán kiểm định là: Ta nêu lên
hai mệnh đề trái ngược nhau, một mệnh đề được
gọi là giả thuyết H và mệnh đề ngược lại được gọi
0

là nghịch thuyết H1 . Dựa vào quan sát mẫu, ta nói


rằng : chấp nhận giả thuyết H , nghĩa là, ta tin rằng
0

H đúng; từ chối H có nghĩa là, ta tin rằng H sai.


0 0 0

Ở đây, ta không thể khẳng định H đúng hay sai, ta


0

chỉ quan sát ngẫu nhiên một số trường hợp nên


không thể khẳng định chắc chắn điều gì cho cả
tổng thể.
3 4

1. Các khái niệm 1. Các khái niệm


c) Bài toán kiểm định: Quan sát mẫu X1 , X 2 , ..., X n Trong ứng dụng, nếu hàm mật độ Q có đồ thị
và đưa ra giả thuyết H . Từ mẫu quan sát, ta chọn thống
0 đối xứng qua 0y, như hàm phân phối Gauss,
kê Q  f  X 1 , X 2 , ..., X n ; 0  sao cho H đúng thì phân
N  0;1 , và phân phối Student, St  n  , thì chọn
0

phối xác suất của Q hoàn toàn xác định. Ta nói thống kê
Q là tiểu chuẩn kiểm định giả thuyết H . 0 KTC  C, C còn nếu hàm mật độ Q không đối
với mức sai lầm  cho trước, ta tìm được KTC
 b của Q với ĐTC   1   và khi đó,
a, xứng, như trong phân phối  2 ,  2  n  , và phân
 Nếu Q   a, b : Ta chấp nhận giả thuyết H , 0 phối Fisher, F  n, m  thì chọn KTC a, b hay
 Nếu Q   a, b : Ta bác bỏ giả thuyết H . 0

5
0, C . 6

1
9/4/2021

2. Kiểm định tham số 2.1. So sánh trung bình tổng thể với
một số cho trước
2.1. So sánh trung bình tổng thể với
1. Nếu biết phương sai tổng thể 2  20
một số cho trước
2.2. So sánh tỷ lệ tổng thể với một số a. Kiểm định hai phía (hai bên)
cho trước Ta có bài toán kiểm định
2.3. So sánh hai trung bình của hai H0 :   0

tổng thể H1 :    0
2.4. So sánh hai tỷ lệ của hai tổng thể Nếu H 0 đúng, ta có thống kê
2.5. So sánh hai phương sai của hai (X  0 ) n
Z  N(0,1)
tổng thể 7 0 8

2.1. So sánh trung bình tổng thể với 2.1. So sánh trung bình tổng thể với
một số cho trước một số cho trước
1. Nếu biết phương sai tổng thể 2  20 Ví dụ 1. Biết rằng chiều cao người Việt Nam
có phân phối chuẩn với độ lệch chuẩn là
a. Kiểm định hai phía (hai bên)
10cm. Có tài liệu cho biết chiều cao trung
Với độ tin cậy   1   , ta có C  Z1 bình này là 160cm. Ta quan sát ngẫu nhiên
2
So sánh Z và C một mẫu 80 người, tính được trung bình là
Nếu Z  C : Bác bỏ H 0 162cm. Hỏi rằng quan sát này có phù hợp với
giá trị của tài liệu cho biết hay không? Kết
Nếu Z  C : Chấp nhận H 0
luận với mức ý nghĩa 5%.
9 10

2.1. So sánh trung bình tổng thể với 2.1. So sánh trung bình tổng thể với
một số cho trước một số cho trước
(X  ) n
Z  N  0,1
0

11 12

2
9/4/2021

2.1. So sánh trung bình tổng thể với 2.1. So sánh trung bình tổng thể với
một số cho trước một số cho trước
1. Nếu biết phương sai tổng thể 2  20 1. Nếu biết phương sai tổng thể 2  20
b. Kiểm định một phía (phía phải) b. Kiểm định một phía (phía phải)
Ta có bài toán kiểm định
Với độ tin cậy  , ta có C  Z12 
H0 :   0 2
 So sánh Z và C
H1 :    0
Nếu H 0 đúng, ta có thống kê Nếu Z  C : Bác bỏ H 0
(X  0 ) n Nếu Z  C : Chấp nhận H 0
Z  N(0,1)
0 13 14

2.1. So sánh trung bình tổng thể với 2.1. So sánh trung bình tổng thể với
một số cho trước một số cho trước
Ví dụ 2. Thu hoạch thử 49 thửa ruộng trồng
lúa, tính được năng suất trung bình 40 tạ/ha.
Trước đây, giống lúa này cho năng suất 39
tạ/ha. Với mức ý nghĩa 5%, có thể cho rằng
 H 0 : μ = 0 =39
năng suất lúa đã tăng lên hay không? Biết rằng 
 H1: μ > 0 =39
năng suất lúa là biến ngẫu nhiên tuân theo quy
luật chuẩn với độ lệch chuẩn là 1,5 tạ/ha.
Z
X  μ 
0
n
 N  0,1
15
0 16

2.1. So sánh trung bình tổng thể với 2.1. So sánh trung bình tổng thể với
một số cho trước một số cho trước
1. Nếu biết phương sai tổng thể 2  20
c. Kiểm định một phía (phía trái)
Ta có bài toán kiểm định
H0 :   0

H1 :   0
Nếu H 0 đúng, ta có thống kê
(X   0 ) n
Z  N(0,1)
17 0 18

3
9/4/2021

2.1. So sánh trung bình tổng thể với 2.1. So sánh trung bình tổng thể với
một số cho trước một số cho trước
Ví dụ 3. Bột ngọt được đóng gói trên dây
1. Nếu biết phương sai tổng thể 2  20
chuyền tự động với trọng lượng đóng gói theo
c. Kiểm định một phía (phía trái) quy định là 453gram. Biết trọng lượng đóng
Với độ tin cậy , ta có C  Z12  gói của bột ngọt là biến ngẫu nhiên có phân
2 phối chuẩn với độ lệch chuẩn là 36gram.
So sánh Z và C Kiểm tra ngẫu nhiên trọng lượng của 81 gói
Nếu Z  C : Bác bỏ H 0 tìm được trọng lượng đóng gói trung bình là
Nếu Z  C : Chấp nhận H 0 448gram. Với mức ý nghĩa 5% có thể cho
19
rằng bột ngọt bị đóng gói thiếu hay không? 20

2.1. So sánh trung bình tổng thể với 2.1. So sánh trung bình tổng thể với
một số cho trước một số cho trước
(X  ) n
Z  N  0,1
0

21 22

2.1. So sánh trung bình tổng thể với 2.1. So sánh trung bình tổng thể với
một số cho trước một số cho trước
2. Nếu chưa biết phương sai tổng thể 2 2. Nếu chưa biết phương sai tổng thể 2
a. Kiểm định hai phía (hai bên) a. Kiểm định hai phía (hai bên)
Ta có bài toán kiểm định
Với độ tin cậy   1   , ta có C  t n1
H0 :   0 2
 So sánh T và C
H1 :   0
Nếu H 0 đúng, ta có thống kê Nếu T  C : Bác bỏ H 0
(X  0 ) n Nếu T  C : Chấp nhận H 0
T  St(n  1)
SX 23 24

4
9/4/2021

2.1. So sánh trung bình tổng thể với 2.1. So sánh trung bình tổng thể với
một số cho trước một số cho trước
Ví dụ 4. Quan sát ngẫu nhiên chiều cao X
của 27 người, ta tính được chiều cao trung
bình là 157cm và độ lệch chuẩn mẫu có hiệu
chỉnh là 12cm. Có tài liệu cho biết chiều cao
trung bình là 160cm. Hỏi rằng quan sát này
có phù hợp với giá trị của tài liệu cho biết
hay không? Kết luận mức múc ý nghĩa 5%.
25 26

2.1. So sánh trung bình tổng thể với 2.1. So sánh trung bình tổng thể với
một số cho trước một số cho trước
(X  ) n
T  St  n  1 2. Nếu chưa biết phương sai tổng thể 2
SX
b. Kiểm định một phía (phía phải)
Ta có bài toán kiểm định
H0 :   0

H1 :    0
Nếu H 0 đúng, ta có thống kê
(X  0 ) n
T  St(n  1)
27 SX 28

2.1. So sánh trung bình tổng thể với 2.1. So sánh trung bình tổng thể với
một số cho trước một số cho trước
Ví dụ 5. Năm trước tiền lương trung bình của
2. Nếu chưa biết phương sai tổng thể 2 các cử nhân quản trị kinh doanh làm việc tại
b. Kiểm định một phía (phía phải) công ty liên doanh với nước ngoài là 210 USD
một tháng. Năm nay điều tra ngẫu nhiên lương
Với độ tin cậy   1   , ta có C  t n1 tháng của 25 cử nhân đang làm việc cho công
ty đó tìm được tiền lương trung bình là 218
So sánh T và C USD và độ lệch chuẩn có hiệu chỉnh là 10
Nếu T  C : Bác bỏ H 0 USD. Với giả thiết tiền lương có phân phối
chuẩn thì có thể cho rằng năm nay các nhân
Nếu T  C : Chấp nhận H 0 viên đó có hưởng mức lương cao hơn hay
29
không với mức ý nghĩa 5%. 30

5
9/4/2021

2.1. So sánh trung bình tổng thể với 2.1. So sánh trung bình tổng thể với
một số cho trước một số cho trước
(X  ) n
T  St  n  1
SX

31 32

2.1. So sánh trung bình tổng thể với 2.1. So sánh trung bình tổng thể với
một số cho trước một số cho trước
2. Nếu chưa biết phương sai tổng thể 2 2. Nếu chưa biết phương sai tổng thể 2
c. Kiểm định một phía (phía trái) c. Kiểm định một phía (phía trái)
Ta có bài toán kiểm định
Với độ tin cậy   1   , ta có C  t n1
H0 :   0
 So sánh T và C
H1 :   0
Nếu H 0 đúng, ta có thống kê Nếu T  C : Bác bỏ H 0
(X  0 ) n Nếu T  C : Chấp nhận H 0
T  St(n  1)
SX 33 34

2.1. So sánh trung bình tổng thể với một 2.1. So sánh trung bình tổng thể với
số cho trước một số cho trước

35 36

6
9/4/2021

2.1. So sánh trung bình tổng thể với 2.2. So sánh tỷ lệ tổng thể với một số
một số cho trước cho trước
1. Kiểm định hai phía (hai bên)
Ta có bài toán kiểm định
H 0 : p  p 0

H1 : p  p0
Nếu H 0 đúng, ta có thống kê
(f  p 0 ) n
Z  N(0,1)
p0 (1  p 0 )
37 38

2.2. So sánh tỷ lệ tổng thể với một số 2.2. So sánh tỷ lệ tổng thể với một số
cho trước cho trước
1. Kiểm định hai phía (hai bên) Ví dụ 7. Điều tra ngẫu nhiên 400 trẻ
Với độ tin cậy   1   , ta có C  Z1 sơ sinh ở một khu dân cư Thái An, ta
So sánh Z và C
2
nhận thấy có 218 bé sơ sinh là trai.
Nếu Z  C : Bác bỏ H 0 Hỏi tỷ lệ sinh con trai và con gái có
Nếu Z  C : Chấp nhận H 0 giống nhau không? Kết luận với mức
ý nghĩa 1%.
39 40

2.2. So sánh tỷ lệ tổng thể với một số 2.2. So sánh tỷ lệ tổng thể với một số
cho trước cho trước

41 42

7
9/4/2021

2.2. So sánh tỷ lệ tổng thể với một 2.2. So sánh tỷ lệ tổng thể với một số
số cho trước cho trước
2. Kiểm định một phía (phía phải) 2. Kiểm định một phía (phía phải)
Ta có bài toán kiểm định Với độ tin cậy   1   , ta có C  Z12
H 0 : p  p 0 2
 So sánh Z và C
H1 : p  p 0
Nếu H 0 đúng, ta có thống kê Nếu Z  C : Bác bỏ H 0
Nếu Z  C : Chấp nhận H 0
(f  p 0 ) n
Z  N(0,1)
p0 (1  p 0 )
43 44

2.2. So sánh tỷ lệ tổng thể với một số 2.2. So sánh tỷ lệ tổng thể với một số
cho trước cho trước
Ví dụ 8. Thống kê 10000 trẻ sơ sinh ở một địa  H 0 : p  p0  0,5
phương, người ta thấy 5080 bé trai. Hỏi tỷ lệ sinh 
 H1 : p  p 0  0,5
con trai có thực sự cao hơn tỷ lệ sinh con gái
không? Cho kết luận với mức ý nghĩa 0,01.

1  2
0  C    0, 49  C  2,33
2
45 46

2.2. So sánh tỷ lệ tổng thể với một số 2.2. So sánh tỷ lệ tổng thể với một số
cho trước cho trước
3. Kiểm định một phía (phía trái)
Ta có bài toán kiểm định
H 0 : p  p 0
 0,508  0,5  10000 
Zqs   1,6
0,5.0,5 H1 : p  p0
Nếu H 0 đúng, ta có thống kê
(f  p 0 ) n
Z  N(0,1)
p0 (1  p 0 )
47 48

8
9/4/2021

2.2. So sánh tỷ lệ tổng thể với một số 2.2. So sánh tỷ lệ tổng thể với một số
cho trước cho trước
3. Kiểm định một phía (phía trái) Ví dụ 9. Một công ty yêu cầu các phân
xưởng của mình có tỷ lệ sản phẩm đạt tiêu
Với độ tin cậy   1   , ta có C  Z12
2
chuẩn xuất là 60%. Kiểm tra ngẫu nhiên
So sánh Z và C 2000 sản phẩm của phẩn xưởng A trong công
Nếu Z  C : Bác bỏ H 0 ty thấy có 1180 sản phẩm đạt tiêu chuẩn xuất
Nếu Z  C : Chấp nhận H 0 khẩu. Với mức ý nghĩa 5%, dựa vào điều tra
này hãy xác minh xem phẩn xưởng A đã đạt
được yêu cầu của công ty hay chưa.
49 50

2.2. So sánh tỷ lệ tổng thể với một số 2.2. So sánh tỷ lệ tổng thể với một số cho
cho trước trước  f  p0  n
Z=  N  0,1
p 0 1  p0 

51 52

2.3. So sánh hai trung bình của hai 2.3. So sánh hai trung bình của hai
tổng thể tổng thể
1. Biết phương sai của hai tổng thể: 2X , Y2
1. Biết phương sai của hai tổng thể 2X , Y2
a. Kiểm định hai phía (hai bên)
Ta có bài toán kiểm định a. Kiểm định hai phía (hai bên)
H 0 :  X   Y Với độ tin cậy   1   , ta có C  Z1

H1 :  X   Y So sánh Z và C
2

Nếu H 0 đúng, ta có thống kê


(X  Y)
Nếu Z  C : Bác bỏ H 0
Z  N(0,1)
2X 2Y Nếu Z  C : Chấp nhận H 0

n m 53 54

9
9/4/2021

2.3. So sánh hai trung bình của hai 2.3. So sánh hai trung bình của hai
tổng thể tổng thể
1. Biết phương sai của hai tổng thể: 2X , Y2
1. Biết phương sai của hai tổng thể 2X , Y2
b. Kiểm định một phía (phía phải)
Ta có bài toán kiểm định b. Kiểm định một phía (phía phải)
H 0 :  X   Y Với độ tin cậy   1   , ta có C  Z12

H1 :  X   Y
2
So sánh Z và C
Nếu H 0 đúng, ta có thống kê
(X  Y)
Nếu Z  C : Bác bỏ H 0
Z  N(0,1)
2X 2Y Nếu Z  C : Chấp nhận H 0

n m 55 56

2.3. So sánh hai trung bình của hai 2.3. So sánh hai trung bình của hai
tổng thể tổng thể
1. Biết phương sai của hai tổng thể: 2X , Y2
1. Biết phương sai của hai tổng thể 2X , Y2
c. Kiểm định một phía (phía trái)
Ta có bài toán kiểm định c. Kiểm định một phía (phía trái)
H 0 :  X   Y Với độ tin cậy   1   , ta có C  Z12

H1 :  X   Y So sánh Z và C
2

Nếu H 0 đúng, ta có thống kê


(X  Y)
Nếu Z  C : Bác bỏ H 0
Z  N(0,1)
2X 2Y Nếu Z  C : Chấp nhận H 0

n m 57 58

2.3. So sánh hai trung bình của hai 2.3. So sánh hai trung bình của hai tổng thể
tổng thể Ví dụ 10. Kết quả điểm thi môn xác suất thống kê
của hai lớp A và B như sau:
2. Chưa biết phương sai của hai tổng
Lớp A: n  64; X  73,2; S  118,81
2
X

thể 2X ,  Y2
Lớp B: m  68; Y  76,6; S  125, 44
2
Y

Thực hiện tương tự như trong trường Với mức ý nghĩa 5%, có thể cho rằng kết quả điểm
hợp 1 ta chỉ cần thay 2X , 2Y bằng bằng thi trung bình của lớp B cao hơn lớp A được không,
biết rằng kết quả điểm thi là biến ngẫu nhiên phân
hai phương sai mẫu có hiệu chỉnh S2X , S2Y phối chuẩn.

59 60

10
9/4/2021

2.3. So sánh hai trung bình của hai tổng thể 2.3. So sánh hai trung bình của hai tổng thể

H 0 : μ X  μ Y

 H1 : μ X  μ Y 1  2
0  C    0, 45  C  1,64
2

XY
Z  N  0;1
S2X S2
+ Y
n m 61 62

2.3. So sánh hai trung bình của hai 2.3. So sánh hai trung bình của hai
tổng thể tổng thể
3. Hai phương sai 2X  Y2 và chưa biết:
3. Hai phương sai 2X  2Y và chưa biết
a. Kiểm định hai phía (hai bên)
Ta có bài toán kiểm định a. Kiểm định hai phía (hai bên)
H 0 :  X   Y Với độ tin cậy   1   , ta có C  t nm2

H1 :  X   Y
2
So sánh T và C
Nếu H 0 đúng, ta có thống kê
(X  Y)
Nếu T  C : Bác bỏ H 0
T  St(n  m  2)
 (n  1)S2X  (m  1)S2Y   m  n 
  
Nếu T  C : Chấp nhận H 0
 nm2   nm  63 64

2.3. So sánh hai trung bình của hai 2.3. So sánh hai trung bình của hai tổng thể
tổng thể
Ví dụ 11. Quan sát ngẫu nhiên 20 bé trai, ta
tính được trọng lượng trung bình là 3200gram
và độ lệch chuẩn mẫu có hiệu chỉnh là
400gram. Quan sát ngẫu nhiên 17 bé gái, ta
tính được trọng lượng trung bình là 3000gram
và độ lệch chuẩn mẫu có hiệu chỉnh là
380gram. Hỏi rằng trọng lượng trung bình của
trẻ sơ sinh trai và gái có giống nhau không?
Kết luận với mức ý nghĩa 5%. (Giả sử phương
sai của trẻ sơ sinh trai và gái là như nhau) 65 66

11
9/4/2021

2.3. So sánh hai trung bình của hai tổng thể 2.3. So sánh hai trung bình của hai
tổng thể
3. Hai phương sai 2X  Y2 và chưa biết:
b. Kiểm định một phía (phía phải)
Ta có bài toán kiểm định
H 0 :  X   Y

H1 :  X   Y
Nếu H 0 đúng, ta có thống kê
(X  Y)
T  St(n  m  2)
 (n  1)S2X
 (m  1)S2Y   m  n 
  
 nm2   nm 
67 68

2.3. So sánh hai trung bình của hai 2.3. So sánh hai trung bình của hai
tổng thể tổng thể
3. Hai phương sai 2X  Y2 và chưa biết:
3. Hai phương sai 2X  2Y và chưa biết
c. Kiểm định một phía (phía trái)
b. Kiểm định một phía (phía phải) Ta có bài toán kiểm định
Với độ tin cậy   1   , ta có C  t n m2 H 0 :  X   Y

So sánh T và C H1 :  X   Y
Nếu H 0 đúng, ta có thống kê
Nếu T  C : Bác bỏ H 0 (X  Y)
T  St(n  m  2)
Nếu T  C : Chấp nhận H 0  (n  1)S2X  (m  1)S2Y   m  n 
  
 nm2   nm 
69 70

2.3. So sánh hai trung bình của hai 2.4. So sánh hai tỷ lệ của hai tổng thể
tổng thể
1. Kiểm định hai phía (hai bên)
3. Hai phương sai 2X  2Y và chưa biết
Ta có bài toán kiểm định
c. Kiểm định một phía (phía trái) H 0 : p1  p2
Với độ tin cậy   1   , ta có C  t n m2 
H1 : p1  p 2
So sánh T và C Nếu H 0 đúng, ta có thống kê
Nếu T  C : Bác bỏ H 0 f1  f 2
Z  N(0,1)
mn
Nếu T  C : Chấp nhận H 0 f (1  f )  
 mn 
71 72

12
9/4/2021

2.4. So sánh hai tỷ lệ của hai tổng thể 2.4. So sánh hai tỷ lệ của hai tổng thể

1. Kiểm định hai phía (hai bên) Ví dụ 12. Giả sử quan sát ngẫu nhiên
nf1  mf 2 100 bé trai thấy có 15 bé mắc bệnh B; và
Với f 
nm quan sát ngẫu nhiên 150 bé gái thấy có
Với độ tin cậy   1  , ta có C  Z1
2
18 bé mắc bệnh B. Hỏi rằng tỷ lệ nhiễm
So sánh Z và C bệnh B đối với bé trai và bé gái có giống
Nếu Z  C : Bác bỏ H 0 nhau hay không? Kết luận với mức ý
Nếu Z  C : Chấp nhận H 0 nghĩa 5%.
73 74

2.4. So sánh hai tỷ lệ của hai tổng thể 2.4. So sánh hai tỷ lệ của hai tổng thể
 H 0 : p1  p 2

 H1: p1  p 2

75 76

2.4. So sánh hai tỷ lệ của hai tổng thể 2.4. So sánh hai tỷ lệ của hai tổng thể

1 
2. Kiểm định một phía (phía phải)
0  C    0,475  C  1,96
2 Ta có bài toán kiểm định
H 0 : p1  p2

H1 : p1  p2
Nếu H 0 đúng, ta có thống kê
f1  f 2
Z  N(0,1)
mn
f (1  f )  
 mn 
77 78

13
9/4/2021

2.4. So sánh hai tỷ lệ của hai tổng thể 2.4. So sánh hai tỷ lệ của hai tổng thể

2. Kiểm định một phía (phía phải) 3. Kiểm định một phía (phía trái)
nf1  mf 2 Ta có bài toán kiểm định
Với f 
nm H 0 : p1  p2
Với độ tin cậy   1   , ta có C  Z12 
2
H1 : p1  p2
So sánh Z và C Nếu H 0 đúng, ta có thống kê
Nếu Z  C : Bác bỏ H 0 f1  f 2
Z  N(0,1)
mn
Nếu Z  C : Chấp nhận H 0 f (1  f )  
 mn 
79 80

2.4. So sánh hai tỷ lệ của hai tổng thể 2.4. So sánh hai tỷ lệ của hai tổng thể
Ví dụ 13. Bệnh B có thể chữa được bằng hai
3. Kiểm định một phía (phía trái)
loại thuốc là H và K. Người ta cho dùng thử
nf1  mf 2
Với f  thuốc H cho 250 bệnh nhân bị bệnh B và
nm
Với độ tin cậy   1   , ta có C  Z12 thấy có 210 người khỏi bệnh và dùng thuốc
2 K cho 200 bệnh nhân bị bệnh B và thấy có
So sánh Z và C
175 người khỏi bệnh. Với mức ý nghĩa 1%
Nếu Z  C : Bác bỏ H 0 có thể kết luận thuốc K có khả năng chữa
Nếu Z  C : Chấp nhận H 0 bệnh B tốt hơn thuốc H hay không?
81 82

2.4. So sánh hai tỷ lệ của hai tổng thể 2.4. So sánh hai tỷ lệ của hai tổng thể
H 0 : p X  p Y

H1: p X  p Y

83 84

14
9/4/2021

2.4. So sánh hai tỷ lệ của hai tổng thể 2.5. So sánh hai phương sai của hai
tổng thể
Ta có bài toán kiểm định
1  2 2 2
0  C    0, 45  C  1,64 H 0 : X   Y
2  2 2
H1 :  X   Y
Nếu H 0 đúng, ta có thống kê
S2X
F  F(n  1, m  1)
S2Y
Phöông sai lôùn
F  F(n  1, m  1)
Phöông sai nhoû
85 86

2.5. So sánh hai phương sai của hai 2.5. So sánh hai phương sai của hai
tổng thể tổng thể
Với độ tin cậy   1   , ta có Ví dụ 14. Quan sát ngẫu nhiên trọng lượng X
của 25 trẻ sơ sinh trai, ta tính được phương
C  f  (n  1,m  1)
sai mẫu có hiệu chỉnh là 450 (gram) 2 và quan
So sánh F và C sát ngẫu nhiên trọng lượng Y của 19 trẻ sơ
sinh gái, ta tính được phương sai mẫu có hiệu
Nếu F  C : Bác bỏ H 0 chỉnh là 360 (gram) 2 . Hãy so sánh hai phương
Nếu F  C : Chấp nhận H 0 sai tổng thể. Kết luận với mức ý nghĩa 5%.

87 88

2.5. So sánh hai phương sai của hai tổng thể 2.5. So sánh hai phương sai của hai tổng thể

89 90

15
1

Bài Giảng Chương 6. Phân tích phương sai


Thống kê ứng dụng 1. Phân tích phương sai một yếu tố
Chương 6. 2. Dùng Excel phân tích phương
sai một yếu tố
Phân tích phương sai
GV: ThS. Nguyễn Trung Đông
nguyentrungdong144@gmail.com
1 2

1. Phân tích phương sai một yếu tố 1. Phân tích phương sai một yếu tố

3 4

1. Phân tích phương sai một yếu tố 1. Phân tích phương sai một yếu tố

5 6

1
1

1. Phân tích phương sai một yếu tố 1. Phân tích phương sai một yếu tố

7 8

1. Phân tích phương sai một yếu tố 1. Phân tích phương sai một yếu tố

9 10

1. Phân tích phương sai một yếu tố 1. Phân tích phương sai một yếu tố

11 12

2
1

1. Phân tích phương sai một yếu tố 1. Phân tích phương sai một yếu tố

13 14

1. Phân tích phương sai một yếu tố 2. Dùng Excel phân tích phương sai 1 yếu tố

15 16

2. Dùng Excel phân tích phương sai 1 yếu tố 2. Dùng Excel phân tích phương sai 1 yếu tố

17 18

3
1

2. Dùng Excel phân tích phương sai 1 yếu tố 2. Dùng Excel phân tích phương sai 1 yếu tố

19 20

2. Dùng Excel phân tích phương sai 1 yếu tố 2. Dùng Excel phân tích phương sai 1 yếu tố

21 22

4
Bài Giảng Chương 7. Phân tích chỉ số
Thống kê ứng dụng
 Khái niệm chỉ số
Chương 7  Phân loại chỉ số
PHÂN TÍCH CHỈ SỐ  Phương pháp tính chỉ số
 Hệ thống chỉ số
GV: ThS. Nguyễn Trung Đông  Một số chỉ số thường gặp trong
nguyentrungdong144@gmail.com thực tế
1 2

1. Khái niệm chỉ số 2. Phân loại chỉ số


+) Chỉ số thống kê là chỉ tiêu số tương
đối, biểu hiện mối quan hệ so sánh (không  Chỉ số cá thể : Phản ánh
gian, thời gian và theo kế hoạch) giữa các Dự váo biến động của từng bộ phận
mức độ của cùng một hiện tượng kinh tế. phạm vi  Chỉ số tổng hợp : Phản
+) Chỉ số được dùng để nghiên cứu tình tính toán ánh biến động của tất cả các
hình biến động của những hiện tượng kinh bộ phận
tế phức tạp, không đồng chất bao gồm
nhiều yêu tố không thể tổng hợp trực tiếp
với nhau được. 3 4

2. Phân loại chỉ số Công thức chỉ số

 Chỉ số của chỉ tiêu khối lượng: • Chỉ số cá thể (i) • Chỉ số tổng hợp (I)
Dự vào • CS cá thể của chỉ • CS tổng hợp của chỉ
CS KLSX, KL tiêu thụ, CS số LĐ.
tính chất tiêu khối lượng tiêu khối lượng
 Chỉ số của chỉ tiêu chất lượng :
của chỉ (iq) (Iq)
CS giá thanh, CS đơn giá, CS năng
tiêu • Chỉ số cá thể của • Chỉ số tổng hợp của
suất lao động.
chỉ tiêu chất lượng chỉ tiêu chất lượng
(ip) (Ip)
5 6

1
3. Phương pháp tính chỉ số
Bộ phận
1000 ñ/ñvsp 3.1. Chỉ số cá thể (CSCT): là chỉ số
SP Đơn Tháng 8 Tháng 9 được lập cho từng yếu tố, từng phần tử
vị Đơn Khối Đơn Khối trong tổng thể hiện tượng nghiên cứu.
giá 0 lượng 0 giá 1 lượng q1
p q p
p1
A Mét 64 40.000 60 42.000 • CSCT của chỉ tiêu chất lượng: i p 
p0
B Cái 24 31.000 24 35.000
q
C Bộ 70 5.000 68 6.000 • CSCT của chỉ tiêu khối lượng: i q  1
q0
p1q1
• CSCT của chỉ tiêu toàn bộ: i pq 
7 p 0q 0 8

Chỉ số cá thể của chỉ tiêu khối lượng Bộ phận


So sánh khối lượng tiêu thụ SP C của T9/T8? 1000 ñ/ñvsp
q1 6000  KL SP Đơn Tháng 8 Tháng 9
iq    1, 2  120%
q 0 5000 vị Đơn Khối Đơn Khối
giá p0 lượng q0 giá p1 lượng q1
 KL
Tốc độ tăng: a  iq  1  20% A Mét 64 40.000 60 42.000
B Cái 24 31.000 24 35.000
Lượng tăng  q  q1  q0  1000 C Bộ 70 5.000 68 6.000

Khối lượng tiêu thụ T9/T8 tăng 20% hay tăng


1000 bộ 9 10

Chỉ số cá thể của chỉ tiêu chất lượng Chỉ số cá thể toàn bộ
So sánh đơn giá tiêu thụ SP C của T9/T8? So sánh doanh thu tiêu thụ SP C của T9/T8
p 68 p1q1 68  6000
ip  1   0,9714  97,14% ÑG i pq    116,57%  DT
p0 70 p0q 0 70  5000

 ÑG Tốc độ tăng a  i pq  1  16,57%


 DT
Tốc độ giảm a  i p  1  2,86%

Lượng giảm  p  p1  p0  2000 Lượng tăng  pq  p1q1  p0 q0  58


Đơn giá tiêu thụ của SP C của T9/T8 giảm Doanh thu tiêu thụ SP C của T9/T8 tăng
2,86% hay là giảm 2000 đồng/ bộ 11 16,57% hay là tăng 58 triệu đồng 12

2
Mối quan hệ của các chỉ số cá thể 3. Phương pháp tính chỉ số
p1q1 p q
i pq  ; ip  1 ; iq  1 3.2. Chỉ số tổng hợp: Chỉ số tổng hợp
p0q 0 p0 q0
là loại chỉ số chỉ nghiên cứu sự biến
Ta có động về một chỉ tiêu nào đó của nhiều
i pq  i p  i q đơn vị, nhiều phần tử của hiện tượng
phức tạp

13 14

3. Phương pháp tính chỉ số Bộ phận


• Chỉ số tổng hợp của chỉ tiêu khối lượng: 1000 ñ/ñvsp
SP Đơn Tháng 8 Tháng 9

Iq 
 q1p 0 vị Đơn Khối Đơn Khối

q
Laspeyres… giá p0 lượng q0 giá p1 lượng q1
0 p0
A Mét 64 40.000 60 42.000
B Cái 24 31.000 24 35.000

Iq 
q p 1 1 C Bộ 70 5.000 68 6.000

q p
Paasche …
0 1

15 16

Iq 
q p1 0

64  42000  24  35000  70  6000
 1,0805 3. Phương pháp tính chỉ số
q p0 0 64  40000  24  31000  70  5000
• Chỉ số tổng hợp của chỉ tiêu chất lượng
 KL
(giá cả)

Tốc độ tăng aq  Iq  1  8, 05%


 DT Ip 
pq 1 0
Laspeyres…
pq 0 0

Lượng tăng

pq(q)   p0q1   p0q 0  294


Ip 
pq 1 1
Paasche …
Khối lượng tiêu thụ chung các mặt hàng của T9/T8 pq 0 1
tăng 8,05% làm cho doanh thu tăng 294 triệu đồng 17 18

3
Ip 
p q
1 1

60  42000  24  35000  68  6000
 0,9544
Bộ phận p q
0 1 64  42000  24  35000  70  6000
1000 ñ/ñvsp
 ÑG
SP Đơn Tháng 8 Tháng 9
vị Đơn Khối Đơn Khối
 DT
giá 0 lượng 0 giá 1 lượng q1
p q p Tốc độ giảm ap  Ip  1  4,56%
A Mét 64 40.000 60 42.000
B Cái 24 31.000 24 35.000 Lượng giảm

C Bộ 70 5.000 68 6.000 pq (p)   p1q1   p0q1  180


Do đơn giá tiêu thụ chung các mặt hàng của T9/T8
19
giảm 4,56% làm cho doanh thu giảm 180 triệu đồng 20

3. Phương pháp tính chỉ số Bộ phận


1000 ñ/ñvsp
• Chỉ số tổng hợp của chỉ tiêu toàn bộ
SP Đơn Tháng 8 Tháng 9
vị Đơn
p
Khối Đơn Khối
1 q1 giá p0 lượng q0 giá p1 lượng q1
I pq 
p 0 q0 A
B
Mét
Cái
64
24
40.000 60
31.000
42.000
24 35.000
C Bộ 70 5.000 68 6.000

21 22

Ipq 
p q
1 1

60  42000  24  35000  68  6000
 1,0312 Mối quan hệ của các chỉ số tổng hợp
p q
0 0 64  40000  24  31  70  5000

 DT p q 1 1

p q  p q
1 1 0 1

p q 0 0 p q p q
0 1 0 0

 DT
Tốc độ tăng apq  Ipq  1  3,12% Ta có
Lượng tăng I pq  I p  Iq
pq   p1q1   p0q 0  114
Tổng doanh thu tiêu thụ T9/T8 tăng 3,12% hay là  pq   pq ( p )   pq ( q )
tổng doanh thu tăng 114 triệu đồng 23 24

4
3. Phương pháp tính chỉ số 3. Phương pháp tính chỉ số
• Chỉ số tổng hợp khối lượng không gian • Chỉ số tổng hợp giá cả không gian
Công thức chỉ số khối lượng tổng hợp ở hai Công thức chỉ số giá cả ở hai thị trường A
thị trường A và B và B:
I p(A|B) 
 p Q ,Q  q
A
 qB
 qA p p A q A  p Bq B
p Q
B
A

Iq(A|B)  , p
q B p qA  qB Ví dụ: Tài liệu giá cả và khối lượng hàng
tiêu thụ của 3 mặt hàng tại hai thành phố X
25
và Y trong cùng một chu kỳ như sau: 26

3. Phương pháp tính chỉ số 4. Hệ thống chỉ số


Loại Thành phố X Thành phố Y
hàng hóa Giá đơn vị Lượng hàng Giá đơn vị Lượng hàng Khái niệm : Là một dãy các chỉ số có
(1000đ) tiêu thụ (tấn) (1000đ) tiêu thụ (tấn)
A 5.0 250 4.8 262 mối liên hệ với nhau hợp thành một
B 4.6 430 4.9 392
C 6.9 187 6.8 213 đẳng thức nhất định. Cơ sở để xây
dựng một hệ thống chỉ số là dựa vào
• Tính chỉ số tổng hợp khối lượng hàng hóa
tiêu thụ thành phố X so với thành phố Y? các phượng trình kinh tế
• Tính chỉ số giá tổng hợp giá cả hàng hóa
tiêu thụ thành phố X so với thành phố Y?
27 28

4. Hệ thống chỉ số 4. Hệ thống chỉ số


Tóm lại 1/ 3/
DT= ĐG x KL SL = NSLĐ x Số CN
Hệ thống Là đẳng thức kinh tếá
(pq) (p) (q) (WT) (W) (T)
chỉ số Mối quan hệ giữa các chỉ số Ipq = Ip x Iq IWT = IW x IT
Nguyên tắc thành lập 2/ 4/
CPSX = GT x KLSX. Tổng TL= TL x Số LĐ
Lập phương trình kinh tế. (zq) (z) (q) (XT) (X) (T)
Đặt ký hiệu. Izq = Iz x Iq IXT = IX x IT
Viết hệ thống chỉ số 29 30

5
Ipq = Ip x Iq Phaân tích söï bieán ñoäng cuûa toång doanh thu
qua 2 thaùng do caùc nhaân toá aûnh höôûng.
pq 1 1
= pq x p q
1 1 0 1
Bộ phận
p q 0 0 p q p q
0 1 0 0
1000 ñ/ñvsp
( p1q1   p 0 q 0) =
SP Đơn Tháng 8 Tháng 9
( p1q1   p 0q1) + ( p 0q1   p 0q 0) vị Đơn Khối Đơn Khối
( p1q1   p 0q 0) giá p0 lượng q0 giá p1 lượng q1
= A Mét 64 40.000 60 42.000
p q 0 0
B Cái 24 31.000 24 35.000
( p q   p q )
1 1 0 1 ( p 0 q1   p 0 q 0)
+ C Bộ 70 5.000 68 6.000
p q 0 0
p q 0 0
31 32

Ipq = Ip x Iq Tổng doanh thu tiêu thụ T9 so với T8 tăng 3,12%


pq 1 1
= pq 1 1
x p q 0 1 hay 114 triệu do các nguyên nhân:
p q0 0
p q0 1
p q 0 0 Do giá bán T9 giam 4,56% so với T8 làm cho
3.768.000 3.948.000 tổng doanh thu giảm 4,93% hay là giảm 180
= 3.768.000 x
3.654.000 3.948.000 3.654.000 triệu.
1,0312 = 0,9544 x 1,0805 Do khối lượng tiêu thụ của T9 tang 8,05% so
+3,12% DT - 4,56 % ĐG + 8,05 % KL với T8 làm cho tổng doanh thu tăng 8,05% hay là
tăng 294 triệu
114.000 DT = - 180.000 DT + 294.000 DT

+ 3,12% DT = - 4,93% DT + ( 8,05%) DT


33 Doanh thu tăng là do khối lượng tăng 34

5. Một số chỉ số thường gặp trong thực tế 5. Một số chỉ số thường gặp trong thực tế
5.1. Chỉ số giá tiêu dung CPI 5.2. Chæ soá chöùng khoaùng (VN - Index)
Toång giaù trò TT cuûa caùc CP nieâm yeát hieän taïi
Chỉ số giá tiêu dùng ở nước ta hiện nay được VN-index= ×100
Toång giaù trò cuûa caùc coå phieáu nieâm yeát cô sô û

tính theo công thức Laspeyres Ngaøy ñöôïc choïn laøm cô sôû laø ngaøy maø VN-index = 100 ñieåm

Ip 
pq t 2000
Ví duï. Ngaøy 28/07/2000
Teân CP Giaù thöïc hieän Soá löôïng NY Giaù thò tröôøng
p q 2000 2000 REE 16000 15.000.000 240.000.000.000
SAM 17000 12.000.000 204.000.000.000
Hiện nay, cơ cấu chi tiêu của các hộ gia đình TOÅNG 444.000.000.000

năm 2000 được chọn làm quyền số để tính CPI. 240.000.000.000+204.000.000.000


35
VN  index   100%  100
36
444.000.000.000

6
5. Một số chỉ số thường gặp trong thực tế
5.2. Chæ soá chöùng khoaùng (VN - Index)

Sau ñoù, vaøo ngaøy 2/8/2000 . Keát quaû giao dòch nhö sau
Giaù thöïc Soá löôïng
Teân CP Giaù thò tröôøng
hieän NY
REE 16600 15.000.000 249.000.000.000
SAM 17500 12.000.000 210.000.000.000
TOÅNG 459.000.000.000

249,000,000,000+210,000,000,000
VNindex   100%  103,3837
444,000,000,000

7
1

Bài Giảng Chương 8.


Thống kê ứng dụng Phân tích chuỗi thời gian
1. Khái niệm và phân loại
Chương 8.
2. Các chỉ tiêu phân tích dãy số thời gian
Phân tích chuỗi thời gian
3. Hàm xu thế
GV: ThS. Nguyễn Trung Đông 4. Dự báo biến động của dãy số thời gian
nguyentrungdong144@gmail.com
1 2

1. Khái niệm và phân loại 1. Khái niệm và phân loại


1.1. Khái niệm: Dãy số thời gian là một Dãy số thời gian có 2 thành phần :
phương pháp phân tích thống kê được sử dụng +) Thời gian : (ti)
khá phổ biến, nhằm nghiên cứu các đặc điểm, Ví dụ : Năm, tháng, tuần ngày,…
bản chất xu hướng và tính quy luật về sự phát +) Giá trị của hiện tượng nghiên cứu : (yi)
triển của hiện tượng thường xuyên biến động
Ví dụ : Doanh thu, lợi nhuận, sản lượng,…
theo thời gian.
TG (ti) t1 t2 t3 t4 ….. tn
GT của chỉ tiêu (yi) y1 y2 y3 y4 yn
3 4

1. Khái niệm và phân loại 1. Khái niệm và phân loại


1.2. Ý nghĩa : Qua dãy số thời gian ta có thể 1.3. Dãy số thời kỳ là dãy số biểu hiện các
phân tích được : mức độ của chỉ tiêu ở từng thời kỳ
 Sự biến động của hiện tượng qua TG Ví dụ 1. Giá trị sản xuất công nghiệp của một
 Sự phát triển của hiện tượng xí nghiệp A (đơn vị tính: triệu đồng)
 Xu hướng phát triển cơ bản của hiện tượng Năm 2005 2006 2007 2008 2009 2010
 Quy luật phát triển của hiện tượng GTSX 31.2 35.4 39.47 40.23 46.89 50.12

5 6

1
1

2. Các chỉ tiêu phân tích dãy số thời gian


1. Khái niệm và phân loại
2.1. Mức độ bình quân theo thời gian
1.4. Dãy số thời điểm: là dãy số biểu hiện các
a) Đối với dãy số thời kỳ :
mức độ của chỉ tiêu ở từng thời điểm nhất định.
1 n
Ví dụ 2. Giá trị hàng nhập khẩu của công ty A. y  yi
n i 1
Kiểm kê vào ngày 1 hàng tháng (đơn vị tính:
triệu đồng) b) Đối với dãy số thời điểm:
1  y1 yn 
y   y2   yn1  
n 1 2 2
7 8

2. Các chỉ tiêu phân tích dãy số thời gian 2. Các chỉ tiêu phân tích dãy số thời gian

1 1
1 n 400  460  480  520  560  596  642 .500  800  200  .600
y  yi 
n i=1 7
 522,57.
y2 2  516,67.
9
4 1 10

2. Các chỉ tiêu phân tích dãy số thời gian 2. Các chỉ tiêu phân tích dãy số thời gian
2.1. Mức độ bình quân theo thời gian
c) Trường hợp dãy số thời điểm có
khoảng cách thời gian không đều nhau
n

t y i i
y i1
n

t
i1
i

11 12

2
1

2. Các chỉ tiêu phân tích dãy số thời gian 2. Các chỉ tiêu phân tích dãy số thời gian
2.2. Lượng tăng (giảm) tuyệt đối là chỉ tiêu thể hiện
sự thay đổi về giá trị tuyệt đối của hiện tượng giữa hai
thời kỳ hoặc thời điểm.
a) Lượng tăng (giảm) tuyệt đối liên hoàn
 i  y i  y i1 , i  2, 3,..., n
b) Lượng tăng (giảm) tuyệt đối định gốc
n
i  yi  y1   n    i
4 i2
t y i i
50  15  58  26  55  23  48  26 c) Lượng tăng (giảm) tuyệt đối trung bình
y= i=1
4   53,01.
15  26  23  26 1 n  y y
t
i=1
i   i  n n1  nn 1 1
n  1 i2
13 14

2. Các chỉ tiêu phân tích dãy số thời gian 2. Các chỉ tiêu phân tích dãy số thời gian

15 16

2. Các chỉ tiêu phân tích dãy số thời gian 2. Các chỉ tiêu phân tích dãy số thời gian
2.3. Tốc độ phát triển
yi
a) Tốc độ phát triển liên hoàn: t i 
y i 1
yi
b) Tốc độ phát triển định gốc: Ti 
y1
n Ti
 t i  Tn ;  ti
i2 Ti1
c) Tốc độ phát triển liên hoàn trung bình là chỉ tiêu thể
hiện nhịp độ phát triển đại diện của hiện tượng trong
suốt thời kỳ nghiên cứu
n yn
t  n 1  t i  n 1
i 2 y1
Còn gọi là số trung bình nhân (Geometric Mean) 17 18

3
1

2. Các chỉ tiêu phân tích dãy số thời gian 2. Các chỉ tiêu phân tích dãy số thời gian
2.4. Tốc độ tăng (giảm) là chỉ tiêu phản ánh mức độ
của hiện tượng giữa 2 thời gian nghiên cứu đã tăng
(giảm) bao nhiêu lần (%)
a) Tốc độ tăng (giảm) liên hoàn
yi  yi1 
ai   i  t i  1 (i  2, n)
yi1 yi1
b) Tốc độ tăng (giảm) định gốc
y i  y1 i
Ai    Ti  1 (i  2, n)
y1 y1
c) Tốc độ tăng (giảm) trung bình
a  t 1 a  t 100
19 Tính theo số lần Tính theo số phần trăm 20

2. Các chỉ tiêu phân tích dãy số thời gian 2. Các chỉ tiêu phân tích dãy số thời gian
2.5. Giá trị tuyệt đối của 1% tăng (giảm) phản ánh
1% tăng (giảm) của 2 thời kỳ đứng liền nhau của hiện
tượng nghiên cứu tương ứng với một lượng giá trị tuyệt
đối là bao nhiêu  y
gi  i
 i1
; i  2 , 3,...
a i (%) 100

21 22

3. Hàm xu thế 3. Hàm xu thế


Phương pháp dự báo bằng hàm xu thế là khái
3.1. Phương trình đường thẳng
quát hóa chiều hướng biến động của hiện

y t  a 0  a1t
tượng nghiên cứu bằng một hàm số toán học,
nhằm mô tả một cách sát nhất, gần đúng nhất Trong đó: a0, a1 được xác định
biến động thực tế của hiện tượng.
Nhận ra mô hình.


 na 0  a1  t  y

a 0  t  a 1  t  yt


2

Lựa chọn mô hình.

Điều chỉnh mô hình. 24

4
1

3. Hàm xu thế 3. Hàm xu thế


Ví dụ 10 3.2. Phương trình hàm bậc 2:
Năm Năng suất Phần tính toán
Bình quân
ŷ t  a 0  a1t  a 2 t 2
Thứ tự thời t2 ty
(tạ/ha) y gian (t) Các tham số a0, a1, a2 có thể xác định thông
2001 30 1 1 30 30.4 qua hệ phương trình
2002 32 2 4 64 31.2 n n n

2003 31 3 9 93 32.0  na 0  a1  t i  a 2  ti2  y i
2004 34 4 16 136 32.8 i 1 i 1 i 1

2005 33 5 25 165 33.6  n n
2
n n

 a 0  ti  a1  ti  a 2  ti3  y t i i
Cộng 160 15 55 488  i 1 i 1 i 1 i 1


 160  5a 0  15a 1  n 2 n n n


3
 y t  29, 6  0, 8 t a 0  t i  a1  ti  a 2  ti4  y t 2

488  15a 0  55a 1
 25  i1 i1 i 1 i 1
i i

3. Hàm xu thế 3. Hàm xu thế

 8a 0  36a1  204a 2  70,8 a 0  3,8143


 
 36a 0  204a 1  1296a 2  385,35  a 1  0,3196
 204a  1296a 1  8772a 2  2429,85 a 2  0,1411
 0

3. Hàm xu thế 3. Hàm xu thế


3.3. Phương trình hàm mũ:
ŷ t  a 0a1t
Các tham số a0, a1 có thể xác định thông qua
hệ phương trình
n n

 n ln  a 0   ln  a1   t i   ln  y  i
10ln  a 0   55ln  a1   20,506 ln  a 0   0,8555 a 0  2,353
 i 1 i 1
 
 
n n n 55ln  a 0   385ln  a1   130,71 ln  a1   0,2173 a1  1, 243
ln  a  t  ln  a1   t i2 
 0  i
i 1 i 1
 t  ln y 
i 1
i i

5
1

3. Hàm xu thế 4. Dự báo biến động của dãy số TG


4.1. Dự báo dựa vào lượng tăng (giảm) tuyệt đối TB

ŷ n  L  yn  L
Trong đó:
ŷ n  L : Mức độ dự báo vào thời gian (n+L)
y n : Mức độ cuối cùng của dãy số thời gian

 : Lượng tăng (giảm) tuyệt đối trung bình


L : Tầm xa dự báo

Năm 2003 2004 2005 2006 4. Dự báo biến động của dãy số TG
Sản lượng (1000 tấn) 256,1 296,6 367,6 460,1 4.2. Dự báo dựa vào tốc độ phát triển TB

ŷnL  yn   t 
L
Dự đoán sản lượng 2007, 2008
y 2006  y 2003 460,1  256,1
   68
2006  2003 3 Trong đó:
ŷ 2007  y 2006    460,1  68  528,1 ŷ n  L : Mức độ dự báo vào thời gian (n+L)
ŷ 2008  y 2006  2  596,1 y n : Mức độ cuối cùng của dãy số thời gian

Phương pháp này thường được sự dụng khi có t : Tốc độ phát triển trung bình

lượng tăng (giảm) tuyệt đối xấp xỉ nhau 33 L : Tầm xa dự báo

Năm 2003 2004 2005 2006 4. Dự báo biến động của dãy số TG
Sản lượng (1000 tấn) 256,1 296,6 367,6 460,1 4.3. Dự báo ngoại suy hàm xu thế
Dự đoán sản lượng 2007, 2008 Dựa trên cơ sở chiều hướng biến động của
yn 460,1
hiện tượng nghiên cứu được khái quát hóa
t  n 1 3  1, 216 bằng một hàm số tuyến tính có dạng.
y1 256,1
ŷ2007  y 2006  t   460,1.1, 216  559,33
2 2
ŷ t  a 0  a1t
ŷ2008  y2006  t   460,1. 1, 216   679,96 Suy ra

Phương pháp này thường được sự dụng khi có ŷ nL  a 0  a1 n  L


các tốc độ PT liên hoàn tương đối xấp xỉ nhau 35

6
1

Năm 2003 2004 2005 2006


Sản lượng (1000 tấn) 256,1 296,6 367,6 460,1

Dự đoán sản lượng 2007, 2008



 1380, 4  4a 0  10a 1 
a 0  174, 35
 


3792, 5  10a 0  30a 1 
 
a 1  68, 3
y t  174, 35  68, 3t

ŷ 2007  y5  515,85
ŷ 2008  y6  584,15
37

You might also like