You are on page 1of 38

TÀI LIỆU ÔN TẬP

Nguyen Phuoc Hung 0888462501


Phuochung26010401@gmail.com

LỜI NÓI ĐẦU ....................................................................................................................................................................................................... 3

CHƯƠNG 2: THỐNG KÊ MÔ TẢ: TRÌNH BÀY BẰNG BẢNG VÀ ĐỒ THỊ ............................................................................................................... 4

2.1 Tóm tắt dữ liệu định tính ......................................................................................................................................................................... 4

2.2 Tóm tắt dữ liệu định lượng ...................................................................................................................................................................... 5

2.3 Phân tích dữ liệu thăm dò ........................................................................................................................................................................ 6

2.4 Bảng chéo và biểu đồ phân tán ................................................................................................................................................................ 7

CHƯƠNG 3: THỐNG KÊ MÔ TẢ: CÁC THƯỚC ĐO SỐ ......................................................................................................................................... 8

3.1 Các đại lượng đo lường vị trí .................................................................................................................................................................... 8

3.2 Các đại lượng đo lường độ phân tán...................................................................................................................................................... 10

3.3 Các đại lượng đo lường hình dáng phân phối, vị trí tương đối và phát hiện giá trị bất thường............................................................. 11

3.4 Phân tích dữ liệu thăm dò ...................................................................................................................................................................... 11

3.5 Các đại lượng đo lường mối liên hệ giữa hai biến .................................................................................................................................. 12

CHƯƠNG 8: ƯỚC LƯỢNG KHOẢNG ................................................................................................................................................................. 14

8.1 Trung bình tổng thể: biết σ .................................................................................................................................................................... 14

8.2 Trung bình tổng thể: chưa biết σ ........................................................................................................................................................... 15

8.3 Tỷ lệ tổng thể ......................................................................................................................................................................................... 17

CHƯƠNG 9: KIỂM ĐỊNH GIẢ THUYẾT ............................................................................................................................................................... 19

9.1 Phát triển giả thuyết KHÔNG và giả thuyết ĐỐI ..................................................................................................................................... 19

9.2 Sai lầm loại I và loại II (đọc thêm)........................................................................................................................................................... 20

9.3 Trung bình tổng thể: Trường hợp σ đã biết (Vô phần quan trọng) ........................................................................................................ 20

9.4 Trung bình tổng thể: Trường hợp σ chưa biết ....................................................................................................................................... 23

9.5 Tỷ lệ tổng thể ......................................................................................................................................................................................... 24

CHƯƠNG 10: SUY DIỄN THỐNG KÊ CHO TRUNG BÌNH VÀ TỶ LỆ CỦA HAI TỔNG THỂ..................................................................................... 26

10.1 Suy diễn về chênh lệch giữa trung bình của hai tổng thể khi σ1 và σ2 đã biết ...................................................................................... 26

10.2 Suy diễn về chênh lệch giữa trung bình của hai tổng thể khi σ1 và σ2 chưa biết .................................................................................. 28

10.3 Suy diễn về chênh lệch trung bình giữa hai tổng thể: mẫu theo cặp (phần quan trọng) ..................................................................... 29

10.4 Suy diễn về chênh lệch giữa hai tỷ lệ tổng thể ..................................................................................................................................... 33

CHƯƠNG 13: CHỈ SỐ......................................................................................................................................................................................... 33

1. Chỉ số giá tương đối ........................................................................................................................................................................... 33

2. Chỉ số giá tổng hợp ............................................................................................................................................................................ 33

3. Chỉ số giá tổng hợp có trọng số (Laspeyres)....................................................................................................................................... 33

4. Chỉ số giá tổng hợp có trọng số (Paasche) ......................................................................................................................................... 33

5. Một số chỉ số quan trọng ................................................................................................................................................................... 34

CHƯƠNG 14: DỰ BÁO ...................................................................................................................................................................................... 35

14.1 Các thành phần của một chuỗi thời gian (tự đọc) ................................................................................................................................ 35

14.2 Các phương pháp làm trơn (tự đọc) .................................................................................................................................................... 35

14.3 Dự phóng xu hướng ............................................................................................................................................................................. 35

14.4 Mô hình nhân ....................................................................................................................................................................................... 37

TÀI LIỆU THAM KHẢO ....................................................................................................................................................................................... 37


2
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

LỜI NÓI ĐẦU


Xin chào mọi người, mình là Nguyễn Phước Hưng. Lời đầu tiên mình xin gửi lời cám ơn đến tất cả
các bạn đã ủng hộ khóa Tổng ôn toán cao cấp vừa qua cũng như các bạn chỉ vừa mới biết đến mình
ở khóa Thống kê này. Mình xin giới thiệu đến các bạn khóa Ôn tập Thống kê trong Kinh tế và Kinh
doanh với nhiệt huyết của chàng trai tuổi đôi mươi. Trong tập tài liệu này, mình đã cố gắng tóm tắt
toàn bộ kiến thức cũng như các bài tập tình huống vận dụng. Minh hi vọng tài liệu này sẽ giúp ích
cho bạn, từ đó giúp bạn có sự chuẩn bị tốt và đạt kết quả tốt trong kì thi sắp tới. Vì thế, chúng ta hãy
cùng nhau dành khoảng 3 tuần trước thi để ôn môn này.
Một điều mình cần thông báo trước khi bạn vào khóa học: Môn này không như Toán cao cấp, lượng
kiến thức khá lớn và mang tính vận dụng cao hơn nên mình hi vọng các bạn nên có đầu tư ngay từ
ban đầu, 2-3 ngày xong một chương, tránh trường hợp nước đến chân mới chạy như Toán nha.
Trong quá trình biên soạn, do kiến thức còn hạn hẹp và và hầu hết dựa trên kinh nghiệm tích lũy
được sau một học kì, cộng với việc tự nghiên cứu thêm trên các trang web, không ngừng trao dồi
bản thân, học hỏi nhưng đôi khi lối viết, ngôn từ sử dụng dưới đây không tránh khỏi nhiều sai sót,
hạn chế về giọng nói, cách quay, độ phân giải khi tải lên, …. Mặc dù đã cố gắng thiết kế tính toán
một cách chi tiết mạch lạc, các thông số đôi khi còn mang tính lý thuyết chưa thực tế. Mình mong
các bạn thông cảm và thật vinh hạnh cho mình khi nhận được sự góp ý của các bạn về tập tài liệu
này có tính khả thi và hiệu quả hơn, sẽ giúp được nhiều hơn cho các khóa sau. Mọi ý kiến đóng góp,
các bạn vui lòng gửi về: phuochung26010401@gmail.com .
Cám ơn các bạn K44 đã tin tưởng và tiếp tục gắn bó với mình trong khóa học này. Vậy thì còn chần
chờ điều gì nữa? Chúng ta bắt đầu thôi!

3
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

CHƯƠNG 2: THỐNG KÊ MÔ TẢ: TRÌNH BÀY BẰNG BẢNG VÀ ĐỒ THỊ

2.1 Tóm tắt dữ liệu định tính

Phân phối tần số là một bảng tóm tắt dữ liệu thể hiện tần số (số lượng) của các phần tử trong
mỗi nhóm không chồng lấn.
Phân phối tần suất bằng tỷ số hoặc tỷ lệ của phần tử thuộc về một nhóm
Phân phối tần suất phần trăm của một nhóm là tần suất nhân với 100.
Ví dụ:
1. Một bà chủ tạp hóa trên địa bàn Quận 7 TPHCM ghi lại sự lựa chọn của 50 khách hàng
ngẫu nhiên đối với 5 loại nước ngọt đang bán trong mỗi lần đến mua trong mùa hè
(Cocacola, Pepsi, Mirinda, 7 up và Sting). Bà có được bảng sau:
Pepsi Cocacola Mirinda 7 up
Cocacola Pepsi 7 up Mirinda
Mirinda Cocacola Pepsi Mirinda
7 up Cocacola Cocacola Pepsi
Mirinda Cocacola Pepsi Cocacola
Mirinda Pepsi Cocacola Sting
Pepsi Cocacola Mirinda Mirinda
Cocacola Pepsi Cocacola Sting
7 up Cocacola Pepsi Cocacola
Sting Sting Cocacola Pepsi
7 up Cocacola Pepsi Cocacola
Cocacola Pepsi Cocacola
Pepsi Cocacola Sting
Với bảng dữ liệu trên, bà chủ có dự định gì cho lần nhập hàng tới?

Yếu tố đề bài cho Tần số Tần suất Tần suất phần trăm

Tổng N 1 100

4
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

2. Cho phần phân phối tần suất như sau:


Nhóm Tần suất
A 0.22
B 0.18
C 0.4
D

a. Tần suất của nhóm D?


b. Tổng mẫu là 200. Tần số của nhóm D?
c. Tạo bảng phân phối tần số?
d. Tạo bảng phân phối tần suất phần trăm?

Biểu đồ thanh
• Thường trên trục ngang, chúng ta đặt các nhãn đại diện cho các nhóm.
• Thường trên trục đứng, thể hiện tần số, tần suất, tần suất phần trăm.
• Các thanh được tách ra để nhấn mạnh thực tế rằng mỗi nhóm riêng biệt.

Biểu đồ tròn

2.2 Tóm tắt dữ liệu định lượng

Phân phối tần số


Ba bước cần để xác định các nhóm cho một phân phối tần số dữ liệu định lượng.
1. Xác định số lượng các nhóm riêng biệt.

2. Xác định độ rộng của mỗi nhóm, thông thường các nhóm có cùng 1 độ rộng.

3. Xác định các giới hạn nhóm: Độ rộng nhóm xấp xỉ =

Trong thực tế, số lượng nhóm và độ rộng nhóm thích hợp được xác định bằng cách thử và
sai, nhà phân tích cần phán đoán để kết hợp số lượng nhóm và độ rộng sao cho có được một phân
phối tần số tóm tắt dữ liệu tốt nhất.

Phân phối tần suất và tần suất phần trăm


Ví dụ:
1. Mẫu tiền lương/tháng (triệu đồng) của 50 nhân viên Marketing trên địa bàn TPHCM.
91 78 93 57 75 52 99 80 97 62

5
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

71 69 72 89 66 75 79 72 76 75
74 62 68 104 97 105 77 65 80 109
85 97 88 68 83 68 71 69 67 74
62 82 98 101 79 105 79 69 62 73

Mức lương Tần số Mức lương Ts Ts %

Tổng

Đồ thị điểm: mỗi giá trị dữ liệu được đại diện bởi một điểm trên trục.
Biểu đồ phân phối Histogram: vẫn là một thanh hình chữ nhật đại diện cho mỗi nhóm,
nhưng không giống biểu đồ thanh, Histogram không có sự tách biệt giữa các hình chữ nhật của các
nhóm liền kề.
Phân phối tích lũy (cộng dồn).
Đồ thị Ogive (đọc thêm).
CHÚ Ý MỘT VÀI HÌNH DÁNG CỦA ĐỒ THỊ (TRANG 48)
2.3 Phân tích dữ liệu thăm dò

Biểu đồ nhánh và lá: thể hiện thứ tự xếp hạng và hình dáng phân phối của dữ liệu.
Các chữ số đầu tiên của mỗi giá trị được đặt bên trái của đường thẳng đứng, bên phải ghi
chữ số cuối của từng giá trị từ nhỏ đến lớn.
Nếu dữ liệu quá nhiều, ta có thể sử dụng nghệ thuật tách nhánh (0-4), (5-9).
Đơn vị lá: do ta quy ước, nếu không nói gì thêm, mặc định là 1. Đơn vị lá dùng để nhân với
nhánh và lá để tái tạo được giá trị gần đúng ban đầu của dữ liệu.

91 78 93 57 75 52 99 80 97 62
71 69 72 89 66 75 79 72 76 75

6
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

74 62 68 104 97 105 77 65 80 109


85 97 88 68 83 68 71 69 67 74
62 82 98 101 79 105 79 69 62 73

5 27
6 2222567888999
7 1122344555678999
8 0023589
9 1377789
10 14559
Ví dụ:
1. Ta có dữ liệu sau:
11.3 9.6 10.4 7.5 8.3 10.5 10.0
9.3 8.1 7.7 7.5 8.4 6.3 8.8

2. Nếu ta có dữ liệu sau:


1806 1717 1974 1791 1682 1910 1838

2.4 Bảng chéo và biểu đồ phân tán

Đồ thị phân tán trình bày đồ họa về mối quan hệ giữa hai biến.
→ Những điểm giá trị vẽ trên đồ thị thể hiện mối quan hệ tổng quát giữa hai biến (thuận,
nghịch, không có mối quan hệ).
Ví dụ:
1. Đội Panthers football qua tâm mối quan hệ có hay không giữa chặn bóng và điểm ghi bàn.
X: số lần chặn bóng 1 3 2 1 3
Y: số điểm ghi bàn 14 24 18 17 30

2. Năm quan sát thu thập cho hai biến theo bảng sau.
6 11 15 21 27

6 9 6 17 12

a. Xây dựng biểu đồ phân tán cho các dữ liệu này.


b. Biểu đồ phân tán cho thấy gì về mối liên hệ giữa x và y.

7
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

TÓM TẮT (trang 73)

CHƯƠNG 3: THỐNG KÊ MÔ TẢ: CÁC THƯỚC ĐO SỐ

3.1 Các đại lượng đo lường vị trí

Trung bình: là đại lượng quan trọng nhất để đo lường vị trí trung tâm. Trung bình mẫu được
kí hiệu là , trung bình tổng thể được kí hiệu là μ.
Trung vị: là giá trị đứng ở giữa khi các giá trị của dữ liệu được xếp theo giá trị tăng dần.
Khi tập dữ liệu có giá trị bất thường, trung vị là thước đo ưu tiên cho vị trí trung tâm (thường
hỏi về thu nhập cá nhân, tiền thuê nhà,… yêu cầu tìm trung vị).
Cách xác định trung vị:
Với số lượng quan sát lẻ:
26 18 27 12 14 27 19 7 quan sát
Được sắp xếp tăng dần

Với số lượng quan sát chẵn:


26 18 27 12 14 27 30 19 8 quan sát

Mode là giá trị có tần số xuất hiện lớn nhất.

8
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

Phân vị thứ p của tập dữ liệu là đại lượng mô tả sự phân bố và sự phân tán của tập dữ liệu.
Là một giá trị mà ít nhất p phần trăm các quan sát có giá trị nhỏ hơn hoặc bằng giá trị này và ít nhất
có (100-p) phần trăm các quan sát có giá trị lớn hơn hoặc bằng giá trị này.
Cách tính toán phân vị thứ p:
3. Xếp dữ liệu theo thứ tự tăng dần

4. Tính chỉ số i, vị trí của phân vị thứ p: i=

a. Nếu i không phải là số nguyên, làm tròn nó. Phân vị thứ p là giá trị ở vị trí i.
b. Nếu i là một số nguyên, phân vị thứ p là trung bình của hai giá trị ở vị trí i và i+1.
Ví dụ:
1.
3310 3355 3450 3480 3480 3490
3520 3540 3550 3650 3730 3925

Tứ phân vị là một phân vị đặc biệt bao gồm:


Tứ phân vị thứ nhất: phân vị thứ 25
Tứ phân vị thứ hai: Phân vị thứ 50 (Trung vị)
Tứ phân vị thứ ba: phân vị thứ 75

9
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

2. Hãy xem xét một mẫu với các giá trị dữ liệu là 27, 25, 20, 15, 30, 34, 28 và 25. Tính các
phân vị thứ 20, 25, 65 và 75.
3. Bảng số liệu dưới đây cung cấp thời gian tự học trên LMS của 15 sinh viên (giờ/tuần):
12 5 15 25 14 16 18 20
24 22 27 12 8 10 12

a. Xác định trung vị về thời gian tự học trên LMS của sinh viên. Phát biểu ý nghĩa về kết
quả đã tính.
b. Xây dựng bảng phân phối tần số về thời gian tự học với các khoảng 5-9, 10-14, 15-19,
20-24, 25-29.
c. Giảng viên phụ trách môn học cho rằng thời gian tự học dưới 15 giờ/ tuần là ít, điểm quá
trình sẽ ảnh hưởng, cần xem xét lại thái độ học tập. Có bao nhiêu sinh viên rơi vào
trường hợp này.
4. Thời gian vào mạng internet của sinh viên năm nhất và sinh viên năm hai
Thời gian (giờ), sv năm nhất Thời gian (giờ), sv năm hai
Nhánh Lá Nhánh Lá
1 222444 1 24568889
2 55566666789 2 000111234444555788
3 0012444 3 00045
Đơn vị lá: 1 Đơn vị lá: 1

a. Hãy tính trung vị và kết luận thời gian vào mạng của mẫu nào nhiều hơn.
b. Hãy dùng mode để so sánh thời gian vào mạng internet của sinh viên năm nhất và sinh
viên năm hai.
c. Thời gian vào mạng của sinh viên năm nhất và năm hai mẫu nào đồng đều hơn.
d. So sánh đặc trưng phân phối thời gian vào mạng của sinh viên năm nhất và năm hai.

3.2 Các đại lượng đo lường độ phân tán

Khoảng biến thiên là chênh lệch giữa giá trị lớn nhất và nhỏ nhất của tập dữ liệu (đại lượng
đơn giản nhất để đo lường độ phân tán).

Độ trải giữa là chênh lệch giữa tứ phân vị thứ ba và tứ phân vị thứ nhất. (Q3-Q1). Nó là
khoảng biến thiên của 50% dữ liệu ở giữa của dãy số.

10
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

Phương sai: nó dựa trên chênh lệch giữa giá trị của mỗi quan sát (xi) và trung bình ( dùng
cho mẫu, μ cho tổng thể).

s2 = =

Mẫu Tổng thể

Độ lệch chuẩn là căn bậc hai của phương sai.


Hệ số biến thiên (tự đọc).
Ví dụ:

1. Một mẫu về giá trị chỉ số chất lượng không khí của thành phố Pomona qua các dữ liệu sau:
28, 42, 58, 48, 55, 60, 49 và 50.
a. Tính khoảng biến thiên và độ trải giữa.
b. Tính phương sai và độ lệch chuẩn mẫu.

3.3 Các đại lượng đo lường hình dáng phân phối, vị trí tương đối và phát hiện
giá trị bất thường

Hình dáng phân phối.


Giá trị z
3.4 Phân tích dữ liệu thăm dò

Bộ tóm tắt 5 số: Min, Q1, Q2, Q3, Max.


Biểu đồ hộp là một tóm tắt bằng hình vẽ của dữ liệu dựa trên bộ tóm tắt 5 số.
• Giới hạn dưới = Q1-1.5*(IQR)
• Giới hạn trên = Q3+1.5*(IQR)
Nếu dữ liệu nằm trong hai khoảng giới hạn trên: không có giá trị bất thường trong dữ liệu.
Dữ liệu bên ngoài giới hạn này được xem là giá trị bất thường.

Ví dụ:
1. Xem xét một mỗi với các giá trị dữ liệu 27, 25, 20, 15, 30, 34, 28 và 25. Hãy tạo bộ tóm tắt 5
số cho dữ liệu. Vẽ biểu đồ hộp cho các dữ liệu.
2. Ebby cung cấp quảng cáo cho các tài sản và bất động sản đặc biệt trên khắp Hoa Kỳ. Giá
niêm yết cho 22 tài sản và bất động sản được trình bày như sau (đơn vị ngàn USD)

1500 700 2995 895 619 880

11
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

719 725 3100 619 739 1699


625 799 1120 4450 2495 1250
2200 1395 912 1280

a. Xây dựng bộ tóm tắt 5 số.


b. Tính GHD và GHT
c. Tài sản có giá cao nhất 4.45 Tr USD, tài sản này có được xem là giá trị bất thường
không?
d. Tài sản có giá cao thứ hai, 3.1 Tr USD có được xem là giá trị bất thường hay không?
e. Trình bày biểu đồ hộp

3.5 Các đại lượng đo lường mối liên hệ giữa hai biến

Thường một nhà quản lý hoặc người ra quyết định quan tâm đến mối liên hệ hai biến.
Đại lượng để mô tả mối liên hệ giữa hai biến là hiệp phương sai

Hệ số tương quan (đọc sách thêm, có cách bấm máy tính).


Ví dụ:

1. Năm quan sát thu thập cho hai biến theo bảng sau.
6 11 15 21 27

6 9 6 17 12

a. Xây dựng biểu đồ phân tán cho các dữ liệu này.


b. Biểu đồ phân tán cho thấy gì về mối liên hệ giữa x và y
c. Tính hiệp phương sai mẫu
d. Tính hệ số tương quan mẫu.
2. Có hai phương pháp để đo lường khan giả xem truyền hình: một là điểm đánh giá chương
trình truyền hình, hai là thị phần chương trình truyền hình đó. Sử dụng dữ liệu thông tin
bảng sau thực hiện các yêu cầu dưới đây:
Điểm đánh giá 19 17 17 14 16 12 15 12 13
Thị phần 32 28 29 24 26 20 24 20 22

a. Xây dựng biểu đồ phân tán với dữ liệu điểm đánh giá nằm trên trục hoành. Mối liên hệ
giữa hai yếu tố trên là gì.
b. Tính toán hiệp phương sai mẫu và hệ số tương quan.
12
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

Trung bình có trọng số và làm việc với dữ liệu đã phân nhóm

= Trong đó: xi: giá trị của quan sát i.

Wi: trọng số của quan sát i.

Trung bình cho dữ liệu phân nhóm (về chương tổng ôn sẽ nhắc lại, 1 câu đề thi K43).

Dữ liệu mẫu: =

Phương sai dữ liệu mẫu: s2= → độ lệch chuẩn

(Ghi chú chỗ nào dễ thấy nhất nha, hơi bị quan trọng đó)

Ứng dụng:
1. Cho dữ liệu về chi tiêu (triệu đồng) của 30 người nội trợ được chọn ngẫu nhiên từ các hộ
gia đình trong khu vực Quận 1 được trình bày dưới dạng nhánh lá sau đây:
Nhánh Lá
5 69
6 1244
6 67789
7 122234
7 667789
9 1344
9 578
Đơn vị lá: 1

a. Phân nhóm sao cho có khoảng cách tổ bằng nhau (chia làm 6 nhóm).
b. Tính tần số, tần suất, tần suất phần trăm, tần suất phần trăm tích lũy.
c. Vẽ biểu đồ phân phối tần số.
d. Hãy tính trung bình, trung vị, mode, độ lệch chuẩn, tứ phân vị thứ nhất, thứ ba. Phân
phối tập dữ liệu trên lệch trái, lệch phải hay đồng đều.
e. Ước lượng khoảng chi tiêu trung bình của toàn bộ người nội trợ trong quận 1 TPHCM
với độ tin cậy 90%.
2. Khảo sát mức chi tiêu cho ăn uống ở quán ăn, nhà hàng của 25 khách (ngàn đồng/ tháng)
được trình bày qua bảng phân nhóm dưới đây:

13
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

Mức chi tiêu 200-499 500-799 800-1099 1100-1399 1400-1699


Số khách 3 5 8 6 3

a. Tính mức chi tiêu trung bình mỗi khách.


b. Tính độ lệch chuẩn về mức chi tiêu.
c. Biểu thị dữ liệu trên bằng biểu đồ Histogram. Nêu dạng phân phối của dãy số.
3. Năm nhất thời đai học chắc có lẽ là nổi ám ảnh nhất trong quãng đời sinh viên của Jack, một
cậu sinh viên miền Tây bước chân lên Hồ Chí Minh với bao ước mơ, hoài bão. Thế Jack, nó
đã bị đánh bay quá sớm chỉ trong một học kì. Nào là ham chơi, tăng động, overnight xem lũ
bạn có trầm trồ và hệ lụy là cậu trải qua lần đầu đau đớn ấy_cậu rớt Toán cao cấp, cậu suy
sụp, chẳng biết nói với ai, mượn tiền bao nhiêu là đủ. Trước khi chuẩn bị học lại lần 2, cậu
nhận ra mình cần đầu tư nghiêm túc vào môn học này, thế là cậu thực hiện một nghiên cứu
về mối quan hệ giữa điểm giữa kỳ và điểm thi kết thúc học phần của môn. Dữ liệu mẫu thu
thập của 15 bạn K43 chung lớp với cậu như sau:
Điểm giữa 8 8 7 7 8 9 7 9 6 7 8 8 6 8 8
kỳ
Điểm cuối 8 9 8 6 7 8 7 10 5 7 7 9 5 7 9
kỳ

a. Vẽ đồ thị phân tán thể hiện mối quan hệ giữa điểm giữa kỳ và cuối kỳ của môn Toán cao
cấp?
b. Tính hệ số tương quan trên dữ liệu mẫu. Kết quả tính toán được có phù hợp với nhận xét
của câu a hay không?

CHƯƠNG 8: ƯỚC LƯỢNG KHOẢNG

8.1 Trung bình tổng thể: biết σ

Sai số biên và ước lượng khoảng


Ước lượng khoảng có thể được tính bằng cách cộng trừ sai số biên vào ước lượng điểm.
Ước lượng điểm ± Sai số biên
Chúng ta đề cập đến trường hợp biết σ:
±

Trong đó:
(1-α): hệ số tin cậy

14
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

: là giá trị z cung cấp diện tích α/2 trong đuôi phải của phân phối xác suất chuẩn
chuẩn hóa.
𝛔: độ lệch chuẩn của tổng thể.
n: cỡ mẫu
Các giá trị za/2 của các độ tin cậy thông dụng:
Độ tin cậy Α α/2
90% 0,1 0,05 1,645
95% 0,05 0,025 1,96
99% 0,01 0,005 2,576
Ví dụ:

1. Một mẫu ngẫu nhiên đơn giản của 50 phần tử từ một tổng thể với σ=6 cho kết quả trung bình
mẫu là 32.
Tìm một khoảng tin cậy lần lượt 90%, 95%, 99% cho trung bình tổng thể.
2. Trung tâm nghiên cứu chất lượng quốc gia tại ĐHQG TPHCM đo lường hàng quý ý kiến
của sinh viên các trường về các sản phẩm và cách thức phục vụ của cănteen trường ở các
khu A, B. Một khảo sát gồm 10 chủ tiệm đã cho thấy trung bình mẫu chỉ số hài lòng của sinh
viên là 71. Dữ liệu quá khứ cho biết độ lệch chuẩn của tổng thể của chỉ số tương đối ổn định
là σ=5.
a. Nhà nghiên cứu cần giả định gì nếu muốn sai số biên được mong muốn
b. Sử dụng độ tin cậy 95%, sai số biên là bao nhiêu.
c. Sai số biên là bao nhiêu nếu mong muốn độ tin cậy 99%?
3. Tạp chí News báo cáo rằng thu nhập trung bình hộ gia đình hằng năm của các độc giả của họ
là 119.155 USD. Giả sử ước lượng thu nhập trung bình hàng năm của hộ gia đình này được
trên mẫu gồm 80 hộ gia đình, và dựa trên các nghiên cứu trong quá khứ, độ lệch chuẩn của
tổng thể được biết là σ=30.000 USD.
a. Xây dựng ước lượng khoảng tin cậy (90; 95; 99 %) cho trung bình tổng thể.
b. Điều gì sẽ xảy ra đối với độ rộng của khoảng tin cậy khi độ tin cậy gia tăng.

8.2 Trung bình tổng thể: chưa biết σ

Nếu ước lượng của độ lệch chuẩn tổng thể σ không thể được xây dựng trước khi lấy mẫu,
chúng ta sử dụng độ lệch chuẩn mẫu s để ước lượng s.

15
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

Trong trường hợp này, ước lượng khoảng của μ dựa trên phân phối t Student. Phân phối t có
đặc trưng là phụ thuộc vào một tham số đã biết là bậc tự do.
Ước lượng khoảng

Trong đó:
1-α = hệ số tin cậy
= giá trị t cung cấp 1 diện tích α/2 trong đuôi phải của phân phối t với n-1 bậc tự do
s= độ lệch chuẩn mẫu.

TÓM TẮT THỦ TỤC ƯỚC LƯỢNG KHOẢNG CHO TRUNG BÌNH TỔNG THỂ
(TRANG 384)
Ví dụ:
1. Một phóng viên của một tờ báo sinh viên đang viết một bài báo về chi phí thuê phòng ở
ngoài trường. Một mẫu 16 căn hộ tiện dụng trong vòng nửa dặm xung quanh trường cho
trung bình mẫu là 750 USD/tháng và độ lệch chuẩn mẫu là 55 USD.
Hãy xây dựng một khoảng tin cậy ước lượng 95% của số tiền thuê trung bình mỗi tháng cho
tổng thể các căn hộ tiện dụng trong vòng nửa dặm xung quanh trường. Chúng ta sẽ giả định tổng thể
này có phân phối chuẩn.

2. Tìm các giá trị t cho mỗi trường hợp sau:


a. Diện tích đuôi phải của 0.025 với bậc tự do 12
b. Diện tích đuôi trái của 0.05 với bậc tự do 50
c. Diện tích đuôi phải của 0.01 với bậc tự do 30
d. Diện tích 90% nằm giữa 2 giá trị t với bậc tự do 25
e. Diện tích 95% nằm giữa 2 giá trị t với bậc tự do 45

3. Dữ liệu mẫu sau từ một tổng thể phân phối chuẩn: 10, 8, 12, 15, 13, 11, 6, 5. Hãy ước lượng
khoảng tin cậy 95% của trung bình tổng thể.

Ứng dụng:
1. Một lần tình cờ ăn may, Jack đổi đời nhờ trúng Vietlot. Sau khi đóng thuế và các chi phí
khác, chàng trai trẻ tuổi 20 này ôm về 20 tỉ. Với đam mê làm chủ từ nhỏ, thế là anh chàng
này lập tức mở liền 30 chuỗi thức ăn nhanh khu vực TPHCM và lân cận Bình Dương. Trong

16
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

mỗi lần ghé mua, khách hàng đi qua quầy A (mua hàng không cần xuống xe) và đặt thức ăn.
Thời gian từ lúc cầm bảng thực đơn đến khi đơn hàng phục vụ xong được ghi nhận. Thời
gian được tính bằng phút của 30 cuộc dừng để mua hàng như sau
0.9 1 1.2 2.2 1.9 3.6 2.8 5.2 1.8

6.8 1.3 3 4.5 2.8 2.3 2.7 5.7 4.8

2.6 3.3 5.0 4.0 7.2 9.1 2.8 3.6 7.3


Hãy ước lượng khoảng tin cậy 95% của trung bình tổng thể?

2. Tiêu thụ đồ uống có cồn bởi phụ nữ trẻ trong độ tuổi uống rượi ngày càng tăng ở Anh, Mỹ
và châu Âu. Dữ liệu dưới đây chỉ ra một mẫu 20 phụ nữ trẻ
266 82 199 174 97

170 222 115 130 169

164 102 113 171 0

93 0 93 110 130
Giả sử tổng thể có tính đối xứng cao, xây dựng một khoảng tin cậy 95% cho lượng tiêu thụ
trung bình hàng năm thức uống có cồn của phụ nữ trẻ châu Âu.

Xác định cỡ mẫu


Cho E= sai số biên mong muốn.

Như phần trước, ta có E= → n (cỡ mẫu cần thiết) =

Nếu s chưa biết, 1 giá trị sơ bộ hoặc sơ khởi của s có thể được sử dụng trong phương trình.
(Đọc thêm).

8.3 Tỷ lệ tổng thể

Dạng tổng quát của ước lượng khoảng tỷ lệ tổng thể là:

Trong đó:
tỷ lệ mẫu.
Ví dụ:
17
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

1. Trong một chiến dịch tranh cử hiện nay, PSI đã tìm thấy 220 cử tri đã đăng ký, trong số 500
cử tri liên lạc được, ưa thích 1 ứng cử viên cụ thể. PSI muốn xây dựng 1 ước lượng khoảng
95% của tỷ lệ tổng thể các cử tri đã đăng ký ưa thích ứng cử viên.

2. Một mẫu ngẫu nhiên tiếp tục đơn giản gồm 800 phần tử tính ra tỷ lệ mẫu = 0.7.
Cung cấp 1 khoảng tin cậy (90%; 95%) cho tỷ lệ tổng thể.
3. Theo báo cáo từ một nguồn nội bộ, phần lớn các công ty ở Việt Nam báo cáo lợi nhuận cao
hơn dự kiến. Jack rất bức xúc vì sự việc trên nên ra quyết định thực hiện một cuộc tổng điều
tra bất ngờ một mẫu gồm 162 công ty random cho thấy 104 công ty cao hơn dự kiến, 29
bằng với dự kiến và 29 thấp hơn dự kiến.
a. Ước lượng điểm của tỷ lệ những ước lượng thấp hơn dự kiến là bao nhiêu?
b. Xác định sai số biên và cung cấp khoảng tin cậy 95% cho tỷ lệ cao hơn dự kiến?
c. Mẫu lớn cỡ nào là cần thiết nếu sai số biên mong muốn là 0.05?
Tổng hợp
1. Một vấn đề nhứt nhối cũng đã bị Jack phơi bày trong chương này đó chính là Cha mẹ quá
bận rộn với công việc của mình mà không dành nhiều sự quan tâm cho con gái. Jack đi dọc
trên các tuyến đường Thành phố, hỏi tận 369 cha mẹ làm việc thì tìm thấy 200 người rơi vào
trình trạng trên chỉ vì chạy theo đồng tiền hay đơn giản là cam kết công việc quan trọng hơn.
Hãy giúp Jack ước lượng tỷ lệ tổng thể cha me mà làm việc bỏ bê con cái là bao nhiêu? Với
độ tin cậy 95%.
2. “Mẹ chồng nàng dâu” luôn là vấn đề nan giải từ xưa nay. Thế Jack trong những năm gần đây
lại phát sinh thêm một trào lưu mới lại khiến các chàng trai mệt mỏi hơn. “Giữa Game và
Em, anh chọn một đi”. Biết Jack là một người nghiện game từ nhỏ Jack, một ngày đẹp trời
trời xui đất khiến, cô bạn gái của Jack lại tiếp tục thực hiện một cuộc khảo sát đối với 1677
anh bạn chẻ (khu vực TPHCM) thì có đến 74% bạn chẻ nói sẽ khó bỏ game. Chỉ có 48% bạn
chẻ nói sẽ khó bỏ bạn gái.
a. Xây dựng khoảng tin cậy 95% cho tỷ lệ các anh bạn chẻ cho rằng sẽ khó bỏ game
b. Xây dựng khoảng tin cậy 99% cho tỷ lệ các anh bạn chẻ cho rằng sẽ khó bỏ gệ.
3. Công ty sản xuất xe máy Yamaha dự định đưa ra thị trường loại xe gắn máy tay ga kiểu
dáng mới chủ yếu dành cho phụ nữ. …. Phòng Marketing đã chọn ngẫu nhiên 200 người phụ
nữ có ý muốn mua xe tay ga trong vòng 12 tháng tới để thăm dò ý kiến về khuynh hướng
chọn màu sắc xe. Sau khi được cho xem các hình xe mẫu với hai nhóm tông màu sắc xe
khác nhau, các khách hàng tiềm năng đã cho biết lựa chọn của họ, các kết quả thu thập được
tóm tắt trong bảng sau:
18
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

Tuổi Tông màu xe ưa thích Tổng


Nhạt, sáng Đậm, tối
Trẻ: 18-25 90 30 120
Trung: 26-40 45 35 80
Tổng khách hàng nữ 135 75 200

a. Hãy ước lượng tỷ lệ nữ nói chung thích tông màu sắt nhạt sáng, với độ tin cậy 95%.
b. Ý nghĩa của kết quả nghiên cứu này đối với việc quyết định màu xe cho loại tay ga mới
này như thế nào.

CHƯƠNG 9: KIỂM ĐỊNH GIẢ THUYẾT


9.1 Phát triển giả thuyết KHÔNG và giả thuyết ĐỐI

Kiểm định giả thuyết: có thể được sử dụng để xác định xem khi nào một phát biểu về giá
trị của một tham số tổng thể nên hoặc không nên bị bác bỏ.
Giả thuyết không: giả thuyết được giả định ban đầu là đúng trong quy trình kiểm định giả
thuyết, không có gì bất thường. (kí hiệu H0). (Vd: tuyên bố của nhà sản xuất, của giám đốc …)
Giả thuyết đối: là giả thuyết có nội dung đối lập với giả thuyết không, là điều mà kiểm
định đang cố gắng chứng minh, giả thuyết được kết luận là đúng khi giả thuyết H0 bị bác bỏ (kí hiệu
Ha). (Hoài nghi, cần kiểm định, nghiên cứu).
Cẩn thận trong cách thiết lập các giả thuyết trên một cách hợp lý.
Ví dụ:
1. Phương pháp giảng dạy mới đang được triển khai được cho là tốt hơn phương pháp giảng
dạy hiện đại.
2. Một kế hoạch khuyến mại đang được triển khai để làm tăng doanh số bán.
3. Một loại thuốc mới được phát triển với mục tiêu làm giảm huyết áp hơn loại thuốc hiện
hành.
4. Nhãn hiệu trên vỏ chai nước giải khát tuyên bố chai nước có chứa ít nhất 67.6 ounces chất
lỏng.
5. Một dây chuyền sản xuất được thiết kế để đổ bột giặt vào hộp với khối lượng trung bình là
32 ounce. Một mẫu các hộp bột giặt được chọn đình kỳ và đem cân để xác định xem có xảy

19
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

ra trường hợp đổ quá nhiều hoặc quá ít hay không. Nếu mẫu dữ liệu đưa đến kết luận đổ quá
nhiều hoặc quá ít, dây chuyền sản xuất sẽ bị ngưng lại và điều chỉnh.
Thiết lập giả thuyết không và giả thuyết đối cho trường hợp khác.
CHÚ Ý 3 TRƯỜNG HỢP KIỂM ĐỊNH GIẢ THUYẾT SẼ GẮN BÓ VỚI CÁC BẠN
XUYÊN SUỐT 2 CHƯƠNG 9 10
H0: μ≥μ0 H0: μ≤μ0 H0: μ=μ0
Ha: μ< μ0 Ha: μ> μ0 Ha: μ≠ μ0

Kiểm định phía trái Kiểm định phía phải Kiểm định hai phía

9.2 Sai lầm loại I và loại II (đọc thêm)

Điều kiện tổng thể


Kết luận H0 đúng (μ≤12) H0 sai (μ>12)
Chấp nhận H0 Kết luận đúng Sai lầm loại II
(Kết luận μ≤12)
Bác bỏ H0 (Kết luận μ>12). Sai lầm loại I Kết luận sai
Trước khi sang mục 9.3, chúng ta cần chú ý khái niệm “Mức ý nghĩa” (kí hiệu là α) là xác
suất phạm sai lầm I với việc bác bỏ H0 khi giả thuyết không là đúng với dấu đẳng thức và người ra
quyết định thường chọn α là 0,05 và 0,01.
9.3 Trung bình tổng thể: Trường hợp σ đã biết (Vô phần quan trọng)

Các bước kiểm định giả thuyết

1. Phát triển giả thuyết không và giả thuyết đối.


2. Xác định rõ mức ý nghĩa α.
3. Thu thập dữ liệu mẫu và tính giá trị thống kê kiểm định.

Phương pháp p-Value

1. Sử dụng giá trị của thống kê để kiểm định tính p-Value.


2. Bác bỏ H0 nếu p-Value≤α.

Phương pháp giá trị tới hạn.


Kiểm định một phía
Kiểm định phía trái Kiểm định phía phải
Giả thuyết H0: μ≥μ0 H0: μ≤μ0
Ha: μ< μ0 Ha: μ> μ0

20
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

Giả trị thống kê


z= z=

Quy tắc bác bỏ: Bác bỏ H0 nếu p≤α Bác bỏ H0 nếu p≤α

p-value
Quy tắc bác bỏ:
Phương pháp tới hạn
Bác bỏ H0 nếu z≤-zα Bác bỏ H0 nếu z≥zα
Ví dụ:
1. Xét kiểm định giả thuyết sau:

H0: μ≥20
Ha: μ<20

Một mẫu gồm 50 quan sát cho trung bình mẫu là 19.4. Độ lệch chuẩn của tổng thể là 2

a. Tính giá trị thống kê kiểm định


b. Giá trị p là bao nhiêu
c. Với α= 0.05, ta kết luận gì?
d. Quy tắc bác bỏ theo phương pháp tới hạn ra sao? Kết luận

2. Xét kiểm định giả thuyết sau


H0: μ≤25
Ha: μ>25

Mẫu gồm 40 quan sát cho trung bình mẫu 26.4. Độ lệch chuẩn tổng thể là 6
Câu hỏi tương tự câu 1 nhưng với α= 0.01.

Ứng dụng:

1. Những người nộp hồ sơ xin hoàn thuế liên bang nhận được khoảng hoàn thuế trung bình là
1056 USD. Xét tổng thể những người nộp hồ sơ cuối cùng trong vòng 5 ngày cuối kỳ hoàn
thuế.
a. Một nhà nghiên cứu cho rằng những người nộp hồ sơ trong năm ngày cuối trung bình
nhận được khoản hoàn thuế thấp hơn những người nộp hồ sơ sớm. Phát triển giả thuyết
hợp lý sao cho khi bác bỏ H0 sẽ ủng hộ lập luận của nhà nghiên cứu.

21
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

b. Với mẫu gồm 400 người nộp hồ sơ hoàn thuế (5 ngày cuối) khoản tiền hoàn thuế trung
bình là 910 USD. Dựa trên kinh nghiệm trước đây, độ lệch chuẩn tổng thể là 1600 USD.
Gía trị của p là bao nhiêu
c. Với α=0.05, ta kết luận gì.
d. Thực hiện quy trình kiểm định theo pp tới hạn.

2. Ries là một công ty nghiên cứu thị trường tại bang New York, theo dõi chi phí thuê nhà ở
Mỹ. Trong năm 2002, giá thuê nhà trung bình trên cả nước là 895 USD một tháng. Giả định
rằng độ lệch chuẩn hợp lý là σ=225 USD. Một mẫu gồm giá thuê nhà của 180 căn nhà trên
cả nước, được lưu trong tập tin tên RentalRates cho biết giá trung bình mẫu là 915 USD.
Mẫu dữ liệu này có cho phép công ty kết luận rằng giá thuê nhà trung bình tổng thể lớn hơn
mức giá vào năm 2002 hay không.
a. Phát biểu giả thuyết không và đối.
b. Giá trị p
c. Với α=0.01, ta kết luận gì
d. Kiểm định theo pp tới hạn. Theo bạn vào lúc này, Ries nên làm gì

Kiểm định hai phía:


Kiểm định hai phía
Giả thuyết H0: μ=μ0
Ha: μ≠μ0
Giá trị thống kê
z=

Quy tắc bác bỏ: giá trị p Bác bỏ H0 nếu giá trị p≤α

Quy tắc bác bỏ: giá trị tới hạn Bác bỏ H0 nếu z≤- hoặc nếu z≥

Ví dụ:

1. Xét kiểm định giả thuyết sau:


H0: μ=15
Ha: μ≠15

Một mẫu gồm 50 quan sát cho trung bình mẫu là 14.15. Độ lệch chuẩn của tổng thể là 3.

a. Tính giá trị thống kê kiểm định


22
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

b. Gia trị p là bao nhiêu


c. Với α= 0.05, ta kết luận gì?
d. Quy tắc bác bỏ theo phương pháp tới hạn ra sao? Kết luận

Ứng dụng:
1. CCN và ActMedia cung cấp kênh truyền hình nhắm đến các cá nhân đang xếp hàng chờ
thanh toán trong siêu thị. Kênh này phát tin tức, báo cáo và quảng cáo. Thời lượng của
chương trình dựa trên giả định là thời gian trung bình để chờ thanh toán tại siêu thị là 8 phút.
Một mẫu thời gian thực khi xếp hàng chờ được dùng để kiểm định giả định trên và quyết
định xem thời gian chờ trung bình có khác biệt thực sự không.
a. Thiết lập giả thuyết cho bài tập này.
b. Mẫu gồm 120 khách hàng cho thời gian trung bình chờ là 8.5 phút. Gỉa sử σ=3.2 phút.
Tính giá trị p
c. Với α=0.05, ta kết luận gì.
d. Tính khoảng tin cậy 95% cho trung bình tổng thể. Khoảng tin cậy có ủng hộ cho kết luận
trên hay không?

9.4 Trung bình tổng thể: Trường hợp σ chưa biết

t=

Kiểm định phía trái, phía phải, hai phía tương tự như trường hợp đã biết σ
Thống kê kiểm định này có phân phối t với n-1 bậc tự do.

Ví dụ:

1. Xét kiểm định giả thuyết sau:


H0: μ≤45
Ha: μ>45

Một mẫu gồm 36 quan sát cho trung bình mẫu là 44 và độ lệch chuẩn của mẫu s=5.2

a. Tính giá trị thống kê kiểm định


b. Dùng bảng phân phối t để ước lượng giá trị p là bao nhiêu
c. Với α= 0.01, ta kết luận gì?
d. Quy tắc bác bỏ theo phương pháp tới hạn ra sao? Kết luận
2. Xét kiểm định giả thuyết sau:
23
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

H0: μ=100
Ha: μ≠100

Một mẫu gồm 65 quan sát Xác định giá trị p và đưa ra kết luận cho các trường hợp sau. Sử
dụng α=0.05

a. =103 và s=11.5

b. =96.5 và s=11.0

Ứng dụng:

1. Hiệp hội Đại lý Xe hơi Quốc gia, giá trung bình cho xe hơi đã qua sử dụng là 10.192 USD.
Giám đốc ở thành phố Kannas xem xét một mẫu gồm 50 xe đã bán gần đây tại đại lý để xác
định xem mức giá trung bình của tổng thể cho xe đã qua sử dụng bán tại đại lý này có khác
biệt so với mức giá toàn nước Mỹ hay không, biết rằng trung bình mẫu trên là 9.750 USD và
độ lệch chuẩn của mẫu là 1.400 USD.
a. Thiết lập giả thuyết kiểm định phù hợp
b. Tính giá trị của p?
c. Với α=0.05, ta kết luận được gì
2. Lượng sữa tiêu thụ BQĐN hằng năm là 21.6 gallon. Bạn tin rằng lượng sữa tiêu thụ tại Mỹ
cao hơn và muốn tìm bằng chứng ủng hộ ý kiến của mình. Một mẫu gồm 16 người sống tại
thành phố Webster tại Mỹ cho thấy lượng tiêu thụ sữa trung bình hằng năm là 24.1gallon với
độ lệch chuẩn s=4.8
a. Đăt giả thuyết kiểm định để quyết định xem lượng sữa tiêu thụ hằng năm trung bình tại
thành phố có cao hơn mức trung bình toàn quốc hay không.
b. Với α=0.05, kiểm định xem có khát biệt thật sự không. Ta kết luận được gì.

9.5 Tỷ lệ tổng thể

Kiểm định phía trái Kiểm định phía phải Kiểm định hai phía
H0: p ≥ H0: p ≤ H0: p =
Ha: p < Ha: p > Ha: p ≠

z=

Tương tự như hai trường hợp trên


24
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

Ví dụ:
1. Xét kiểm định giả thuyết sau:

H0: p≥0.75
Ha: p<0.75

Một mẫu gồm 300 quan sát. Tính p và phát biểu trong các trường hợp sau. Sử dụng α=0.05,
= (0.68; 0.72; 0.7; 0.77).

2. Xét kiểm định giả thuyết sau:


H0: p=0.2
Ha: p≠0.2

Một mẫu gồm 400 quan sát có tỉ lệ mẫu =0.175


a. Tính giá trị thống kê
b. Tính giá trị p
c. Với α=0.05, ta kết luận gì
d. Bác bỏ theo phương pháp tới hạn

Ứng dụng:

1. Trong một bài báo tạp chí Business Week công bố thông tin về thói quen ngủ của người Mỹ.
Bài báo cho rằng ngủ không đủ giấc gây ra nhiều vấn đề, trong đó có tai nạn giao thông.
Năm mươi mốt phần tram tài xế thừa nhận đã từng buồn ngủ khi lái xe. Một người nghiên
cứu cho rằng vấn đề này nghiêm trọng hơn đối với công nhân làm ca đêm.
a. Thiết lập giả thuyết để xác định xem tỷ lệ công nhân làm đêm thừa nhận buồn ngủ khi lái
xe có cao hơn 51% hay không
b. Mẫu gồm 500 công nhân làm ca đêm trong đó đã xác định những người thừa nhận lái xe
buồn ngủ. Tính tỷ lệ mẫu? Gía trị p
c. Với α=0.01, ta kết luận gì?
2. Tổ bộ môn Vật lý muốn đánh giá chất lượng giảng dạy của Giáo viên cũng như hiệu quả học
tập của học sinh. Vì thế sau thi kết thúc thi học kỳ 2, một cuộc khảo sát được diễn ra, một
mẫu ngẫu nhiên 5 lớp 11 gồm 180 học sinh của trường được khảo sát thì có 152 học sinh trả
lời hài lòng với chất lượng giảng dạy (dễ hiểu, giáo viên nhiệt tình, kiểm tra thường xuyên,
…) Hãy ước lượng tỷ lệ học sinh hài lòng với môn Vật lý với độ tin cậy 95%. Giả sử chỉ tiêu
ban đầu của Trưởng ban Vật lý đề ra là có hơn 75% học sinh của trường hài lòng về chất
lượng giảng dạy môn Vật lý thì Thầy có cần phải bận tâm nữa hay không?

25
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

CHƯƠNG 10: SUY DIỄN THỐNG KÊ CHO TRUNG BÌNH VÀ TỶ LỆ CỦA


HAI TỔNG THỂ

10.1 Suy diễn về chênh lệch giữa trung bình của hai tổng thể khi σ1 và σ2 đã biết

Ước lượng khoảng của µ1 - µ2


Kiểm định giả thiết về µ1 - µ2
Gọi μ1 là trung bình của tổng thể 1 và μ2 là trung bình của tổng thể 2.
Sự chênh lệch giữa hai trung bình tổng thể là μ1 – μ2.
Vấn đề đặt ra cho anh em mình là ước lượng μ1 – μ2, bắt đầu từ việc ta chọn mẫu ngẫu nhiên
kích thước n1 từ tổng thể 1, mẫu ngẫu nhiên kích thước n2 từ tổng thể 2.
Bước tiếp theo ta tính được 1 là trung bình của mẫu 1 và 2 là trung bình của mẫu 2.
Ước lượng điểm của sự chênh lệch giữa hai trung bình tổng thể 1và 2: 1 - 2

Giá trị kì vọng E ( 1 - 2) = μ1 – μ2

Ước lượng khoảng: 1 - 2 ± zα/2 với 1 -α: độ tin cậy

Ví dụ:
1. Chi phí trung bình cho ngày Valentine được kì vọng là 100,89 USD (Theo Today,
13/02/2006). Có phải người tiêu dùng nam và nữ chi tiêu khác nhau cho ngày lễ Valentine
hay không? Một khảo sát gồm 40 người tiêu dùng nam, chi phí trung bình là 135,67 USD,
một mẫu khảo sát gồm 30 người tiêu dùng nữ, chi phí trung bình là 68,64 USD. Dựa vào
nghiên cứu trước đó độ lệch chuẩn tổng thể của tiêu dùng nam và nữ lần lượt là 35 USD và
20 USD.

a. Tìm ước lượng chênh lệch chi phí trung bình tổng thể giữa tiêu dùng nam và nữ.
b. Với độ tin cậy 99%, hãy tìm khoảng chênh lệch giữa hai trung bình tổng thể.

2. Công ty Par là một công ty sản xuất lớn trong lĩnh vực thiết bị gôn đã phát triển một loại
bóng đánh gôn mới được thiết kế nhằm mục tiêu “kéo dài khoảng cách”. Để kiểm tra khoảng
cách đánh bóng, sử dụng một máy đo. Một mẫu các bóng đánh gôn của Par được so sánh với
mẫu bóng của công ty đối thủ Rap. Thống kê mẫu được trình bày dưới đây:
Mẫu số #1 Công ty Bar Mẫu số #2 Công ty Rap
Kích thước mẫu 120 bóng 80 bóng
Trung bình mẫu 275 yard 258 yard

26
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

Biết rằng σ1=15 yard, σ2=20 yard. Trình bày ước lượng khoảng tin cậy về sự chênh lệch giữa
hai khoảng cách bóng trung bình với độ tin cậy 95%.

Kiểm định giả thuyết về μ1 – μ2 khi đã biết (vô phần quan trọng)
H0: μ1 – μ2≥D0 H0: μ1 – μ2≤D0 H0: μ1 – μ2=D0
Ha: μ1 – μ2<D0 Ha: μ1 – μ2>D0 Ha: μ1 – μ2≠D0
Phía trái Phía phải Hai phía
Thống kê kiểm định Z=

Cách tiếp cận bằng giá trị p

Cách tiếp cận bằng phương


pháp tới hạn.

Ví dụ:

1. Xem xét kiểm định giả thuyết sau


H0: μ1 – μ2≤0
Ha: μ1 – μ2>0

Kết quả sau đây được tính từ hai mẫu độc lập của hai tổng thể
Mẫu 1 Mẫu 2 a. Tìm giá trị thống kê kiểm định.
N1=40 N2=50 b. Tìm giá trị p.
1= 25.2 2= 22.8 c. Với α= 0.05, bạn kết luận thế nào về kiểm đinh giả thuyết
=5.2 =6.0 này.

2. Xem xét kiểm định giả thuyết sau


H0: μ1 – μ2=0
Ha: μ1 – μ2≠0

Kết quả sau đây được tính từ hai mẫu độc lập của hai tổng thể
Mẫu 1 Mẫu 2

27
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

N1=80 N2=70
1= 104 2= 106
=8.4 =7.6

Câu hỏi tương tự câu như trên.


Ứng dụng:

1. Arrnold Palmer và Tiger Woods là hai gôn thủ giỏi nhất từ trước tới nay. Để so sánh hai
người nếu cả hai đều chơi ở đỉnh cao, dữ liệu mẫu sau đây cho biết kết quả điểm thi đấu gon
18 lỗ trong giải PGA.
Palmer, 1960 Woods, 1999
N1=112 N2= 84

1= 69.95 2=69.56

Sử dụng những kết quả trên để kiểm định giả thuyết là không có sự chênh lệch trung bình
tổng thể về điểm thi đấu gon 18 lỗ của hai gôn thủ.
a. Giả sử là độ lệch chuẩn là 2.5 cho cả hai gôn thủ. Gía trị thống kê kiểm định là bao
nhiêu.
b. Tìm giá trị p.
c. Với α=0.01, bạn có kết luận gì.

10.2 Suy diễn về chênh lệch giữa trung bình của hai tổng thể khi σ1 và σ2 chưa
biết

Khi σ1 và σ2 chưa biết, ta sẽ


Sử dụng độ lệch chuẩn mẫu s1 và s2 như là ước lượng cho σ1 và σ2
Thay thế zα/2 bằng tα/2.
Phần này cũng quan trọng nhưng trong quá trình quay anh ít đề cập đến, anh sẽ có 1 video
nói cụ thể phần này nha.
Ước lượng khoảng của µ1 - µ2
Kiểm định giả thiết về µ1 - µ2

28
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

10.3 Suy diễn về chênh lệch trung bình giữa hai tổng thể: mẫu theo cặp (phần
quan trọng)

Với thiết kế theo mẫu theo cặp. Mỗi đơn vị mẫu sẽ cung cấp một cặp dữ liệu.
Công nhân Thời gian hoàn thành Thời gian hoàn thành Chênh lệch (di)
PP 1 PP 2
1 6,0 5,4
2 5,0 5,2
3 7,0 6,5
4 6,2 5,9
5 6,0 6,0
6 6,4 5,8

Phương pháp giải:

1. Phát triển giả thuyết


H0: μ1 – μ2= 0 H0: μd=0
Ha: μ1 – μ2≠0 Ha: μd≠0

Gọi μd là trung bình các giá trị chênh lệch giữa các giá trị của tổng thể.
Có thể có 3 trường hợp kiểm định giả thuyết như ta đã học
H0: μd≥0 H0: μd≤0 H0: μd=0
Ha: μd<0 Ha: μd>0 Ha: μd≠0
Phía trái Phía phải Hai phía

2. Chỉ định mức tới hạn (ví dụ α=0.05)


3. Tính toán giá trị thống kê kiểm định

t=

4. Tính toán giá trị p, xác định khi nào bác bỏ H0.
29
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

5. Xác định giá trị tới hạn, xác định khi nào bác bỏ H0.
Ví dụ:
1. Xem xét kiểm định giả thuyết sau đây.
H0: μd≤0
Ha: μd>0
Các dữ liệu sau đây từ mẫu theo cặp được rút ra từ hai tổng thể.
Tổng thể
Phần tử 1 2
1 21 20
2 28 26
3 18 18
4 20 20
5 26 24
a. Tính toán giá trị chênh lệch cho mỗi phần tử

b. Tính

c. Tính độ lệch chuẩn


d. Tiến hành kiểm định với α=0.05. Kết luận của bạn như thế nào?

2. Dữ liệu sau đây từ mẫu theo cặp được rút ra từ hai tổng thể
Tổng thể
Phần tử 1 2
1 11 8
2 7 8
3 9 6
4 12 7
5 13 10
6 15 15
7 15 14

a. Tính .
b. Tính độ lệch chuẩn sd.
c. Tìm ước lượng điểm trung bình giữa hai tổng thể.

30
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

d. Tìm khoảng tin cậy 95% chênh lệch trung bình giữa hai tổng thể.

Ứng dụng:

1. Một nhà máy sản xuất cả hai mẫu hàng cao cấp và tiêu chuẩn cho một dụng cụ đánh bóng tự
động sử dụng cho gia đình. Giá bán được thu thập được từ mẫu các của hàng bán lẻ như sau:
Giá bán
CHBL Cao cấp Tiêu chuẩn
1 39 27
2 39 28
3 45 35
4 38 30
5 40 30
6 39 34
7 35 29
Nhà sản xuất đề nghị chênh lệch giá bán cho hai mẫu là 10 USD. Sử dụng mức ý nghĩa 0.05
và kiểm định giả thuyết chênh lệch trung bình giữa giá bán của hai mẫu hàng này là 10 USD. Tìm
khoảng tin cậy 95% cho chênh lệch giữa giá bán trung bình của hai mẫu hàng này.
2. Một công ty nghiên cứu thị trưởng sử dụng một mẫu gồm nhiều cá nhân để đánh giá tiềm
năng mua hàng cho một sản phẩm trước và sau khi họ xem quảng cáo về sản phẩm đó trên
thang điểm từ 0 đến 10. Giả thuyết không, cho rằng các đánh giá trung bình “sau khi xem”
sẽ thấp hơn hoặc bằng “trước khi xem”. Bác bỏ giả thuyết này sẽ cho rằng chương trình
quảng cáo cải thiện điểm đánh giá tiềm năng mua hàng. Với α=0.05 hãy kiểm định giả
thuyết trên và nhận xét về giá trị của chương trình quảng cáo.
Đánh giá mua hàng
Cá nhân Trước Sau
1 6 5
2 6 4
3 7 7
4 4 3
5 3 5
6 9 8
7 7 5
8 6 6

31
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

3. Sau một năm thành công với phi vụ đến từ “Toán Cao Cấp”, Jack quyết định sẽ thưởng cho
toàn bộ nhân viên của mình một kỳ Holiday hoành tráng. Jack cho họ 3 ngày để suy nghĩ với
2 phương án lựa chọn. Phương án 1 là kéo nguyên đám về quê Sếp Bến Tre học trèo dừa cho
biết, mệt thì cho ăn thử đuông dừa chấm nước mắm ra sao, sẵn em nào được ở lại làm dâu
cho Má Jack khỏi càm nhàm cũng được, phương án 2 thì kéo qua Quảng Châu, Trung Quốc
nhảy BUNGEE, ai cũng nhảy, nhảy xong rồi leo Vạn Lý Trường Thành rèn luyện sức khỏe,
làm việc văn phòng tối ngày không vận động. Jack chọn mẫu 12 nhân viên trong tổng số 100
nhân viên đánh giá về mức độ thích 2 phương án trên (trên thang điểm 10), được kết quả
dưới đây:
Nhân viên Mức độ thích
Bến Tre trèo dừa Nhảy Bungee
1 8 6
2 10 6
3 10 10
4 8 8
5 8 4
6 5 10
7 8 5
8 7 9
9 9 6
10 10 3
11 5 5
12 9 7

Sau khảo sát, nếu nhân viên không có khuynh hướng thích phương án 1 hay phương án 2
hơn thì Jack sẽ chọn Phương án 2 và bắt đầu đặt vé vì chi phí tổ chức bên Trung Quốc sẽ hấp dẫn
hơn cũng như Jack đã dắt về quê Jack một lần rồi, cần đi nơi khác.
a. Lập giả thuyết không và đối xem liệu thực sự các nhân viên của Jack có khuynh hướng
thích phương án nào hơn không.
b. Kiểm định giả thuyết với độ tin cậy 95%.
c. Theo bạn, Jack nên quyết định như thế nào.

32
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

10.4 Suy diễn về chênh lệch giữa hai tỷ lệ tổng thể

Tự học, nếu cho thi đem theo công thức vào phòng thi làm từ từ.
Ước lượng khoảng của p1 - p2
Kiểm định giả thiết về p1 - p2

Ví dụ:
1. Xem xét kết quả sau đây cho các mẫu độc lập được rút ra từ hai tổng thể
Mẫu 1 Mẫu 2
N1=400 N2=300

1=0.48 2=0.36

a. Tìm ước lượng điểm cho chênh lệch tỷ lệ giữa hai tổng thể.
b. Tìm khoảng tin cậy 90% cho chênh lệch tỷ lệ hai tổng thể.

CHƯƠNG 13: CHỈ SỐ


Chương này có nội dung tương đối giống môn Kinh tế Vĩ mô của các bạn đang học. Chỉ cần nhớ
công thức nào áp dụng trong trường hợp nào là ổn. Các bạn tự đọc ở nhà. Mình sẽ tóm tắt một số
công thức quan trọng.
1. Chỉ số giá tương đối

Phản ánh giữa đơn giá hiện tại của một món hàng so với đơn giá trong kì gốc (kỳ cơ sở) của
món hàng đó

Chỉ số giá tương đối trong kỳ t =

2. Chỉ số giá tổng hợp

= (100)

3. Chỉ số giá tổng hợp có trọng số (Laspeyres)

4. Chỉ số giá tổng hợp có trọng số (Paasche)

33
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

5. Một số chỉ số quan trọng

• Chỉ số giá tiêu dùng (CPI)


• Chỉ số giá sản xuất (PPI)
• Chỉ số khối lượng:
• Chỉ số khối lượng tổng hợp không trọng số kỳ t: =

• Chỉ số khối lượng tổng hợp có trọng số kỳ t: =

Ví dụ:
1. Bảng dữ liệu sau đây cho biết giá và khối lượng sử dụng của hai mặt hàng trong năm 2004
và 2006.
Khối lượng Đơn giá (USD)
Mặt hàng 2004 2006 2004 2006
A 1500 1800 7.5 7.75
B 2 1 630 1500

a. Hãy tính chỉ số tương đối về giá của từng mặt hàng năm 2006 với năm 2004 là kỳ gốc.
b. Tính chỉ số giá tổng hợp không trọng số (2004 là kỳ gốc).
c. Tính chỉ số giá tổng hợp có trọng số bằng phương pháp Laspeyres.
d. Tính chỉ số giá tổng hợp có trọng số bằng phương pháp Paasche.
2. Dữ liệu về khối lượng của ba mặt hàng được bán trong năm 1995 và năm 2006 được cung
cấp cùng với giá bán của các mặt hàng này trong năm 1995. Hãy tính chỉ số khối lượng tổng
hợp có trọng số cho năm 2006.
Khối lượng bán
Mặt hàng 1994 2006 Đơn giá năm 1995 (USD)
A 350 300 18
B 220 400 4.9
C 730 850 15

3. Có tài liệu về giá cả và lượng hàng hóa tiêu thụ tại một thị trường như sau:
Sản phẩm Đơn vị tính Năm 2016 Năm 2017
Gía đv (1000đ) Lượng tiêu thụ Gía đv (1000đ) Lượng tiêu thụ
Café Tách 5 1000 5.5 1100
Nước ép Ly 3 2000 3.2 2400
Sinh tố Tách 2 4000 4.3 6000

34
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

a. Tính chỉ số giá tổng hợp có trọng số cho hàng hóa tiêu thụ của năm 2017 so với năm
2016, sử dụng lượng hàng tiêu thụ năm 2017 của từng sản phẩm làm trọng số.
b. Nhận xét sự thay đổi về giá của năm 2017 so với năm 2016

CHƯƠNG 14: DỰ BÁO

14.1 Các thành phần của một chuỗi thời gian (tự đọc)

• Thành phần chu kỳ.


• Thành phần mùa.
• Thành phần bất thường.

14.2 Các phương pháp làm trơn (tự đọc)

• Trung bình trượt.


• Trung bình có trọng số.
• Làm trơn bằng hàm mũ.

14.3 Dự phóng xu hướng

Trong sách viết cụ thể, nếu rãnh thì đọc thêm slide nha. Chương này các bạn chỉ cần nhớ:
Khi dùng phương pháp bình phương bé nhất thì công thức để dự phóng thành phần xu hướng là
Tt = b 0 + b 1 t
Với: Tt = giá trị của chuỗi thời gian ở thời kỳ t
b0= điểm cắt của đường xu hướng.
b1= độ dốc của đường xu hướng.
t= thời gian
Nhiệm vụ của bạn cần tìm ra b0 và b1 dựa vào dữ kiện đề cho, gần như giải xong bài toán.
Ví dụ:

1. Xem xét dữ liệu sau:

t 1 2 3 4 5
Yt 6 11 9 14 15
Xây dựng phương trình hàm xu thế tuyến tính cho chuỗi thời gian này. Tính giá trị dự báo
khi t=6; 7.

2. Xem xét dữ liệu dưới đây

35
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

t 1 2 3 4 5 6
Yt 205 202 195 190 191 188

Xây dựng phương trình hàm xu thế tuyến tính cho chuỗi thời gian này. Tính giá trị dự báo
khi t=7.
3. Dữ liệu tổng doanh thu (triệu USD) của hãng Hàng Không Regional qua 10 năm dưới đây
Năm Doanh thu Năm Doanh thu
2000 2428 2005 4246
2001 2951 2006 4738
2002 3533 2007 4460
2003 3618 2008 5318
2004 3616 2009 6915

a. Xây dựng phương trình xu thế tuyến tính cho chuỗi thời gian này
Nhận xét rút ra từ phương trình tổng doanh thu trong giai đoạn 10 năm này.
b. Cung cấp dự báo tổng doanh thu cho năm thứ 11 và 12

4. Phòng kinh doanh (PKD) của công ty Jack đang lập kế hoạch kinh doanh cho năm 2017. Để
lập kế hoạch kinh doanh và đặt ra mục tiêu cho doanh số cho sản phẩm máy tính xách tay,
PKD muốn dự báo số lượng máy tính xách tay có thể tiêu thụ trong năm 2017. Bộ phận dữ
liệu của PKD đã cung cấp số liệu tiêu thụ về số lượng tiêu thụ máy vi tính xách tay trong
toàn hệ thống bán lẻ của công ty qua các năm sau
Năm 2011 2012 2013 2014 2015 2016
Số lượng (ngàn 60 81 103 122 140 157
cái)

a. Xây dựng phương trình xu hướng tuyến tính cho chuỗi thời gian này. Nhận xét rút ra từ
phương trình về số lượng tiêu thị máy tính xách tay của công ty.
b. Cung cấp dự báo số lượng tiêu thụ cho năm 2017.
c. Bộ phân sản xuất định giá bán cho một máy tính bán ra thị trường trong năm 2016 sẽ là
13 triệu. Hãy tính doanh thu sản phẩm máy tính xách tay mà công ty Jack đạt được trong
năm 2017.

5. Có số liệu về số lượng tiêu thụ máy lạnh dân dụng công suất nhỏ 1 đến 2 HP dùng cho gia
đình hay văn phòng nhỏ, tại thị trường thành phố qua các năm sau:
Năm 2010 2011 2012 2013 2014 2015 2016

36
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

Số lượng 46 60 78 104 135 177 228

Dự đoán số lượng máy lạnh tiêu thụ tại năm 2017.

14.4 Mô hình nhân

Chú ý công thức quan trọng:


Yt= Tt*St*It
Trong đó: T: thành phần xu hướng
S: thành phần mùa, chỉ số mùa
I: thành phần bất thường
Các bạn tham khảo cách tính toán chỉ số mùa (trang 771) đề phòng trường hợp xấu. Nếu
không có thay đổi thì chỉ số mùa đề sẽ cho, không cần chúng ta tính.
TÀI LIỆU THAM KHẢO

Sách: Thống kê trong Kinh tế và kinh doanh.


TKUD – Slide – tóm tắt tiếng Việt 20171009.

Như vậy chúng ta đã hoàn thành toàn bộ khóa Tổng ôn Thống kê. Chúc các bạn thi đạt được kết quả
cao! Cảm ơn bạn đã ủng hộ Jack trong thời gian qua!
Nguyễn Phước Hưng

37
Nguyen Phuoc Hung 0888462501
Phuochung26010401@gmail.com

38

You might also like