You are on page 1of 20

ĐẠI HỌC KIẾN TRÚC HÀ NỘI

BÀI GIẢNG TOÁN CAO CẤP

CHƯƠNG 3 : MẪU THỐNG KÊ VÀ


ƯỚC LƯỢNG THAM SỐ
(PHẦN 1)

Giảng viên: ThS. Nguyễn Xuân Quý

Email: quynx2705@gmail.com
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

NỘI DUNG CHÍNH

1. Giới thiệu về mẫu và thống kê

2. Một số thống kê quan trọng

• trung bình mẫu

• trung vị, mode

• phương sai mẫu, độ lệch chuẩn mẫu

2
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

ĐẶT VẤN ĐỀ

− Trong thống kê, người ta quan tâm nhất là vấn đề làm

thế nào để rút ra được những kết luận chính xác cho một

đối tượng nghiên cứu nào đó. Thông thường các đối tượng

nghiên cứu có số lượng rất lớn nên ta không thể quan sát

trên toàn bộ tập hợp đó.

− Để thu được kết luận, người ta phải nghiên cứu trên 1

“mô hình thu nhỏ” của tập hợp rồi từ đó dẫn đến kết luận.

Phương pháp làm như vậy được gọi là phương pháp mẫu.
3
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

I. MẪU NGẪU NHIÊN

− Tập hợp gồm tất cả các đối tượng có chung một đặc tính

nào đó mà ta đang quan tâm được gọi là một tổng thể.

− Việc chọn ra từ tổng thể một tập con bất kỳ nào đó gọi là

phép lấy mẫu. Tập con này gọi là một mẫu, số lượng phần tử

trong mẫu gọi là cỡ mẫu.

− Nếu việc chọn mẫu được tiến hành một cách ngẫu nhiên và

các quan sát là độc lập thì mẫu được gọi là mẫu ngẫu nhiên.

4
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

II. MỘT SỐ THỐNG KÊ QUAN TRỌNG

− Mục đích chính trong việc chọn ra các mẫu ngẫu nhiên là

để tìm ra thông tin về các tham số của phân phối tổng thể.

− Chẳng hạn, ta muốn có một kết luận về tỉ lệ p người thích

một nhãn hiệu cà phê nào đó trong số những người uống cà

phê ở Mỹ, ta không thể hỏi toàn bộ những người uống cà

phê trên toàn nước Mỹ để tính p mà ta chỉ chọn ra một mẫu

ngẫu nhiên với cỡ đủ lớn để tính tỉ lệ p̂ những người trong

mẫu thích nhãn hiệu cà phê nói trên.

5
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Sau đó, người ta sử dụng p̂ để suy diễn về giá trị p.

− Như vậy p̂ là một số được tính theo các giá trị đã thu được

từ một mẫu.

− Vì có nhiều mẫu ngẫu nhiên chọn được từ tổng thể nên giá

trị của p̂ sẽ thay đổi từ mẫu này sang mẫu khác. Tức là p̂ là

một giá trị của một biến ngẫu nhiên ký hiệu là P̂ , biến ngẫu

nhiên này là một hàm của mẫu ngẫu nhiên.

Các biến ngẫu nhiên kiểu này được gọi là những thống kê.

6
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

− Chúng ta sẽ xét một số thống kê quan trọng mô tả các giá

trị đo tương ứng của một mẫu ngẫu nhiên.

− Thống kê được dùng nhiều nhất để đo tâm của một tập

các số liệu được bố trí theo trật tự độ lớn là trung bình mẫu,

trung vị, mode.

− Những thống kê để đo mức độ phân tán và độ biến động

của tập số liệu là phương sai mẫu, độ lệch chuẩn mẫu.

7
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

2.1 Trung bình mẫu

− Cho X1, . . . , Xn là một mẫu ngẫu nhiên cỡ n. Trung bình


n
1 X
mẫu là một thống kê, kí hiệu X và X = Xi.
n
i=1
Chú ý: Nếu bnn gốc X có E[X] = µ và DX = σ 2 thì
σ2
E[X] = µ, DX = .
n
− Trong tính toán thì ta dùng công thức tương ứng:
n k
1 X 1 X
x= xi hoặc x= nixi.
n n
i=1 i=1

8
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

VD 1. Một vị thanh tra thực phẩm kiểm tra một mẫu ngẫu

nhiên 7 hộp cá ngừ có cùng nhãn hiệu để xác định phần trăm

các tạp chất lạ. Các số liệu sau đây đã được ghi lại:

1, 8; 2, 1; 1, 7; 1, 6; 0, 9; 2, 7; 1, 8.

Hãy tính trung bình mẫu.

Giải. Giá trị x thu được của thống kê X là


1, 8 + 2, 1 + 1, 7 + 1, 6 + 0, 9 + 2, 7 + 1, 8
x= = 1, 8%.
7

9
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

2.2 Phương sai mẫu


n  2 n
1 X 1 X 2
2
S = Xi − X = 2
X −X .
n n i
i=1 i=1
2 n−1 2 n−1
Chú ý: E[S ] = σ = DX.
n n
Phương sai mẫu điều chỉnh:
n  2
1 X n 2
S02 = Xi − X = S
n−1 n−1
i=1
Khi đó E[S02] = DX.
p
Độ lệch chuẩn mẫu s = s2
p
Độ lệch chuẩn mẫu điều (hiệu) chỉnh s0 = s02
10
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

VD 2. Cho mẫu (đơn)

xi 5 10 15 20 25

ni 15 25 30 20 10

Tính trung bình mẫu, phương sai mẫu và phương sai mẫu hiệu

chỉnh.

Chú ý • Các số ni ở trên gọi là tần số của xi tương ứng.


ni
• Các tỉ số X gọi là tần suất của xi.
ni
i≥1

11
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

xi 5 10 15 20 25
Giải.
ni 15 25 30 20 10
• Trung bình mẫu
n
1X 5.15 + 10.25 + 15.30 + 20.20 + 25.10
x= nixi = = 14, 25.
n 100
i=1

• Phương sai mẫu


n
1 X 52
.15 + 102
.25 + 152
.30 + 20 2
.20 + 252
.10
x =
2 nixi =
2
= 238, 75
n 100
i=1
 2
⇒ s2 = x2 − x = 238, 75 − (14, 25)2 = 35, 6875.
n 2 100
• Phương sai mẫu điều chỉnh s = s = .35, 6875 = 36, 05.
02
n−1 99

12
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Cách bấm máy Casio (đời cũ)

• Vào trình Thống kê: MODE SD (tùy loại máy)

• Xóa dữ liệu Thống kê cũ (nếu có): SHIFT MODE 1

xi 5 10 15 20 25
• Nhập dữ liệu: giả sử cần nhập bảng
ni 15 25 30 20 10
thì bấm: 5 SHIFT ; 15 M+ (máy sẽ hiện n = 15)

tiếp tục bấm 10 SHIFT ; 25 M+ (máy sẽ hiện n = 40)

tiếp tục đến hết (khi đó máy hiển thị n = 100)

• Xem kết quả: SHIFT 2 , chọn một trong các phím 1 2 3 để được x

hoặc s hoặc s0 (để có s2 thì bấm SHIFT 2 2 x2 )

13
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Cách bấm máy Casio (đời mới)

• Vào trình Thống kê: SHIFT MODE ↓ 4 1 (chọn ON)

• Tiếp tục bấm: MODE 3 1

• Nhập dữ liệu theo 2 cột (rất trực quan). Sau đó ấn AC

• Xem kết quả: SHIFT 1 4 (VAR) rồi chọn tham số cần biết.

Chú ý xσn = s = σx và xσn − 1 = s0 = sx

(muốn tính phương sai thì bấm thêm phím x2 = )

14
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

VD 3. (mẫu lớp)
Thống kê cân nặng của 400 trẻ sơ sinh thu được bảng:

Cân nặng (kg) 2, 4 − 2, 6 2, 6 − 2, 8 2, 8 − 3, 0 3, 0 − 3, 2 3, 2 − 3, 4 3, 4 − 3, 6 3, 6 − 3, 8

Số trẻ 6 44 76 100 95 49 30

Dựa vào bảng trên, hãy tính:

• trung bình mẫu

• phương sai mẫu

• phương sai mẫu hiệu chỉnh.

15
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Cân nặng (kg) 2, 4 − 2, 6 2, 6 − 2, 8 2, 8 − 3, 0 3, 0 − 3, 2 3, 2 − 3, 4 3, 4 − 3, 6 3, 6 − 3, 8

Số trẻ 6 44 76 100 95 49 30

Giải. Trước tiên ta chuyển dạng mẫu lớp trên về dạng mẫu
đơn:
Cân nặng (kg) 2, 5 2, 7 2, 9 3, 1 3, 3 3, 5 3, 7

Số trẻ 6 44 76 100 95 49 30

Khi đó việc tính toán được thực hiện như Ví dụ trước.

SV tự giải.
n n
1 X 1 X  2 n 2
x= ni xi x2 = ni x2 2
s = x2 − x s02 = s
n n i n−1
i=1 i=1

16
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Đáp số. (tính theo trình Thống kê của máy tính Casio)

x = 3, 15 s2 = 0, 0841 s02 = 0, 0844.

17
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

2.3 Tần suất mẫu


X
là tỉ số f = , trong đó n là kích thước mẫu và X là số phần
n
tử mang dấu hiệu cần nghiên cứu.

VD 4. Kiểm tra ngẫu nhiên 30 sản phẩm thì thấy có 5 sản phẩm

không có nhãn mác. Tìm tần suất mẫu.

Giải. Gọi A là biến cố "sản phẩm thiếu nhãn mác" thì tần suất

xảy ra biến cố A trong mẫu kích thước n = 30 đã chọn là


5 1
f = = .
30 6

18
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

2.4 Mode mẫu

SV xem SGT.

2.5 Trung vị mẫu

SV xem SGT.

19
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Sinh viên tự giải

1. Kiểm tra sức khỏe của một nhóm sinh viên, thu được
kết quả về cân nặng cho bởi bảng:
Cân nặng 42, 5 − 47, 5 47, 5 − 52, 5 52, 5 − 57, 5 57, 5 − 62, 5 62, 5 − 67, 5

Số sinh viên 8 14 28 18 12

Tính cân nặng trung bình và độ lệch chuẩn mẫu.


2. Điều tra năng suất lúa trên diện tích 100ha trồng lúa của
một vùng thu được bảng số liệu:
Năng suất (tạ/ha) 40 44 45 47 49 52 53

Số ha 5 14 36 12 18 10 5

Tính trung bình mẫu và phương sai mẫu điều chỉnh.


20

You might also like