You are on page 1of 10

Chương 4: Lý thuy@t m§u

Nguy@n Thi Kim Ngân


Đ�i hc;c Thu Dju M9t, Bình Dương

Các khái ni�m v� m�u

2
Mô ta du li�u b1ng đ6 thi

3
Mô ta du li�u b1ng s6
• T6ng th� (đám đông): là t�p h<p t�t ca các ph �n tu là đ6i tư<ng ta nghiên
cuu.
• Tu t6ng thi ta ch9n ra n ph �n tu đi khao sát thì n ph �n tu đó đư<c g9i là m$t
m�u kích thưoc n.
• M�u đư<c ch9n ng�u nhiên nên đư<c g9i là m�u ng�u nhiên.
• Vi�c l�y m�u ti@n hành chu y@u theo hai phương thuc:
- L�y m�u có hoàn l9i
- L�y m�u không hoàn l9i.
NhJn xét: Khi t6ng thi có kích thưoc lon thì vi �c l �y m �u có hoàn l9i và không
hoàn l9i cho k@t qua sai l�ch không đáng ki

M�u ng�u nhiên: Tu t6ng thi l�y ra n ph�n tu.


• M�u có kích thưoc n đư<c l�p tu đ9i lư<ng ng �u nhiên X và có cùng phân ph6i
xác su�t voi X đư<c g9i là m�u t6ng quát ca n. Ký hi�u
WX = (X1, . . . , Xn)
• Khi các đ9i lư<ng Xi nh�n giá tri cw thi xi , ta có m�u cl;! th�. Ký hi�u wx =
(x1, . . . , xn)
Ví dl;! : Tung m$t con xúc s�c 5 l�n. Kí hi�u Xi là s6 ch�m xu�t hi�n trong l�n
tung thu i ⇔ Ta có m�u t6ng quát
WX = (X1, X2, X3, X4, X5)
Thvc hi�n m$t phép thu đ6i voi m �u này, ta đư<c m$t m �u cw thi, ví dw
wx = (4, 3, 2, 6, 4)

Năm Nam Nu
2003 $44, 456 $41, 789
2004 $47, 286 $46, 478
2005 $56, 234 $53, 854
2006 $57, 890 $58, 600
2007 $63, 467 $59, 070
2008 $61, 090 $55, 321
2009 $67, 543 $64, 506
Bang: Lương kh6i điim 6 công ty lu�t BLW

·104

8
Nam
Nu

0
2003 2004 2005 2006 2007 2008 2009

M$t khao sát v� s6 ti�n mà các sinh viên dv đinh tiêu trưoc khi bưoc vào
năm h9c moi cho bang s6 li�u sau

V�t dwng Trung bình cua nam ($) Trung bình cua nu ($)
Qu�n áo 207.46 198.15
Giày 107.22 88.65
Dwng cw h9c t�p 86.85 81.56
Máy tính 533.17 344.90
Đ6 gia dwng 266.69 266.98

Mô ta du li�u b1ng biiu đ6 thanh.

M6i năm Princeton Review ti@n hành m$t cu$c khao sát các h9c sinh
trung h9c dv tuyin vào các trưong đ9i h9c và phw huynh cua h9. Trong ban báo cáo
năm 2009 có k@t qua 12715 h9c sinh trung h9c tra lưoi câu hoi "Khoang cách lý tư6ng
tu nhà đ@n trưong đ9i h9c là bao nhiêu?" Ban báo cáo cũng bao g6m phan h6i cua
3007 phw huynh đ6i vơi câu hoi "B9n mu6n trưong đ9i h9c mà con b9n h9c cách nhà
bao xa?"

Khoang cách lý tư6ng H9c sinh Phw huynh


Ít hơn 250 d�m 4450 1594
250 đ@n 500 d�m 3942 902
500 đ@n 1000 d�m 2416 331
Nhi�u hơn 1000 d�m 1907 180

Mô ta du li�u b1ng biiu đ6 thanh.

Gold Equipment g�n đây đã thvc hi�n khao sát voi 300 ngưoi chơi golf v �
tác đ$ng cua công ngh� moi đ6i voi trò chơi. M$t câu hoi yêu c �u các golf thu chT ra
mang nào cua thi@t bi chơi gôn tác đ$ng nhi �u nh �t đi cai thi �n
trò chơi golf nghi�p dư. Các du li�u sau đây đã thu đư<c
Equipment Frequency Proportion
Golf ball 81 0.27
Club head material 66 0.22
Shaft material 63 0.21
Club head size 63 0.21
Shaft length 3 0.01
Don’t know 24 0.08
300 1.00

Club head size


Shaft length Don’t 21% Shaft material
know 1%

8%

21%

27% 22%

Golf ball Club head material


M$t cu$c khao sát trvc tuy@n trên báo Tu6i tre năm 2015 v � vi �c đ9c
sách cho k@t qua sau                                                                             
T�n s6 T�n
Không bao gio đ9c 314 su �t
11.4
Đ9c m$t vài cu6n và không đ9c nua 398 21.2
Ch9n lva đ� tài đi đ9c 625 33.3
Đ9c nhi�u và cam th�y nhi�u ung dwng 465 24.8
Có đ9c nhưng chưa th�y b6 ích 175 9.3
Ve biiu đ6 bánh mô ta du li�u.

Các l6i chính ta trên m$t ban sơ y@u lí lich có thi t9o �n tư<ng không t6t cho nhà
tuyin dwng. M$t khao sát voi các lãnh đ9o cao c �p v � s6 l6i chính ta trong m$t sơ
y@u lí lich có thi làm cho h9 bo qua m$t ung viên đư<c đăng trên to USA Today tháng
3/2009 có s6 li�u như sau
S6 l6i chính ta T�n s6 T �n su �t
1 60 0.40
2 54 0.36
3 21 0.14
≥4 10 0.07
Không bi@t 5 0.03
Ve biiu đ6 bánh mô ta du li�u.
Ví dl;! Bang phân ph6i t�n s6 v� s6 ngưoi s6 huu phim DVD
DVD Movies Owned (classes) Frequency
0-3 60
4-7 50
8-11 47
12-15 40
16-19 18
20-23 8
24-27 6
28-31 1
230

60

40

20

0
3 7 11 15 19 23 27 31

M$t khao sát v� thói quen xem tivi cua tre em 6 My. Bang dưoi đây là t �n
s6 gio xem tivi m6i ngày cua m$t m �u tre em m$t tu6i và m$t m �u tre em 3 tu6i.

S6 gio xem M$t tu6i Ba tu6i


tivi m6i ngày T�n su�t T�n su�t
0-2 0.270 0.630
2-4 0.390 0.195
4-6 0.190 0.100
6-8 0.085 0.025
8-10 0.030 0.020
10-12 0.020 0.015
12-14 0.010 0.010
14-16 0.005 0.005
Ve biiu đ6 phân b6 t�n s6.

• S�p x�p s6 li�u dư6'i d�ng đi�m


Ví dw. Điim thi môn Toán cua m$t lop g6m 50 sinh viên

X 4 5 6 7 8 9 10
n 2 8 6 15 13 5 1
• S�p x�p s6 li�u dư6'i d�ng khoang
Ví dw. Đo chi�u cao X(cm) cua 100 sinh viên ta đư<c

X 148-152 152-156 156-160 160-164 164-168 168-172


n 13 7 20 28 22 10

Gia su m$t m�u ng�u nhiên


S = (X1, . . . , Xn)

Trung bình m�u X x�p xT (dv ki@n) trung bình t6ng thi µ = E(X )

Đ nh nghĩa
Trung bình m�u X là giá tri trung bình
X1 + · · · + Xn
X=
n

Tính ch�t.
E(X ) = µ
σ2

D(X ) = Var (X ) =
n
Kí hi�u
µ = trung bình t6ng thi
X = trung bình m�u, ưoc tính cho µ
σ = đ$ l�ch chu�n t6ng thi
s = đ$ l�ch chu�n m�u, ưoc tính cho σ
σ2 = phương sai t6ng thi
s2 = phương sai m�u, ưoc tính cho σ2

Gia su m$t m�u ng�u nhiên

S = (X1, . . . , Xn)

Đ nh nghĩa
Phương sai m�u (có hi�u chinh) s2 đư<c đinh nghĩa
  n (Xi − X )
2

s2 = i=1                          
n−1
Nó đo sv thay đ6i giua các quan sát và ưoc lư<ng phương sai t6ng thi.
Đ9 l�ch chu�n m�u (có hi�u chinh) đư<c đinh nghĩa
s = √s2
Nó ưoc lư<ng đ$ l�ch chu�n t6ng thi σ = Std (X )

Tính
ch�t.
• n
X 2 − nX 2
s2 =       i=1     i                 
• n−1 2
Es = σ2
Ví dl;!. Đi đánh giá hi�u qua cua b$ xu lý đ6i voi m$t lo9i tác vw nh �t đinh, chúng
tôi đã ghi l9i thoi gian CPU cho 30 công vi �c đư<c ch9n ng �u nhiên (tính b1ng giây)
70 36 43 69 82 48 34 62 35 15
59 139 46 37 42 30 55 56 36 82
38 89 54 25 35 24 22 9 56 19
Giai. Trung bình m�u
70 + 36 + · · · + 19 1447
X= = = 48.2333

30 30
Phương sai m�u

s2 = 702 + · · · + 192 − 30 × (48.2333)2 90185 − 69794 = 703.1506


30 − 1 =
29

Đ$ l�ch chu�n s = √703.1506 = 26.1506


m�u

1. Cho bang dân s6 nưoc My tu năm 1790 đ@n năm 2010


Năm Dân s6 Năm Dân s6 Năm Dân s6
(tri�u ngưoi) (tri�u ngưoi) (tri�u ngưoi) )
1790 3.9 1870 38.6 1950 151.3
1800 5.3 1880 50.2 1960 179.3
1810 7.2 1890 63.0 1970 203.3
1820 9.6 1900 76.2 1980 226.5
1830 12.9 1910 92.2 1990 248.7
1840 17.1 1920 106.0 2000 281.4
1850 23.2 1930 123.2 2010 308.7
1860 31.4 1940 132.2
Ve biiu đ6 thanh mô ta du li�u.

2. M$t nhà cung c�p m9ng đi�u tra tai cua m9ng. S6 lư<ng ngưoi dùng
đ6ng thoi đư<c ghi nh�n t9i năm mươi đia điim (ngàn ngưoi)
17.2 22.1 18.5 17.2 18.6 14.8 21.7 15.8 16.3 22.8
24.1 13.3 16.2 17.5 19.0 23.9 14.8 22.2 21.7 20.7
13.5 15.8 13.1 16.1 21.9 23.9 19.3 12.0 19.9 19.4
15.4 16.7 19.5 16.2 16.9 17.1 20.2 13.4 19.8 17.7
19.7 18.7 17.6 15.9 15.2 17.1 15.0 18.8 21.6 11.9

a) Tính trung bình m�u, phương sai m�u và đ$ lêch chu�n m �u cua s6
lư<ng ngưoi dùng.
b) S6 lư<ng ngưoi dùng có theo phân ph6i chu �n? (Dùng histogram)

3. Dưoi đây là giá (đơn vi VND) m$t gam phô mai Thwy Sĩ cua m$t s6 hãng khác nhau
225 481 287 318 543
636 365 404 380 980
Tinh trung bình và phương sai m �u cua du li �u.
4. Dưoi đây là huy@t áp t6i đa cua 16 ngưoi lon
147 141 120 124 127 132 98 112
120 128 137 119 160 130 136 129
a) Tinh trung bình và phương sai m �u cua du li �u.
b) Xây dvng biiu đ6 phân b6 t �n s6 su dwng các khoang b1ng nhau voi khoang đ �u
tiên là [90,99].

Ron S. Kenett, Shelemyahu Zacks; Nguy@n Văn Minh M �n (dich), Th6ng kê công
nghi�p hi�n đ9i voi ung dwng vi@t trên R, MINITAB và JMP : Th6ng kê trong thvc
ti@n, NXB Bách khoa Hà N$i, 2016. S6 đinh danh: 658.562 K203
Nguy@n Ti@n Dũng, Nguy@n Đình Huy, Xác su �t - th6ng kê và phân tích s6 li �u,
NXB ĐHQG TPHCM 2019. S6 đinh danh: 519.2 NG527
Hà Văn Sơn (chu biên), Giáo trình nguyên lý th6ng kê kinh t@ -
Statistics for business and economics: Ung dwng trong kinh doanh và kinh t@, NXB
Th6ng kê, 2010. S6 đinh danh: 330.072 H100
Michael Baron, Probability and statistics for computer scientists, Third Edition, CRC
Press LLC 2019.

You might also like