Professional Documents
Culture Documents
SV-XSTK1-part 3
SV-XSTK1-part 3
2
Mô ta du li�u b1ng đ6 thi
3
Mô ta du li�u b1ng s6
• T6ng th� (đám đông): là t�p h<p t�t ca các ph �n tu là đ6i tư<ng ta nghiên
cuu.
• Tu t6ng thi ta ch9n ra n ph �n tu đi khao sát thì n ph �n tu đó đư<c g9i là m$t
m�u kích thưoc n.
• M�u đư<c ch9n ng�u nhiên nên đư<c g9i là m�u ng�u nhiên.
• Vi�c l�y m�u ti@n hành chu y@u theo hai phương thuc:
- L�y m�u có hoàn l9i
- L�y m�u không hoàn l9i.
NhJn xét: Khi t6ng thi có kích thưoc lon thì vi �c l �y m �u có hoàn l9i và không
hoàn l9i cho k@t qua sai l�ch không đáng ki
Năm Nam Nu
2003 $44, 456 $41, 789
2004 $47, 286 $46, 478
2005 $56, 234 $53, 854
2006 $57, 890 $58, 600
2007 $63, 467 $59, 070
2008 $61, 090 $55, 321
2009 $67, 543 $64, 506
Bang: Lương kh6i điim 6 công ty lu�t BLW
·104
8
Nam
Nu
0
2003 2004 2005 2006 2007 2008 2009
M$t khao sát v� s6 ti�n mà các sinh viên dv đinh tiêu trưoc khi bưoc vào
năm h9c moi cho bang s6 li�u sau
V�t dwng Trung bình cua nam ($) Trung bình cua nu ($)
Qu�n áo 207.46 198.15
Giày 107.22 88.65
Dwng cw h9c t�p 86.85 81.56
Máy tính 533.17 344.90
Đ6 gia dwng 266.69 266.98
M6i năm Princeton Review ti@n hành m$t cu$c khao sát các h9c sinh
trung h9c dv tuyin vào các trưong đ9i h9c và phw huynh cua h9. Trong ban báo cáo
năm 2009 có k@t qua 12715 h9c sinh trung h9c tra lưoi câu hoi "Khoang cách lý tư6ng
tu nhà đ@n trưong đ9i h9c là bao nhiêu?" Ban báo cáo cũng bao g6m phan h6i cua
3007 phw huynh đ6i vơi câu hoi "B9n mu6n trưong đ9i h9c mà con b9n h9c cách nhà
bao xa?"
Gold Equipment g�n đây đã thvc hi�n khao sát voi 300 ngưoi chơi golf v �
tác đ$ng cua công ngh� moi đ6i voi trò chơi. M$t câu hoi yêu c �u các golf thu chT ra
mang nào cua thi@t bi chơi gôn tác đ$ng nhi �u nh �t đi cai thi �n
trò chơi golf nghi�p dư. Các du li�u sau đây đã thu đư<c
Equipment Frequency Proportion
Golf ball 81 0.27
Club head material 66 0.22
Shaft material 63 0.21
Club head size 63 0.21
Shaft length 3 0.01
Don’t know 24 0.08
300 1.00
8%
21%
27% 22%
Các l6i chính ta trên m$t ban sơ y@u lí lich có thi t9o �n tư<ng không t6t cho nhà
tuyin dwng. M$t khao sát voi các lãnh đ9o cao c �p v � s6 l6i chính ta trong m$t sơ
y@u lí lich có thi làm cho h9 bo qua m$t ung viên đư<c đăng trên to USA Today tháng
3/2009 có s6 li�u như sau
S6 l6i chính ta T�n s6 T �n su �t
1 60 0.40
2 54 0.36
3 21 0.14
≥4 10 0.07
Không bi@t 5 0.03
Ve biiu đ6 bánh mô ta du li�u.
Ví dl;! Bang phân ph6i t�n s6 v� s6 ngưoi s6 huu phim DVD
DVD Movies Owned (classes) Frequency
0-3 60
4-7 50
8-11 47
12-15 40
16-19 18
20-23 8
24-27 6
28-31 1
230
60
40
20
0
3 7 11 15 19 23 27 31
M$t khao sát v� thói quen xem tivi cua tre em 6 My. Bang dưoi đây là t �n
s6 gio xem tivi m6i ngày cua m$t m �u tre em m$t tu6i và m$t m �u tre em 3 tu6i.
X 4 5 6 7 8 9 10
n 2 8 6 15 13 5 1
• S�p x�p s6 li�u dư6'i d�ng khoang
Ví dw. Đo chi�u cao X(cm) cua 100 sinh viên ta đư<c
Trung bình m�u X x�p xT (dv ki@n) trung bình t6ng thi µ = E(X )
Đ nh nghĩa
Trung bình m�u X là giá tri trung bình
X1 + · · · + Xn
X=
n
Tính ch�t.
E(X ) = µ
σ2
D(X ) = Var (X ) =
n
Kí hi�u
µ = trung bình t6ng thi
X = trung bình m�u, ưoc tính cho µ
σ = đ$ l�ch chu�n t6ng thi
s = đ$ l�ch chu�n m�u, ưoc tính cho σ
σ2 = phương sai t6ng thi
s2 = phương sai m�u, ưoc tính cho σ2
S = (X1, . . . , Xn)
Đ nh nghĩa
Phương sai m�u (có hi�u chinh) s2 đư<c đinh nghĩa
n (Xi − X )
2
s2 = i=1
n−1
Nó đo sv thay đ6i giua các quan sát và ưoc lư<ng phương sai t6ng thi.
Đ9 l�ch chu�n m�u (có hi�u chinh) đư<c đinh nghĩa
s = √s2
Nó ưoc lư<ng đ$ l�ch chu�n t6ng thi σ = Std (X )
Tính
ch�t.
• n
X 2 − nX 2
s2 = i=1 i
• n−1 2
Es = σ2
Ví dl;!. Đi đánh giá hi�u qua cua b$ xu lý đ6i voi m$t lo9i tác vw nh �t đinh, chúng
tôi đã ghi l9i thoi gian CPU cho 30 công vi �c đư<c ch9n ng �u nhiên (tính b1ng giây)
70 36 43 69 82 48 34 62 35 15
59 139 46 37 42 30 55 56 36 82
38 89 54 25 35 24 22 9 56 19
Giai. Trung bình m�u
70 + 36 + · · · + 19 1447
X= = = 48.2333
30 30
Phương sai m�u
2. M$t nhà cung c�p m9ng đi�u tra tai cua m9ng. S6 lư<ng ngưoi dùng
đ6ng thoi đư<c ghi nh�n t9i năm mươi đia điim (ngàn ngưoi)
17.2 22.1 18.5 17.2 18.6 14.8 21.7 15.8 16.3 22.8
24.1 13.3 16.2 17.5 19.0 23.9 14.8 22.2 21.7 20.7
13.5 15.8 13.1 16.1 21.9 23.9 19.3 12.0 19.9 19.4
15.4 16.7 19.5 16.2 16.9 17.1 20.2 13.4 19.8 17.7
19.7 18.7 17.6 15.9 15.2 17.1 15.0 18.8 21.6 11.9
a) Tính trung bình m�u, phương sai m�u và đ$ lêch chu�n m �u cua s6
lư<ng ngưoi dùng.
b) S6 lư<ng ngưoi dùng có theo phân ph6i chu �n? (Dùng histogram)
3. Dưoi đây là giá (đơn vi VND) m$t gam phô mai Thwy Sĩ cua m$t s6 hãng khác nhau
225 481 287 318 543
636 365 404 380 980
Tinh trung bình và phương sai m �u cua du li �u.
4. Dưoi đây là huy@t áp t6i đa cua 16 ngưoi lon
147 141 120 124 127 132 98 112
120 128 137 119 160 130 136 129
a) Tinh trung bình và phương sai m �u cua du li �u.
b) Xây dvng biiu đ6 phân b6 t �n s6 su dwng các khoang b1ng nhau voi khoang đ �u
tiên là [90,99].
Ron S. Kenett, Shelemyahu Zacks; Nguy@n Văn Minh M �n (dich), Th6ng kê công
nghi�p hi�n đ9i voi ung dwng vi@t trên R, MINITAB và JMP : Th6ng kê trong thvc
ti@n, NXB Bách khoa Hà N$i, 2016. S6 đinh danh: 658.562 K203
Nguy@n Ti@n Dũng, Nguy@n Đình Huy, Xác su �t - th6ng kê và phân tích s6 li �u,
NXB ĐHQG TPHCM 2019. S6 đinh danh: 519.2 NG527
Hà Văn Sơn (chu biên), Giáo trình nguyên lý th6ng kê kinh t@ -
Statistics for business and economics: Ung dwng trong kinh doanh và kinh t@, NXB
Th6ng kê, 2010. S6 đinh danh: 330.072 H100
Michael Baron, Probability and statistics for computer scientists, Third Edition, CRC
Press LLC 2019.