Professional Documents
Culture Documents
Chuong 2
Chuong 2
THỐNG KÊ MÔ TẢ
1
2.1. Mô tả một tiêu thức định tính
2.1.1. Lập bảng phân phối
- Trường hợp tiêu thức có ít biểu hiện:
? Một biểu hiện thuộc tính là một tổ.
Xét dữ liệu chéo ở trang 3.
Kết cấu người tiêu dùng ở một thị trường theo nghề nghiệp
4
2.1. Mô tả một tiêu thức định tính
200
150
100 Mức độ ưa
50
thích sản phẩm
0
Khong Thich it Kha thich Thich Rat thich
thich
Số lần Tần số
khiếu nại
1 9
2 7
3 2
6
*
2.2. Mô tả một tiêu thức định lượng
2.2.1. Lập bảng phân phối
xmax - xmin
h=
k
xmax, xmin: lượng biến lớn nhất, nhỏ nhất
Ví dụ:
(xmax-xmin)/k = (10,32–4,32)/4 = 1,523
=> Chọn h = 1,53
9
*
2.2. Mô tả một tiêu thức định lượng
2.2.1. Lập bảng phân phối
*10
2.2. Mô tả một tiêu thức định lượng
2.2.1. Lập bảng phân phối
Mức thu nhập Tần số Tần suất Tần số tích Tần suất tích
(tr.đ) (fi) (%) luỹ (Si) luỹ (%)
0,52 - 1,60 30 50 30 50
1,60 - 2,68 10 17 40 67
2,68 - 3,76 10 17 50 84
3,76 - 4,84 2 3 52 87
4,84 - 5,92 3 5 55 92
5,92 - 7,00 5 8 60 100
*11
2.2. Mô tả một tiêu thức định lượng
BIỂU ĐỒ ĐIỂM
**
**
*** *
******** * *
********* * * * * *
*********** * * ***** * * ** * * * * **
12
2.2. Mô tả một tiêu thức định lượng
2.2.2. Trình bày bằng biểu đồ
BIỂU ĐỒ PHÂN PHỐI
Tần số
30
27
24
21
18
15
12
9
6
3
0 Mức thu nhập
0,52 1,60 2,68 3,76 4,84 5,92 7,00
Phân phối người tiêu dùng theo mức thu nhập ở một thị trường
13
2.2. Mô tả một tiêu thức định lượng
2.2.2. Trình bày bằng biểu đồ
BIỂU ĐỒ HÌNH CUNG (Gấp khúc)
Phân phối người tiêu dùng theo mức thu nhập ở một thị trường
14
2.2. Mô tả một tiêu thức định lượng
2.2.2. Trình bày bằng biểu đồ
BIỂU ĐỒ CÀNH VÀ LÁ
Xét dữ liệu:
0 5
1
5 23 25 34 38 39
2 35
39 40 42 42 45 50 3 4899
4 0225
5 0
*15
2.3. Mô tả kết hợp 2 tiêu thức
2.3.1. Lập bảng phân phối kết hợp (bảng chéo)
Bảng phân phối chéo của hai tiêu thức: Mức độ ưa thích
sản phẩm và Độ tuổi của 360 người tiêu dùng :
*17
2.3. Mô tả kết hợp 2 tiêu thức
2.3.1. Lập bảng phân phối kết hợp (bảng chéo)
*18
2.3. Mô tả kết hợp 2 tiêu thức
2.3.1. Lập bảng phân phối kết hợp (bảng chéo)
Độ tuổi
Mức độ ưa Tổng
thích SP Dưới 46 - Trên cộng
16 - 25 26 - 45
16 60 60
Không thích 15.8 33.7 18.9 26.3 5.3 100
Thích ít 6.3 10.1 25.3 48.1 10.1 100
Khá thích 2.1 7.3 31.3 43.8 15.6 100
Rất thích 1.1 5.6 11.1 55.6 26.7 100
*19
2.3. Mô tả kết hợp 2 tiêu thức
2.3.1. Lập bảng phân phối kết hợp (bảng chéo)
Mức độ ưa Độ tuổi
thích SP Dưới 16 16 - 25 26 - 45 46 - 60 Trên 60
Không thích 65.2 61.5 23.1 16.1 9.6
Thích ít 21.7 15.4 25.6 24.5 15.4
Khá thích 8.7 13.5 38.5 27.1 28.8
Rất thích 4.3 9.6 12.8 32.3 46.2
Tổng cộng 100 100 100 100 100
*20
2.3. Mô tả kết hợp 2 tiêu thức
2.3.2. Trình bày bằng biểu đồ
BIỂU ĐỒ NHIỀU THANH CẠNH NHAU
Tần số
60
50
40
Dưới 16
16 - 25
30
26 - 45
46 - 60
20
Trên 60
10
0
Không thích Thích ít Khá thích Rất thích
Từng nhóm thanh thể hiện một dòng dữ liệu trong bảng
tần số chéo (không gồm dòng và cột tổng cộng).
*21
2.3. Mô tả kết hợp 2 tiêu thức
2.3.2. Trình bày bằng biểu đồ
BIỂU ĐỒ NHIỀU THANH CHỒNG NHAU
Tỉ lệ %
Mỗi thanh thể hiện một dòng dữ liệu trong bảng chéo tỉ
lệ phần trăm theo dòng (không gồm cột tổng cộng).
*22
2.3. Mô tả kết hợp 2 tiêu thức
2.3.2. Trình bày bằng biểu đồ
ĐỒ THỊ PHÂN TÁN VÀ ĐƯỜNG XU HƯỚNG
Y
Liên hệ giữa thời gian gặp sự cố (x) và giá trị sản phẩm
(y) trong dữ liệu về 18 đơn thư khiếu nại ở trang 3
*23
2.3. Mô tả kết hợp 2 tiêu thức
2.3.2. Trình bày bằng biểu đồ
ĐỒ THỊ PHÂN TÁN VÀ ĐƯỜNG XU HƯỚNG
y y
x x
*24
2.4. Mô tả một tiêu thức định
lượng bằng các chỉ tiêu thống kê
25
2.4.1. Các chỉ tiêu mô tả vị trí trung tâm
(khuynh hướng hội tụ)
Số trung
Trung vị (Me) Mốt (Mo)
bình (mean)
n
Trong đó: xi : Lượng biến (quan sát)
n : Số đơn vị tổng thể (số quan sát)
Ví dụ: Với dữ liệu ở trang 3 về tuổi của 18 KH:
22 26 25 27 26 26 25 27 26 48 26 25 26 25 60 27 26 27
x=
å x i
=
22 + 26 + 25 + ... + 27
= 28,89 (tuổi) 26
n 18
Số trung bình
+ Với dữ liệu có tần số:
Ví dụ
x=
å xi f i Với dữ liệu trang 3
å fi Tuổi Tần số
(fi)
KH
Trong đó 22 1
xi : Lượng biến (các giá trị có tần số) 25 4
26 7
fi : Tần số hoặc tần suất 27 4
48 1
60 1
Tuổi trung bình của KH:
x=
å xf i i
=
22´1 + 25´ 4 + × × × + 60´1
= 28,89 (tuổi)
åf i 1 + 4 + × × × +1
*27
Số trung bình
- Với dữ liệu được phân tổ có khoảng cách tổ:
x=
å xf i i
åf i
x=
å xfi i
=
10,5 ´ 20 + 20,5 ´180 + × × × + 68,0 ´ 40
= 35,25 (tuổi)
åf i 20 + 180 + × × × + 40
*29
2.4.1. Các chỉ tiêu mô tả vị trí trung tâm
(khuynh hướng hội tụ)
N
Trong đó: xi : Lượng biến (quan sát)
N : Số đơn vị tổng thể (số quan sát)
åf i
x=
å xw i i
åw i
* 31
Số trung bình có trọng số
Trong kinh tế số đo này thường được dùng để phản
ảnh trị số đại biểu của tiêu thức có thể viết được dưới
dạng: M
xi = i
wi
Số trung bình có trọng số:
x=
å xw i i
wi: Trọng số
åw i
*32
Số trung bình có trọng số
Ví dụ: Có dữ liệu về 5 đại lý của một doanh nhiệp.
Mi
x=
å xw
Tiêu thức dạng: xi =
i i
=>
wi åw i
Lợi nhuận
Tỉ suất lợi nhuận =
Vốn (KD, CĐ, LĐ)
Lợi nhuận
Tỉ suất lợi nhuận =
Doanh thu 35
Số trung bình có trọng số
Chú ý: Số trung bình có trọng số có thể dùng trọng số là
tỉ trọng mỗi bộ phận trong tổng thể:
x=
åx w åx d
= i i i i với di =
wi
100
åw åd i i å wi
Tỉ trọng vốn Tỉ trọng vốn lưu động trung
Tỉ trọng
Đại KD trong tất bình có trọng số:
lý vốn lưu
cả các đại lý
động (%)
(%)
x=
å
xi wi
1
2
20
15
10
30
å
wi
3 28 20 20 *10 + 15 * 30 + × × × + 16 * 30
=
4 30 10 10 + 30 + × × × + 30
5 16 30
*36
Trung vị (Median)
Trung vị: là lượng biến đứng ở vị trí giữa của dữ liệu
đã được sắp xếp theo trật tự tăng dần
? Tìm trung vị với dữ liệu được sắp xếp sơ bộ hay rút gọn:
Nếu n lẽ: Me = x n+1
( ) xi: lượng biến
2
x n +x n n: số quan sát
( ) ( +1)
Nếu n chẵn: Me = x n+1 = 2 2
( ) 2
2
22 25 25 25 25 26 26 26 26 26 26 26 27 27 27 27 48 60
? n chẵn:
Số lần Tần số
khiếu nại (số đơn thư)
1 9
2 7
3 2
Mo = 1 (lần)
39
2.4.2. Các chỉ tiêu mô tả độ phân tán
Khoảng Độ lệch Hệ số
Phương Độ lệch
biến tuyệt đối biến
sai chuẩn
thiên trung bình thiên
40
Khoảng biến thiên (Range)
41
Độ lệch tuyệt đối trung bình
Dữ liệu không phân tổ:
d=
å x i -x
với x=
å x i
n n
Ví dụ: Với dữ liệu chéo ở trang 3, độ lệch tuyệt đối tb:
x=
å x
=
i 22 + 26 + 25 + ... + 27
= 28,9 (tuổi)
n 18
d=
å xi - x
n
22 - 28,9 + 25 - 28,9 + ... + 60 - 28,9
= = 5,6 (tuổi)
18
42
Độ lệch tuyệt đối trung bình
d=
å x -x f
i i x=
å x f i i 25 4
åf i åf i
26
27
7
4
Ví dụ: 48 1
d=
å x -x f i i
60 1
åf i
Với: x=
å xf i i
=
22´1 + 25´ 4 + × × × + 60´1
= 28,9 (tuổi)
åf i 1+ 4 + × × × +1
43
Phương sai (Variance) TỔNG THỂ
s2 =
å i
( x - m ) 2
N
Trong đó:
m=
å x i
: Số trung bình tổng thể
N
N: Số đơn vị tổng thể của tổng thể
44
Phương sai (Variance) mẫu
Dữ liệu không phân tổ:
å i
( x - x ) 2
với x=
å x i
s2 = n
n -1
Ví dụ: Với dữ liệu chéo ở trang 3, phương sai tuổi:
s =
2 å i
( x - x ) 2
n -1
=
(22 - 28,9) + (25 - 28,9) + ... + (60 - 28,9)
2 2 2
= 84 (tuổi)2
18 -1
Với x= å x i
=
22 + 26 + 25 + ... + 27
= 28,9 (tuổi)
n 18
45
Phương sai (Variance) mẫu
Dữ liệu phân tổ:
Độ tuổi Tần số
s2 =
å i fi
( x - x ) 2
Với: x =
å xi f i 22
25
1
4
n -1 å fi 26 7
27 4
48 1
Ví dụ: s2 =
å i fi
( x - x ) 2
60 1
n -1
s =
2 (22 - 28,9 )2
. 1 + (25 - 28,9 )2
. 4 + ... + (60 - 28,9 )2
.1
= 84 (tuổi)2
18 - 1
Với: x=
å xf i i
=
22´1 + 25´ 4 + × × × + 60´1
= 28,9
åf i 1+ 4 + × × × +1
46
Độ lệch chuẩn (Standard deviation)
s= s 2
s = s2
Ví dụ: Độ lệch chuẩn về tuổi của dữ liệu trang 3.
s = s 2 = 332,56 = 18,236 (tuổi)
CV = * 100 (% )
s
x
Ví dụ: với dữ liệu về tuổi của dữ liệu ở trang 3.
18 , 236
CV = * 100 = 43 ,9 (% )
41,75
Được dùng để so sánh độ phân tán của cùng một
tiêu thức trên các tập dữ liệu khác nhau (về địa
điểm hay thời gian, quy mô) hoặc của các tiêu
thức khác nhau (đơn vị tính). 48
Hệ số biến thiên (Coefficient of variation)
Chứng khoán A:
– Giá trung bình năm trước: 50 (nghìn đồng)
– Độ lệch chuẩn: 5 (nghìn đồng)
×100 = 5(% )
s 10
CV = ×100 =
x 200
2.4.3. Tứ phân vị và biểu đồ hộp
x = Me = Mo
*53
2.4.4. Mô tả hình dáng phân phối
? Để mô tả tính đối xứng, sử dụng hệ số SKEWNESS:
Trong đó:
*54
2.4.4. Mô tả hình dáng phân phối
? Để mô tả độ nhọn, sử dụng hệ số KURTOSIS:
(n - 1)(n + 1) 3(n - 1) 2
KURT = K-
(n - 2)(n - 3) (n - 2)(n - 3)
Trong đó:
*56
2.4.4. Mô tả hình dáng phân phối
Gía trị
Đơn thư
sp (xi) xi - x ( xi - x ) 2 ( xi - x )3 ( xi - x ) 4
1 2,5 -3,52 12,41 -43,70 153,91
2 1,8 -4,22 17,83 -75,27 317,81
… … … … …. …
Tổng 108,4 0 155,51 218,30 3137,16
TB 6,02 0,00 8,64 12,13 174,29
Có phần
lệch phải
n ( n - 1) 18 (18 - 1)
SKEW = H = 0,48 = 0,52
n-2 18 - 2
*57
2.4.4. Mô tả hình dáng phân phối
Gía trị
Đơn thư xi - x ( xi - x ) 2 ( xi - x )3 ( xi - x ) 4
sp (xi)
… … … … …. …
TB 6,02 0,00 8,64 12,13 174,29
å (x i - m x )( yi - m y )
s xy = i =1
N
*60
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng
å (x i - x )( yi - y )
S xy = i =1
n -1
? Ý nghĩa:
- Sxy = 0: Không có liên hệ tương quan tuyến tính
- Sxy > 0: Liên hệ tương quan tuyến tính thuận
- Sxy < 0: Liên hệ tương quan tuyến tính nghịch
*61
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng
Ví dụ: Xét liên hệ tương quan giữa tuổi và giá trị sản
phẩm của khách hàng khiếu nại ở trang 3.
Đơn Tuổi Giá trị sản xi - x yi - y ( xi - x )( yi - y)
thư (x) phẩm (y)
1 22 2,5 -6,89 -3,52 24,26
2 26 1,8 -2,89 -4,22 12,20
… … … … … …
Tổng 520,0 108,4 0,00 0,00 -28,26
TB 28,89 6,02 0,00 0,00 -1,57
n
å ( x - x )( y - y )
i i
- 28,26
Sxy = i =1
= = -1,66
n -1 18 - 1
? Sxy < 0 : Liên hệ tương quan nghịch chiều.
*62
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng
s xy
? Hệ số tương quan tổng thể: r =
s xs y
? Hệ số tương quan mẫu (Pearson):
r=
å ( x - x )( y - y)
i i
=
S xy
å ( x - x ) å ( y - y)
i
2
i
2 SxSy
? Ý nghĩa:
* r càng gần 1: Tương quan tuyến tính thuận càng chặt.
* r càng gần -1: Tương quan tuyến tính nghịch càng chặt.
* r càng gần 0: Tương quan tuyến tính càng lỏng.
*63
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng
Ví dụ: Xét liên hệ tương quan giữa tuổi và giá trị sản
phẩm của khách hàng khiếu nại ở trang 3.
Đơn Tuổi Giá trị sản
( xi - x )( yi - y) ( xi - x ) 2 ( yi - y ) 2
thư (x) phẩm (y)
1 22 2,5 24,26 47,46 12,41
2 26 1,8 12,20 8,35 17,83
… … … … … …
Tổng 520,0 108,4 -28,26 1513,78 155,51
TB 28,89 6,02 -1,57 84,10 8,64
? Hệ số tương quan Pearson:
r=
å ( x - x )( y - y )
i i
=
- 28,26
= -0,058
å (x - x ) å ( y - y)
i
2
i
2
1513,78 * 155,51
? Liên hệ tương quan nghịch rất yếu. *64
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng
? Ý nghĩa:
* r càng gần 1: Tương quan tuyến tính thuận càng chặt
* r càng gần -1: Tương quan tuyến tính nghịch càng chặt.
* r càng gần 0: Tương quan tuyến tính càng lỏng
* r = 0 : Không có liên hệ tương quan tuyến tính
*65
Ví dụ: Xét 18 đơn thư khiếu nại ở trang 3.
Đơn Tuổi Giá SP Hạng x Hạng y Rix-Riy
di2
thư (x) (y) (Rix) (Riy) (di)
1 22 2,5 1 2 -1 1
2 26 1,8 6 (9) 1 8 64
3 25 12,5 2 (3,5) 18 -14,5 210,25
4 27 4,5 13 (14,5) 7 7,5 56,25
5 26 2,8 7 (9) 4 5 25
6 26 6,4 8 (9) 11 -2 4
7 25 10,2 3 (3,5) 17 -13,5 182,25
8 27 3,5 14 (14,5) 5 9,5 90,25
9 26 6,8 9 12 -3 9
10 48 5,5 17 9 8 64
11 26 4,7 10 (9) 8 1 1
12 25 8,2 4 (3,5) 14 -10,5 110,25
13 26 9,1 11 (9) 15 -6 36
14 25 7,4 5 (3,5) 13 -9,5 90,25
15 60 5,8 18 10 8 64
16 27 4,4 15 (14,5) 6 8,5 72,25
17 26 9,7 12 (9) 16 -7 49
18 27 2,6 16 (14,5) 3 11,5 132,25
Tổng - - - - - 1261 *66
Ví dụ: Xét 18 đơn thư khiếu nại ở trang 3.
? Hai tiêu thức danh định trong một tổng thể có thể có
liên hệ ở một mức độ nào đó.
Đơn thư Giới tính Loại sự cố Yêu cầu của khách hàng
1 Nữ Kêu B.T
2 Nam Bể Đổi
3 Nam Rỉ Đổi
4 Nữ Nứt B.T
5 Nữ Cháy B.T
6 Nữ Cháy B.T
7 Nam Kêu Sửa
8 Nữ Nứt Đổi
9 Nữ Nứt B.T
… … … …
18 Nam Bể Sửa
*68
2.5.2. Mô tả liên hệ giữa hai tiêu thức danh định
? Liên hệ giữa hai tiêu thức danh định có thể được
mô tả thông qua hệ số Cramer và hệ số liên hợp.
(1) Phân tổ kết hợp theo hai tiêu thức:
c 2
x2
f21 f22
…
f2m
V = e21 e22 e2m
n ( h - 1) … … … … …
Trong đó: h = min(k, m) fk1 fk2 fkm
xk …
ek1 ek2 ekm
? Ý nghĩa:
- V =0: Không có mối liên hệ.
- V càng gần1: Liên hệ càng chặt.
- V càng gần 0: Liên hệ càng yếu. 70
*
2.5.2. Mô tả liên hệ giữa hai tiêu thức danh định
fi x f j y
? Tần số lý thuyết: eij =
n
71
*
2.5.2. Mô tả liên hệ giữa hai tiêu thức danh định
Ví dụ:
fi x f j y
? Tần số lý thuyết: eij =
n
72
*
Giới Yêu cầu của khách hàng
Ví dụ: tính B.T Đổi Sửa
k m ( f ij - eij ) 2 Nam 1 (4) 3 (2.5) 5 (2.5)
c =åå
2
c2 9, 7
? Hệ số liên hợp: C= = = 0,592
c +n
2
9,7 + 18