Professional Documents
Culture Documents
Chuong 2 - TK Mo Ta
Chuong 2 - TK Mo Ta
THỐNG KÊ MÔ TẢ
1
2.1. Mô tả một tiêu thức định tính
2.1.1. Lập bảng phân phối
- Trường hợp tiêu thức có ít biểu hiện:
Một biểu hiện thuộc tính là một tổ.
Xét dữ liệu chéo ở trang 3.
Kết cấu người tiêu dùng ở một thị trường theo nghề nghiệp
4
2.1. Mô tả một tiêu thức định tính
200
150
100 Mức độ ưa
50
thích sản phẩm
0
Khong Thich it Kha thich Thich Rat thich
thich
Số lần Tần số
khiếu nại
1 9
2 7
3 2
6
*
2.2. Mô tả một tiêu thức định lượng
2.2.1. Lập bảng phân phối
xmax xmin
h
k
xmax, xmin: lượng biến lớn nhất, nhỏ nhất
*10
2.2. Mô tả một tiêu thức định lượng
2.2.1. Lập bảng phân phối
Mức thu nhập Tần số Tần suất Tần số tích Tần suất tích
(tr.đ) (fi) (%) luỹ (Si) luỹ (%)
0,52 - 1,60 30 50 30 50
1,60 - 2,68 10 17 40 67
2,68 - 3,76 10 17 50 84
3,76 - 4,84 2 3 52 87
4,84 - 5,92 3 5 55 92
5,92 - 7,00 5 8 60 100
*11
2.2. Mô tả một tiêu thức định lượng
BIỂU ĐỒ ĐIỂM
**
**
*** *
******** * *
********* * * * * *
*********** * * ***** * * ** * * * * **
12
2.2. Mô tả một tiêu thức định lượng
2.2.2. Trình bày bằng biểu đồ
BIỂU ĐỒ PHÂN PHỐI
Tần số
30
27
24
21
18
15
12
9
6
3
0 Mức thu nhập
0,52 1,60 2,68 3,76 4,84 5,92 7,00
Phân phối người tiêu dùng theo mức thu nhập ở một thị trường
13
2.2. Mô tả một tiêu thức định lượng
2.2.2. Trình bày bằng biểu đồ
BIỂU ĐỒ HÌNH CUNG
Phân phối người tiêu dùng theo mức thu nhập ở một thị trường
14
2.2. Mô tả một tiêu thức định lượng
2.2.2. Trình bày bằng biểu đồ
BIỂU ĐỒ CÀNH VÀ LÁ
Xét dữ liệu:
0 5
1
5 23 25 34 38 39
2 35
39 40 42 42 45 50 3 4899
4 0225
5 0
*15
2.3. Mô tả kết hợp 2 tiêu thức
2.3.1. Lập bảng phân phối kết hợp (bảng chéo)
Bảng phân phối chéo của hai tiêu thức: Mức độ ưa thích
sản phẩm và Độ tuổi của 360 người tiêu dùng:
*17
2.3. Mô tả kết hợp 2 tiêu thức
2.3.1. Lập bảng phân phối kết hợp (bảng chéo)
*18
2.3. Mô tả kết hợp 2 tiêu thức
2.3.1. Lập bảng phân phối kết hợp (bảng chéo)
Độ tuổi
Mức độ ưa Tổng
thích SP Dưới 46 - Trên cộng
16 - 25 26 - 45
16 60 60
Không thích 15.8 33.7 18.9 26.3 5.3 100
Thích ít 6.3 10.1 25.3 48.1 10.1 100
Khá thích 2.1 7.3 31.3 43.8 15.6 100
Rất thích 1.1 5.6 11.1 55.6 26.7 100
*19
2.3. Mô tả kết hợp 2 tiêu thức
2.3.1. Lập bảng phân phối kết hợp (bảng chéo)
Mức độ ưa Độ tuổi
thích SP Dưới 16 16 - 25 26 - 45 46 - 60 Trên 60
Không thích 65.2 61.5 23.1 16.1 9.6
Thích ít 21.7 15.4 25.6 24.5 15.4
Khá thích 8.7 13.5 38.5 27.1 28.8
Rất thích 4.3 9.6 12.8 32.3 46.2
Tổng cộng 100 100 100 100 100
*20
2.3. Mô tả kết hợp 2 tiêu thức
2.3.2. Trình bày bằng biểu đồ
BIỂU ĐỒ NHIỀU THANH CẠNH NHAU
Tần số
60
50
40 Dưới 16
16 - 25
30
26 - 45
46 - 60
20
Trên 60
10
0
Không thích Thích ít Khá thích Rất thích
Từng nhóm thanh thể hiện một dòng dữ liệu trong bảng
tần số chéo (không gồm dòng và cột tổng cộng).
*21
2.3. Mô tả kết hợp 2 tiêu thức
2.3.2. Trình bày bằng biểu đồ
BIỂU ĐỒ NHIỀU THANH CHỒNG NHAU
Tỉ lệ %
Mỗi thanh thể hiện một dòng dữ liệu trong bảng chéo tỉ
lệ phần trăm theo dòng (không gồm cột tổng cộng).
*22
2.3. Mô tả kết hợp 2 tiêu thức
2.3.2. Trình bày bằng biểu đồ
ĐỒ THỊ PHÂN TÁN VÀ ĐƯỜNG XU HƯỚNG
Y
Liên hệ giữa thời gian gặp sự cố (x) và giá trị sản phẩm
(y) trong dữ liệu về 18 đơn thư khiếu nại ở trang 3
*23
2.3. Mô tả kết hợp 2 tiêu thức
2.3.2. Trình bày bằng biểu đồ
ĐỒ THỊ PHÂN TÁN VÀ ĐƯỜNG XU HƯỚNG
y y
x x
*24
2.4. Mô tả một tiêu thức định
lượng bằng các chỉ tiêu thống kê
25
2.4.1. Các chỉ tiêu mô tả vị trí trung tâm
(khuynh hướng hội tụ)
Số trung
Trung vị Mốt
bình
n
Trong đó: xi : Lượng biến (quan sát)
n : Số đơn vị tổng thể (số quan sát)
Ví dụ: Với dữ liệu ở trang 3 về tuổi của 18 KH:
22 26 25 27 26 26 25 27 26 48 26 25 26 25 60 27 26 27
x
x i
22 26 25 ... 27
28,89 (tuổi) 26
n 18
Số trung bình
+ Với dữ liệu có tần số:
Ví dụ
x
xi f i Với dữ liệu trang 3
fi Tuổi Tần số
(fi)
KH
Trong đó 22 1
xi : Lượng biến (các giá trị có tần số) 25 4
26 7
fi : Tần số hoặc tần suất 27 4
48 1
60 1
Tuổi trung bình của KH:
x
xf i i
221 25 4 601
28,89 (tuổi)
f i 1 4 1
*27
Số trung bình
- Với dữ liệu được phân tổ có khoảng cách tổ:
x
xf i i
f i
x
xf i i
10,5 20 20,5 180 68,0 40
35,25 (tuổi)
f i 20 180 40
*29
2.4.1. Các chỉ tiêu mô tả vị trí trung tâm
(khuynh hướng hội tụ)
N
Trong đó: xi : Lượng biến (quan sát)
N : Số đơn vị tổng thể (số quan sát)
f i
x
xw i i
w i
*31
Số trung bình có trọng số
Trong kinh tế số đo này thường được dùng để phản
ảnh trị số đại biểu của tiêu thức có thể viết được dưới
dạng: M
xi i
wi
Số trung bình có trọng số:
x
xw i i
wi: Trọng số
w i
*32
Số trung bình có trọng số
Ví dụ: Có dữ liệu về 5 đại lý của một doanh nghiệp.
Mi xw
Tiêu thức dạng: x i
i i
=> x
wi w i
Lợi tức
Lợi suất (đầu tư) =
Vốn đầu tư
Lợi nhuận
Tỉ suất lợi nhuận =
Vốn (KD, CĐ, LĐ) 35
Số trung bình có trọng số
Chú ý: Số trung bình có trọng số có thể dùng trọng số là
tỉ trọng mỗi bộ phận trong tổng thể:
x
x w x d
i i i i với di
wi
100
w d i i wi
Tỉ trọng vốn Tỉ trọng vốn lưu động trung
Tỉ trọng
Đại KD trong tất bình có trọng số:
lý vốn lưu
cả các đại lý
động (%)
(%)
x
xidi
1
2
20
15
10
30
d i
3 28 20 20 *10 15 * 30 16 * 30
4 30 10 10 30 30
5 16 30
*36
Trung vị (Median)
Trung vị: là lượng biến đứng ở vị trí giữa của dữ liệu
đã được sắp xếp.
Tìm trung vị với dữ liệu được sắp xếp sơ bộ hay rút gọn:
Nếu n lẽ: Me x n1
( ) xi: lượng biến
2
x n x n n: số quan sát
( ) ( 1)
Nếu n chẵn: Me x n1 2 2
(
2
) 2
22 25 25 25 25 26 26 26 26 26 26 26 27 27 27 27 48 60
n chẵn:
Số lần Tần số
khiếu nại (số đơn thư)
1 9
2 7
3 2
Mo = 1 (lần)
39
2.4.2. Các chỉ tiêu mô tả độ phân tán
Khoảng Độ lệch Hệ số
Phương Độ lệch
biến tuyệt đối biến
sai chuẩn
thiên trung bình thiên
40
Khoảng biến thiên (Range)
41
Độ lệch tuyệt đối trung bình
Công thức: d
x i x
với x
x i
n n
Ví dụ: Với dữ liệu chéo ở trang 3, độ lệch tuyệt đối tb:
x
x
i 22 26 25 ... 27
28,9 (tuổi)
n 18
d
xi x
n
22 28,9 25 28,9 ... 60 28,9
5,6 (tuổi)
18
42
Độ lệch tuyệt đối trung bình
Công thức: d
x x f
i i
Độ tuổi Tần số
f i 22 1
Với: x
x f i i
25
26
4
7
f i 27 4
Ví dụ: 48 1
d
x x fi i
60 1
f i
Với: x
xi fi 221 25 4 601
28,9 (tuổi)
fi 1 4 1
43
Phương sai (Variance)
2 i
( x ) 2
N
Trong đó:
x i
: Số trung bình tổng thể
N
N: Số đơn vị tổng thể của tổng thể
44
Phương sai (Variance)
với x
x i
n 1 n
Ví dụ: Với dữ liệu chéo ở trang 3, phương sai tuổi:
s
2 i
( x x ) 2
n 1
22 28,9 25 28,9 ... 60 28,9
2 2 2
84 (tuổi)2
18 1
Với x
x i
22 26 25 ... 27
28,9 (tuổi)
n 18
45
Phương sai (Variance)
Với: x
x f i i
25
26
4
7
f i 27 4
48 1
Ví dụ: s 2
( x x)
i
2
fi 60 1
n 1
s
2 22 28,9 2
.1 25 28,9 2
. 4 ... 60 28,9 2
.1
84 (tuổi)2
18 1
Với: x
xf i i
221 25 4 601
28,9
f i 1 4 1
46
Độ lệch chuẩn (Standard deviation)
2
s s2
Ví dụ: Độ lệch chuẩn về tuổi của dữ liệu trang 3.
s s 2 332,56 18,236 (tuổi)
x Me Mo Mo Me x
x Me Mo
*53
2.4.4. Mô tả hình dáng phân phối
Để mô tả tính đối xứng, sử dụng hệ số SKEWNESS:
Trong đó:
SKEW bằng không, phân phối đối xứng. SKEW dương càng
lớn, phân phối lệch phải càng nhiều. SKEW âm càng lớn phân
phối lệch trái càng nhiều.
*54
2.4.4. Mô tả hình dáng phân phối
Để mô tả độ nhọn, sử dụng hệ số KURTOSIS:
(n 1)(n 1) 3(n 1) 2
KURT K
(n 2)(n 3) (n 2)(n 3)
Trong đó:
*56
2.4.4. Mô tả hình dáng phân phối
Gía trị
Đơn thư
sp (xi) xi x ( xi x ) 2 ( xi x )3 ( xi x ) 4
1 2,5 -3,52 12,41 -43,70 153,91
2 1,8 -4,22 17,83 -75,27 317,81
… … … … …. …
Tổng 108,4 0 155,51 218,30 3137,16
TB 6,02 0,00 8,64 12,13 174,29
Có phần
lệch phải
n ( n 1) 18 (18 1)
SKEW H 0, 48 0,52
n2 18 2
*57
2.4.4. Mô tả hình dáng phân phối
Gía trị
Đơn thư xi x ( xi x ) 2 ( xi x )3 ( xi x ) 4
sp (xi)
… … … … …. …
TB 6,02 0,00 8,64 12,13 174,29
(x i x )( yi y )
xy i 1
N
*60
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng
( x x )( y
i i y)
S xy i 1
n 1
Ý nghĩa:
- Sxy = 0: Không có liên hệ tương quan tuyến tính
- Sxy > 0: Liên hệ tương quan tuyến tính thuận
- Sxy < 0: Liên hệ tương quan tuyến tính nghịch
*61
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng
Ví dụ: Xét liên hệ tương quan giữa tuổi và giá trị sản
phẩm của khách hàng khiếu nại ở trang 3.
Đơn Tuổi Giá trị sản xi x yi y ( xi x )( yi y)
thư (x) phẩm (y)
1 22 2,5 -6,89 -3,52 24,26
2 26 1,8 -2,89 -4,22 12,20
… … … … … …
Tổng 520,0 108,4 0,00 0,00 -28,26
TB 28,89 6,02 0,00 0,00 -1,57
n
( x x )( y y )
i i
28,26
Sxy i 1
1,66
n 1 18 1
Sxy < 0 : Liên hệ tương quan nghịch chiều.
*62
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng
xy
Hệ số tương quan tổng thể:
x y
r
( x x )( y y)
i i
S xy
( x x ) ( y y)
i
2
i
2 SxS y
Ý nghĩa:
* r càng gần 1: Tương quan tuyến tính thuận càng chặt.
* r càng gần -1: Tương quan tuyến tính nghịch càng chặt.
* r càng gần 0: Tương quan tuyến tính càng lỏng.
*63
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng
Ví dụ: Xét liên hệ tương quan giữa tuổi và giá trị sản
phẩm của khách hàng khiếu nại ở trang 3.
Đơn Tuổi Giá trị sản
( xi x )( yi y) ( xi x ) 2 ( yi y ) 2
thư (x) phẩm (y)
1 22 2,5 24,26 47,46 12,41
2 26 1,8 12,20 8,35 17,83
… … … … … …
Tổng 520,0 108,4 -28,26 1513,78 155,51
TB 28,89 6,02 -1,57 84,10 8,64
Hệ số tương quan Pearson:
r
( x x )( y y )
i i
28,26
0,058
(x x) ( y y)
i
2
i
2
1513,78 * 155,51
Liên hệ tương quan nghịch rất yếu. *64
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng
Ý nghĩa:
* r càng gần 1: Tương quan tuyến tính thuận càng chặt
* r càng gần -1: Tương quan tuyến tính nghịch càng chặt.
* r càng gần 0: Tương quan tuyến tính càng lỏng
* r = 0 : Không có liên hệ tương quan tuyến tính
*65
Ví dụ: Xét 18 đơn thư khiếu nại ở trang 3.
Đơn Tuổi Giá SP Hạng x Hạng y Rix-Riy
di2
thư (x) (y) (Rix) (Riy) (di)
1 22 2,5 1 2 -1 1
2 26 1,8 6 (9) 1 8 64
3 25 12,5 2 (3,5) 18 -14,5 210,25
4 27 4,5 13 (14,5) 7 7,5 56,25
5 26 2,8 7 (9) 4 5 25
6 26 6,4 8 (9) 11 -2 4
7 25 10,2 3 (3,5) 17 -13,5 182,25
8 27 3,5 14 (14,5) 5 9,5 90,25
9 26 6,8 9 12 -3 9
10 48 5,5 17 9 8 64
11 26 4,7 10 (9) 8 1 1
12 25 8,2 4 (3,5) 14 -10,5 110,25
13 26 9,1 11 (9) 15 -6 36
14 25 7,4 5 (3,5) 13 -9,5 90,25
15 60 5,8 18 10 8 64
16 27 4,4 15 (14,5) 6 8,5 72,25
17 26 9,7 12 (9) 16 -7 49
18 27 2,6 16 (14,5) 3 11,5 132,25
Tổng - - - - - 1261 *66
Ví dụ: Xét 18 đơn thư khiếu nại ở trang 3.
Đơn thư Giới tính Loại sự cố Yêu cầu của khách hàng
1 Nữ Kêu B.T
2 Nam Bể Đổi
3 Nam Rỉ Đổi
4 Nữ Nứt B.T
5 Nữ Cháy B.T
6 Nữ Cháy B.T
7 Nam Kêu Sửa
8 Nữ Nứt Đổi
9 Nữ Nứt B.T
… … … …
18 Nam Bể Sửa
*68
2.5.2. Mô tả liên hệ giữa hai tiêu thức danh định
Liên hệ giữa hai tiêu thức danh định có thể được
mô tả thông qua hệ số Cramer và hệ số liên hợp.
(1) Phân tổ kết hợp theo hai tiêu thức:
fi x f j y
Tần số lý thuyết: eij
n
71
*
2.5.2. Mô tả liên hệ giữa hai tiêu thức danh định
Ví dụ:
fi x f j y
Tần số lý thuyết: eij
n
72
*
Giới Yêu cầu của khách hàng
Ví dụ: tính B.T Đổi Sửa
k m ( f ij eij ) 2 Nam 1 (4) 3 (2.5) 5 (2.5)
2
(1 4) 2 (3 2.5) 2 (0 2.5)2
... 9.7
4 2.5 2.5
2 9,7
Hệ số Cramer: V 0,734
n ( h 1) 18 ( 2 1)
2 9, 7
Hệ số liên hợp: C 0,592
n
2
9,7 18