You are on page 1of 73

Chương 2

THỐNG KÊ MÔ TẢ

2.1. Mô tả (tóm tắt) dữ liệu cho một tiêu thức (1 biến)


định tính bằng bảng phân phối và biểu đồ
2.2. Mô tả (tóm tắt) dữ liệu cho một tiêu thức (1 biến)
định lượng bằng bảng phân phối và biểu đồ
2.3. Mô tả (tóm tắt) dữ liệu cho hai tiêu thức (2 biến)
bằng bảng phân phối và biểu đồ
2.4. Mô tả một tiêu thức định lượng bằng các chỉ tiêu
2.5. Mô tả liên hệ giữa hai tiêu thức bằng các chỉ tiêu

1
2.1. Mô tả một tiêu thức định tính
2.1.1. Lập bảng phân phối
- Trường hợp tiêu thức có ít biểu hiện:
 Một biểu hiện thuộc tính là một tổ.
Xét dữ liệu chéo ở trang 3.

Giới tính Tần số


Nam 9
Nữ 9

Yêu cầu của KH Tần số


Sửa 5
Đổi 5
Bồi thường 8 * 2
2.1. Mô tả một tiêu thức định tính
2.1.1. Lập bảng phân phối
- Trường hợp tiêu thức có nhiều biểu hiện:
 Ghép các biểu hiện gần giống nhau về tính chất
thành từng tổ (nhóm).
 Có thể thử một vài cách ghép để chọn ra cách ghép
cho nhận thức rõ nhất về hiện tượng.

Xét dữ liệu chéo ở trang 3, phân tổ theo tiêu thức


loại sự cố.
Ghép thành 2 tổ: Loại sự cố Tần số
(số đơn thư)
* Bể, nứt và rỉ
Sự cố vật liệu 10
* Cháy, hỏng và kêu Sự cố kỹ thuật 8
3
*
2.1. Mô tả một tiêu thức định tính

2.1.2. Trình bày bằng biểu đồ

BIỂU ĐỒ HÌNH BÁNH

Chinh khach va doanh nhan


45%
28%
Gioi lao đong khoa hoc
13%
11%
3% Cong chuc hanh chinh

Cong nhan vien lao đong truc tiep


Nguoi lam cac cong viec khac

Kết cấu người tiêu dùng ở một thị trường theo nghề nghiệp

4
2.1. Mô tả một tiêu thức định tính

2.1.2. Trình bày bằng biểu đồ

BIỂU ĐỒ HÌNH THANH


Tần số
250

200

150

100 Mức độ ưa
50
thích sản phẩm

0
Khong Thich it Kha thich Thich Rat thich
thich

Số người tiêu dùng ở các cấp độ ưa thích sản phẩm


5
2.2. Mô tả một tiêu thức định lượng
2.2.1. Lập bảng phân phối

- Trường hợp lượng biến rời rạc và biến thiên ít:


 Mỗi giá trị rời rạc là một tổ.

Xét dữ liệu chéo ở trang 3, phân


tổ theo tiêu thức số lần khiếu nại.

Số lần Tần số
khiếu nại
1 9
2 7
3 2

6
*
2.2. Mô tả một tiêu thức định lượng
2.2.1. Lập bảng phân phối

- Trường hợp lượng biến biến thiên nhiều:


 Phân tổ (nhóm) có khoảng cách tổ đều.

xmax  xmin
h
k
xmax, xmin: lượng biến lớn nhất, nhỏ nhất

 Số tổ k thường được xác định công thức:


k = (2 x n)0,333

Trong đó: n là số quan sát của dữ liệu


7
*
Phân tổ với khoảng cách đều
Ví dụ: Xét dữ liệu chéo ở trang 3, phân tổ 18 đơn
thư khiếu nại theo tiêu thức giá trị sản phẩm.

Chọn số tổ: k = (2 x n)0,333 = (2x18)0,333 = 3

xmax  xmin 12,5 1,8


Trị số khoảng cách tổ: h   3,6
k 3
Chú ý:
 k Được làm tròn theo qui tắc thông thường
 h được xác định cùng một độ chính xác với dữ
liệu (cùng số chữ số sau dấu phẩy) nhưng theo
nguyên tắc làm tròn lên trên.
8
*
Phân tổ với khoảng cách đều

 h được xác định cùng một độ chính xác với dữ liệu


(cùng số chữ số sau dấu phẩy) nhưng theo nguyên
tắc làm tròn lên trên.

Ví dụ: (xmax-xmin)/k = (10,32–4,32)/4 = 1,523


=> Chọn h = 1,53

(xmax-xmin)/k = (9,6–3,2)/4 = 1,60


=> Chọn h = 1,7

(xmax-xmin)/k = (15–3)/4 = 3,0


=> Chọn h = 4
9
*
2.2. Mô tả một tiêu thức định lượng
2.2.1. Lập bảng phân phối

 Bảng phân phối tần số:

Giá trị sản phẩm Tần số


(tr.đ) (số đơn thư)

1,8 đến dưới 5,4 8


5,4 đến dưới 9,0 6
9,0 đến dưới 12,6 4

*10
2.2. Mô tả một tiêu thức định lượng
2.2.1. Lập bảng phân phối

Mức thu nhập Tần số Tần suất Tần số tích Tần suất tích
(tr.đ) (fi) (%) luỹ (Si) luỹ (%)
0,52 - 1,60 30 50 30 50
1,60 - 2,68 10 17 40 67
2,68 - 3,76 10 17 50 84
3,76 - 4,84 2 3 52 87
4,84 - 5,92 3 5 55 92
5,92 - 7,00 5 8 60 100

 Dựa vào bảng phân phối, ta nhận thức được các


đặc trưng phân phối của hiện tượng

*11
2.2. Mô tả một tiêu thức định lượng

2.2.2. Trình bày bằng biểu đồ

BIỂU ĐỒ ĐIỂM

**
**
*** *
******** * *
********* * * * * *
*********** * * ***** * * ** * * * * **

0,52 1,82 3,12 4,42 5,72 7,02

Phân phối người tiêu dùng theo mức thu nhập

12
2.2. Mô tả một tiêu thức định lượng
2.2.2. Trình bày bằng biểu đồ
BIỂU ĐỒ PHÂN PHỐI
Tần số
30
27
24
21
18
15
12
9
6
3
0 Mức thu nhập
0,52 1,60 2,68 3,76 4,84 5,92 7,00

Phân phối người tiêu dùng theo mức thu nhập ở một thị trường
13
2.2. Mô tả một tiêu thức định lượng
2.2.2. Trình bày bằng biểu đồ
BIỂU ĐỒ HÌNH CUNG

Phân phối người tiêu dùng theo mức thu nhập ở một thị trường
14
2.2. Mô tả một tiêu thức định lượng
2.2.2. Trình bày bằng biểu đồ

BIỂU ĐỒ CÀNH VÀ LÁ

Xét dữ liệu:
0 5
1
5 23 25 34 38 39
2 35
39 40 42 42 45 50 3 4899
4 0225
5 0

*15
2.3. Mô tả kết hợp 2 tiêu thức
2.3.1. Lập bảng phân phối kết hợp (bảng chéo)
Bảng phân phối chéo của hai tiêu thức: Mức độ ưa thích
sản phẩm và Độ tuổi của 360 người tiêu dùng:

Mức độ ưa Độ tuổi Tổng


thích SP Dưới 16 16 - 25 26 - 45 46 - 60 Trên 60 cộng
Không
15 32 18 25 5 95
thích
Thích ít 5 8 20 38 8 79
Khá thích 2 7 30 42 15 96
Rất thích 1 5 10 50 24 90
Tổng cộng 23 52 78 155 52 360
*16
2.3. Mô tả kết hợp 2 tiêu thức
2.3.1. Lập bảng phân phối kết hợp (bảng chéo)

=> Bảng phân phối theo từng tiêu thức

Mức độ ưa thích SP Tần số Tần suất Tần suất (%)


Không thích 95 0,26 26
Thích ít 79 0,22 22
Khá thích 96 0,27 27
Rất thích 90 0,25 25
Tổng cộng 360 1,00 100

*17
2.3. Mô tả kết hợp 2 tiêu thức
2.3.1. Lập bảng phân phối kết hợp (bảng chéo)

=> Bảng phân phối theo từng tiêu thức

Độ tuổi Tần số Tần suất Tần suất (%)


Dưới 16 23 0.06 6
16 - 25 52 0.14 14
26 - 45 78 0.22 22
46 - 60 155 0.43 43
Trên 60 52 0.14 14
Tổng cộng 360 1,00 100

*18
2.3. Mô tả kết hợp 2 tiêu thức
2.3.1. Lập bảng phân phối kết hợp (bảng chéo)

Bảng chéo tỉ lệ phần trăm theo dòng.

Độ tuổi
Mức độ ưa Tổng
thích SP Dưới 46 - Trên cộng
16 - 25 26 - 45
16 60 60
Không thích 15.8 33.7 18.9 26.3 5.3 100
Thích ít 6.3 10.1 25.3 48.1 10.1 100
Khá thích 2.1 7.3 31.3 43.8 15.6 100
Rất thích 1.1 5.6 11.1 55.6 26.7 100
*19
2.3. Mô tả kết hợp 2 tiêu thức
2.3.1. Lập bảng phân phối kết hợp (bảng chéo)

Bảng chéo tỉ lệ phần trăm theo cột.

Mức độ ưa Độ tuổi
thích SP Dưới 16 16 - 25 26 - 45 46 - 60 Trên 60
Không thích 65.2 61.5 23.1 16.1 9.6
Thích ít 21.7 15.4 25.6 24.5 15.4
Khá thích 8.7 13.5 38.5 27.1 28.8
Rất thích 4.3 9.6 12.8 32.3 46.2
Tổng cộng 100 100 100 100 100

*20
2.3. Mô tả kết hợp 2 tiêu thức
2.3.2. Trình bày bằng biểu đồ
BIỂU ĐỒ NHIỀU THANH CẠNH NHAU
Tần số
60

50

40 Dưới 16
16 - 25
30
26 - 45
46 - 60
20
Trên 60

10

0
Không thích Thích ít Khá thích Rất thích

Từng nhóm thanh thể hiện một dòng dữ liệu trong bảng
tần số chéo (không gồm dòng và cột tổng cộng).
*21
2.3. Mô tả kết hợp 2 tiêu thức
2.3.2. Trình bày bằng biểu đồ
BIỂU ĐỒ NHIỀU THANH CHỒNG NHAU
Tỉ lệ %

Mỗi thanh thể hiện một dòng dữ liệu trong bảng chéo tỉ
lệ phần trăm theo dòng (không gồm cột tổng cộng).
*22
2.3. Mô tả kết hợp 2 tiêu thức
2.3.2. Trình bày bằng biểu đồ
ĐỒ THỊ PHÂN TÁN VÀ ĐƯỜNG XU HƯỚNG
Y

Liên hệ giữa thời gian gặp sự cố (x) và giá trị sản phẩm
(y) trong dữ liệu về 18 đơn thư khiếu nại ở trang 3
*23
2.3. Mô tả kết hợp 2 tiêu thức
2.3.2. Trình bày bằng biểu đồ
ĐỒ THỊ PHÂN TÁN VÀ ĐƯỜNG XU HƯỚNG

y y

x x

Có liên hệ nghịch Không có liên hệ


giữa hai biến giữa hai hiến

*24
2.4. Mô tả một tiêu thức định
lượng bằng các chỉ tiêu thống kê

Đây là phương pháp mô tả dữ liệu định lượng


cô đọng nhất, khái quát nhất.

Nó giúp ta nhận thức được hai đặc trưng cốt


lõi nhất của dữ liệu định lượng là vị trí trung tâm
(khuynh hướng hội tụ) và độ phân tán của dữ
liệu.

25
2.4.1. Các chỉ tiêu mô tả vị trí trung tâm
(khuynh hướng hội tụ)

Số trung
Trung vị Mốt
bình

 Số trung bình mẫu:

+ Với dữ liệu không có tần số: x


 x i

n
Trong đó: xi : Lượng biến (quan sát)
n : Số đơn vị tổng thể (số quan sát)
Ví dụ: Với dữ liệu ở trang 3 về tuổi của 18 KH:
22 26 25 27 26 26 25 27 26 48 26 25 26 25 60 27 26 27

x
 x i

22  26  25  ...  27
 28,89 (tuổi) 26
n 18
Số trung bình
+ Với dữ liệu có tần số:
Ví dụ

x
 xi f i Với dữ liệu trang 3

 fi Tuổi Tần số
(fi)
KH
Trong đó 22 1
xi : Lượng biến (các giá trị có tần số) 25 4
26 7
fi : Tần số hoặc tần suất 27 4
48 1
60 1
Tuổi trung bình của KH:

x
 xf i i

221  25 4      601
 28,89 (tuổi)
f i 1 4     1
*27
Số trung bình
- Với dữ liệu được phân tổ có khoảng cách tổ:

x
 xf i i

f i

Trong đó: xi : Trị số giữa


fi : Tần số hoặc tần suất

Trị số giữa mỗi tổ được xác định bằng công thức:


xi = (ximin + ximax)/2

Với: ximin : Giới hạn dưới tổ i


ximax : Giới hạn trên tổ i
*28
Số trung bình
Ví dụ:
Tần số Tần suất % Trị số giữa
Độ tuổi
(fi) (di) (xi)
6 - 15 Dưới 16 20 3,3 10,5
16 – 25 180 30,0 20,5
26 – 45 260 43,3 35,5
46 – 60 100 16,7 53,0
61 - 75 Trên 60 40 6,7 68,0

Độ tuổi trung bình:

x
 xf i i

10,5  20  20,5 180      68,0  40
 35,25 (tuổi)
f i 20  180      40

*29
2.4.1. Các chỉ tiêu mô tả vị trí trung tâm
(khuynh hướng hội tụ)

 Số trung bình tổng thể:

+ Với dữ liệu không có tần số:   x i

N
Trong đó: xi : Lượng biến (quan sát)
N : Số đơn vị tổng thể (số quan sát)

+ Với dữ liệu có tần số:   xf i i

f i

Trong đó: xi : Lượng biến (các giá trị có tần số)


fi : Tần số hoặc tần suất
30
Số trung bình có trọng số
 Công thức tổng quát của số trung bình có trọng số:

x
 xw i i

w i

Trong đó: xi : Quan sát thứ i


wi : Trọng số của quan sát thứ i

 Trọng số là con số chỉ tầm quan trọng của các quan


sát trong tổng thể. Tùy mục đích khác nhau, các trọng số
có thể được chọn khác nhau.

 Ví dụ trong tính điểm trung bình của SV trọng số là


số tín chỉ.

*31
Số trung bình có trọng số
Trong kinh tế số đo này thường được dùng để phản
ảnh trị số đại biểu của tiêu thức có thể viết được dưới
dạng: M
xi  i
wi
Số trung bình có trọng số:

x
 xw i i
wi: Trọng số
w i

*32
Số trung bình có trọng số
Ví dụ: Có dữ liệu về 5 đại lý của một doanh nghiệp.

Tỉ trọng Tỉ trọng vốn lưu động có dạng:


vốn lưu Vốn
Vốn lưu động (Mi)
động kinh xi =
Đại Vốn kinh doanh (wi)
trong doanh

vốn kinh (tỉ Tỉ trọng vốn lưu động trung
doanh đồng) bình có trọng số:
(%)
x
xw i i wi: Vốn KD
1 20 1,0
2 15 0,6
w i

3 28 0,4 20.1,0  15.0,6      16.0,7



4 30 0,8 1,0  0,6      0,7
5 16 0,7 = 21,54 (%) *33
So sánh Số trung bình mô tả
với Số trung bình có trọng số

Tỉ trọng vốn lưu động trung


Tỉ trọng bình (mô tả):
vốn lưu Vốn
động kinh x
x

i 20  15  28  30  167
 21,8(%)
Đại n 5
trong doanh

vốn kinh (tỉ Tỉ trọng vốn lưu động trung
doanh đồng) bình có trọng số:
(%)
x
 xw i i
wi: Vốn KD
1 20 1,0
w i
2 15 0,6
3 28 0,4 20.1,0  15.0,6      16.07

4 30 0,8 1,0  0,6      0,7
5 16 0,7 = 21,54 (%) *34
Số trung bình có trọng số

Mi  xw
Tiêu thức dạng: x i 
i i
=> x
wi w i

Lợi tức
Lợi suất (đầu tư) =
Vốn đầu tư
Lợi nhuận
Tỉ suất lợi nhuận =
Vốn (KD, CĐ, LĐ) 35
Số trung bình có trọng số
Chú ý: Số trung bình có trọng số có thể dùng trọng số là
tỉ trọng mỗi bộ phận trong tổng thể:

x
x w x d
 i i i i với di 
wi
100
w d i i  wi
Tỉ trọng vốn Tỉ trọng vốn lưu động trung
Tỉ trọng
Đại KD trong tất bình có trọng số:
lý vốn lưu
cả các đại lý
động (%)
(%)
x

xidi
1
2
20
15
10
30
d i

3 28 20 20 *10  15 * 30      16 * 30

4 30 10 10  30      30
5 16 30
*36
Trung vị (Median)
Trung vị: là lượng biến đứng ở vị trí giữa của dữ liệu
đã được sắp xếp.

 Tìm trung vị với dữ liệu được sắp xếp sơ bộ hay rút gọn:
Nếu n lẽ: Me  x n1
( ) xi: lượng biến
2
x n x n n: số quan sát
( ) ( 1)
Nếu n chẵn: Me  x n1  2 2
(
2
) 2

Ví dụ: Với dữ liệu ở trang 3 về tuổi của khách hàng:


22 26 25 27 26 26 25 27 26 48 26 25 26 25 60 27 26 27

 Dữ liệu chưa được sắp xếp.


*37
Trung vị (Median)

Ví dụ: Với dữ liệu ở trang 3:


22 26 25 27 26 26 25 27 26 48 26 25 26 25 60 27 26 27

 Dữ liệu cần được sắp xếp như sau:

22 25 25 25 25 26 26 26 26 26 26 26 27 27 27 27 48 60

 n chẵn:

 Tuổi trung vị:


x n x n
( ) ( 1) x9  x10 26 26
Me  2 2
   26 (tuổi)
2 2 2
*38
Mốt (Mode)
Mốt: là lượng biến xuất hiện nhiều nhất trong tập hợp
dữ liệu.
 Tìm Mốt với dữ liệu được sắp xếp rút gọn: Mốt là lượng
biến có tần số lớn nhất.
Ví dụ: Có dữ liệu.

Số lần Tần số
khiếu nại (số đơn thư)
1 9
2 7
3 2

Mo = 1 (lần)
39
2.4.2. Các chỉ tiêu mô tả độ phân tán

Khoảng Độ lệch Hệ số
Phương Độ lệch
biến tuyệt đối biến
sai chuẩn
thiên trung bình thiên

a. Khoảng biến thiên (Range):


R = xmax - xmin
Trong đó: xmax : Lượng biến lớn nhất
xmin : Lượng biến nhỏ nhất

40
Khoảng biến thiên (Range)

Ví dụ: Độ tuổi Tần số


22 1
R = xmax – xmin= 60 – 22 = 38 (tuổi) 25 4
26 7
27 4
Số đo này không xét đến tất cả 48 1
các lượng biến nên kém chặt chẽ. 60 1

41
Độ lệch tuyệt đối trung bình

Công thức: d
 x i x
với x
 x i

n n
Ví dụ: Với dữ liệu chéo ở trang 3, độ lệch tuyệt đối tb:

x
 x

i 22  26  25  ...  27
 28,9 (tuổi)
n 18

d
 xi  x
n
22  28,9  25  28,9  ...  60  28,9
  5,6 (tuổi)
18
42
Độ lệch tuyệt đối trung bình

Công thức: d
 x x f
i i
Độ tuổi Tần số
f i 22 1

Với: x
 x f i i
25
26
4
7
f i 27 4
Ví dụ: 48 1

d
 x x fi i
60 1

f i

22  28,9 .1 25 28,9.4  ... 60  28,9 .1


  5,6 (tuổi)
1 4  ...1

Với: x 
 xi fi 221  25 4      601
  28,9 (tuổi)
 fi 1 4     1
43
Phương sai (Variance)

Phương sai tổng thể:

2   i
( x   ) 2

N
Trong đó:


 x i
: Số trung bình tổng thể
N
N: Số đơn vị tổng thể của tổng thể

44
Phương sai (Variance)

Phương sai mẫu: s  2  i


( x  x ) 2

với x
 x i
n 1 n
Ví dụ: Với dữ liệu chéo ở trang 3, phương sai tuổi:

s 
2  i
( x  x ) 2

n 1


22  28,9  25  28,9  ...  60  28,9
2 2 2
 84 (tuổi)2
18 1

Với x
 x i

22  26  25  ...  27
 28,9 (tuổi)
n 18
45
Phương sai (Variance)

Phương sai mẫu: s 


2  i fi
( x  x ) 2
Độ tuổi Tần số
n 1 22 1

Với: x
 x f i i
25
26
4
7
f i 27 4
48 1
Ví dụ: s 2

( x  x)
i
2
fi 60 1
n 1

s 
2 22  28,9 2
.1  25  28,9 2
. 4  ...  60  28,9 2
.1
 84 (tuổi)2
18  1

Với: x
 xf i i

221  25 4      601
 28,9
f i 1  4     1
46
Độ lệch chuẩn (Standard deviation)

Độ lệch chuẩn tổng thể:

  2

Độ lệch chuẩn mẫu:

s  s2
Ví dụ: Độ lệch chuẩn về tuổi của dữ liệu trang 3.
s  s 2  332,56  18,236 (tuổi)

Đây là số đo độ phân tán tốt nhất, thường được dùng


nhất cho một tập hợp dữ liệu của một tiêu thức.
47
Hệ số biến thiên (Coefficient of variation)
Hệ số biến thiên tổng thể:

CV  *100% 

Hệ số biến thiên mẫu:
s
CV  *100 % 
x
Ví dụ: với dữ liệu về tuổi của dữ liệu ở trang 3.
18 , 236
CV  * 100  43 ,9 % 
41,75
Được dùng để so sánh độ phân tán của cùng một
tiêu thức trên các tập dữ liệu khác nhau (về địa điểm
hay thời gian) hoặc của các tiêu thức khác nhau.
48
Hệ số biến thiên (Coefficient of variation)
Chứng khoán A:
– Giá trung bình năm trước: 50 (nghìn đồng)
– Độ lệch chuẩn: 5 (nghìn đồng)
s 5
CV  100  100  10% 
x 50
Chứng khoán B:
– Giá trung bình năm trước: 200 (nghìn đồng)
– Độ lệch chuẩn: 10 (nghìn đồng)
s 10
CV  100  100  5% 
x 200
2.4.3. Tứ phân vị và biểu đồ hộp

Gồm ba số đo chia tập hợp dữ liệu (đã được sắp xếp)


thành bốn phần bằng nhau.
xn
x1
Q2 Q3
Q1
t1
Tứ phân vị thứ nhất: Q1  x( n 1) / 4  x n1  (x( n1 1)  x n1 )
4
t2
Tứ phân vị thứ hai: Q2  x2(n 1) / 4  xn2  (x(n2 1)  xn2 )
4
t3
Tứ phân vị thứ ba: Q3  x 3( n 1) / 4  x n3  (x ( n3 1)  x n3 )
4
Trong đó: n1, n2, n3 là các số nguyên dương và t1, t2, t3
là các phần dư (1, 2 hoặc 3).
50
2.4.3. Tứ phân vị
Độ Tần Si
tuổi số
Ví dụ:
22 1 1
x18 25 4 5
x1 26 7 12
Q1 Q2 Q3 27 4 16
48 1 17
60 1 18

Q1 = x (n+1)/4 = x19/4 = x4 + 3/4(x5 - x4) = 25 + 3/4(25-25) = 25 (tuổi)

Q2 = x2(n+1)/4 = x38/4 = x9 + 2/4(x10 - x9) = 26 + 2/4(26-26) = 26 (tuổi)

Q3 = x3(n+1)/4 = x57/4 = x14 + 1/4 (x15 - x14) = 27 + 1/4(27-27) = 27 (tuổi)


51
Biểu đồ hộp
Độ Tần Tuổi
tuổi số *
55
Q1 = 25 22 1
25 4 50 *
Q2 = 26 26 7 45
27 4 40
Q3 = 27
48 1
35
60 1
30
Phát hiện giá trị bất thường 25
x > Q3 + 1,5 (Q3 – Q1) 20
x < Q1 - 1,5 (Q3 – Q1)

Q3 + 1,5 (Q3 – Q1) = 27 + 1,5(27-25) = 30


Q1 - 1,5 (Q3 – Q1) = 25 - 1,5(27-25) = 22
52
2.4.4. Mô tả hình dáng phân phối
Phân phối lệch trái Phân phối lệch phải

x  Me  Mo Mo  Me  x

Phân phối đối xứng  Phân phối chuẩn

x  Me  Mo
*53
2.4.4. Mô tả hình dáng phân phối
 Để mô tả tính đối xứng, sử dụng hệ số SKEWNESS:

Trong đó:

 SKEW bằng không, phân phối đối xứng. SKEW dương càng
lớn, phân phối lệch phải càng nhiều. SKEW âm càng lớn phân
phối lệch trái càng nhiều.

*54
2.4.4. Mô tả hình dáng phân phối
 Để mô tả độ nhọn, sử dụng hệ số KURTOSIS:

(n  1)(n  1) 3(n  1) 2
KURT  K
(n  2)(n  3) (n  2)(n  3)

Trong đó:

 KURT bằng không, phân phối có độ dốc như phân phối


chuẩn. KURT dương càng lớn, phân phối càng dốc hơn phân
phối chuẩn. KURT âm càng lớn phân phối càng ít dốc hơn
phân phối chuẩn.
*55
2.4.4. Mô tả hình dáng phân phối
Ví dụ: Xét dữ liệu về giá trị sản phẩm của 18 đơn thư
khiếu nại ở trang 3.

Đơn Gía trị


thư sphẩm (xi)
1 2,5
2 1,8
3 12,5
4 4,5
5 2,8
6 6,4
… …
18 2,6

*56
2.4.4. Mô tả hình dáng phân phối
Gía trị
Đơn thư
sp (xi) xi  x ( xi  x ) 2 ( xi  x )3 ( xi  x ) 4
1 2,5 -3,52 12,41 -43,70 153,91
2 1,8 -4,22 17,83 -75,27 317,81
… … … … …. …
Tổng 108,4 0 155,51 218,30 3137,16
TB 6,02 0,00 8,64 12,13 174,29

Có phần
lệch phải

n ( n  1) 18 (18  1)
SKEW  H  0, 48  0,52
n2 18  2
*57
2.4.4. Mô tả hình dáng phân phối
Gía trị
Đơn thư xi  x ( xi  x ) 2 ( xi  x )3 ( xi  x ) 4
sp (xi)
… … … … …. …
TB 6,02 0,00 8,64 12,13 174,29

(n  1)(n  1) 3(n  1) 2 Ít dốc hơn


KURT  K
(n  2)(n  3) (n  2)(n  3) PP chuẩn

(18  1)(18  1) 3(18  1) 2


 2,33   0,48
(18  2)(18  3) (18  2)(18  3)
*58
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng
 Hai tiêu thức định lượng trong cùng một tổng thể có thể
có liên hệ tuyến tính ở một mức độ và chiều hướng nào đó.

Đơn Giá trị sản Số lần Số ngày bảo


Tuổi
thư phẩm khiếu nại hành còn lại
1 22 2,5 1 72
2 26 1,8 2 24
3 25 12,5 2 37
… … … … …
18 60 2,6 2 39

 Để đo lường liên hệ tương quan tuyến tính, dùng Hiệp


phương sai, Hệ số tương quan Pearson, Hệ số tương quan
Spearman.
*59
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng

 Hiệp phương sai tổng thể:

 (x i   x )( yi   y )
 xy  i 1
N

*60
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng

 Hiệp phương sai mẫu:


n

 ( x  x )( y
i i  y)
S xy  i 1
n 1
 Ý nghĩa:
- Sxy = 0: Không có liên hệ tương quan tuyến tính
- Sxy > 0: Liên hệ tương quan tuyến tính thuận
- Sxy < 0: Liên hệ tương quan tuyến tính nghịch

*61
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng
Ví dụ: Xét liên hệ tương quan giữa tuổi và giá trị sản
phẩm của khách hàng khiếu nại ở trang 3.
Đơn Tuổi Giá trị sản xi  x yi  y ( xi  x )( yi  y)
thư (x) phẩm (y)
1 22 2,5 -6,89 -3,52 24,26
2 26 1,8 -2,89 -4,22 12,20
… … … … … …
Tổng 520,0 108,4 0,00 0,00 -28,26
TB 28,89 6,02 0,00 0,00 -1,57
n

 ( x  x )( y  y )
i i
 28,26
Sxy  i 1
  1,66
n 1 18  1
 Sxy < 0 : Liên hệ tương quan nghịch chiều.
*62
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng
 xy
 Hệ số tương quan tổng thể:  
 x y

 Hệ số tương quan mẫu (Pearson):

r
 ( x  x )( y  y)
i i

S xy

 ( x  x )  ( y  y)
i
2
i
2 SxS y

 Ý nghĩa:
* r càng gần 1: Tương quan tuyến tính thuận càng chặt.
* r càng gần -1: Tương quan tuyến tính nghịch càng chặt.
* r càng gần 0: Tương quan tuyến tính càng lỏng.
*63
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng
Ví dụ: Xét liên hệ tương quan giữa tuổi và giá trị sản
phẩm của khách hàng khiếu nại ở trang 3.
Đơn Tuổi Giá trị sản
( xi  x )( yi  y) ( xi  x ) 2 ( yi  y ) 2
thư (x) phẩm (y)
1 22 2,5 24,26 47,46 12,41
2 26 1,8 12,20 8,35 17,83
… … … … … …
Tổng 520,0 108,4 -28,26 1513,78 155,51
TB 28,89 6,02 -1,57 84,10 8,64
 Hệ số tương quan Pearson:

r
 ( x  x )( y  y )
i i

 28,26
 0,058
 (x  x)  ( y  y)
i
2
i
2
1513,78 * 155,51
 Liên hệ tương quan nghịch rất yếu. *64
2.5.1. Mô tả liên hệ tương quan tuyến
tính giữa hai tiêu thức định lượng

 Hệ số tương quan hạng Spearman:


n
6 d i2
r  1 i 1
n ( n  1)
2

 Ý nghĩa:
* r càng gần 1: Tương quan tuyến tính thuận càng chặt
* r càng gần -1: Tương quan tuyến tính nghịch càng chặt.
* r càng gần 0: Tương quan tuyến tính càng lỏng
* r = 0 : Không có liên hệ tương quan tuyến tính

*65
Ví dụ: Xét 18 đơn thư khiếu nại ở trang 3.
Đơn Tuổi Giá SP Hạng x Hạng y Rix-Riy
di2
thư (x) (y) (Rix) (Riy) (di)
1 22 2,5 1 2 -1 1
2 26 1,8 6 (9) 1 8 64
3 25 12,5 2 (3,5) 18 -14,5 210,25
4 27 4,5 13 (14,5) 7 7,5 56,25
5 26 2,8 7 (9) 4 5 25
6 26 6,4 8 (9) 11 -2 4
7 25 10,2 3 (3,5) 17 -13,5 182,25
8 27 3,5 14 (14,5) 5 9,5 90,25
9 26 6,8 9 12 -3 9
10 48 5,5 17 9 8 64
11 26 4,7 10 (9) 8 1 1
12 25 8,2 4 (3,5) 14 -10,5 110,25
13 26 9,1 11 (9) 15 -6 36
14 25 7,4 5 (3,5) 13 -9,5 90,25
15 60 5,8 18 10 8 64
16 27 4,4 15 (14,5) 6 8,5 72,25
17 26 9,7 12 (9) 16 -7 49
18 27 2,6 16 (14,5) 3 11,5 132,25
Tổng - - - - - 1261 *66
Ví dụ: Xét 18 đơn thư khiếu nại ở trang 3.

Đơn Tuổi Giá SP Hạng x Hạng y Rix-Riy


di2
thư (x) (y) (Rix) (Riy) (di)
1 22 2,5 1 2 -1 1
2 26 1,8 6 (9) 1 8 64
3 25 12,5 2 (3,5) 18 -14,5 210,25
… … … … … … …
18 27 2,6 16 (14,5) 3 11,5 132,25
Tổng - - - - - 1261
 Hệ số tương quan hạng Spearman:
n
6  d i2
6  1261
r 1 i 1
1  0,301
n ( n  1)
2
18(18  1
2

 Tương quan tuyến tính nghịch rất yếu.


*67
2.5.2. Mô tả liên hệ giữa hai tiêu thức danh định
 Hai tiêu thức danh định trong một tổng thể có thể có
liên hệ ở một mức độ nào đó.

Đơn thư Giới tính Loại sự cố Yêu cầu của khách hàng
1 Nữ Kêu B.T
2 Nam Bể Đổi
3 Nam Rỉ Đổi
4 Nữ Nứt B.T
5 Nữ Cháy B.T
6 Nữ Cháy B.T
7 Nam Kêu Sửa
8 Nữ Nứt Đổi
9 Nữ Nứt B.T
… … … …
18 Nam Bể Sửa
*68
2.5.2. Mô tả liên hệ giữa hai tiêu thức danh định
 Liên hệ giữa hai tiêu thức danh định có thể được
mô tả thông qua hệ số Cramer và hệ số liên hợp.
(1) Phân tổ kết hợp theo hai tiêu thức:

Các tổ Các tổ của Y (2) Xác định tần


Tổng số lý thuyết khi
của X C C2Y … CmY
1Y
hai tiêu thức độc
C1X f11 f12 … f1m f1x
lập:
C2X f21 f22 … f2m f2x
fi x f j y
… … … … eij 
CkX fk1 fk2 … fkm fkx
n

Tổng f1y f2y fmy n


69
*
2.5.2. Mô tả liên hệ giữa hai tiêu thức danh định

(3) Xác định: Các tổ của Y


Các tổ
k m ( f ij  eij ) 2 của X y1 y2 … ym
2  
i 1 j 1 eij
f11 f12 f1m
x1 …
 Hệ số Cramer : e11 e12 e1m

 2 f21 f22 f2m


x2 …
V  e21 e22 e2m
n ( h  1) … … … … …
Trong đó: h = min(k, m) fk1 fk2 fkm
xk …
ek1 ek2 ekm
 Ý nghĩa:
- V =0: Không có mối liên hệ.
- V càng gần1: Liên hệ càng chặt.
- V càng gần 0: Liên hệ càng yếu. 70
*
2.5.2. Mô tả liên hệ giữa hai tiêu thức danh định

Ví dụ: Xét dữ liệu về 18 đơn thư khiếu nại ở trang 3. Liên


hệ giữa Giới tính và Yêu cầu của khách hàng được mô tả
như sau.

 Phân tổ kết hợp theo hai tiêu thức :

Yêu cầu của khách hàng


Giới tính Cộng
Bồi thường Đổi Sửa
Nam 1 3 5 9
Nữ 7 2 0 9
Cộng 8 5 5 18

fi x f j y
 Tần số lý thuyết: eij 
n
71
*
2.5.2. Mô tả liên hệ giữa hai tiêu thức danh định

Ví dụ:

Yêu cầu của khách hàng


Giới tính Cộng
Bồi thường Đổi Sửa
Nam 1 (4) 3 (2.5) 5 (2.5) 9
Nữ 7 (4) 2 (2.5) 0 (2.5) 9
Cộng 8 5 5 18

fi x f j y
 Tần số lý thuyết: eij 
n
72
*
Giới Yêu cầu của khách hàng
Ví dụ: tính B.T Đổi Sửa
k m ( f ij  eij ) 2 Nam 1 (4) 3 (2.5) 5 (2.5)
 
2

i 1 j 1 eij Nữ 7 (4) 2 (2.5) 0 (2.5)

(1  4) 2 (3  2.5) 2 (0  2.5)2
   ...   9.7
4 2.5 2.5
2 9,7
 Hệ số Cramer: V    0,734
n ( h  1) 18 ( 2  1)

2 9, 7
 Hệ số liên hợp: C   0,592
 n
2
9,7  18

 Có liên hệ khá mạnh giữa giới tính và YCCKH.


73
*

You might also like