You are on page 1of 28

Chương 4

MÔ TẢ DL BẰNG CÁC ĐẶC


TRƯNG ĐO LƯỜNG
Mục tiêu
• Học xong chương này, người học có
thể tính toán và hiểu được ý nghĩa
của:
– Các đặc trưng đo lường khuynh hướng
tập trung.
– Các đặc trưng đo lường độ phân tán.
– Chuẩn hóa DL.
4.2. Các đặc trưng đo lường
khuynh hướng tập trung
Để đo độ tập trung của DL
• Trung bình cộng
• Trung vị (Me)
• Tứ phân vị
• Mốt (Mo)
• Trung bình nhân
4.2. Các đặc trưng đo lường
khuynh hướng tập trung
• Trung bình cộng đơn giản:
N
 xi
  i 1
N
• Trung bình cộng gia quyền:
k
 xifi
 i 1
k
 fi
i 1
4.2. Các đặc trưng đo lường
khuynh hướng tập trung
• Tính số TBC trong trường hợp tài liệu phân tổ
có khoảng cách tổ:
Người ta lấy trị số giữa mỗi tổ làm lượng biến
đại diện cho tổ đó.
x max  x min
xi 
2
Trong đó XMAX, XMIN là giới hạn trên, giới hạn
dưới của mỗi tổ.

5
4.2. Các đặc trưng
1.4. SỐ TRUNG BÌNH NHÂN
đo lường
khuynh hướng
(SỐ TB HÌNH HỌC)
tập trung
• Số TB nhân: Được tính từ những lượng biến có quan
hệ tích số.
CÔNG THỨC:
m
t  m t1t 2t 3 ...t m  m  t i
i 1

Với
ti : số tương đối động thái liên hoàn thứ I ( tốc độ phát
triển liên hoàn) 6
Trong trường hợp các lượng biến ti được gặp nhiều lần,
nghĩa là các tần số fi khác nhau, công thức trên được
viết gọn:

k k
 fi  fi k f
f1 f2 fk
t i 1
t1  t2  ...  t k  i 1  t i
i
i 1

k
 fi  m
Với

i 1
7
Tài liệu về sản lượng lúa thu hoạch của
Ví dụ
tỉnh X như sau:

Năm 1999 2000 2001 2002 2003


Sl lúa
400 395 416 450 480
(1000 tấn)
ti 0.987 1.053 1.082 1.067

8
Tốc độ phát triển trung bình về SL lúa của
tỉnh X giai đoạn 1999 – 2003 là:

4
t  4  t i  4 0,987x1,053x1,082x1,067 
i1
1,047 laà
n hay 104,7%

9
4.2. Các đặc trưng đo lường
khuynh hướng tập trung
• Trung vị (Me)
• Trong một dãy số gồm n phần tử
được sx theo giá trị tăng dần:
– n lẻ: Me là giá trị thứ (n+1)/2
– n chẵn: Me là TB cộng của hai giá trị
thứ n/2 và (n/2+1)
4.2. Các đặc trưng đo lường
khuynh hướng tập trung
• Tứ phân vị: chia dãy số có n phần tử
SX theo thứ tự tăng dần thành 4
phần, mỗi phần có số giá trị bằng
nhau.
Q1 Q2 Q3
Vị trí thứ (n+1)/4 (n+1)/2 3(n+1)/4

• Tứ phân vị cho DL phân tổ:


(A)/t84&89
4.2. Các đặc trưng đo lường
khuynh hướng tập trung
• Mốt (Mo): là giá trị mà tại đó có tần
số lớn nhất.
• Có thể có 1, nhiều, không có Mo
• Mo cho DL phân tổ: (A)/t89
4.3. Các đặc trưng đo lường
độ phân tán
Để đo độ phân tán/đồng đều của DL
• Khoảng biến thiên (R)
• Độ trải giữa (RQ)
• Độ lệch tuyệt đối trung bình
• Phương sai
• Độ lệch chuẩn
• Hệ số biến thiên (CV)
4.3. Các đặc trưng đo lường
độ phân tán
• Khoảng biến thiên (R)
R=xmax-xmin
4.3. Các đặc trưng đo lường
độ phân tán
• Độ trải giữa (RQ)
RQ=Q3-Q1
4.3. Các đặc trưng đo lường
độ phân tán
• Độ lệch tuyệt đối trung bình
n _
_  | xi  x |
d i 1
n
4.3. Các đặc trưng đo lường
độ phân tán
• Phương sai:     x   
2
2 i

• Phương sai mẫu hiệu chỉnh:


n
 ( x i  x)
2
i 1
S  2
n1
• Độ lệch chuẩn: 
• Hệ số biến thiên: 
CV  x100%

4.4Hình dáng phân phối của tập dữ liệu
Diễn tả dữ liệu được phân phối như thế nào
Đối xứng hay lệch

Left-Skewed Symmetric Right-Skewed

Mean < Median < Mode Mean = Median = Mode Mode < Median < Mean

(Longer tail extends to left) (Longer tail extends to right)

Lệch trái Đối xứng Lệch phải


Hình dáng phân phối của tập dữ liệu
Diễn tả dữ liệu được phân phối như thế nào
Đối xứng hay lệch

Left-Skewed Symmetric Right-Skewed

Q1 Q2Q3 Q1Q2Q3 Q1 Q2 Q3

20
4.4. Khảo sát hình dạng
phân phối của dãy số
Tiêu chí Đặc điểm phân phối

Skewness =0 Đối xứng


Skewness >0 Lệch phải
Skewness <0 Lệch trái
Kurtosis =3 Tập trung ở mức bình thường
Kurtosis >3 Tập trung hơn mức bình thường
Kurtosis <3 Ít tập trung hơn bình thường
4.6. Chuẩn hóa dữ liệu
• Cho phép chuyển đổi
• Khi làm việc với dữ liệu số lượng, sẽ
có lúc bạn cần biến đổi chúng thành
dữ liệu của một thang đo chuẩn.với
mục đích so sánh:
x
• Giá trị chuẩn hóa z: z

Ví dụ

A : 820 điểm Toeic với (X = 550 ; = 90)


B : 7.5 điểm IELTS với ( X = 5 ;  = 1)

Z1 = (820-550)/90=3
Z 2 = (7.5-5)/1=2.5
=> A giỏi tiếng Anh hơn B.
Biểu đồ hộp và râu
Biểu đồ hộp và râu (Box and whisker plot)
Là công cụ đồ họa thể hiện 5 số trị số tóm tắt :
Minimum -- Q1 -- Median -- Q3 -- Maximum

25% 25%
25% 25%

Minimum 1st Median 3rd Maximum


Minimum 1st
Quartile Median 3rd
Quartile Maximum
Quartile Quartile
Hình hộp và đường trung tâm ở ngay vị trí chính giữa cho thấy
dữ liệu đối xứng quanh trung vị

24
Các thước đo vị trí khác
Phân vị (percentile)

• Phân vị thứ p trong một tập dữ liệu có n trị số là trị số ở vị trí


thứ I được định nghĩa như sau:

p
i (n  1)
100

 Ví dụ: Phân vị thứ 60 trong một tập dữ liệu có 19 trị số quan


sát là trị số ở vị trí thứ 12:
p 60
i (n  1)  (19  1)  12
100 100
25
Các thước đo vị trí khác
Tứ phân vị (quartile)
• Tứ phân vị chia tập dữ liệu đã xếp thứ tự thành 4 nhóm có số
lượng trị số bằng nhau.

25% 25% 25% 25%

Q1 Q2 Q3

 Ví dụ: tìm tứ phân vị thứ nhất


Tập dữ liệu đã xếp thứ tự: 11 12 13 16 16 17 18 21 22
(n = 9)
25
Q1 = phân vị thứ 25, do đó (9+1) = 2.5 position
100
Vì vậy sử dụng trị số ở giữa vị trí 2 và vị trí 3: Q1 = 12.5

26
Đo lường độ phân tán/biến thiên
Quy tắc thực nghiệm
• Đối với những tổng thể lớn, phân phối của các giá trị có
dạng gần giống hình chuông cân đối (có thể dùng đồ thị
Histogram để xem xét), phân phối chuẩn được sử dụng để
mô tả hình dáng của phân phối.

27
Đo lường độ phân tán/biến thiên
Quy tắc Tchebychev
• Bất kỳ một tổng thể nào với trung bình là  và độ lệch tiêu
chuẩn là , thì có ít nhất 100(1-1/m2)% giá trị rơi vào
khoảng   m, với m > 1.
m 1,5 2 2,5 3
100(1-1/m2)% 55,6% 75% 84% 88,9%

28
THE END

You might also like