You are on page 1of 4

Ba số đo chính cho giá trị trung tâm của phân bố là 

mode (mode), trung bình và trung vị


(median). Mỗi một số đo đều dựa trên các ý tưởng khác nhau trong cách mô tả phân bố của giá
trị trung tâm. Trước tiên ta sẽ cùng biểu diễn mỗi một số đo riêng, sau đó sẽ so sánh tính chất của
chúng.

1 Mode
Cho tới nay, khi ta nhìn vào hình dạng của phân bố, ta xác định mode là giá trị mà ở đó
phân bố "có đỉnh" và nhìn vào một vài ví dụ khi phân bố có một mode (phân bố đơn mode) hay
hai mode (phân bố hai mode). Nói cách khác là ta xác định mode một cách trực quan từ biểu đồ
tần suất.
Về mặt kỹ thuật, mode là giá trị thường xuất hiện nhất trong phân bố. Đối với các tập dữ
liệu đơn giản, nơi tần số của mỗi giá trị đều có sẵn hoặc được xác định dễ dàng, giá trị mà xuất
hiện với tần suất cao nhất là mode.
Ví dụ: Giải Cúp bóng đá Thế giới
Các dữ liệu đã được thu thập từ ba kì thi đấu World Cup vừa qua. Tổng số có 192 trận
đấu. Bảng dưới đây liệt kê ra số bàn thắng ghi được trong mỗi trận (không bao gồm bàn thắng
được ghi trong loạt đá luân lưu).

Tổng số # bàn thắng/trận đấu Tần suất

0 17

1 45

2 51

3 37

4 25

5 11

6 3

7 0
8 1

Ta có thể thấy giá trị xuất hiện thường xuyên nhất là 2 bàn thắng (xuất hiện 51 lần). Từ
đó, mode cho tập dữ liệu này là 2.

2 Mean-Trung bình
Ví dụ: Giải Cúp bóng đá Thế giới
Ta sẽ tiếp tục với dữ liệu từ 3 kì Cúp bóng đá Thế giới trước đây. Tổng số có 192 trận
đấu. Bảng phía trên đã liệt kê ra số bàn thắng được ghi trong mỗi trận (không bao gồm bàn thắng
trong lượt đá luân lưu)
Để tìm ra Trung bình số bàn thắng được ghi trong mỗi trận, ta cần tính tổng số bàn thắng
trong 192 trận, sau đó chia tổng đó cho 192. Thay vì cộng 192 số lại với nhau, ta sử dụng những
số xuất hiện lặp lại để tính toán. Ví dụ, số 0 xuất hiện 17 lần, số 1 xuất hiện 45 lần, số 2 xuất hiện
51 lần, v.v...
Nếu ta cộng 17 lần 0, ta được 0. Nếu cộng 45 lần 1, ta có 45. Nếu ta cộng 51 lần 2, ta có
102. Lặp lại các phép cộng ta có phép nhân.
Do đó, tổng của 192 số là = 0(17) + 1(45) + 2(51) + 3(37) + 4(25) + 5(11) + 6(3) + 7(2) +
8(1) = 453.
Trung bình là 453 / 192 = 2.359.
Cách tính toán này đôi khi được gọi là tính bình quân trọng số, do mỗi giá trị được tính
"trọng số" bằng số lần lặp lại của nó. Lưu ý rằng trong ví dụ này, giá trị 1,2 và 3 là có trọng số
nhiều nhất.

3 Median - Trung vị
Trung vị M là điểm giữa của phân bố. Đó là số sao cho một nửa số quan sát nằm ở phía
trên, và một nửa phân bố ở phía dưới. Để tìm trung vị:
Sắp xếp dữ liệu từ nhỏ nhất đến lớn nhất.
Xem xét liệu n, số quan sát, là chẵn hay lẻ.
Nếu n lẻ, trung vị M là quan sát ở chính giữa của danh sách sắp xếp. Quan sát này "nằm"
ở vị trí (n+1)/2 trong danh sách.
Nếu n chẵn, trung vị M là trung bình của hai quan sát chính giữa trong danh sách sắp xếp.
Hai quan sát này "nằm" ở vị trí n / 2 and n / 2 + 1 trong danh sách.
Ví dụ 1: Một ví dụ trực quan vị trí của trung vị, ta cùng xem xét hai trường hợp đơn giản
dưới đây có số quan sát lần lượt là n = 7 và n = 8, với mỗi quan sát được biểu diễn bằng một
chấm tròn đậm:

4 So sánh Trung bình và Trung vị


Như ta thấy, trung bình và trung vị, là hai tính toán trung tâm phổ biến, mỗi giá trị đều
mô tả giá trị trung tâm của phân bố theo cách cách khác nhau. Trung bình miêu tả giá trị trung
tâm như giá trị bình quân, mà trong đó các giá trị thực tế của các điểm dữ liệu đóng vai trò quan
trọng. Bên cạnh đó, trung vị lại xác định giá trị nằm ở giữa như giá trị trung tâm và vị trí của dữ
liệu là mấu chốt để tìm ra nó.
Để hiểu rõ hơn về sự khác biệt giữa hai cách tính toán trung tâm này, ta cùng xem ví dụ
dưới đây.
Dưới đây là hai tập dữ liệu:
Tập dữ liệu A → 64 65 66 68 70 71 73
Tập dữ liệu B → 64 65 66 68 70 71730
Với tập dữ liệu A, trung bình là 68.1, và trung vị là 68. Còn tập dữ liệu B, ta nhận thấy
rằng tất cả các quan sát ngoại trừ quan sát cuối cùng thì đều có giá trị rất gần nhau. Quan sát 730
là giá trị lớn, và tất nhiên đây sẽ là ngoại lệ. Trong trường hợp này, trung vị vẫn là 68, nhưng giá
trị trung bình bị ảnh hưởng bởi giá trị ngoại lệ lớn, và tăng lên tới 162. Kết luận rút ra từ ví dụ
này là:
Giá trị trung bình rất nhạy cảm với các ngoại lệ (do ảnh hưởng tới độ lớn của nó), trong
khi trung vị không bị ảnh hưởng bởi ngoại lệ.
Trung bình là phép tính cho trung tâm phù hợp khi phân bố đối xứng không có ngoại lệ.
Trong tất cả các trường hợp còn lại, trung vị là giá trị nên được sử dụng để mô tả phân bố.

You might also like