Professional Documents
Culture Documents
1.2.5 Mode, trung vị và giá trị trung bình
1.2.5 Mode, trung vị và giá trị trung bình
1 Mode
Cho tới nay, khi ta nhìn vào hình dạng của phân bố, ta xác định mode là giá trị mà ở đó
phân bố "có đỉnh" và nhìn vào một vài ví dụ khi phân bố có một mode (phân bố đơn mode) hay
hai mode (phân bố hai mode). Nói cách khác là ta xác định mode một cách trực quan từ biểu đồ
tần suất.
Về mặt kỹ thuật, mode là giá trị thường xuất hiện nhất trong phân bố. Đối với các tập dữ
liệu đơn giản, nơi tần số của mỗi giá trị đều có sẵn hoặc được xác định dễ dàng, giá trị mà xuất
hiện với tần suất cao nhất là mode.
Ví dụ: Giải Cúp bóng đá Thế giới
Các dữ liệu đã được thu thập từ ba kì thi đấu World Cup vừa qua. Tổng số có 192 trận
đấu. Bảng dưới đây liệt kê ra số bàn thắng ghi được trong mỗi trận (không bao gồm bàn thắng
được ghi trong loạt đá luân lưu).
0 17
1 45
2 51
3 37
4 25
5 11
6 3
7 0
8 1
Ta có thể thấy giá trị xuất hiện thường xuyên nhất là 2 bàn thắng (xuất hiện 51 lần). Từ
đó, mode cho tập dữ liệu này là 2.
2 Mean-Trung bình
Ví dụ: Giải Cúp bóng đá Thế giới
Ta sẽ tiếp tục với dữ liệu từ 3 kì Cúp bóng đá Thế giới trước đây. Tổng số có 192 trận
đấu. Bảng phía trên đã liệt kê ra số bàn thắng được ghi trong mỗi trận (không bao gồm bàn thắng
trong lượt đá luân lưu)
Để tìm ra Trung bình số bàn thắng được ghi trong mỗi trận, ta cần tính tổng số bàn thắng
trong 192 trận, sau đó chia tổng đó cho 192. Thay vì cộng 192 số lại với nhau, ta sử dụng những
số xuất hiện lặp lại để tính toán. Ví dụ, số 0 xuất hiện 17 lần, số 1 xuất hiện 45 lần, số 2 xuất hiện
51 lần, v.v...
Nếu ta cộng 17 lần 0, ta được 0. Nếu cộng 45 lần 1, ta có 45. Nếu ta cộng 51 lần 2, ta có
102. Lặp lại các phép cộng ta có phép nhân.
Do đó, tổng của 192 số là = 0(17) + 1(45) + 2(51) + 3(37) + 4(25) + 5(11) + 6(3) + 7(2) +
8(1) = 453.
Trung bình là 453 / 192 = 2.359.
Cách tính toán này đôi khi được gọi là tính bình quân trọng số, do mỗi giá trị được tính
"trọng số" bằng số lần lặp lại của nó. Lưu ý rằng trong ví dụ này, giá trị 1,2 và 3 là có trọng số
nhiều nhất.
3 Median - Trung vị
Trung vị M là điểm giữa của phân bố. Đó là số sao cho một nửa số quan sát nằm ở phía
trên, và một nửa phân bố ở phía dưới. Để tìm trung vị:
Sắp xếp dữ liệu từ nhỏ nhất đến lớn nhất.
Xem xét liệu n, số quan sát, là chẵn hay lẻ.
Nếu n lẻ, trung vị M là quan sát ở chính giữa của danh sách sắp xếp. Quan sát này "nằm"
ở vị trí (n+1)/2 trong danh sách.
Nếu n chẵn, trung vị M là trung bình của hai quan sát chính giữa trong danh sách sắp xếp.
Hai quan sát này "nằm" ở vị trí n / 2 and n / 2 + 1 trong danh sách.
Ví dụ 1: Một ví dụ trực quan vị trí của trung vị, ta cùng xem xét hai trường hợp đơn giản
dưới đây có số quan sát lần lượt là n = 7 và n = 8, với mỗi quan sát được biểu diễn bằng một
chấm tròn đậm: