Professional Documents
Culture Documents
Chuong 3 Descriptive Stats
Chuong 3 Descriptive Stats
Descriptive Statistics:
Numerical Measures
CONTENTS Chebyshev’s Theorem
STATISTICS IN PRACTICE: Empirical Rule
SMALL FRY DESIGN Detecting Outliers
! Trung vị: đó là giá trị tới hạn mà một nửa dữ liệu nhỏ
hơn nó và nửa còn lại thì lớn hơn.
! Công thức tính trung vị: sắp xếp các giá trị trong tập dữ liệu
theo thứ tự tăng dần.
• Nếu cỡ mẫu là lẻ, trung vị là giá trị tương ứng với vị trí !"#
$
• Nếu cỡ mẫu là chẵn, trung vị là trung bình cộng của các giá
! !
trị thứ và + 1
$ $
! Yếu vị: là giá trị có mặt nhiều nhất trong tập dữ liệu.
• Trong tập dữ liệu có thể có nhiều hơn một yếu vị
! Ví dụ: Tìm yếu vị cho tập dữ liệu sau: 67, 27, 46, 21,
46, 29, 67, 28, 65, 67, 10
! Lời giải: Giá trị 67 có mặt nhiều nhất (3 lần) trong tập
dữ liệu.
! Lời giải:
! Tứ phân vị: bao gồm tứ phân vị thứ nhất Q1, tứ phân vị thứ hai
Q2 (còn gọi là trung vị) và tứ phân vị thứ ba Q3.
• Q1: giá trị tới hạn mà 25% dữ liệu nhỏ hơn nó, và 75% còn lại
thì lớn hơn.
• Q2: 50% dữ liệu nhỏ hơn nó
• Q3: 75% dữ liệu nhỏ hơn nó, và 25% còn lại thì lớn hơn
! Ví dụ: Tìm các tứ phân vị cho dữ liệu sau (đã sắp xếp
thứ tự tăng dần)
28, 30, 40, 44, 44, 44, 45, 46, 47, 51, 54, 54, 55
! Lời giải:
! Phương sai: phản ánh mức độ phân tán của các giá trị
trong dữ liệu với vị trí làm chuẩn là giá trị trung
bình.
! Phương sai tổng thể được tính tương tự; trong biểu
thức của phương sai mẫu thay vì chia n – 1 thì thay
bằng N
! Ví dụ: cho dữ liệu chiều cao từ một tổng thể như sau
54, 77, 67, 68, 46, 64, 62, 56, 38
Tính phương sai tổng thể.
! Có thể quan sát được mức độ phân tán của hai tập dữ
liệu này là khác nhau
! Ví dụ: Điểm số của một mẫu các sinh viên như sau
Student 1 2 3 4 5 6 7 8 9 10
Score 4 5 5 8 9 12 14 16 17 20
! Quan hệ giữa hai biến có thể phản ánh bằng các thước đo: hiệp
phương sai (covariance), hệ số tương quan (correlation
coefficient)
Hãy tính hiệp phương sai giữa hai đại lượng này.
! Lời giải:
! Lời giải:
! Công thức tính phương sai cho dữ liệu nhóm: tương tự với dữ
liệu có trọng số
• Giá trị trung điểm của mỗi lớp (midpoint) sẽ đại diện cho
lớp.
! Hầu hết các máy tính cầm tay thế hệ gần đây đều có
thể thực hiện chức năng thông kê cơ bản
Xem là dữ liệu tổng thể, hãy tính giá trị trung bình và
độ lệch chuẩn.
! Lời giải: thao tác trên máy các tổ hợp phím như sau
Trả lời: trung bình bằng 3, độ lệch chuẩn tổng thể bằng
1.154700538
! Ví dụ: Thu thập dữ liệu cho cặp biến (X, Y) như sau
X 20 110 200 290
Y 3150 7310 8800 9310
Tính hệ số tương quan giữa hai biến này (sử dụng chế
độ Fix 3, tức kết quả làm tròn tới 3 chữ số thập phân).