You are on page 1of 16

Xác suất thống kê

cơ bản & ứng dụng


trong y sinh học

Phân phối chuẩn


Mục tiêu học tập
Bài này cung cấp:
• Phân phối chuẩn trong phân tích số liệu
Cần bao nhiêu thống kê mô tả
định lượng?
• Thông thường là 15.
Minh họa
www.calculatorsoup.com/calculators/statistics/descriptivestati
stics.php

• Cơ bản là 8
Minh họa
www.calculatorsoup.com/calculators/statistics/statistics.php

• Có thể rút bớt con số này xuống nữa hay không?
Nếu được thì ít nhất là bao nhiêu?

• Còn ít nhất bao nhiêu?


•3

• Là những thống kê nào?


• Cỡ mẫu, trung bình, độ lệch chuẩn

• Khi nào làm được như vậy?


• Biến có phân phối chuẩn
Đánh giá biến có phân phối
chuẩn hay không
• Không phải luôn gặp biến có phân phối chuẩn
• Đánh giá đặc điểm của biến số thông qua số liệu
• Đặc trưng phân phối chuẩn lý thuyết:
• Dạng biểu đồ đối xứng hình chuông
• Trung bình và trung vị bằng nhau.
• Luật kinh nghiệm 1-2-3 sigma.
• Khoảng tứ phân vị bằng 1,33 lần độ lệch chuẩn.
Đánh giá biến có phân phối
chuẩn hay không
So sánh đặc trưng số liệu với đặc trưng lý thuyết
• Dùng biểu đồ, đồ thị
• Số liệu cỡ vừa và nhỏ: biểu đồ cành-lá, biểu đồ hộp có đối xứng hay không

• Số liệu cỡ lớn: tổ chức đồ, đa giác tần số có hình chuông hay không

• Dùng đặc trưng thống kê mô tả


• trung bình, trung vị, yếu vị có bằng nhau hay không

• khoảng tứ phân vị IQR có xấp xỉ 1,33 lần S hay không

• phạm vi phân tán Range có xấp xỉ 6 lần S hay không


Đánh giá biến có phân phối
chuẩn hay không
So sánh đặc trưng số liệu với đặc trưng lý thuyết
• Dùng đặc trưng phân phối số liệu
• Xấp xỉ 2/3 kết quả quan sát nằm trong miền TB ±1 ĐLC hay không

• Xấp xỉ 80% kết quả quan sát nằm trong miền TB ±1.28 ĐLC hay không

• Xấp xỉ 95% kết quả quan sát nằm trong miền TB ±2 ĐLC hay không

• Đánh giá trên biểu đồ normal probability plot


• Đồ thị normal probability plot có dạng đường thẳng hướng lên hay
không
Quantile-Quantile Normal Probability Plot

• Sắp xếp các trị số: theo thứ tự tăng dần

• Biến đổi quy tâm: từ trị số X sang trị số Z

• Định vị các điểm: tung độ X và hoành độ Z

• Đánh giá hình dạng: của tập hợp các điểm (Z,X)
Quantile-Quantile Normal
Probability Plot
Q-Q plot của số liệu từ phân phối
chuẩn có dạng xấp xỉ đường thẳng

X
90

60

30

-2 -1 0 1 2 Z
Quantile-Quantile Normal
Probability Plot
Lệch trái Lệch phải
X 90 X 90
60 60
30 30
-2 -1 0 1 2 Z -2 -1 0 1 2 Z

Chữ nhật
X 90 Càng cong, càng khác
chuẩn
60
30
-2 -1 0 1 2 Z
Ví dụ

Biểu đồ hộp lệch bên phải.


IQR = 7,4
Ví dụ

• Trung bình lớn hơn trung vị. (Trong phân phối


chuẩn lý thuyết, trung bình và trung vị bằng
nhau.)
• Khoảng tứ phân vị xấp xỉ 1,21 độ lệch chuẩn.
(Trong phân phối chuẩn lý thuyết, IQR = 1,33 σ)
• Khoảng phân tán 40,8 bằng 6,7 lần độ lệch
chuẩn. (Trong phân phối chuẩn lý thuyết,
Range = 6σ.)
• Độ đối xứng là 0,9085 và độ nhọn là 2,456.
(Trong phân phối chuẩn lý thuyết là 0.)
Ví dụ

• 73.91% kết quả quan sát nằm trong khoảng 1


lần độ lệch chuẩn từ trung bình. (Trong phân
phối chuẩn lý thuyết là 68,26%.)
• 85.33% kết quả quan sát nằm trong khoảng
1,28 lần độ lệch chuẩn từ trung bình. (Trong
phân phối chuẩn lý thuyết là 80%.)
• 96.20% kết quả quan sát trong khoảng 2 lần độ
lệch chuẩn từ trung bình. (Trong phân phối
chuẩn lý thuyết là 95,44%.)
Ví dụ
Quantile-Quantile Normal Probability Plot

Đồ thị không là
đường thẳng : phân
phối không chuẩn.
Đồ thị dạng chữ C
ngược: phân phối
lệch phải
Ví dụ
Nhận xét
• Số liệu có phân phối lệch phải
• So với lý thuyết:
- Có nhiều giá trị trong khoảng TB ±1 ĐLC hơn
- Khoảng phân tán rộng hơn do trị số ngoại vi 32
- Q-Q plot không có dạng đường thẳng

Kết luận
- Số liệu có đặc trưng khác xa đặc trưng lý thuyết của phân
phối chuẩn.
- Đây là dấu hiệu khá rõ cho thấy biến số không có phân
phối chuẩn.
Tổng kết
• Số liệu định lượng cần 8 thống kê cơ bản:
N, TB, ĐLC, Min, Max, Q1, Q2, Q3
• Một số trường hợp có thể chỉ cần 3 thống kê:
N, TB, ĐLC
• Điều kiện để giảm bớt:
Biến số có phân phối chuẩn
Khi đó TB và ĐLC đại diện cho biến
• Dấu hiện của PPC được đánh giá qua số liệu:
Dạng biểu đồ và tính chất thống kê
• Quy tắc kinh nghiệm 1-2-3 ĐLC

You might also like