You are on page 1of 42

KHÁI NIỆM CƠ BẢN VỀ SINH

THỐNG KÊ THỐNG KÊ MÔ TẢ VÀ
SỐ ĐO BỆNH TRẠNG
NỘI DUNG TRÌNH BÀY

1. Mục tiêu
2. Khái niệm thống kê
3. Các khái niệm cơ bản về thống kê mô tả: phân bố tần số,
đo lường độ tập trung và phân tán.
4. Phân bố chuẩn của biến số liên tục
MỤC TIÊU

1. Nắm được một số khái niệm sinh thống kê cơ bản


2. Nắm được các khái niệm cơ bản về thống kê mô tả: phân
bố tần số, đo lường độ tập trung và phân tán.
3. Giới thiệu về phân bố chuẩn của biến số liên tục
CÁC GIAI ĐOẠN QUẢN LÝ HIV:
* Giai đoạn 1:
+ Tỷ lệ nhóm nhiễm nguy cơ cao <5%
* Giai đoạn 2: Giai đoạn tập trung
+ Tỷ lệ nhóm nhiễm nguy cơ cao >5%
+ Tỷ lệ nhóm nhiễm cộng đồng nguy cơ thấp {PNMT}
<1%
* Giai đoạn 3: Lan rộng ra cộng đồng
+ Tỷ lệ nhóm nhiễm nguy cơ cao >5%
+ Tỷ lệ nhóm nhiễm cộng đồng nguy cơ thấp {PNMT}
>1%
CÁC GIAI ĐOẠN QUẢN LÝ HIV:
=> Tỷ lệ hiện nhiễm MSM ở những người dương tính
HIV:
 Tử số: số MSM dương tính

 Mẫu số: số người nhiễm HIV


Khái niệm (1)
- Số liệu: Là kết quả việc thu thập có hệ thống về các đặc
tính hay đại lượng của đối tượng nghiên cứu. Số liệu
chính là vật liệu thô của thống kê. Số liệu bao gồm các
biến số.

- Biến số: là những đại lượng hay đặc tính có thể thay đổi
từ người này sang người khác hay từ thời điểm này sang
thời điểm khác: tuổi, giới tính
Khái niệm (2)
Phân loại Biến số: Là đặc tính hay đại lượng có thể thay
đổi của một đối tượng
- Biến định lượng là các biên số có thể đo lường hay đếm
được, ví dụ chiều cao, cân nặng, tuổi, huyết áp và biểu thị
bằng các con số.
- Biến định tính là các biến số không đo lường được theo
nghĩa thông thường, ví dụ ý kiến của cá nhân về một vấn
đề gì đó, và biểu thị bằng chữ. Các thang bậc đo lường
của biến số định tínhthông thường là thang bậc không
thứ tự (nominal): nam/nữ, nghề nghiệp,… hoặc có thứ tự
(ordinal): TĐHV, các giai đoạn,
Khái niệm (4)
 Thống kê: đặc trưng của đặc tính hay đại lượng của mẫu
Tỷ lệ hút thuốc lá ở trong mẫu nghiên cứu gồm 100
thanh niên
-Chiều cao trung bình 100 thanh niên trong mẫu nghiên
cứu
Chỉ số:
Khái niệm (4)
- Quần thể và mẫu nghiên cứu
- Khi lấy mẫu, để có thể phản ánh chính xác nhất về
quần thể, thông thường người ta sẽ chọn mẫu ngẫu
nhiên
Mẫu

Quần thể

Mẫu

Mẫu

Mẫu
QUẦN THỂ VÀ MẪU NGHIÊN CỨU

QUẦN THỂ MẪU


Thống kê mô tả (1)
- Sử dụng các kỹ thuật thống kê để tổ chức, sắp xếp
và tóm tắt các dữ liệu sao cho chúng ta có thể biết
dữ liệu chứa những thông tin gì
Ví dụ: Tuổi của 50 người
15 21 23 27 33
17 21 23 28 34
19 21 24 29 34
19 22 24 29 36
19 22 24 29 38
20 23 25 30 39
20 23 25 30 39
20 23 26 32 39
21 23 26 32 43
21 23 26 33 61
Thống kê mô tả biến định tính (2)
Bảng sau trình bày cho bạn Phân bố tần số theo nhóm

Nhóm tuổi TSố TSố lũy tích Tỷ lệ Tỷ lệ lũy tích


15-19 5 5 0.10 0.10
20-24 20 25 0.40 0.50
25-29 10 35 0.20 0.70
30-34 8 43 0.16 0.86
35-39 5 48 0.10 0.96
40-44 1 49 0.02 0.98
Trên 44 1 50 0.02 1.00
Tổng số 50 1.00
Thống kê mô tả biến định tính (3)
Biểu diễn dữ liệu trên 1 biểu đồ cột liên tục được gọi là histogram
(Tổ chức đồ)

25
20
20

15
Tần số

10
10 8
5 5
5
1 1
0
Nhóm tuổi

15-19 20-24 25-29 30-34 35-39 40-44 45 trở lên


THỐNG KÊ MÔ TẢ CHO BIẾN ĐỊNH
LƯỢNG:

Biến
định
lượng
Thống kê mô tả
Thống kê
tính phân tán
khuynh hướng
tập trung - Phạm vi số liệu
- Trung bình - Độ lệch chuẩn
- Trung vị - Sai số chuẩn
- Yếu vị - Khoảng tứ phân
vị
- Khoảng tin cậy 10
Thống kê mô tả biến định lượng (4)
Đo lường độ tập trung
 Mặc dầu phân bố tần số là hữu ích, bạn có thể muốn biết rõ hơn về
tuổi trung bình của các đối tượng chẳng hạn. Đó gọi là đo lường độ
tập trung. Công thức tính tuổi trung bình đơn giản như sau:

Trong đó trung bình = Tổng các giá trị / số người trong mẫu
15+17+19+19+………..+39+43+61
Trung bình tuổi = ………………….....= 1354/50 = 27,1.
Thống kê mô tả biến định lượng (5)
Trung vị là con số ở khoảng chính giữa, khi có những giá trị rất
xa số trung bình (ví dụ 61) thì số trung bình không phản ánh
đúng phân bố của các giá trị. Lúc này số trung vị có ý nghĩa
hơn.
Mode là một con số nữa có thể lưu ý: con số mode này phản
ánh giá trị xuất hiện nhiều nhất. Ở trong dữ liệu này, mode là
23.
Phạm vi của dữ liệu (range) Là tất cả các giá trị của dữ liệu từ
giá trị nhỏ nhất đến giá trị lớn nhất.
PHÂN VỊ
 Phân vị ¼
 Q1= giá trị quan sát thứ
(n+1)/4: vị trí thứ 2 là 3
 Q2= giá trị quan sát thứ
(n+1)/2: 4
 Q3= giá trị quan sát thứ
3(n+1)/4: là 8
 Khoảng phân vị
 IQR= Q3-Q1:8-3=5
Thống kê mô tả biến định lượng (6)
Đo lường độ phân tán
Khi các giá trị của các quan sát gần với trung bình, ta
nói đó là độ phân tán của dữ liệu là thấp. Khi mà có
nhiều giá trị xa với số trung bình, hoặc có các giá trị rất
xa, hoặc các giá trị rải rác, ta nói đó là độ phân tán của
dữ liệu là cao. Người ta đo lường độ phân tán bằng một
tham số là phương sai.
Thống kê mô tả (7)
Phương sai = Tổng bình phương các hiệu số của giá trị
và giá trị trung bình / n-1

- Vì phương sai là một giá trị đơn vị bình phương, nên


người ta sử dụng một tham số khác thay thế để nói lên độ
phân tán. Đó là độ lệch chuẩn (SD). Độ lệch chuẩn chính
là căn bậc hai của phương sai.
- Trong số liệu về tuổi của 50 người, phương sai tính toán
được là 66,52 và độ lệch chuẩn tính toán được là 8,2. Có
thể nói là dữ liệu của chúng ta cũng có độ phân tán tương
đối cao
VÍ DỤ
Thống kê mô tả (8)
Ví dụ nhiệt độ 1000 người khỏe mạnh

– Vị trí nhiệt độ trung


bình ở chính giữa là
37 độ C, và có khoảng
gần 20% có nhiệt độ
chính xác là 37 độ C,
có khoảng 17% có
nhiệt độ 36 độ 9 hoặc
37 độ 1, và càng xa
nhiệt độ 37 độ C thì tỷ
lệ càng giảm
Thống kê mô tả (9)
Đây chính là hình ảnh nổi
tiếng của phân bố chuẩn:
hình chuông úp. Còn gọi
đó là phân bố Z của các
biến số liên tục. Thông
thường, khi chúng ta đo
biến số liên tục bất kỳ, rất
nhiều lần, thì phân bố xác
suất của biến số liên tục
này có hình dạng như
trên.
Thống kê mô tả (12)
– Tính đối xứng xung quanh giá trị
trung bình = 0;
– Trung bình = trung vị = mode;
– Tổng diện tích dưới đường cong =
1;
– Khoảng giữa -1 và 1 tức là ± 1 độ
lệch chuẩn có diện tích là 68%
– Khoảng giữa -2 và 2 tức là ± 2 độ
lệch chuẩn có diện tích là 95%
– Khoảng giữa -3 và 3 tức là ± 3 độ
lệch chuẩn có diện tích là 99%
TÀI LIỆU THAM KHẢO
 Rosner B. 2006. Chapter 2,6,7,8. Fundamentals of
Biostatistics. Sixth Edition. Thomson Brooks/Cole.
 Wassertheil-Smoller S, 2004. Biostatistics and
Epidemiology, A Primer for Health and Biomedical
Professionals. Third Edition. Springer-Verlag.
KHOẢNG TIN CẬY
KHOẢNG TIN CẬY (KTC)

 Nếu như có mô hình thống kê đúng và không có sai số


hệ thống, kèm với sự lặp lại mẫu nghiên cứu vô số lần
thì KTC được bắt nguồn từ 1 phép kiểm định có giá trị sẽ
chứa giá trị thật với tần số không nhỏ hơn mức tin cậy
của nó.
 Khoảng tin cậy 95%: Nếu như lặp lại nghiên cứu vô số
lần (mô hình thống kê đúng, không sai số hệ thống) thì
có 95% các KTC có chứa giá trị thật
KTC 95% MỘT TỶ LỆ
p ± z*s.e.(p) p.q
s.e( p ) 
n
 Z=1,96

 P=30/120= 0,25
CÁC SỐ ĐO BỆNH TRẠNG
TỶ SỐ (RATIO)
 Là phân số trong đó tử số có thể không thuộc mẫu
số (x/y)
 Ví dụ:
Trong 100 trường hợp báo cáo HIV, 80 trường
hợp là nam, 20 trường hợp là nữ.
Số nam/số nữ là gì? 80/20
-BMI (body mass index = Chỉ số khối cơ thể)

-Risk ratio (tỷ số nguy cơ), odds ratio (Tỷ số chênh)


v.v…là những tỷ số.
TỶ LỆ (PROPORTION)

 Tỷ lệ là phân số trong đó tử số thuộc mẫu số


(một phần của mẫu số): x/(x+y).
 Giá trị thay đổi từ 0 đến 1

 Có thể biểu hiện tỷ lệ dưới dạng phần trăm, phần


ngàn hay phần trăm ngàn
 Ví dụ:

- Trong 100 trường hợp báo cáo HIV, 80 trường


hợp là nam, 20 trường hợp là nữ. Tính tỉ lệ nam
giới ở những bệnh nhân HIV này
TỶ SUẤT (RATE)
 Tỷ suất: là một dạng đặc biệt của tỷ lệ/tỷ số, có liên
quan đến một khoảng thời gian nhất định.
 Khác với tỷ lệ/tỷ số, khi tính tỷ suất thì mẫu số có thể
bao gồm yếu tố thời gian
 Tỷ suất thay đổi từ 0 đến vô hạn.

 Ví dụ:

Tỷ suất mới mắc tiêu chảy cấp ở trẻ em làng A, là 10/100


mỗi tháng trong năm qua.
Các số đo trong dịch tễ học

 Tỷ lệ hiện mắc
 Tỷ lệ mới mắc
 Tỷ suất mới mắc
TỶ LỆ HIỆN MẮC
(PREVALENCE PROPORTION)
 Tỷ lệ hiện mắc: xác định tỷ lệ đang lưu hành một
hiện tượng sức khỏe hay bệnh trong quần thể nào
đó trong một khoảng/điểm thời gian xác định.
 Có 2 loại tỷ lệ hiện mắc:
Tỷ lệ hiện mắc điểm (thường dùng)
Tỷ lệ hiện mắc khoảng
TỶ LỆ HIỆN MẮC (2)
 Tỷ lệ hiện mắc điểm: là khả năng mà một cá thể
trong dân số đang mắc bệnh (đã mắc hay mới mắc)
tại thời điểm t.
 Công thức :

Số cá thể hiện đang mắc bệnh (cũ và mới) tại thời điểm t

Quần thể khảo sát tại thời điểm đó


TỶ LỆ HIỆN MẮC (3)
 Tỷ lệ hiện mắc khoảng: là khả năng mà một cá
thể trong dân số đang mắc bệnh tại bất cứ thời
điểm nào trong khoảng thời gian t.
 Công thức :

Số cá thể mắc bệnh (cũ và mới) trong thời khoảng t

Dân số trung bình của khoảng thời gian đó


CÁCH TÍNH DÂN SỐ TRONG MỘT
THỜI KHOẢNG
 Tính trung bình:
Dân số giữa năm 1975 (1/7/75)
= Dân số vào 1/1/75 + ½ (S. của năm 75 – C. của năm 75 + N.
của năm 75 – D. của năm 75)
Hay = Dân số vào 1/1/76 - ½ (S. củc năm 75 – C. của năm 75 +
N. của năm 75 – D. của năm 75)
Hay = ½ (Dân số vào 31/12/74 + Dân số vào 31/12/75)
Trong đó:
 S. = Tổng số trẻ sinh ra trong năm
 C. = Tổng số người chết trong năm
 N. = Tổng số người nhập cư trong năm
 D. = Tổng số người di cư trong năm
TỶ LỆ MỚI MẮC (Incidence proportion)
 Tỷ lệ mới mắc phản ánh nguy cơ mắc bệnh trong một khoảng
thời gian xác định.

 Cách tính:
Tổng số bệnh nhân mới mắc bệnh trong một khoảng
thời gian xác định

Quần thể nguy cơ phát sinh bệnh


TỶ SUẤT MỚI MẮC (2)
 Còn gọi “Tỷ trọng mới mắc”: là số trường hợp
mới nhiễm của một bệnh trong một thời gian
nhất định được chia cho mẫu số bao gồm “thời
gian x người nguy cơ”.
 Cách tính:

Tổng số bệnh nhân mới mắc của một bệnh trong


một khoảng thời gian theo dõi xác định

Tổng thời gian có nguy cơ mắc bệnh của tất cả các


cá thể trong dân số (đơn vị là thời gian*người)
Thí dụ: 2/10 người/tháng là 20/100 người*tháng
Tháng 1 Tháng 2 Tháng 3 Tháng 4

Cá thể 1 1 người*tháng

Cá thể 2 3 người*tháng

Cá thể 3 4 người*tháng

Cá thể 4 2 người*tháng
Mối tương quan giữa tỷ lệ hiện mắc (P) và tỷ
lệ mới mắc (I)
Trong một số điều kiện (quần thể ổn định, không
có nhập hay di dân, P<10%), thì

P=I*D

P tăng khi I tăng hay D tăng hay cả I và D đều tăng


hoặc khi điều kiện chẩn đoán cải thiện
D = Khoảng thời gian mắc bệnh
Thí dụ về HIV
P=I*D

Do thời gian mắc HIV kéo dài, sống trung bình 10


năm (nếu điều trị ARV thì sống kéo dài hơn nữa)
Do đó tuy P tăng nhưng chưa chắc do I tăng mà có
thể do thời gian kéo dài bệnh tăng.
Cần cẩn thận khi giải thích tác động của can thiệp
khi sử dụng tỷ lệ hiện nhiễm
TRÂN TRỌNG CÁM ƠN !

You might also like