You are on page 1of 16

BÀI 1: VAI TRÒ CỦA THỐNG KÊ, TIN HỌC TRONG CUNG CẤP BẰNG CHỨNG CHO VIỆC

RA QUYẾT ĐỊNH Y TẾ

- Số liệu là các dữ liệu dưới dạng số giúp cho việc đo lường, biểu thị giá trị của một biến số ứng với một đối t ượng nghiên cứu
cụ thể nào đó
- Thông tin có thể dưới dạng số, hình ảnh, bản đồ, lời nói, câu chữ…Cũng có thể là tổng hợp của các số liệu như chiều cao trung
bình của một nhóm đối tượng nghiên cứu, tỷ lệ cao huyết áp của người dân trong một quần thể…
 Số liệu và thông tin chưa được coi là các bằng chứng nếu nó chưa bao hàm một sự so sánh về không gian hoặc thời gian giúp
cho người ra quyết định có cơ sở cân nhắc và ban hành quyết định
- Bằng chứng thu được từ các nghiên cứu luôn được coi là nguồn cung cấp có giá trị nhất.

Các loại nghiên cứu có thiết kế khác nhau cũng cho những bằng chứng có giá trị khác nhau:

Chăm sóc sức khỏe cho một cá nhân Chăm sóc sức khỏe cho một cộng đồng
1.Tổng quan tài liệu có hệ thống, phân 1.Tổng quan tài liệu có hệ thống, phân
tích gộp tích gộp
2.Thử nghiệm lâm sàng ngẫu nhiêu có 2.Can thiệp cộng đồng có đánh giá
nhóm chứng trước, sau và có nhóm đối chứng
tương thích
3.Thử nghiệm lâm sàng so sánh trước- 3.Can thiệp cộng đồng so sánh trước-
sau can thiệp (không có đối chứng) sau can thiệp (không có đối chứng)
4.Nghiên cứu thuần tập tương lai có 4.Nghiên cứu thuần tập tương lai có
nhóm chứng nhóm chứng
5.Nghiên cứu thuần tập hồi cứu có 5.Nghiên cứu thuần tập hồi cứu có
nhóm chứng nhóm chứng
6.Nghiên cứu bệnh-chứng 6.Nghiên cứu bệnh-chứng
7.Nghiên cứu cắt ngang 7.Nghiên cứu cắt ngang, điều tra cộng
đồng
8.Mô tả chùm bệnh, loạt bệnh, ca 8.Nghiên cứu thăm dò
bệnh
9.Nghiên cứu tương quan 9.Phương pháp tư vấn chuyên gia

- Người sử dụng bằng chứng để ra quyết định trong y tế có thể được phân ra 2 nhóm chính:
1. Nhóm các thầy thuốc sử dụng bằng chứng cho các quyết định chẩn đoán, điều trị bệnh cho một cá nhân. Đây là những
quyết định liên quan trực tiếp đến bệnh tật và sức khỏe của con người nên bằng chứng càng chính xác và càng tin cậy thì
càng tốt.
2. Nhóm các nhà quản lý y tế sử dụng bằng chứng cho việc lập kế hoạch, quản lý chăm sóc sức khỏe cho một cộng đồng hoặc
cho hoạch định các chính sách y tế
- Ví dụ: Khi xem xét bộ số liệu huyết áp (mmHg) của một cộng đồng dân cư người ta thường tổng hợp bộ số liệu này theo các
cách dưới đây:
1. Số người có huyết áp bất thường (cao hoặc thấp) trong cộng đồng dân cư
2. Tỷ lệ người có huyết áp bất thường trên tổng số người có huyết áp bình thường
3. Giá trị trung bình và độ lệch chuẩn của huyết áp của cộng đồng dân cư
Tương ứng với các cách tổng hợp sau:
A. Một trạm trưởng trạm y tế hoặc một bác sỹ gia đình muốn dự trù thuốc điều trị huyết áp cho cộng đồng
B. Một cán bộ trung tâm y học dự phòng muốn biết tình trạng huyết áp bất thường của cộng đồng
C. Một cán bộ trung tâm y học dự phòng muốn so sánh tình trạng huyết áp giữa cộng đồng này với một cộng đồng khác (do
nhiều trường hợp tỷ lệ huyết áp bất thường của hai cộng đồng có thể bằng nhau nhưng giá trị trung bình và độ lệch chuẩn
của huyết áp của hai cộng đồng này lại khác nhau)

- Hai biểu đồ trên trình bày cùng một bộ số liệu nhằm mô tả thực trạng mắc tiêu chảy tại Việt Nam năm 1996, tuy nhiên biểu đồ
1.1 trình bày số ca mắc tiêu chảy (giá trị tuyệt đối), còn biểu đồ 1.2 trình bày tỷ lệ mắc tiêu chảy (giá trị tương đối) ở các vùng
khác nhau.
Nhìn vào biểu đồ 1.1 ta có cảm giác là tiêu chảy ở Tây Nguyên không phải là vấn đề đáng quan tâm vì cột có chiều cao thấp
nhất so với các vùng khác, nhưng nếu nhìn vào biểu đồ 1.2 thì tỷ lệ tiêu chảy ở Tây Nguyên lại là cao nhất. Sở dĩ cột Tây
Nguyên ở biểu đồ 1.1 thấp hơn các cột khác vì số mắc tiêu chảy ở Tây Nguyên thấp hơn, nhưng do dân số chung ở Tây Nguyên
thấp hơn nhiều so với các vùng khác nên tỷ lệ mắc tiêu chảy ở Tây Nguyên lại cao hơn các vùng khác, trong khi số mắc lại ít
hơn.
Như vậy biểu đồ nào có giá trị cung cấp thông tin hơn? Trên thực tế, không thể có câu trả lời đúng cho câu hỏi này nếu như ta
không quan tâm đến ai là người sử dụng thông tin này. Nếu người sử dụng thông tin làm cán bộ công tác điều trị thì biểu đồ
1.1 sẽ có thể có giá trị hơn do nó cho biết tổng số ca mắc bệnh, nhưng nếu người sử dụng thông tin là cán bộ làm công tác dự
phòng thì biểu đồ 1.2 lại có thể có ý nghĩa hơn do nó cho biết nguy cơ mắc bệnh của từng vùng và có thể dễ dàng so sánh với
các vùng khác. Nhưng vậy việc lựa chọn cách trình bày và chuyển tải các thông tin và bằng chứng y tế không chỉ tùy thuộc vào
bản chất thông tin mà còn tùy thuộc vào người sử dụng thông tin là ai.
- Bổ sung:

BÀI 4: THỐNG KÊ MÔ TẢ, THỐNG KÊ SUY LUẬN, KHÁI NIỆM VỀ BIẾN SỐ


- Thống kê là khoa học của thu thập, tổ chức và diễn giải các sự kiện dưới dạng số mà ta gọi là dữ liệu.
1. Thống kê mô tả: là mô tả kết quả thu được từ mẫu nghiên cứu
- Với biến định lượng, việc tổng hợp và tóm tắt bộ số liệu thông qua:
+ Đo lường độ tập trung (như giá trị trung bình, trung vị, mốt)
+ Độ phân tán (phương sai, độ lệch chuẩn, hệ số biến thiên, khoảng tứ phân vị)
- Với biến định tính, việc tổng hợp và tóm tắt bộ số liệu thông qua: tần số, tỷ số, tỷ lệ, tỷ suất
 Lựa chọn cách biểu thị và trình bày số liệu thích hợp: với hai biến định lượng thường dùng biểu đồ hình đám mây; với hia biến
định tính có thể dùng bảng ần số hoặc đồ thị hình cột.
2. Thống kê suy luận
- Thống kê suy luận là quá trình rút ra các suy luận về một quần thể đích dựa trên dữ liệu của một mẫu (mẫu phải đủ lớn và đại
diện cho quần thể nghiên cứu), hay là quá trình ngoại suy kết quả nghiên cứu từ mẫu ra quần thể nghiên cứu, bao gồm 2
phương pháp:
+ Ước lượng điểm và ước lượng khoảng
+ Kiểm định giả thuyết: sử dụng các trắc nghiệm thống kê thích hợp để kiểm định giả thuyết của nhà nghiên cứu đặt ra là đúng
hay sai

3. Biến số
3.1. Phân loại theo bản chất của biến số

- Biến định lượng: giá trị của biến được biểu thị bằng các con số
+ Biến liên tục: các số đo có thể mang giá trị thập phân (giá trị của nó có thể được biểu thị liên tục trên một trục số); ví dụ: cân
nặng (15 kg, 22,35 kg), hàm lượng đường huyết, tuổi theo năm, tháng.
+ Biến rời rạc: các số đo chỉ mang các giá trị là số nguyên, không có giá trị thập phân; ví dụ: số giường trong một bệnh viện (1,
2, 20, …chứ không thể là 10,5 hay 3,15), số giường trong một nhóm, số hồng cầu/1 ml máu
+ Biến tỷ suất: là biến mà có giá trị 0 là có thực; ví dụ: biến cân nặng là biến tỷ suất vì giá trị 0 là thực, khi cân nặng bằng 0 tức
là không có cân nặng. Khi độ lệch chuẩn (s) lớn hơn giá trị trung bình thì số liệu đó thường ít có ý nghĩa; ví dụ: đường kính đo
được là 8mm ± 15mm => Nếu theo kết quả này thì đường kính có thể mang giá trị âm, điều này trên thực tế không bao giờ có.
Có thể áp dụng được phép tính cộng, trừ, nhân, chia đối với hai giá trị của một biến tỷ suất
+ Biến khoảng chia: là biến có giá trị 0 là không có thực (chỉ do quy ước); ví dụ: biến nhiệt độ có giá trị 0 là không có thực, vì khi
nhiệt độ bằng 00C không có nghĩa là không có nhiệt độ mà chỉ là nhiệt độ ở thời điểm nước chuyển sang trạng thái từ lỏng
sang rắn. Khi độ lệch chuẩn (s) lớn hơn giá trị trung bình thì số liệu đó lại có ý nghĩa; ví dụ: Nhiệt độ trung bình trong năm 2001
là 80C ± 150C => Chấp nhận được nhiệt độ âm nên có ý nghĩa. Chỉ có thể áp dụng được phép tính cộng, trừ đối với hai giá trị
của một biến khoảng chia, ví dụ: không thể nói 600C nóng gấp 3 lần 200C mà chỉ được nói 600C nóng hơn 200C là 400C
- Biến định tính: giá trị của biến được biểu thị bằng các chữ, ký hiệu. Trong một số trường hợp, các loại, nhóm trong một biến
định tính được ký hiệu bởi các con số nhưng nó vẫn không phải là một biến định lượng vì bản chất nó không có giá trị đo
lường mà chỉ có ý nghĩa như các ký hiệu, ví dụ: biến về mức độ suy dinh dưỡng có thể ký hiệu là thể nhẹ, vừa, nặng hoặc biểu
thị dưới dạng độ 1, độ 2, độ 3.
+ Biến danh mục: các nhóm của biến không cần sắp xếp theo một trật tự nhất định; ví dụ: Nơi ở của các đối tượng nghiên cứu:
Hà Nội, Hải Phòng, Nghệ An, Thái Bình,… => Việc sắp xếp tên các địa dư này không cần theo trật tự và cách sắp xếp đó không
ảnh hưởng đến việc phân tích và trình bày số liệu sau này
+ Biến thứ hạng: các nhóm của biến phải được sắp xếp theo một trật tự nhất định. Ví dụ: Biến trình độ văn hóa phải theo thứ
tự tăng dần hoặc giảm dần chứ không tùy tiện như biến danh mục: mù chữ, văn hóa cấp I, cấp II, cấp III, đại học, sau đại học.
=> Điều này có ý nghĩa trong việc chọn test phân tích số liệu sau này
+ Biến nhị phân: các giá trị bao giờ cũng chỉ được phân thành hai nhóm. Ví dụ: Biến cao huyết áp chia thành hai nhóm: có hay
không; Biến giới tính: nam, nữ. Các biến định lượng và định tính cuối cùng đều có thể chuyển sang dạng biến nhị phân nếu
như chúng ta có được một một để chuyển dạng.

3.2. Phân loại theo mối tương quan giữa các biến số
- Biến độc lập: (biến số thuộc nhóm biến nguyên nhân) tồn tại một cách độc lập, không chịu sự chi phối của yếu tố “quả”. Ví dụ:
Độ âm thấp và thiếu sáng trong nhà ở là yếu tố nguy cơ (biến độc lập) của bệnh lao chứ bệnh lao không gây ra nhà ẩm thấp và
thiếu ánh sáng. Chia ra 3 nhóm:
+ Biến số về căn nguyên
+ Biến số về yếu tố nguy cơ
+ Nhóm các yếu tố ảnh hưởng: ảnh hưởng tầm vĩ mô, chính sách, dịch vụ, ảnh hưởng gián tiếp
- Biến phụ thuộc: (biến số thuộc nhóm biến hậu quả) giá trị thường bị phụ thuộc vào sự biến đổi của các biến ảnh hưởng đến
nó. Ví dụ: Bướu cổ đơn thuần là một biến phụ thuộc vào tình trạng thiếu iod trong chế độ ăn uống.
 Một biến có thể là độc lập trong nghiên cứu này nhưng lại là phụ thuộc trong nghiên cứu khác và ngược lại.
- Các yếu tố nhiễu: Một yếu tố được coi là nhiễu khi tác động của nó làm sai lệch ảnh hưởng của phơi nhiễm đối với bệnh.
Ví dụ: Khi người nghiên cứu muốn xem xét ảnh hưởng của uống cà phê lên bệnh tim mạch thì hút thuốc là có thể là yếu tố nhiễu
vì hút thuốc lá cũng là yếu tố nguy cơ của bệnh tim mạch, đồng thời giữa hút thuốc lá và uống cà phê lại có mối quan hệ qua lại
(người hút thuốc lá thường hay uống cà phê và ngược lại). Tuy nhiên, khi người nghiên cứu muốn tìm hiểu xem hút thuốc lá có
hại đến tim mạch không thì khi đó uống cà phê có thể lại là yếu tố nhiễu.

Tiêu chuẩn một yếu tố được gọi là nhiễu:


 Phải là một yếu tố nguy cơ đối với bệnh
 Phải có liên quan với phơi nhiễm nhưng lại không phụ thuộc vào phơi nhiễm
 Không phải là yếu tố trung gian giữa yếu tố phơi nhiễm và bệnh
 Phải thực sự tác động lên mối tương quan giữa phơi nhiễm và bệnh. Điều này chỉ có thể được khẳng định trong quá trình
phân tích số liệu
 Nhiễu và yếu tố phơi nhiễm có thể đổi chỗ cho nhau tùy theo mục đích của người làm nghiên cứu.
4. Chỉ số
- Có rất nhiều biến số nếu chỉ xem xét một mình đã có thể cho một ý nghĩa nhất định cho nghiên cứu, nhưng nhiều biến nếu chỉ
xét riêng biến đó thì chưa thể có ý nghĩa.
Ví dụ: Tỷ lệ giữa hai biến cân nặng/tuổi, chiều cao/tuổi được gọi là chỉ số
BÀI 12: SAI SỐ CHUẨN VÀ KHOẢNG TIN CẬY

- Đường cong phân bố số liệu: Nghiêng phải, hình chuông, nghiêng trái
+ Đường cong nghiêng phải: đa số các quan sát có giá trị thấp, còn ít quan sát có giá trị cao
+ Đường cong phân bố đối xứng hay hình chuông (phân bố chuẩn):
+ Đường cong nghiêng trái: đa số các quan sát có giá trị cao, còn ít quan sát có giá trị thấp
- Phân bố chuẩn:
+ Đường cong có dạng đối xứng hình chuông
+ Giá trị trung bình, trung vị, mốt bằng nhau
+ Một đường cong phân bố chuẩn được xác định bởi hai tham số: giá trị trung bình (µ) quyết định vị trí đường cong trên trục
số; độ lệch chuẩn (ơ) quyết định hình dáng đường cong
+ Độ lệch chuẩn không chỉ thể hiện độ phân tán của số liệu mà còn có ý nghĩa về mặt số lượng
+ Nếu kẻ đường thẳng ở vị trí một độ lệch chuẩn về bên trái và phải của giá trị trung bình => diện tích vùng nằng dưới đường
cong, trên trục hoành và giữa hai đường thằng này sẽ chiếm 68,5% tổng diện tích dưới đường cong.
+ vị trí 2 độ lệch chuẩn: 95% tổng diện tích dưới đường cong
+ vị trí 3 độ lệch chuẩn: 99,7% tổng diện tích dưới đường cong
+ Nếu bộ số liệu được phân bố chuẩn ta mới áp dụng được các test tham số; còn nếu số liệu không phân bố chuẩn, ta phải áp
dụng test phi tham số hoặc chuyển sang dạng chuẩn để áp dụng được các test tham số

- Phân bố chuẩn tắc:


+quy tất cả các phân bố chuẩn về một loại mà giá trị trung bình luôn bằng 0 và độ lệch chuẩn bằng 1 ( µ=0 ; ơ=1). Trục hoành
được coi là trục z và giá trị biểu thị trên trục này là giá trị z
+ mọi phân bố chuẩn đều có thể chuyển được sang dạng phân bố chuẩn tắc:
x−µ
z=
ơ
x là giá trị quan sát cụ thể
µ là giá trị trung bình quần thể
ơ là độ lệch chuẩn của quần thể
Ví dụ: Tỷ lệ người có cân nặng trên 78kg là bao nhiêu? Với cân nặng trung bình của quần thể là 75 kg và độ lệch chuẩn là 6kg.
 z = (78-75)/6=0,5
 P(X>78) = P(z>0,5) = 0,3085 (tra bảng)
 Kết luận: Tỷ lệ người có cân nặng trên 78kg là 30,85%

+ Kiểm tra phân bố chuẩn:

(Độ gù và độ dốc)
- Các dạng phân bố khác:
+ Phân bố nhị phân: áp dụng cho các biến nhị phân
+ Phân bố chuẩn gần với phân bố nhị phân: áp dụng cho các biến nhị phân với bộ số liệu lớn
+ Phân bố Poison: áp dụng cho các biến rời rạc
+ Phân bố Student: áp dụng cho các biến liên tục
+ Phân bố khi bình phương: áp dụng cho biến định tính
- Sai số chuẩn: Khi đưa ra con số giá trị trung bình của mẫu, chúng ta muốn biết giá trị trung bình của mẫu nghiên cứu đó gần
với giá trị trung bình quần thể như thế nào => sử dụng sai số chuẩn của giá trị trung bình. 68,5% các giá trị trung bình mẫu sẽ
nằm trong giới hạn một sai số chuẩn của giá trị trung bình quần thể, 95% nằm trong giới hạn hai sai số chuẩn, 99% nằm trong
3 sai số chuẩn

SE = SD/√ n

SE: sai số chuẩn


SD: độ lệch chuẩn của quần thể
n: cỡ mẫu
Ví dụ: Kết quả thu được từ mẫu nghiên cứu 100 nam giới trưởng thành cho thấy chiều cao trung bình của nhóm này là 165 cm
với độ lệch chuẩn của quần thể này là 7 cm. Như vậy sai số chuẩn ước lượng ở đây là: 7/√ 100 = 0,7. Có thể phiên giải kết quả này như
sau:
 68% giá trị trung bình mẫu có giá trị từ 165 - 0,7 đến 165 + 0,7
 95% giá trị trung bình mẫu có giá trị từ 165 – 2x0,7 đến 165 + 2x0,7
 99% giá trị trung bình mẫu có giá trị từ 165 – 3x0,7 đến 165 + 3 x0,7
- Mẫu xác suất là mẫu được chọn từ một quần thể theo cách mà mỗi thành viên trong quần thể có một xác suất biết trước
được chọn vào mẫu nghiên cứu

CỠ MẪU VÀ PHƯƠNG PHÁP CHỌN MẪU NGHIÊN CỨU


- Quần thể đích: là đối tượng mà nghiên cứu đang hướng đến, đáp ứng các tiêu chí quan tâm của người nghiên cứu
- Quần thể nghiên cứu: là quần thể mà từ đó mẫu được rút ra cho nghiên cứu. Quần thể nghiên cứu có thể là tập con của quần
thể đích hoặc là quần thể đích
- Mẫu: là một tập con của quần thể nghiên cứu.
Ví dụ:Quần thể đích: trẻ em <=5 tuổi của một tỉnh để nghiên cứu tình trạng SDD
Quần thể nghiên cứu: trẻ em <=5 tuổi tại 3 huyện A, B, C
Mẫu nghiên cứu: Rút ra một số trẻ em nhất định (<=5 tuổi) tại 3 huyện A, B, C để nghiên cứu SDD

+ Đơn vị quan sát: là một chủ thể mà sự quan sát, đo lường sẽ được tiến hành trên chủ thể đó khi nghiên cứu
+ Đơn vị mẫu: là một chủ thể được sử dụng khi chọn mẫu
Ví dụ: Trong một điều tra đánh giá tình trạng SDD của trẻ em <=5 tuổi, do danh sách trẻ em không có sẵn nên danh sách các
hộ gia đình được sử dụng để chọn mẫu. Khi đó đơn vị quan sát là trẻ em <=5 tuổi, còn đơn vị mẫu là hộ gia đình.
- Khung mẫu: là danh sách các đơn vị mẫu
- Phương pháp chọn mẫu:
+ Chọn mẫu xác suất: Xác suất các cá thể được chọn vào mẫu là như nhau. Kỹ thuật này chỉ thực hiện được khi biết khung
chọn mẫu của quần thể nghiên cứu
1. Chọn mẫu ngẫu nhiên đơn
2. Chọn mẫu ngẫu nhiên hệ thống
3. Chọn mẫu phân tầng
4. Chọn mẫu chùm
5. Chọn mẫu nhiều giai đoạn
+ Chọn mẫu không xác suất: Xác suất các cá thể được chọn vào mẫu là không như nhau
1. Chọn mẫu ngẫu nhiên đơn
- Ưu điểm:
+ Đơn giản, dễ làm
+ Tính ngẫu nhiên và tính đại diện cao
+ Có thể được lồng vào tất cả các kỹ thuật chọn mẫu xác suất phức tạp khác
- Nhược điểm:
+ Việc thu thập số liệu sẽ tốn kém, mất thời gian
+ Cần phải có một danh sách của các đơn vị mẫu (khung mẫu)
2. Chọn mẫu ngẫu nhiên hệ thống
- Xác định khung mẫu và đánh số đơn vị mẫu
- Xác định khoảng cách mẫu k=N/n
- Chọn đơn vị mẫu đầu tiên trong khoảng 1-k bằng phương pháp chọn mẫu ngẫu nhiên đơn
- Xác định đơn vị mẫu kế tiếp bằng cách cộng k với đơn vị mẫu đầu tiên, làm như vậy cho đến khi đủ cỡ mẫu
- Ưu điểm:
+ Nhanh, dễ áp dụng
+ Ít tốn kém
- Nhược điểm:
+ Thiếu tính đại diện do đơn vị mẫu không xếp ngẫu nhiên
3. Chọn mẫu phân tầng
- Chia quần thể thành các tầng
- Áp dụng chọn mẫu ngẫu nhiên đơn hoặc ngẫu nhiên hệ thống trong từng tầng
- Cỡ mẫu mỗi tầng có thể
+ Bằng nhau: chọn mẫu phân tầng không theo tỷ lệ kích cỡ tầng
+ Không bằng nhau: chọn mẫu phân tầng theo tỷ lệ kích cỡ tầng
- Ưu điểm:
+ Đảm bảo tính đại diện của mỗi tầng
+ Dễ thu thập số liệu
- Nhược điểm:
+ Thiếu chính xác khi số lượng mẫu ở mỗi tầng quá ít
4. Chọn mẫu chùm
- Xác định chùm: dựa vào vị trí địa lý hoặc đơn vị hành chính
- Lập danh sách chùm
- Chọn chùm ngẫu nhiên
- Chọn cá thể:
+ Lấy toàn bộ cá thể (chùm bậc 1)
+ Chọn mẫu trong từng chùm bằng phương pháp ngẫu nhiên đơn hoặc ngẫu nhiên hệ thống (chùm bậc 2)
- Ưu điểm:
+ Có thể điều tra phạm vi rộng, phân tán
+ Khung mẫu đơn giản, dễ lập
+ Điều tra dễ, nhanh và hiệu quả
- Nhược điểm:
+ Tính đại diện thấp
+ Phân tích số liệu phức tạp
5. Chọn mẫu nhiều giai đoạn
- Là dạng phức tạp của chọn mẫu chùm
- Ví dụ: chọn tỉnh, huyện, xã, đối tượng nghiên cứu
- Các công thức tính cỡ mẫu:
- Cỡ mẫu xác định một tỷ lệ:

- Cỡ mẫu so sánh hai tỷ lệ:


- Cỡ mẫu so sánh hai số trung bình:

Bài 10: THỐNG KÊ MÔ TẢ: TỔNG HỢP VÀ TÓM TẮT SỐ LIỆU


- Mô tả số liệu định lượng:
+ Đo lường độ tập trung: trung bình, trung vị, mode
+ Đo lường độ phân tán: phương sai, độ lệch chuẩn, hệ số biến thiên
+ Đo lường vị trí của số liệu: khoảng phần trăm, phần tư
- Mô tả số liệu định tính:
+ Tính toán tần số, tỷ lệ, tỷ số, tỷ suất
1. Đo lường độ tập trung:
- Trung bình: là tổng giá trị của các quan sát chia cho tổng số quan sát. Nếu tập hợp số liệu có phân bố chuẩn, giá trị trung bình
là giá trị đại diện tốt nhất

- Trung vị: là giá trị quan sát chính giữa nhất trong một tập hợp các quan sát khi ta sắp xếp chúng theo thứ tự từ nhỏ đến lớn
hoặc ngược lại.
+ nếu là số lẻ (lấy giá trị chính giữa): (n+1)/2
+ nếu là số chẵn (lấy trung bình của 2 giá trị chính giữa): (xn/2 + x(n+2)/2)/2
- Mode: là giá trị quan sát có tần số lớn nhất. Có thể không có mode hoặc có nhiều mode
Trong một phân phối không đối xứng, ba giá trị trung tâm không trùng nhau:
2. Đo lường độ phân tán
- Khoảng quan sát: hiệu giữa giá trị cao nhất và thấp nhất
- Phương sai và độ lệch chuẩn: được dùng nhiều nhất, nhằm diễn tả mức độ phân tán của các giá trị quan sát đối với số trung
bình
+ Phương sai = Tổng bình phương độ lệch / Số các đơn vị quan sát

+ Độ lệch chuẩn: nhỏ => các giá trị quan sát sẽ tập trung gần số trung bình, tập hợp có độ đồng nhất cao
Lớn => các giá trị quan sát sẽ phân tán xa số trung bình, tập hợp không đồng nhất

- Hệ số biến thiên: sử dụng khi muốn so sánh độ phân tán của 2 nhóm số liệu có đơn vị đo lường khác nhau
Ví dụ:
Cân nặng: CVcn = 3,9/50 x 100 = 7,8%
Chiều cao: CVcc = 7,5/160 x 100 = 4,7%

3. Đo lường vị trí của số liệu


- Khoảng phần trăm: các giá trị chia số liệu thành một trăm phần bằng nhau
- Khoảng phần tư: các giá trị chia số liệu làm 4 phần bằng nhau
Mô tả số liệu định tính
1. Tần số
2. Tần số cộng dồn
3. Tần số tuyệt đối và tần số tương đối
- Tần số tuyệt đối: là tần số thực của quan sát, nó không phụ thuộc vào cỡ mẫu lớn hay nhỏ
- Tần số tương đối (tần suất): biểu thị của tần số trong mối tương quan với cỡ mẫu, thường biểu thị dưới dạng %
4. Tỷ lệ, tỷ lệ phần trăm
- Là một dạng biểu thức so sánh giữa một phần đơn vị nghiên cứu với tổng số đơn vị nghiên cứu
- Ví dụ:
Tỷ lệ sinh = Số ca đẻ sống trên 1000 dân/ năm
Tỷ lệ chết = Tổng số ca chết trên 1000 dân/ năm
5. Tỷ số
- Mẫu số không bao hàm tử số
- Ví dụ:
Số học sinh nam/Số học sinh nữ
6. Tỷ suất
- Là số lượng, tổng số hay mức độ của một bệnh hay một vấn đề, được đo trong một đơn vị thời gian nhất định. Là một dạng
đặc biệt của tỷ số/tỷ lệ đo trong một đơn vị thời gian
- Ví dụ:
Tỷ suất sinh = Số ca đẻ sống / 1000 dân / 1 năm (2015)
Tỷ suất chết sơ sinh = Số trẻ sơ sinh chết / 1000 trẻ sơ sinh sống / năm 2015
Trình bày kết quả nghiên cứu
- Bảng một chiều: trình bày sự phân phối của một biến số khảo sát
- Bảng hai chiều, bảng nhiều chiều: trình bày sự phân phối của một biến số khảo sát tương quan với một biến số khác
1. Biểu đồ cột đứng hoặc nằm ngang
- Biểu thị sự phân bố các tần số, tỷ lệ giữa các loại, nhóm của một biến định tính (danh mục, thứ hạng)
Biểu đồ đám mây: tương quan của hai biến định lượng

You might also like