You are on page 1of 44

TRƯỜNG ĐẠI HỌC TRÀ VINH KHOA Y DƯỢC

Bộ môn Y TẾ CÔNG CỘNG

XỬ LÝ VÀ PHÂN TÍCH SỐ LIỆU

GV: Nguyễn Thị Nhật Tảo


MỤC TIÊU BÀI HỌC

Sau buổi học, học viên có khả năng:


1. Trình bày các nội dung chính của xử lý số liệu
2. Trình bày được những nội dung chính của kỹ thuật
phân tích số liệu định lượng và định tính
3. Áp dụng các kỹ thuật xử lý và phân tích số liệu vào
thực tiễn
CÁC NỘI DUNG XỬ LÝ SỐ LIỆU
1. Phân loại và sắp xếp số liệu
2. Tiến hành kiểm tra chất lượng số liệu
3. Xử lý số liệu
✓ Phân loại số liệu
✓ Mã hóa số liệu
✓ Bảng tổng hợp số liệu (Data Master Sheet)
1. PHÂN LOẠI VÀ SẮP XẾP SỐ LIỆU
➢Các quần thể nghiên cứu khác nhau:
nhân viên y tế xã, các trạm y tế xã

→ mỗi quần thể có các bộ câu hỏi riêng


→ sắp xếp riêng
➢ Trong nghiên cứu so sánh:
sắp xếp → dễ dàng so sánh/phân tích
➢ Trong nghiên cứu cắt ngang:
sắp xếp tùy theo mục đích nghiên cứu
2. KIỂM TRA CHẤT LƯỢNG
➢ Thường tiến hành ngay trong quá trình thu thập
➢ Trong giai đoạn xử lý là kiểm tra lại
→ kiểm tra tính thống nhất, đầy đủ của thông tin
=> làm sạch SL

=>
=>
➢ CÁC VIỆC CẦN LÀM:
- Nếu BCH thu được có tỷ lệ “missing” cao → bỏ
- Sự không thống nhất SL có nguyên nhân/
/là người PV → trao đổi lại → chỉnh sửa
➢ VD:
ĐT Không hút thuốc lá → các câu LQ HTL của cá nhân
sẽ được bỏ qua, sẽ không thống nhất nếu người PV tiếp
tục ghi nhận các câu trả lời LQ HTL của cá nhân
➢ CÁC VIỆC CẦN LÀM:
- Nếu sự không thống nhất:
không do người PV mà do ghi chép
(Bộ câu hỏi tự điền) → hỏi lại người trả lời
- Nếu không thể hiệu chỉnh các sai sót
→ cân nhắc loại bỏ 1 phần số liệu
→ không gộp dữ liệu để phân tích
- Đối với các câu TL mơ hồ → loại bỏ
➢ KHI NÀO CẦN QUYẾT ĐỊNH LOẠI BỎ???
- Cần QĐ kỹ càng vì nó AH → chất lượng NC
- Mang tính chất trung thực trong nghiên cứu
- Mang tính đạo đức trong nghiên cứu
- Các SL bỏ, hoặc SL không đầy đủ
→ Cần đưa vào bàn luận
3. XỬ LÝ SỐ LIỆU
=> SỐ LIỆU CÓ THỂ XỬ LÝ BẰNG NHIỀU CÁCH:
➢ Bằng tay, sử dụng bảng tổng hợp SL
(data master sheet)
➢ Bằng máy tính qua các phần mềm:
(SPSS, Stata)
➢ Quá trình xử lý SL gồm các bước:
✓ Phân loại số liệu
✓ Mã hóa số liệu
✓ Bảng tổng hợp số liệu
=> PHÂN LOẠI SỐ LIỆU

➢ Dựa vào định nghĩa biến số:


✓ Biến số định lượng
✓ Biến số định tính:
/biến số nhị giá, danh định và thứ tự
✓ Biến số sống còn
=> MÃ HÓA SỐ LIỆU

➢ Chuyển SL sang kí hiệu phù hợp phân tích


➢ Thường NC định lượng, mỗi BS → gán 1 con số
➢ VD:
1 “Có”
2 “Không”
9 “Không biết”
=> QUY ƯỚC CỦA MÃ HÓA:
➢ Các câu TL giống nhau → cùng 1 mã số
→ giúp giảm sai sót khi mã hóa
➢ Mã hóa CH mở: các câu TL trùng lắp nhiều
→ sẽ được mã hóa
=> BẢNG TỔNG HỢP SỐ LIỆU
(DATA MASTER SHEET)

➢ Nếu xử lý số liệu bằng tay:


=> để tăng tính hiệu quả là tổng hợp/
/các SL thô vào 1 bảng → bảng tổng hợp SL
→ giúp quá trình phân tích dễ dàng, thuận tiện

=> VÍ DỤ
=>

MÃ SỐ Q1 Q2 Q3 Q5
TUỔI GIỚI TÍNH HÚT THUỐC LÁ SỐ
(NĂM) Nam Nữ Có Không Không LƯỢNG

trả lời HÚT


MỖI
NGÀY

1 20 x x 10
2 21 x x 0
3 40 x x 0
….
TỔNG CỘNG
➢ SL dễ dàng được kiểm tra từ bảng tổng hợp
➢ Có thể tính toán các BS cơ bản:
giới, nơi ở, tình trạng hút thuốc lá …
➢ Trong NC so sánh: cần bảng SL tổng hợp
→ so sánh 2 hoặc 3 nhóm
➢ VD: Nhóm SD và nhóm KSD biện pháp tránh thai
➢ Trong NC cắt ngang: bảng tổng hợp SL
/tùy thuộc vào hoàn cảnh, MTNC
/ý định có so sánh 2 hay nhiều nhóm?
LƯU Ý:
➢ Việc lập bảng tổng hợp SL cần cẩn thận
→ tránh sai sót không đáng có
➢ Kiểm tra lại
➢ Đặt ra thêm các mục: “không trả lời”, “mất số liệu”
→ phục vụ quá trình tổng kết báo cáo
PHÂN TÍCH SỐ LIỆU ĐỊNH LƯỢNG
3 BƯỚC CƠ BẢN TRONG PHÂN TÍCH SL

1. Phân tích riêng biệt từng BS: lần lượt


/hết BS này đến BS khác
Xét phân bố tần số ở mỗi BS → bảng TS 1 chiều
2. Phân tích từng cặp BS tương ứng
/VD: số mắc theo nhóm tuổi, giới … → bảng 2 chiều
3. Tính các giá trị TB, ĐLC, tỷ lệ %
→ các giá trị thống kê (các số đo trên mẫu)
CÁC DẠNG PHÂN TÍCH SỐ LIỆU

➢ Phương pháp thủ công:


đếm số liệu, đánh dấu bằng tay và/
/sử dụng máy tính cầm tay để tính toán
➢ Sử dụng máy vi tính: Phần mềm
1. PHƯƠNG PHÁP THỦ CÔNG
➢ Phương pháp này có thể điều chỉnh
/những sai sót do ghi chép hoặc mã hóa
➢ Tạo cảm giác hoàn chỉnh

=>
➢ Áp dụng khi cỡ mẫu nhỏ
(Ví dụ: <100 cỡ mẫu)

1 NGƯỜI THỰC HIỆN TỪ 2 NGƯỜI THỰC HIỆN

- Sắp xếp bằng tay - Sắp xếp bằng tay hoặc


- Sử dụng khi số liệu của đánh dấu
mỗi vấn đề được ghi trên
các trang, bảng riêng biệt
➢ CÁC BƯỚC THỰC HIỆN
SẮP XẾP BẰNG TAY ĐẾM ĐÁNH DẤU

- Làm từng câu hỏi một - 1 đọc 1 ghi: đánh dấu


- Chia các phiếu hỏi vào VD: “///” thể hiện có 3 đối
các chồng khác nhau tượng cùng chọn 1 câu TL
theo từng khả năng trả - Thực hiện trên từng BS
lời của câu hỏi - Nếu thu thập TT 3 BS thì
VD: nam/nữ; BV công/tư sắp bằng tay câu đầu,
- Đếm số lượng các phiếu sau đó đếm 2 câu còn lại
hỏi trong các chồng đó - Đếm lại và tổng kết vào
- Kiểm tra lại tránh bỏ sót từng nhóm
- Kiểm tra lại
➢ VD bảng liệt kê tần số bằng đánh dấu

Triệu chứng Đánh dấu tần số Tổng

Buồn nôn // 2

Tiêu chảy ///// / 6

Tón bón ///// //// 9

Dị ứng ///// 5
➢ VD: bảng đếm tần số bằng cách đánh dấu cho một
bảng 2 chiều biểu thị tuổi và thứ tự sinh của trẻ
Nhóm Thứ tự sinh Tổng
tuổi 1 2 3 4 5

0-4 /// ///// /// 11

5-9 / ///// /// 11


//

10-14 / / // 4

15-19 /// //// // 9

20-24 ///// ///// // //// / 25


///// ///

Tổng số 23 8 14 10 5 60
2. PHÂN TÍCH SỐ LIỆU BẰNG MÁY TÍNH

➢ Tiết kiệm thời gian


➢ Nâng cao chất lượng của việc phân tích SL
➢ CÁC BƯỚC THỰC HIỆN
✓ Chọn chương trình máy tính phù hợp
✓ Nhập số liệu
✓ Kiểm tra chất lượng số liệu
✓ Lập chương trình tính toán (nếu cần)
✓ Đưa ra các kết quả
=> (1)CHỌN CHƯƠNG TRÌNH MÁY TÍNH

➢ LOTUS 1-2-3: chương trình bảng tính


➢ dBASE (phiên bản III + IV)/
/hệ quản trị số liệu (Ashton –Tate)
➢ Epi Info
➢ SPSS
➢ STATA: chương trình phân tích
=>(2)NHẬP SỐ LIỆU

➢ EPIDATA
➢ HOẶC CÁC CHƯƠNG TRÌNH KHÁC: EXCEL
=>(3)KIỂM TRA

➢Trong quá trình nhập liệu có thể có sai sót


VD:

✓ Sự xuất hiện mã 3 và 9 cho BS giới tính


✓ Xuất hiện mã ĐT >200 trong khi
/chúng ta chỉ có 200 cỡ mẫu
=>(4)LẬP CHƯƠNG TRÌNH TÍNH TOÁN

LƯU Ý
➢ Tên các biến số trong bộ câu hỏi
➢ Vị trí của BS đó trong mối QH các chủ đề
➢ Cần phân tích bao nhiêu đối tượng
➢ So sánh với nhóm nào
➢ Biến số nào cần mã hóa lại
➢ Trình bày bằng bảng TS hay bảng chéo để so sánh
=>Bảng tần số:
số lần xuất hiện 1 BS/1 câu TL nào đó
VD:
• Người hút thuốc lá: 63, không HTL: 67
=> Tổng cộng: 130
➢ Nên chia thành các nhóm khác nhau
=> Nhóm tuổi >50
Nhóm tuổi <50
➢ VD bảng tần số:

Loại Tần số Tỷ lệ %

Hút thuốc lá 63 48,46%

Không hút thuốc lá 67 51,54%

Tổng cộng 130 100%


➢ VD bảng tần số:
Loại Tần số* Tỷ lệ %

Hút thuốc lá 63 48,46%

Không hút thuốc lá 63 51,54%

Tổng cộng 130 100%

* Ở nhóm không hút thuốc lá mất 4 dữ liệu


- Cần thể hiện số dữ liệu bị mất
- Là 1 dữ kiện quan trọng
→ đánh giá chất lượng SL thu thập đƣợc
=> Bảng chéo:
➢ Mục đích: phối hợp các thông tin 2/
/nhiều BS để mô tả VĐ hoặc giải thích
➢ 3 dạng bảng chéo:
✓ Bảng chéo mô tả: mô tả VĐ đang NC
✓ Bảng phân tích sự khác biệt giữa các nhóm
✓ Bảng phân tích tìm kiếm mối liên quan
➢ Bảng: Biểu hiện ho ở người HTL và không HTL
Ho trong 2 Không ho trong 2 Tổng
ngày gần đây ngày gần đây

Hút thuốc 11 52 63

Không hút 3 71 74
thuốc

Tổng 14 123 137


=>(5)RÚT RA KẾT QUẢ

➢ BẢNG
➢ ĐỒ THỊ
➢ BIỂU ĐỒ
➢ BIỂU THỊ CÁC KIỂM ĐỊNH THỐNG KÊ
PHÂN TÍCH SỐ LIỆU ĐỊNH TÍNH
PHÂN TÍCH SỐ LIỆU ĐỊNH TÍNH
- Các SL ĐT được thu thập qua các CH mở
- Phân tích thông tin thu thập được
✓ Ý kiến của người được PV về một VĐ
✓ Lí do cho một hành vi nào đó
✓ Mô tả 1 hành động, thực hành/
/niềm tin/kiến thức mà NC chưa biết đến
CÁC BƯỚC PHÂN TÍCH
BƯỚC 1
- Liệt kê tất cả các SL cho mỗi CH
- Đưa vào cả thông tin về nguồn gốc/
/của các SL liệt kê
BƯỚC 2
- Để hình thành các nhóm: đọc qua 1 lượt/
/toàn bộ DS các khả năng câu trả lời
- Tiến hành gán các mã (VD: A, B, C, D…)
/cho các TL gần như đồng nghĩa
BƯỚC 3
- Gắn các nhãn cho mỗi một loại
- Sau khi xong phân loại, sẽ có được từ
/4 – 6 loại → đưa vào BCH hoặc bảng TH
- Nhóm khác (thông thường <5% tổng số)
- Phân loại giúp:
✓ Biết được (%) những người được PV đưa ra
/lí do/quan điểm thuộc từng loại nhất định
✓ Phân tích nội dung từng câu TL => kế hoạch
/về những hoạt động cần tiến hành tiếp theo
LƯU Ý:
- Những câu hỏi về mô tả thực hành, niềm tin/kiến thức
→ không nên lượng hóa
- Các câu trả lời từ những câu hỏi mở thường rất đa
dạng → lưu ý khi gom nhóm
TÀI LIỆU THAM KHẢO

1. Lưu Ngọc Hoạt, NCKH trong Y học, trường Đại học Y Hà Nội – năm 2013.
2. Đỗ Hàm (2007) Phương pháp luận trong nghiên cứu khoa học y học, NXB Y
học, Trường Đại học Y khoa - Đại học Thái Nguyên, trang 37 - trang 48.
3. Bộ Y tế (2012), Dịch tễ học cơ sở và các bệnh phổ biến (Sách đào tạo Bác sỹ
chuyên khoa định hướng y học dự phòng), Trường Đại Học Y Hà Nội, Bộ môn

Dịch tễ học, trang 101 – 111.


4. Đỗ Văn Dũng (2012). Sách thống kê với phần mềm STATA ứng dụng trong
nghiên cứu khoa học, Đại học Y dược Tp. HCM - Khoa Y tế Công Cộng - Bộ
môn Dân số - Thống kê Y học và Tin học, trang 52 - 57.

5. Phạm Văn Lình (12/06/2013). Phương pháp nghiên cứu khoa học sức khỏe,
NXB tổng hợp Thành phố Hồ Chí Minh, trang 153 – 163.
CHÚC CÁC BẠN HỌC TỐT

You might also like