You are on page 1of 104

TRƯỜNG ĐẠI HỌC Y TẾ CÔNG CỘNG

BỘ MÔN TIN HỌC – THỐNG KÊ

TÀI LIỆU GIẢNG DẠY MÔN KỸ THUẬT MÁY TÍNH

PHẦN MỀM EPIDATA

HÀ NỘI, NĂM 2006


OOOOOOOOOOOOOOOOOOOOOOOOOOOOO

CHỦ BIÊN
Kỹ sư Phạm Việt Cường

NHÓM BIÊN SOẠN


Cử nhân Mạc Văn Huy
Cử nhân Chử Việt Anh
Cử nhân Trương Đức Tùng

THƯ KÝ BIÊN SOẠN


Cử nhân Mạc Văn Huy

OOOOOOOOOOOOOOOOOOOOOOOOOOOOO

[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 2
MỤC LỤC
BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU .......................... 6
1. Phần mềm Epidata là gì? ........................................................................................ 6
2. Đặc điểm của phần mềm Epidata ........................................................................... 6
3. Tiến trình thu thập và xử lý số liệu ....................................................................... 7
4. Chu trình của số liệu ............................................................................................... 8
5. Kiểu dữ liệu .......................................................................................................... 10
BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA .................................................. 16
1. Cài đặt Epidata ..................................................................................................... 16
1.1 Tải tệp chương trình cài đặt............................................................................. 16
1.2 Cài đặt chương trình ........................................................................................ 20
2. Khởi động chương trình ....................................................................................... 25
3. Thiết lập tùy chọn chương trình .......................................................................... 29
4. Tệp liên đới ........................................................................................................... 37
BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU ............................ 40
1. Khai báo bộ câu hỏi .............................................................................................. 40
2. Hạn chế lỗi số liệu ................................................................................................ 52
2.1 Lỗi số liệu ........................................................................................................ 52
2.2 Phát hiện lỗi dữ liệu......................................................................................... 53
2.3 Kiểm tra lỗi dữ liệu ......................................................................................... 54
3. Thiết lập ràng buộc số liệu với phần mềm Epidata .............................................. 55
4. Liên kết các tệp dữ liệu liên quan với lệnh RELATE .......................................... 64
BÀI 4: NHẬP DỮ LIỆU ............................................................................................. 71
1. Nhập số liệu .......................................................................................................... 71
2. Xem dữ liệu .......................................................................................................... 77
3. Xem cấu trúc tệp REC .......................................................................................... 77

[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 3
4. Liệt kê số liệu ....................................................................................................... 78
5. Xem mô tả số liệu ................................................................................................. 79
BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU ...................................... 82
1. Ghép tệp số liệu .................................................................................................... 82
2. Xuất nhập tệp số liệu ............................................................................................ 87
2.1 Xuất tệp số liệu ................................................................................................ 87
2.2 Nhập tệp số liệu ............................................................................................... 88
BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH ...................................................................... 90
1. Sửa tên trường ...................................................................................................... 90
2. Sao chép cấu trúc tệp REC ................................................................................... 91
3. Đếm bản ghi theo trường dữ liệu.......................................................................... 93
4. So sánh hai tệp dữ liệu.......................................................................................... 95
5. Đóng gói tệp số liệu.............................................................................................. 96
6. Tạo tệp QES từ tệp REC ...................................................................................... 97
BÀI TẬP TỔNG KẾT ................................................................................................. 98

[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 4
LỜI GIỚI THIỆU
Tài liệu này được viết bởi các cán bộ Bộ môn Tin học – Thống kê, Trường Đại học Y
tế công cộng, được sử dụng làm giáo trình phục vụ cho giảng dạy và là tài liệu tham
khảo cho sinh viên và học viên Y tế công cộng và các đối tượng tự học khác. Tài liệu
cung cấp cho người học những kiến thức, kỹ thuật làm việc với số liệu sử dụng phần
mềm Epidata.
Nội dung tài liệu được chia làm 6 bài học, lần lượt cung cấp cho người học những
kiến thức, kỹ thuật liên quan đến các bước trong tiến trình thu thập và xử lý số liệu
trong gian đoạn trước phân tích thống kê số liệu. Tài liệu cũng cung cấp cho người
học một cách tiếp cận đơn giản với các khái niệm về số liệu và hướng dẫn người học
sử dụng phần mềm Epidata trong thu thập và xử lý số liệu. Tài liệu này cũng giúp
người học hình dung được họ phải làm gì và làm như thế nào để có một bộ số liệu
phục vụ cho thống kê phân tích số liệu.
Tài liệu này được xây dựng lần đầu tiên nên khó tránh khỏi những thiếu sót. Chúng tôi
mong muốn các học viên, giảng viên cũng như bạn đọc sẽ đưa ra các ý kiến đóng góp
quý báu để tài liệu ngày càng hoàn thiện và phục vụ người đọc tốt hơn.

Hà Nội, tháng 11 năm 2006

[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 5
BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU
Sẽ rất khó để có thể hình dung về mục đích, ý nghĩa của các công việc mà chúng ta
thực hiện với Epidata, nếu như chúng chỉ được hướng dẫn thực hành với phần mềm.
Vì vậy, mục tiêu của bài học này là giới thiệu về phần mềm Epidata, quá trính thu thập
xử lý số liệu và những kiến thức liên quan đến dữ liệu (số liệu).

1. Phần mềm Epidata là gì?


EpiData là phần mềm hỗ trợ nhập và quản lý số liệu, được lập trình bởi Bác sĩ Jens
M.Lauritsen, người Đan Mạch. Phần mềm này đã được sử dụng lần đầu tiên cho một
nghiên cứu dịch tễ học “Phòng chống tai nạn”.

2. Đặc điểm của phần mềm Epidata


Trước khi EpiData ra đời, đã có những phần mềm được sử dụng để nhập liệu và thực
hiện các công việc thống kê số liệu như EpiInfo (do Tổ chức Y tế Thế giới xây dựng)
và những sản phẩm thương mại có sẵn khác. Tuy nhiên, những phần mềm đó không có
nhiều ưu điểm như phần mềm Epidata. Phần mềm Epidata đơn giản, dễ sử dụng, có
khả năng kiểm tra và hạn chế lỗi số liệu, đặc biệt là khả năng hỗ trợ tạo ra công cụ
nhập liệu nhanh hơn nhiều so với các phần mềm khác.
Ý tưởng của người phát triển phần mềm EpiData là việc tạo ra một phần mềm nhập
liệu miễn phí, giao diện người dùng thân thiện, dễ sử dụng. Với Epidata, người sử
dụng có thể nhập số liệu dưới dạng văn bản đơn giản và sau đó chuyển đổi số liệu
sang các dạng khác nhau để phục vụ cho việc phân tích thống kê số liệu bằng các
phần mềm khác nhau. Phần mềm Epidata có những đặc điểm sau:
ƒ Epidata được phát triển nhằm phục vụ cho mục đích nghiên cứu và học tập, hỗ
trợ cho quy trình quản trị số liệu.
ƒ Epidata có giao diện người dùng thân thiện và tạo ra tiến trình làm việc đơn
giản. Những người sử dụng có trình độ Tin học khác nhau đều có thể dễ dàng
học tập và sử dụng được phần mềm này trong một thời gian rất ngắn.
ƒ EpiData là sản phần hoàn toàn miễn phí, người sử dụng có thể tải chương
trình cài đặt từ trang Web http://www.epidata.dk.
ƒ EpiData có thể chạy trên các máy tính cài đặt hệ điều hành Microsoft Windows
hoặc Macintosh.

[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 6
ƒ Epidata có thể xuất số liệu sang nhiều dạng khác nhau để sử dụng cho phân
tích số liệu bằng các phần mềm như Stata, Spss, .v.v.

Những ưu điểm của Epidata đã khiến cho phần mềm này được nhiều người sử dụng
trên thế giới lựa chọn. Tuy nhiên, Epidata không có phiên bản hỗ trợ tiếng Việt, vì
vậy, cộng đồng sử dụng tiếng Việt nên sử dụng tiếng Việt không dấu khi làm việc với
Epidata.

3. Tiến trình thu thập và xử lý số liệu

Tiến trình thu thập và xử lý số liệu gồm nhiều bước nối tiếp nhau. Đây là công việc rất
tỷ mỉ. Chất lượng của số liệu có ảnh hưởng quyết định đến tính chính xác của kết quả
phân tích số liệu. Các bước của tiến trình thu thập và xử lý số liệu như sau:

1. Điều tra viên phỏng vấn, thu thập số liệu.

2. Điều tra viên kiểm tra thông tin trên phiếu đã phỏng vấn để xác định lỗi
và sửa lỗi.
3. Giám sát viên kiểm tra lại các phiếu đã phỏng vấn, chọn ra một số phiếu
trong số các phiếu đã phỏng vấn và thực hiện phỏng vấn lại để kiếm tra
đánh giá tính chính xác của những thông tin đã phỏng vấn.

4. Nhập liệu viên nhập số liệu vào máy tính.

5. Nhập liệu viên khác hoặc một nhóm nhập liệu viên khác nhập lại số liệu
lần thứ 2.

6. So sánh số liệu hai lần nhập để tìm lỗi số liệu sinh ra do quá trình nhập
liệu và sửa lỗi.

7. Kiểm tra ràng buộc số liệu. Tính ràng buộc của số liệu thể hiện những
quy luật của thông tin. Số liệu không thỏa mản các ràng buộc thì số liệu đó
là không chính xác. Ví dụ, thông tin về một sự kiện mang thai phải thuộc
vào những cá nhân có giới tính là nữ. Tuy nhiên, trong cơ sở dữ liệu lại có
những trường hợp cá nhân có giới tính là nam có thông tin về việc mang
thai và sinh đẻ. Đây chính là những số liệu không thỏa mãn ràng buộc số

[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 7
liệu.

8. Tạo các biến (biến số liệu còn gọi là trường số liệu) mới từ các biến có
sẵn trong cơ sở dữ liệu (cơ sở dữ liệu là một tệp hoặc một tập hợp các tệp
lưu trữ thông tin về số liệu và lưu trữ số liệu). Việc tạo ra biến mới thực
chất là tạo ra các thông tin mới trong cơ sở dữ liệu từ những thông tin ban
đầu.

9. Liên kết số liệu để tạo ra những bộ số liệu có đủ những biến mong muốn
phục vụ cho mục đích phân tích tích thống kê số liệu.

10. Xuất tệp số liệu sang các dạng khác. Hiện nay có nhiều dạng tệp số
liệu khác nhau như các dạng tệp số liệu của phần mềm Spss là dạng tệp
.SAV, Stata là dạng tệp .DTA và Epi_info là dạng .REC, .v.v. Các phần
mềm thường chỉ hiểu được dạng tệp mà nó tạo ra. Chẳng hạn, phần mềm
Epi_info chỉ hiểu được tệp .REC, phần mềm Stata chỉ hiểu được tệp .DTA.
Điều này có nghĩa là chỉ có thể chạy phân tích số liệu bằng phần mềm
Epi_info với tệp .REC, phần mềm Stata với tệp .DTA. Chính vì vậy, khi số
liệu được nhập vào tệp .REC với phần mềm Epidata chỉ sử dụng được cho
phần mềm Epi_info. Để có thể phân tích số liệu với phần mềm Stata hay
Spss cần chuyển tệp .REC thành tệp .DTA hoặc .SAV. Việc này gọi là xuất
tệp số liệu sang các dạng khác nhau.

4. Chu trình của số liệu

Số liệu được thu thập thông qua phỏng vấn, hoặc quan sát, hoặc đo đếm .v.v. trên các
đối tượng nghiên cứu, sau đó được ghi lại trên một phiếu thu thập thông tin (phiếu thu
thập thông tin còn được gọi là bộ câu hỏi).

[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 8
Biến 1 Mã số : ………….

Họ và tên:………………
Biến 2
Một bản ghi Ngày sinh:………………
(1 case) Nhóm biến
Biến 3 Giới tính:……………

Biến 4 Tình trạng hôn nhân:…

Biến 5

Hình 1: Mô tả biến và bản ghi


Số liệu được thu thập và được điền vào các mục (các câu hỏi) tương ứng trên bộ câu
hỏi. Qua qúa trình nhập liệu, số liệu được lưu vào cơ sở dữ liệu dưới dạng các bản ghi.
Mỗi bản ghi thường là một tập hợp các số liệu trên một bộ câu hỏi, được lưu liền kề
nhau và được gắn kết lại với nhau thành một khối trong cơ sở dữ liệu.

Bản ghi 1
Tệp số liệu

Bản ghi 2

Bản ghi 3

Hinh 2: Mô tả tệp số liệu

[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 9
Các bản ghi số liệu của các bộ câu hỏi được xếp nối tiếp nhau trong cơ sở dữ liệu với
cùng một cấu trúc. Cấu trúc đó cũng chính là cấu trúc dữ liệu. Ta có thể hình dung cầu
trúc dữ liệu được sắp xếp giống như một bảng biểu gồm nhiều hàng nhiều cột, mỗi
hàng là một bản ghi, mỗi cột là một trường số liệu (gọi là trường) hay còn gọi một biến
số liệu (gọi là biến) và số liệu được lưu trong mỗi trường đều thuộc vào một dạng duy
nhất nào đó đã được xác định trước. Ví dụ số liệu trong trường họ và tên là dạng số
liệu văn bản và số liệu trong trường ngày sinh là số liệu dạng ngày tháng. Các quy
định về cấu trúc số liệu cũng đảm bảo cho các tính toán trên số liệu cho ra kết quả
chính xác. Hình 1 và 2 sau đây là minh họa cho liên quan giữa thông tin trên phiếu
điều tra và các biến trong tệp số liệu, cấu trúc tệp số liệu. Bảng sau đây là ví dụ về số
liệu trong một tệp số liệu có 4 trường (biến) và có 4 bản ghi.

trường số liệu (biến)

bản
ghi

5. Kiểu dữ liệu

Tệp số liệu trong Epidata có cấu trúc gồm nhiều trường, trường có các thuộc tính là
nhãn, kiểu và độ rộng. Nhãn biến là chú thích về biến, kiểu cho biết dạng số liệu (dạng
ngày tháng, dạng số, dạng xâu chuỗi văn bản .v.v.) và độ rộng cho biết kích thước lớn
nhất của số liệu mà biến có thể chứa được. Các dạng số liệu được thu thập ở các câu hỏi
trên các bộ câu hỏi luôn thuộc vào một dạng số liệu nào đó. Vì vậy, khi xây dựng cơ sở
dữ liệu để lưu trữ số liệu, người thực hiện công việc này cần nắm được các kiểu dữ liệu
mà phần mềm hỗ trợ.

[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 10
Text
Auto ID
Number

Kiểu biến Numeric


Boolean,
Logic,Y/N

Soundex
Date

Hình 3: Kiểu dữ liệu trong Epidata


Epidata hỗ trợ các kiểu dữ liệu gồm Numeric, ID Number, Text, Date, Boolean và
Soundex. Những người sử dụng Epidata cần nắm được đặc điểm và cách sử dụng các
kiểu dữ liệu này.
5.1.1. Kiểu ID number
Kiểu ID number là kiểu dữ liệu số tự động và có các đặc điểm sau:
ƒ Chuỗi định dạng là <IDNUM>
ƒ Một trường số liệu được khai báo kiểu ID number thì giá trị số liệu của trường
sẽ được tự động nhập khi nhập số liệu. Người sử dụng không được nhập giá trị
cho trường này.
ƒ Kiểu ID number thường được sử dụng để khai báo cho trường khóa. Trường
khóa là trường chứa số liệu định danh cho bản ghi. Đặc điểm của trường khóa
là trong tất cả các bản ghi của một tệp dữ liệu sẽ không có cặp bản ghi nào có
cùng giá trị tại trường khóa. Dựa vào số liệu của trường khóa, ta luôn tìm được
bản ghi duy nhất tương ứng với nó trong tệp số liệu.

Ví dụ:

[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 11
Khai báo trường mã số phỏng vấn có tên trường là IDX, kiểu số tự động, có
nhãn là “So thu tu phong van”, viết như sau:
IDX So thu tu phong van <IDNUM>
5.1.2. Kiểu Numeric
Kiểu Numeric là kiểu dữ liệu số dùng để khai báo cho các trường số liệu dạng số như
tuổi, thu nhập, chiều cao, cân nặng .v.v. Đặc điểm của kiểu này như sau:
ƒ Chuỗi định dạng sử dụng kí tự #, ví dụ ###, hoặc ###.###, hoặc ########,
hoặc ##.#### .v.v.
ƒ Trường được khai báo kiểu số chỉ chấp nhận số liệu nhập vào ở dạng số.
ƒ Độ rộng của trường được xác định bằng số kí tự # được khai báo.
ƒ Kích cỡ lớn nhất số liệu nhập vào một trường có kiểu số là 14 chữ số gồm cả ký
tự (“.”)ngăn cách phần số nguyên và phần thập phân với số thập phân.
Ví dụ:
Khai báo một trường có tên v1 và có 8 chữ số là số nguyên, có nhãn biến là
“tong thu nhập” dùng để lưu thu nhập của hộ gia đình, viết như sau:
V1 “Tong thu nhap” ########
Nếu khai báo trường số liệu trên dạng số thập phân với phần thập phân có hai
số, viết như sau:
V1 Tong thu nhap ########.##
5.1.3. Kiểu Text
Kiểu Text là kiểu dữ liệu văn bản (còn gọi là kiểu chuỗi ký tự), thường được sử dụng
khai báo cho các trường số liệu dạng văn bản như họ và tên, địa chỉ, ghi chú .v.v.
ƒ Chuỗi định dạng là sử dụng ký tự “_” hoặc <E >
ƒ Chuỗi văn bản nhập vào có thể gồm các ký tự a, b, c, … và kể cả các chữ số.
ƒ Độ rộng của trường lớn nhất là 80 kí tự.
ƒ Khi khai báo mỗi dấu “_” tương ứng với khai báo cho một kí tự.
Ví dụ 1:

[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 12
Khi khai báo trường họ tên với độ rộng 25 ký tự thì sẽ có 25 dấu “_” trong
phần khai báo:
V2 Ho ten _________________________
Ví dụ 2:
Khi muốn khai báo trường V3 kiểu Text, có 7 ký tự, dữ liệu nhập được mã hóa
và bảo mật, ta khai báo như sau:
V3 “Mat khau” <E >
Số dấu cách (ký tự trắng) trong cặp “<E” và “>” là 7 tương ứng khai báo cho
giá trị mật khẩu 7 kí tự.
5.1.4. Kiểu Upper-case text
Đây cũng là một kiểu dữ liệu văn bản, kiểu này có các đặc tính sau:
ƒ Chuỗi định dạng là <A>, hoặc <A >
ƒ Trường được khai báo kiểu Upper-case text thì số liệu nhập vào trường này
được hiểu là dạng văn bản và được tự động chuyển sang dạng kí tự viết hoa.
ƒ Độ rộng của trường tương ứng với số kí tự “trống” (dấu cách) giữa hai dấu “<”
và “>”.
5.1.5. Kiểu Boolean
Đây là kiểu dữ liệu logic. Trường được khai báo kiểu này chỉ chấp nhận giá trị Y hoặc
N (cũng có thể chấp nhận số 0 hoặc 1) và chuỗi định dạng là <Y>.
Ví dụ:
Khai báo biến giới tính có tên là V4, trong đó, giá trị Y thể hiện giới tính là nữ
và N thể hiện giới tính là nam, ta viết như sau:
V4 “Gioi tinh” <Y>
5.1.6. Kiểu Date
Kiểu dữ liệu Date được sử dụng để khai báo cho các trường số liệu dạng ngày tháng,
có các đặc điểm sau:
ƒ Chuỗi định dạng là <dd/mm/yyyy>, hoặc <mm/dd/yyyy>, hoặc
<yyyy/mm/dd>

[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 13
ƒ Trường được khai báo kiểu Date chỉ chấp nhận giá trị nhập vào dạng ngày
tháng theo định dạng đã khai báo.
ƒ Kiểu số liệu ngày tháng có độ rộng là 10 kí tự gồm cả ký tự ngăn cách (“/” hoặc
“-“) giữ các thành phần ngày, tháng và năm.
Ví dụ:
Khai báo biến ngày sinh tên là V5 viết như sau:
V5 “Ngay sinh” <dd/mm/yyyy>
5.1.7. Kiểu today’s date
Đây cũng là một kiểu dữ liệu thể hiện số liệu ngày tháng. Các đặc điểm của kiểu dữ
liệu này gồm như sau:
ƒ Chuỗi định dạng là <today-dmy>, hoặc <today-mdy>, hoặc <today-ymd>
ƒ Một trường được khai báo kiểu Today’s date sẽ được tự động điền vào giá trị
ngày hiện tại (ngày của máy tính) khi nhập liệu.
Ví dụ:
Khai báo ngày nhập số liệu tên là V6, ta viết như sau:
V6 “Ngay nhap lieu” <today-dmy>
5.1.8. Kiểu soundex
Kiểu Soundex là kiểu dữ liệu mã hóa. Số liệu nhập vào trường này sẽ được Epidata tự
động mã hóa (chuyển sang một giá trị khác) theo quy luật mã hóa của Epidata trước
khi lưu vào cơ sở dữ liệu.
ƒ Chuỗi định dạng là <S >
ƒ Trường số liệu kiểu Soundex chấp nhận tất cả các kí tự. Trừ kí tự đầu tiên, các
kí tự còn lại sẽ được tự động mã hóa.
ƒ Khuôn dạng của chuỗi mã hóa là A-999, tức là chuỗi mã hóa gồm một kí tự đầu
và tiếp theo là dấu “-“ và ba chữ số. Khi chuỗi nhập vào là HOLMES, chữ H
được giữ lại và chuỗi “OLMES” được mã hóa thành 452 và ta có chuỗi sau mã
hóa là H-452.
Ví dụ:
Khai báo biến tên tỉnh có tên biến là V7, viết như sau:

[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 14
V7 “Ten tinh” <S >
5.1.9. Chỉ định Tabulator code
Chỉ định Tabulator code được sử dụng khi khai báo trường câu hỏi, nhằm chỉ dẫn cho
Epidata về việc thực hiện căn lề cho các thành phần trên Mẫu biểu (cửa sổ nhập liệu)
nhập liệu.
ƒ Ký tự định dạng là @
ƒ Bình thường thì trên Mẫu biểu nhập liệu các thành phần (các câu hỏi) không
được căn lề. Tabulator code sẽ giúp giải quyết vấn đề trên.
Ví dụ:
Có thể khai báo các cho các câu hỏi được căn lề đều theo lề trái như sau:
V1 “Ma so” @<IDNUM>
V2 “Ho ten”@__________________

Câu hỏi lượng giá


1. Phần mềm Epidata là gì?
2. Nêu đặc điểm của phần mềm Epidata.
3. Nêu mười bước của tiến trình thu thập và xử lý số liệu.
4. Mô tả lại chu trình của số liệu và nêu các khái niệm tệp số liệu, bản ghi,
biến/trường, nhãn, kiểu.
5. Nêu đặc điểm của các kiểu dữ liệu ( định dạng biến, cách viết khai báo biến …)

[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 15
BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA
Bài học này cung cấp cho người học những thông tin và hướng dẫn cần thiết về kỹ
thuật cài đặt và sử dụng phần mềm Epidata. Nội dung bàì học gồm kỹ thuật tải bộ cài
Epidata từ Internet về máy tính cá nhân, cài đặt Epidata và thiết lập các tham số tùy
chọn cho phần mềm Epidata. Nắm vững được các kỹ thuật này, người sử dụng có thể
chủ động hơn khi làm việc với Epidata.

1. Cài đặt Epidata

Khi người sử dụng muốn sử dụng một phần mềm nào đó trên máy tính của mình thì
trước tiên phải cài đặt phần mềm đó vào máy tính, nếu phần mềm đó chưa được cài
đặt. Đối với phần mềm Epidata, công việc cài đặt gồm tải bộ cài từ Internet về máy
tính và cài đặt chương trình.

1.1 Tải tệp chương trình cài đặt

Bộ cài của Epidata là tệp chương trình setup_epidata.exe, được đăng tải trên trang web
www.epidata.dk, người sử dụng có thể tự do truy nhập trang web này và tải về máy
tính của mình. Các bước tải chương trình như sau:

Bước 1: Mở cửa sổ trình duyệt Internet Explorer hoặc Netscape explorer, vào trang
web www.epidata.dk, vào mục Download (get files).

Hình 4: Hình ảnh trang web www.epidata.dk

Bước 2: Chọn liên kết Epidata Entry để nhảy đến phần Epidata Entry, hình ảnh trên
trang web như sau:

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 16
Hình 5: Hình ảnh trang web download của website Epidata software
Bước 3: Chọn mục Complete setup để bắt đầu tải tệp chương trình cài đặt về máy tính.
Hình ảnh trên trang web như sau:

Hình 6: Hình ảnh chọn bộ cài của phiên bản Epidata tiếng Anh
Trên trang web, có nhiều bộ cài đặt EpiData của các phiên bản chương trình sử dụng
ngôn ngữ khác nhau như tiếng Anh, Trung Quốc, .v.v. Nếu muốn sử dụng ngôn ngữ
nào thì người sử dụng phải tải về bộ cài đặt của phiên bản chương trình sử dụng ngôn
ngữ đó. Ở đây, chúng ta sẽ chọn phiên bản chương trình sử dụng tiếng Anh nên mục
Complete Setup được chọn như ở hình ảnh trên.
Bước 4: Sau khi chọn Complete Setup, hộp thoại File Download xuất hiện, chọn nút
lệnh Save trên hộp thoại để tải tệp chương trình cài đặt về máy tính.

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 17
Hình 7: Hộp thoại File Download
Bước 5: Ở bước này, ta phải chọn thư mục để lưu bộ cài Epidata sẽ tải về. Sau khi ta
chọn Save trên hộp thoại File Download ở bước 4, hộp thoại Save As xuất hiện. Hộp
thoại này yêu cầu chọn ra nơi lưu bộ cài được tải về trên máy tính. Giả sử ta muốn để
bộ cài đặt ở màn hình Desktop, ta chọn nút Desktop và chọn Save. Chú ý, trong mục
File Name tên tệp chương trình cài đặt tự động mặc định là setup_epidata. Khi chạy
tệp này, chương trình Epidata sẽ được cài đặt trên máy tính.

Hình 8: Hộp thoại Save As

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 18
Hộp thoại tải thông báo tiến độ tải bộ cài về máy tính xuất hiện, sau khi nút Save được
chọn trên hộp thoại Save As và đưa ra thông tin về tiến trình tải bộ cài, có hình ảnh
như sau:

Hình 9: Hộp thoại thông báo tiến độ tải bộ cài


Khi tiến trình tải bộ cài kết thúc, hộp thoại thông báo tiến trình có hình ảnh như sau:

Hình 10: Bộ cài Epidata đã được tải về máy tính


Chú ý: Nếu mục “Close this dialog box when download completes” trên hộp thoại
được tích trước đó thì hộp thoại download tự động đóng lại khi tiến trình tải bộ cài kết
thúc.

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 19
1.2 Cài đặt chương trình
Khi ta chạy chương trình cài đặt từ bộ cài đặt, các tệp chương trình Epidata được tải
nén từ bộ cài và copy vào thư mục được chỉ định trước. Các bước cài đặt Epidata như
sau:
Bước 1: Mở thư mục chứa bộ cài vừa được tải về và kích đúp chuột trái vào tệp cài đặt
để chạy tệp chương trình cài đặt setup_epidata.exe. Chúng ta cũng có thể chạy chương
trình cài đặt từ hộp thoại thông báo tiến độ tải bộ cài, bằng cách nhấn nút Run khi tiến
trình tải bộ cài kết thúc. Với nhiều phần mềm khác, bộ cài có thể có nhiều tệp thành
phần. Tuy nhiên, bộ cài của Epidata chỉ có một tệp setup_epidata.exe là duy nhất. Khi
chương trình cài đặt được kích hoạt, hộp thoại Setup – Epidata Entry xuất hiện, bắt
đầu cho tiến trình cài đặt. Hộp thoại cài đặt có hình ảnh như sau:

Hình 11: Hộp thoại cài đặt Epidata bước 1


Hộp thoại trên đưa ra lời chào người sử dụng chương trình, để chuyển sang bước tiếp
theo của tiến trình cài đặt, chọn nút lệnh Next.
Bước 2: Chương trình cài đặt đưa ra một số thông tin về tác giả và nguồn gốc của phần
mềm. Để có thể chuyển qua bước này, ta tích vào mục “I accept the agreement” và
chọn Next.

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 20
Hình 12: Hộp thoại cài đặt Epidata bước 2
Bước 3: Thư mục Program Files được chương trình cài đặt mặc định là nơi các tệp
chương trình Epidata sẽ được cài đặt. Nếu người sử dụng muốn cài đặt chương trình vào
một thư mục khác thì có thể chọn nút Browse để chỉ định thư mục cài đặt trên hộp thoại
Browse. Trên hộp thoại Browse, người sử dụng chọn thư mục trong cây thư mục và
chọn OK để kết thúc thao tác chọn thư mục cài đặt. Sau đó, trên hộp thoại Setup Epidata
Entry, chọn Next để chuyển qua bước tiếp theo. Hình ảnh hộp thoại cài đặt Epidata ở
bước này như sau:

Hình 13: Hộp thoại cài đặt Epidata bước 3

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 21
Hình 14: Hộp thoại Browse
Bước 4: Chương trình cài đặt mặc định là sẽ tạo ra thư mục Epidata trên thanh Start và
đồng thời cũng cho phép người sử dụng bỏ qua việc này. Nếu không muốn tạo ra thư
mục Epidata trên thanh thực đơn Start, người sử dụng có thể chọn “Don’t create a Start
Menu Folder” trên hộp thoại. Để chuyển sang bước cài đặt tiếp theo, chọn Next.

Hình 14: Cài đặt Epidata bước 4

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 22
Bước 5: Chương trình cài đặt đưa ra các tùy chọn để người sử dụng lựa chọn. Các tùy
chọn bao gồm:

ƒ Create a Desktop icon: tạo biểu tượng lối tắt (Shortcut) trên màn hình Desktop.

ƒ Create a Quick Launch icon: tạo biểu tượng trên thanh công cụ Quick launch.

ƒ Field/variable names option set to: nếu được chọn là “Standard field naming
“thì khi khai báo bộ câu hỏi tên biến được Epidata hiểu là từ đầu tiên của dòng
khai báo, và nếu được chọn là “Automatic field naming” thì 10 ký tự đầu tiên
của dòng khai báo sẽ là tên biến.

Sau khi chọn các tùy chọn, ta chọn Next để chuyển sang bước tiếp theo. Hộp thoại của
chương trình cài đặt ở bước này có hình ảnh như sau:

Hình 15: Hộp thoại cài đặt Epidata bước 5

Bước 6: Sau khi các tùy chọn đã được người sử dụng xác định, chương trình cài đặt
đưa ra thông báo là đã sẵn sàng để cài đặt Epidata và yêu cầu người sử dụng nhấn nút
Install để cài đặt chương trình. Hộp thoại cài đặt ở bước này có hình ảnh như sau:

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 23
Hình 16: Hộp thoại cài đặt Epidata bước 6.
Bước 7: Khi tiến trình cài đặt Epidata kết thúc, chương trình cài đặt đưa ra các thông
tin cần lưu ý về chương trình Epidata như địa chỉ trang web Epidata, đại chỉ Email của
tổ chức cung cấp phần mềm Epidata. Để chuyển qua bước tiếp theo, người sử dụng
phải nhấn nút lệnh Next. Hình ảnh hộp thoại cài đặt ở bước này như sau:

Hình 17: Hộp thoại cài đặt Epidata bước 6

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 24
Bước 7: Tiến trình cài đặt phần mềm Epidata đã kết thúc, chương trình cài đặt đưa ra
thông báo hoàn thành tiến trình cài đặt. Nếu người sử dụng muốn xem tài liệu hướng
dẫn sử dụng chương trình thì tích vào mục “See intro” và nếu muốn chương trình cài
đặt khởi động chương trình Epidata thì tích vào “Launch Epidata”. Sau cùng chọn nút
Finish để kết thúc cài đặt.

Hình 18: Kết thúc tiến trình cài đặt Epidata

2. Khởi động chương trình


Có hai cách khởi động chương trình Epidata như sau:
Cách 1: Kích đúp chuột trái vào biểu tượng Epidata trên màn hình desktop (chỉ thực
hiện được nếu có biểu tượng Epidata trên màn hình Desktop).

Hình 19: Khởi động Epidata bằng biểu tượng trên màn hình Desktop

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 25
Cách 2: Chọn Start/All Programs/Epidata/Epidata3.1 (chỉ thực hiện được nếu thư mục
Epidata được tạo ra trên thanh thực đơn Start)

Hình 20: Khởi động Epidata từ thanh thực đơn Start

Cửa sổ chương trình Epidata sau khi được khởi động có hình ảnh như sau:

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 26
Hình 21: Cửa sổ chương trình Epidata và hộp thoại Welcome to Epidata
Khi Epidata được khởi động lần đầu tiên, chương trình sẽ đưa ra một hộp thoại chào
mừng giống như ở hình 20. Nút Close trên hộp thoại được sử dụng để đóng hộp thoại,
nếu người sử dụng muốn hộp thoại này không xuất hiện vào những lần khởi động
Epidata sau đó thì phải tích vào mục “Don’t show this window again” trước khi chọn
nút Close đóng hộp thoại. Cửa sổ chương trình Epidata có hình ảnh như sau:

Hình 22: Cửa sổ chương trình Epidata

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 27
Giống như nhiều phần mềm khác, Epidata có một thanh thực đơn và hai thanh công cụ
để cung cấp các điểm kích hoạt các chức năng chương trình cho các tác nghiệp của
người sử dụng.
Thanh thực đơn
Thanh thực đơn bao gồm các danh mục thể hiện đầy đủ các chức năng chương trình
của Epidata. Các danh mục trên thanh thực đơn của phần mềm như sau:

File Nhóm các chức năng New (tạo mới tệp .QES), open (mở tệp
.QES đã có sẵn) và Option (thiết lập các lưu chọn)

Check Chức năng Add/Advise (thêm ràng buộc số liệu)

Data In/out Chức năng vào/ra số liệu như lệnh nhập/xuất tệp số liệu, …

Document Chức năng hỗ trợ làm báo cáo như chức năng codebook (tạo
báo cáo giải thích ý nghĩa các trường và ý nghĩa của số liệu),
chức năng đếm bản ghi theo trường số liệu (count record), …

Tools Các chức năng tiện ích như QES file from REC file (sinh tệp
.qes từ tệp .rec), clear checks (loại bỏ ràng buộc nhập liệu), …

Help Sách điện tử hướng dẫn sử dụng phần mềm.

Thanh công cụ tiến trình 6 bước


Thanh công cụ tiến trình 6 bước nằm dưới thanh thực đơn. Trên thanh công cụ này có
6 nút lệnh thể hiện 6 bước của tiến trình làm việc với Epidata.

Sáu bước của tiến trình làm việc với Epidata gồm định nghĩa dữ liệu (1.Define Data),
tạo tệp dữ liệu (2.Make Data File), thiết lập các kiểm tra lỗi số liệu (3.Checks), nhập
dữ liệu (4.Enter Data), tạo các báo cáo mô tả dữ liệu (5. Document), xuất tệp số liệu
sang các định dạng khác (6. Export Data).
Thanh công cụ soạn thảo
Thanh công cụ soạn thảo chứa các nút lệnh gọi đến các chức năng liên quan đến soạn
thảo như mở tệp, ghi tệp, copy, cắt dán nội dung tệp .v.v.

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 28
3. Thiết lập tùy chọn chương trình
Epidata cho phép người sử dụng thiết lập một số thuộc tính của chương trình, chủ yếu
là các thuộc tính liên quan đến hiển thị của cửa sổ chương trình như phông chữ to nhỏ,
màu nền màu chữ, .v.v. Ngoài ra, Epidata cũng cho phép người sử dụng đặt giá trị
khởi đầu cho kiểu dữ liệu ID Automumber. Khi sử dụng Epidata, nhiều người sử dụng
muốn thay đổi hiển thị cửa sổ chương trình sao cho phông chữ màu nền, màu chữ và
các khoảng cách phù hợp hơn, dễ nhìn hơn với con mắt của mình. Trong một số
trường hợp, người sử dụng lại muốn thiết lập lại giá trị khởi đầu cho kiểu dữ liệu ID
Autonumber để đảm bảo các giá trị này ở các tệp dữ liệu được nhập vào trên các máy
tính khác nhau không có cặp giá trị dữ liệu nào trùng nhau (kiểu giữ liệu ID
Autonumber sẽ được giải thích rõ hơn ở bài học tiếp theo). Chức năng thiết lập tùy
chọn chương trình của Epidata sẽ cung cấp những tham số tùy chọn cho phép người sử
dụng thiết lập lại các thuộc tính của chương trình để thỏa mãn yêu cầu sử dụng. Để
thiết lập các tham số tùy chọn chương trình, chọn File, chọn Options trên thanh thực
đơn.

Hình 23: Khởi động chức năng thiết lập tham số tùy chọn chương trình

Các tham số tùy chọn của chương trình Epidata được đưa ra trên hộp thoại Options.
Hộp thoại này xuất hiện khi chức năng thiết lập tham số tùy chọn chương trình được
khởi động. Hình ảnh của hộp thoại như sau:

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 29
Hình 24: Hộ thoại Options

Hộp thoại Option có nhiều thẻ, mỗi thẻ là một nhóm các tham số tùy chọn chương
trình liên quan. Các nhóm tham số liên quan trên các thẻ như sau:

ƒ Editor: các tham số liên quan đến hiển thị màu nền màu chữ, phông chữ của cửa
sổ soạn thảo của chương trình.

ƒ Show data Mẫu biểu: các tham số tùy chọn liên quan đến hiển thị của Mẫu biểu
nhập liệu.

ƒ Document: các tham số liên quan đến hiển thị các báo cáo.

ƒ Advance: số đầu tiên trong trường ID Number, tham số về các thông báo của
chương trình.

ƒ File associations: các tham số xác định các loại tệp liên đới

Sau đây là hướng dẫn chi tiết về cách thiết lập các tham số tùy chọn chương trình.

Thiết lập tham số tùy chọn liên quan cửa sổ soạn thảo

Trên hộp thoại Options, chọn thẻ Editor, hình ảnh nội dung thẻ Editor như sau:

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 30
Tùy chọn
hiện tại

Chọn màu
nền

Chọn
phông chữ

Khoảng
cách TAB

Hình 25: Thẻ Editor


Các tham số tùy chọn chương trình liên quan đến chức năng soạn thảo được mặc định
trước, phông chữ mặc định là Courier New, cỡ chữ là 9 và màu nền trắng, số ký tự
trắng khi nhấn phím TAB trên bàn phím là 4. Người sử dụng có thể nhấn nút Select
font để thay đổi phông chữ, Background để đổi màu nền và thay giá trị trắng của phím
TAB là 4 bằng giá trị mong muốn (có thể xóa số 4 và nhập vào số 8 hoặc 10,…).

Ví dụ 1: Thiết lập các tham số tùy chọn để đổi phông chữ sang Arial, cỡ 16, màu chữ
màu đỏ và màu nền có màu xanh, các bước thực hiện như sau:

Bước 1: Chọn nút Select Font, sau đó hộp thoại Font được mở ra. Trên hộp thoại Font,
người sử dụng lần lượt đặt các tham số (1) Font là Arial, Font Style là Regular, Size là
16, Color là Red và nhấn nút Ok để kết thúc.

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 31
1 2 3 5

Hình 26: Hộp thoại Font


Bước 2: Chọn nút Background, chọn màu nền trong hộp thoại Color và nhấn OK kết
thúc.

2
Hình 27: Hộp thoại Color
Bước 3: Trên thẻ Editor nhập 8 thay giá trị 4 trong mục The TAB key insert bằng giá
trị 8 và chọn Ok để kết thúc. Để kiểm tra các tùy chọn được áp dụng như thế nào ở
chức năng soạn thảo của chương trình, ta có thể chọn Define Data và chọn New QES

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 32
và soạn thảo vài dòng văn bản bất kỳ. Hình ảnh sau minh họa cho kết quả của việc
thiết lập tham số.

Hình 28: Chức năng soạn thảo sau khi thiết lập lại tham số
Thiết lập các tham số tùy chọn liên quan đến hiển thị Mẫu biểu nhập liệu
Chọn thẻ Show data Mẫu biểu trên hộp thoại Options, để chuyển đến các tham số trên
thẻ Show data Mẫu biểu. Hình ảnh thẻ này như sau:

Chọn kiểu hiển thị


trường

Chọn khoảng cách


dòng trên Mẫu

Khoảng cách Tab


trong Mẫu biểu dữ

Màu hiển thị


trường

Hình 29: Thẻ Show data Mẫu biểu


Các tham số được đưa ra trên thẻ như sau:
ƒ Font and background colour: phông chữ và màu nền.

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 33
ƒ Field colour: màu hiển thị của trường số liệu trên Mẫu biểu nhập liệu.

ƒ Highlight active colour: màu hiển thị trường khi đang được chọn (kích hoạt).

ƒ Field Style: hiển thị trường nhập liệu dạng 3D (3D look), hoặc phẳng có đường
kẻ khung (flat with border), hoặc phẳng không có đường kẻ khung (flat without
border).

ƒ Line height: khoảng cách giữa các dòng trên Mẫu biểu nhập liệu.

ƒ Tab/Indents: khoảng cách giữa các thành phần trên Mẫu biểu nhập liệu.

Tương tự như cách thay đổi các các tham số tùy chọn liên quan đến chức năng soạn
thảo, người sử dụng có thể thay đổi các tham số này, sau đó chọn OK để kết thúc thiết
lập tham số.

Thiết lập tham số tùy chọn liên quan đến việc tạo tệp số liệu

Chọn thẻ Create data file trên hộp thoại Options để chuyển đến các tham số liên quan
đến việc tạo tệp số liệu. Các tham số liên quan đến tạo tệp số liệu như sau:

ƒ How to generate field names: tên trường được sinh ra khi tạo tệp số liệu là do
phần mềm tự động tạo ra hay ngầm định là từ đầu tiên của dòng khai báo
trường (trường số liệu và khai báo trường số liệu trong tệp QES được trình bày
trong các bài học tiếp theo). Nếu chọn tham số được thiết lập là “First word in
question is field name” thì tên trường sẽ là từ đầu tiên của dòng khai báo, và
nếu là “Automatic field names” thì tên trường sẽ được Epidata tự động tạo ra.

ƒ Letter case of field names: tham số mặc định tên trường được Epidata chuyển
sang chữ hoa (Upper-case), hoặc chữ thường (Lower-case), hoặc được giữ
nguyên (Leave as is) như được khai báo.

ƒ Update question to actual field name: mặc định 10 ký tự đầu tiên trong từ đầu
tiên của dòng khai báo trường số liệu được chọn làm tên trường nếu từ đầu tiên
đó dài hơn 10 ký tự.

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 34
Hình 30: Thẻ Create data file
Thiết lập tham số tùy chọn liên quan đến các báo cáo
Trên hộp thoại Options, chọn thẻ Documentation để chuyển đến các tham số liên quan
hiển thị nội dung các báo cáo thuộc danh mục các chức năng Document. Các tham số
tùy chọn được đưa ra trên thẻ này gồm tham số liên quan phông chữ và màu nền. Cách
thiết lập các tham số này tương tự như với thiết lập các tham số liên quan chức năng
soạn thảo (Editors).

Hình 31: Thẻ Documentation

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 35
Thiết lập tham số tùy chọn liên quan số đầu tiên của trường ID Number và các
thông báo.
Trên hộp thoại Options, chọn thẻ Advance để chuyển đến các tham số tùy chọn của thẻ
này. Để thiết lập tham số, người sử dụng lần lượt thay đổi các tham số trên hộp thoại
theo mong muốn và sau cùng nhấn Ok để kết thúc.

Số bắt đầu của số


được sinh tự động

Sử dụng thông báo


dạng âm thanh khi
nhâp liệu

Hiển thị thông báo


lỗi khi nhập sai số
liệ

Hình 32: Thẻ Advance


Thiết lập tham số tùy chọn liên quan đến các tệp liên đới
Chọn thẻ File Associations trên hộp thoại để chuyển đến các tham số liên quan tệp liên
đới. Các tệp liên đới là các tệp lưu kết quả làm việc với Epidata của người sử dụng.
Các tệp liên đới có thể gồm tệp .REC, .QES, .CHK, .LOG và .NOT. Việc thiết lập
tham số hết sức đơn giản, người sử dụng chỉ cần tích vào các loại tệp liên đới và sau
đó nhấn nút Associate file type để mặc định liên đới hoặc nhấn nút Remove
association để loại bỏ liên đới.

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 36
Chỉ định tệp .QES
là tệp liên đới

Chỉ định tệp .REC


là tệp liên đới

Chỉ định tệp .CHK


là tệp liên đới

Chỉ định tệp .NOT


là tệp liên đới

Chỉ định tệp .LOG


là tệp liên đới

Hình 33: Thẻ File Associations

4. Tệp liên đới


Tệp liên đới là các tệp Epidata được sinh ra và được sử dụng trong khi người sử dụng
làm việc với phần mềm. Có ba loại tệp liên đới quan trọng như sau:
ƒ Tệp .QES (QUESTIONAIRE): được Epidata sử dụng để lưu trữ các dòng khai
báo bộ câu hỏi. Một bộ câu hỏi có nhiều câu hỏi và nhiều đáp án. Việc người sử
dụng viết lại các câu hỏi và đáp án vào trong tệp .QES, theo quy tắc do Epidata
quy định, để sau đó làm cơ sở cho Epidata sinh ra tệp .REC theo mong muốn
của người sử dụng, được gọi là khai báo bộ câu hỏi.
ƒ Tệp .REC (RECORD): chứa số liệu do người nhập liệu nhập số liệu từ các bộ
câu hỏi vào Mẫu biểu nhập liệu. Tệp .REC được sinh ra trên cơ sở nội dung của
tệp .QES. Tệp .REC là cơ sở để Epidata tạo ra Mẫu biểu nhập số liệu khi nhập
số liệu.
ƒ Tệp .CHK (CHECK): chứa các dòng lệnh khai báo các ràng buộc số liệu nhằm
hạn chế lỗi trong khi nhập số liệu.

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 37
Ngoài các tệp trên, tệp .NOT và tệp .LOG cũng là những tệp liên đới. Các tệp này lưu
lại ghi chú và thông tin về phiên làm việc của người sử dụng như thông báo lỗi của
việc sinh tệp .REC từ tệp .QES, …
Sơ đồ sau là mô tả tổng quát cho thấy nội dung của các tệp QES, REC, CHK và mối
liên quan giữa chúng với bộ câu hỏi.

Phiếu điều tra

Khai báo | Mẫu phiếu Thiết lập | Ràng buộc


Nhập | Số liệu

Sinh ra Gắn kết

Tệp QES Tệp REC Tệp CHK

Hình 34: Phiếu điều tra và các tệp liên đới


Khi tạo Mẫu biểu nhập liệu, các câu hỏi (cấu trúc phiếu hay mẫu phiếu) được khai báo
vào trong một tệp QES. Tệp REC được sinh ra từ tệp QES. Khi nhập số liệu vào máy
tính thì số liệu (thông tin trên bộ câu hỏi) được lưu vào trong tệp REC. Tệp CHK chứa
các dòng lệnh được lập trình để thiết lập các ràng buộc số liệu nhằm hạn chế lỗi số
liệu. Tệp CHK luôn được gắn kèm với một tệp REC tương ứng. Nếu liên kết tệp REC
với tệp CHK bị hủy bỏ thì không còn khả năng phát hiện lỗi số liệu và thông báo cho
người nhập liệu trong khi nhập số liệu.

Câu hỏi lượng giá


1. Vì sao phải tải chương trình cài đặt Epidata từ trên mạng và cài vào máy tính?
2. Nêu các bước tải chương trình cài đặt phần mềm Epidata từ internet và cài đặt
Epidata?

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 38
3. Làm thế nào để khởi động chương trình Epidata sau khi đã cài đặt?
4. Thanh thực đơn chương trình và thanh công cụ của Epidata có những mục nào
và các mục đó có ý nghĩa gì?
5. Vì sao cần đặt các tùy chọn cho Epidata, có những tùy chọn nào chúng ta có thể
đặt?
6. Ý nghĩa của các tham số tùy chọn là gì và thiết lập chúng như thế nào ?
7. Liệt kê các tệp liên đới của Epidata và nêu ý nghĩa của mỗi loại tệp liên đới.

[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA 39
BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU
Bài học này cung cấp những kỹ thuật quan trọng trong việc tạo cơ sở dữ liệu và công
cụ nhập liệu với phần mềm Epidata. Hai kỹ thuật đó là khai báo bộ câu hỏi và thiết
lập các ràng buộc số liệu nhằm hạn chế lỗi số liệu. Ngoài ra, nội dung bài học cũng
cung cấp thông tin về các loại lỗi số liệu thường gặp và phương pháp hạn chế các loại
lỗi này. Bài học được bắt đầu bằng yêu cầu tạo cơ sở dữ liệu và công cụ nhập liệu cho
một bộ câu hỏi, được xem như là một tình huống thực tế nhằm giúp cho người học tiếp
cận dế dàng hơn với các kỹ thuật này.

1. Khai báo bộ câu hỏi


Khai báo bộ câu hỏi là viết lại cấu trúc bộ câu hỏi trong tệp QES theo quy tắc của
chương trình Epidata. Để có thể khai báo bộ câu hỏi với Epidata, người sử dụng cần
xác định được những thông tin cần lưu tương ứng với mỗi câu hỏi và những trường số
liệu nào cần được tạo ra để lưu những thông tin đó. Với mỗi trường số liệu, người sử
dụng phải đặt tên, xác định kiểu, định dạng và độ rộng cho trường số liệu đó. Người sử
dụng cũng cần nắm được cách viết một dòng khai báo trường số liệu theo quy tắc của
Epidata gọi là cú pháp khai báo trường dữ liệu. Khi hoàn tất bước này, các trường dữ
liệu trong cơ sở dữ liệu (hoặc tệp số liệu) đã được khai báo hoặc được định nghĩa.
Chúng ta bắt đầu công việc với tình huống được yếu cầu sử dụng phần mềm Epidata
tạo công cụ nhập liệu cho bộ câu hỏi của nghiên cứu cúm gia cầm với nội dung như
sau:
/*____________________________________________________________*/
PHỎNG VẤN KIẾN THỨC – THÁI ĐỘ - THỰC HÀNH
PHÒNG CHỐNG CÚM GIA CẦM
(Phần thông tin chung)
Ngày phỏng vấn:_____/____/2006
Họ tên người được phỏng vấn:…………….............
Tên chủ hộ: ……………........................
SG1. Giới (không hỏi, quan sát rồi ghi lại) 1. Nữ 2. Nam
SG2. Anh/chị bao nhiêu tuổi? .............................................
SG3. Tình trạng hôn nhân của anh/chị?

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 40
1. Độc thân (chưa bao giờ lập gia đình) 2. Có gia đình
3. Li dị/Li thân 4. Goá
SG4. Nơi ở hiện tại của anh/chị?
1. Nông thôn 2. Thành thị
SG5. Trình độ học vấn cao nhất mà anh/chị đạt được?
1. Không đi học/mù chữ 2. Biết đọc, biết viết
3. Cấp I 4. Cấp II
5. Cấp III 6. Trung cấp
7. Cao đẳng/Đại học 8. Trên Đại học
SG6. Nghề nghiệp hiện tại của anh/chị:
01. Về hưu 02. Không có việc làm/thất nghiệp
03. Sinh viên đại học 04. Nội trợ
05. Có một nghề nào đó 06. Nhân viên văn phòng
07. Nhân viên bán hàng/dịch vụ 08. Làm nông nghiệp/chăn nuôi/làm vườn
09. Thợ thủ công 10. Kỹ thuật viên/điều khiển máy móc
11. Người quản lý 12. Khác (ghi rõ) ..................................
SG7. Anh/chị có đi đâu ra khỏi địa bàn xã nơi đang sinh sống trong vòng một tháng
qua không?
1. Có
2. Không ___________________________________ Chuyển câu SG7c.
SG7b. Nếu có, anh/chị đi đâu, ghi rõ: ............................................................................
SG7c. Lần cuối cùng anh/chị đi ra khỏi địa bàn xã cách đây bao lâu? ........................
ngày (qui đổi theo ngày)
SG7d. Mức độ thường xuyên anh/chị đi lại giữa các xã như thế nào?
1. Hàng ngày 2. Hai, ba lần một tuần
3. Một tuần một lần 4. Ít hơn 3 lần trong hai tuần
5. Hàng tháng 6. Vài tháng một lần
7. Một, hai lần một năm 8. Ít hơn một lần trong năm/không lần nào

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 41
SG7e. Anh/chị có thường đi lại giữa các tỉnh, thành phố, hay nước ngoài không?
1. Có -> Bao nhiêu lần/tháng ....................................................................
2. Không
SG8. Thu nhập bình quân của gia đình anh/chị trong một háng là bao nhiêu tiền:
...................... nghìn đồng
SG9. Anh/chị có hút thuốc lá, thuốc lào không?
1. Chưa bao giờ hút 2. Đã từng hút 3. Hiện đang hút
/*_____________________________________________________________*/

Bộ câu hỏi trên được trích ra từ bộ câu hỏi của nghiên cứu cúm gia cầm của trường
Đại học Y tế công cộng tiến hành năm 2006. Công việc khai báo bộ câu hỏi trên (tạo
tệp QES) với phần mềm Epidata gồm các bước khai báo trường (biến) trong tệp QES,
ghi tệp QES, sinh ra tệp REC từ tệp QES và chạy Mẫu biểu nhập liệu.
Tạo tệp QES
Để tạo tệp QES, trên cửa sổ chương trình Epidata đang mở, chọn 1.Define data và
chọn New .QES file trên thanh công cụ.

Hình 35: Tạo tệp QES mới


Tệp QES mới tạo luôn được chương trình đặt cho một cái tên mặc định như là Untitled
1, Untitled 2, ... Việc tiếp theo của người sử dụng viết khai báo trường số liệu và ghi
tệp bằng một cái tên nào đó.

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 42
Hình 36: Cửa sổ soạn thảo tệp QES
Để có thể viết khai báo trường số liệu, người sử dụng cần nắm được quy tắc viết khai
báo. Tên trường, nhãn và kiểu dữ liệu của các trường số liệu sẽ được thể hiện tronbg
dòng khai báo. Tên trường có thể được mặc định là từ đầu tiên hoặc mười ký tự của từ
đầu tiên của dòng khai báo tùy theo giá trị mặc định của tham số tùy chọn liên quan
đến sinh tệp số liệu.
Ví dụ 1: Khai báo trường số liệu cho thông tin “Ngày phỏng vấn”
“Ngày phỏng vấn” là dạng số liệu ngày tháng nên các thuộc tính của trường có thể xác
định như sau:
ƒ Tên trường: I1
ƒ Nhãn: Ngay phong van
ƒ Kiểu: Date
ƒ Định dạng: <dd/mm/yyyy> (định dạng ngày đứng đầu có hai chữ số, tiếp theo
là tháng có hai chữ số và năm có bốn chữ số, được ngăn cách nhau bởi dấu “/”)

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 43
Từ những xác định ở trên, ta có thể viết dòng khai báo trường ngày phỏng vấn như
sau:

I1 Ngay phong van <dd/mm/yyyy> (ngay/thang/nam)

Tên biến Nhãn biến Chuỗi định dạng Chú thích

Ví dụ 2: Khai báo trường số liệu cho thông tin “Họ tên người được phỏng vấn”
“Họ tên người được phỏng vấn” là dạng số liệu văn bản (text), các thuộc tính của
trường có thể xác định như sau:
ƒ Tên trường: I2
ƒ Nhãn: Ho ten nguoi duoc phong van
ƒ Kiểu: Text
ƒ Định dạng: ___________________________ (độ rộng của trường này bằng số
ký tự “_“ trong chuỗi định dạng)
Dòng khai báo trường tên người được phỏng vấn như sau:

I2 Ho ten nguoi duoc phong van __________________________

Tên biến Nhãn biến Chuỗi định dạng

Ví dụ 3: Khai báo trường số liệu cho thông tin “Giới tính”


“Giới tính” là số liệu dạng số, các thuộc tính của trường có thể xác định như sau:
ƒ Tên trường: SG1
ƒ Nhãn: Gioi tinh
ƒ Kiểu: Numeric
ƒ Định dạng: # (độ rộng của trường bằng 1 ký tự tương ứng với một dấu # trong
chuỗi định dạng)
Dòng khai báo trường này viết như sau:

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 44
SG1 Gioi tinh # (1.Nam / 2.Nu)

Tên biến Nhãn Chuỗi định dạng Chú thích

Ví dụ 4: Khai báo trường số liệu câu hỏi SG7 - Anh/chị có đi đâu ra khỏi địa bàn xã
nơi đang sinh sống trong vòng một tháng qua không?
Trường này là số liệu dạng logic với hai giá trị (có, không) nên có thể áp dụng dạng số
với hai giá trị 1 (có) và 2 (không). Tuy nhiên, để minh họa cho kiểu Boolean, trong ví
dụ này, trường sẽ được khai báo kiểu Boolean
ƒ Tên trường: SG7
ƒ Nhãn: Anh/chi co di dau ra khoi dia ban xo noi dang sinh song trong vung mot
thong qua khong?
ƒ Kiểu: Boolean
ƒ Định dạng: <Y>
Dòng khai báo trường này như sau:

SG7 Anh/chi co di dau ra khoi dia ban xo noi dang sinh song trong vung mot
thong qua khong? <Y> (Y- có, N - không)

Tên biến Nhãn Chuỗi định dạng Chú thích

Ví dụ 5: Khai báo trường số liệu câu hỏi SG8 - Thu nhập bình quân của gia đình
anh/chị trong một tháng là bao nhiêu tiền: ...................... nghìn đồng
Số liệu của trường này là dạng số (Numeric). Giả sử thu nhập bình quân tháng của hộ
gia đình cần nhập chính xác đến đơn vị trăm đồng và thu nhập bình quân tháng cao
nhất là 1 tỷ đồng, thì có thể xác định các thuộc tính cho trường như sau:
ƒ Tên trường: SG8

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 45
ƒ Nhãn: Thu nhap binh quan cua gia dinh anh/chi trong mot thang la bao nhieu
tien: ...................... nghin dong
ƒ Kiểu: Numeric
ƒ Định dạng: #######.# (giá trị của trường có thể có đến 7 chữ số trước dấu thập
phân và có một chữ số sau dấu thập phân thể hiện giá đến trăm đồng)
Dòng khai báo trường này như sau:

SG8 Thu nhap binh quan cua gia dinh anh/chi trong mot thang la bao nhieu tien:
#######.# . nghin dong

Tên biến Chuỗi định dạng Chú thích Nhãn

Với bộ câu hỏi nghiên cứu cúm gia cầm, nội dung tệp QES khai báo như sau:

/*____________________________________________________________*/
***********************************************************************************************
KIEN THUC - THAI DO - THUC HANH CUA NGUOI DAN VE MUA BAN GIA CAM
(Thong tin chung)
-----------------&&&-----------------

id Ma so tu dong <IDNUM>
c Ma so __________
i1 Ngay phong van: <dd/mm/yyyy> (ngay/thang/nam)
i2 Ho ten nguoi duoc phong van: ___________________________
i3 Ten chu ho: ___________________________
sg1 Gioi (khong hoi, quan sat roi ghi lai) : # (1. Nu/2. Nam)
sg2 Anh/chi bao nhieu tuoi? ##

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 46
sg2d (ghi tuoi duong lich cu the): ___________________________
sg3 Tinh trang hon nhan cua anh/chi? #
1. Doc than
2. Co gia dinh
3. Li di/Li than
4. Goa
sg4 Noi o hien tai cua anh/chi? #
1. Nong thon
2. Thanh thi
sg5 Trinh do hoc van cao nhat ma anh/chi dat duoc? #
1. Khong di hoc/mu chu/
2. Biet doc, biet viet/
3. Cap I
4. Cap II
5. Cap III
6. Trung cap
7. Cao dang/Dai ho
8. Tren Dai hoc
sg6 Nghe nghiep hien tai cua anh/chi: ##
1. Ve huu
2.that nghiep
3. Sinh vien dai hoc
4. Noi tro
5. Co mot nghe nao do
6. Nhan vien van phong
7. Nhan vien ban hang/dich vu
8. Lam nong nghiep
9. Tho thu cong

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 47
10. Ky thuat vien/dieu khien may moc
11. Nguoi quan ly
12. Khac
sg6d (ghi ro nghe nghiep) ___________________________________________
sg7 Anh/chi co di dau ra khoi dia ban xa noi dang sinh song trong vong mot thang#
1. Co
2. Khong
sg7b Neu co, anh/chi di dau, ghi ro: ___________________________________
sg7c Lan cuoi cung anh/chi di ra khoi dia ban xa cach day bao lau? ### ngay
sg7d Muc do thuong xuyen anh/chi di lai giua cac xa nhu the nao? #
1. Hang ngay
2. Hai, ba lan mot tuan
3. Mot tuan mot lan
4. It hon 3 lan hai tuan
5. Hang thang
6. Vai thang mot lan
7. Mot, hai lan mot nam
8. It hon mot lan nam/khong lan nao
sg7e Anh/chi co thuong di lai giua cac tinh, thanh pho, hay nuoc ngoai khong? <Y>
1. Co
2. Khong
sg7ed Co-> Bao nhieu lan/thang: ###
sg8 Thu nhap binh quan cua gia dinh anh/chi trong mot thang la bao nhieu tien
#######.# nghin dong
sg9 Anh/chi co hut thuoc la, thuoc lao khong? #
1. Chua bao gio hut
2. Da tung hut
3. Hien dang hut

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 48
**********************************************************************************************

/*____________________________________________________________*/

Hình 37: Cửa sổ soạn thảo tệp QES của nghiên cứu cúm gia cầm
Ghi tệp QES
Sau khi soạn thảo nội dung tệp QES, người sử dụng cần ghi tệp để kết thúc việc khai
báo. Để ghi tệp, ta chọn biểu tượng Save trên thanh công cụ hoặc chọn File, chọn Save
trên thanh thực đơn.

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 49
Nút lệnh Save được nhấn sẽ mở hộp thoại Save As. Trên hộp thoại Save As, người sử
dụng phải nhập tên tệp vào mục File name, chọn nơi chứa tệp ở mục Save in, chọn
kiểu tệp là .qes ở mục Save as type và chọn nút Save để ghi tệp.

Hình 38: Hộp thoại Save As


Chú ý: Để mở một tệp QES đã tồn tại, ta có thể chọn File và chọn Open hoặc chọn
1.Define Data và chọn Open QES file, sau đó chỉ ra tệp QES và chọn Open trên hộp
thoại Open để mở tệp.
Sinh tệp REC từ tệp QES
Chưa có tệp REC thì người sử dụng vẫn chưa có tệp chứa số liệu để bắt đầu công việc
nhập liệu. Để sinh ra tệp REC từ một tệp QES, ta chọn “2. Make data file” trên thanh
công cụ và chọn “Make data file”, hộp thoại tạo tệp số liệu xuất hiện như sau:

Hình 39: Hộp thoại tạo tệp số liệu REC

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 50
Hộp thoại có hai mục “Name of .QES file” và “Name of data file”. Ta có thể nhấn nút
để chọn tệp QES và nhập tên tệp REC vào mục “Name of data file”, chọn OK để
kết thúc tạo tệp REC.

Chạy thử Mẫu biểu nhập liệu

Khi đã tạo ra được tệp REC, người sử dụng có thể nhập số liệu vào tệp để kiểm tra
xem Mẫu biểu nhập liệu được tạo đã đúng như mong muốn chưa. Nếu các trường được
sinh ra trong tệp REC vẫn chưa được như mong đợi thì có thể sửa lại các khai báo
trong tệp QES và tạo lại tệp REC từ tệp QES đã chỉnh sửa. Để nhập số liệu, ta chọn
nút lệnh “4.Enter Data”.

Hình 40: Hộp thoại Open

Hộp thoại Open xuất hiện khi “4.Enter Data” được chọn. Trên hộp thoại này, người sử
dụng có thể sử dụng mục “Look in” để chọn thư mục chứa tệp REC cần mở và chọn
tệp REC cần mở. Khi tên tệp REC đã xuất hiện trong mục “File name“, chọn nút lệnh
Open để mở Mẫu biểu nhập số liệu. Sau đây là hình ảnh của Mẫu biểu nhập liệu của
bộ câu hỏi nghiên cứu cúm gia cầm.

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 51
Hình 41: Mẫu biểu nhập liệu của bộ câu hỏi nghiên cứu cúm gia cầm
Khai báo bộ câu hỏi là bước quan trọng, vì thế, các dòng khai báo cần được thực hiện
chính xác. Mẫu biểu nhập liệu được sinh ra sau khi khai báo bộ câu hỏi phải đảm bảo
tên trường, kiểu dữ liệu được tạo ra đáp ứng được cho nhập và lưu số liệu.

2. Hạn chế lỗi số liệu


Trong cơ sở dữ liệu thường tồn tại số liệu không hợp lệ và số liệu có sai số, dường như
không thể có một cơ sở dữ liệu sạch tuyệt đối. Những nỗ lực của người sử dụng cũng
chỉ làm giảm hoặc giảm số liệu không sạch đó trong cơ sở dữ liệu đến một mức độ tối
thiểu có thể chấp nhận được.
2.1 Lỗi số liệu
Số liệu lỗi có thể được sinh ra trong tất cả các công đoạn từ khâu thu thập số liệu cho
đến nhập số liệu. Sau đây là các loại lỗi số liệu thường gặp:
ƒ Lỗi phỏng vấn: là lỗi do người phỏng vấn đặt thực hiện phỏng vấn sai trình
tự của các câu hỏi. Điều này thường xảy ra do sơ xuất ở khâu xây dựng bộ câu
hỏi, hoặc do nhóm thu thập số liệu không được đào tạo tốt.

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 52
ƒ Lỗi mã hóa: đôi khi dữ liệu sau khi thu thập cần được mã hóa lại thành các
nhóm theo tiêu chí nào đó, lỗi dữ liệu có thể xuất hiện trong công đoạn này
và được gọi là lỗi mã hóa. Lỗi mã hóa có thể được giảm thiểu bằng cách sử
dụng một kiểu mã hóa hoặc một chiến lược mã hóa thống nhất.
ƒ Lỗi chuyển vị: thường là các lỗi phát sinh do đánh máy sai thứ tự phím hoặc lỗi
của bàn phím. Ví dụ số 39 lại bị nhầm thành 93.
ƒ Lỗi nhầm ký tự: cũng là một dạng lỗi đánh máy, ví dụ nhập nhầm số 1
thành số 7, hoặc chữ cái O thành số 0.
ƒ Lỗi ràng buộc thông tin: là lỗi khi có hai hoặc nhiều câu trả lời mang thông
tin trái ngược nhau và vi phạm tính nhất quán của thông tin. Ví dụ thông tin
một người có giới tính là nữ và bị ung thư tuyến tiền liệt.
ƒ Lỗi giới hạn giá trị: lỗi này xảy ra khi các thông tin nằm ngoài khoảng giới hạn
đúng cho phép. Ví dụ trường hợp bà mẹ 30 tuổi, còn đứa con 28 tuổi.
2.2 Phát hiện lỗi dữ liệu
Khi tạo ra các bộ số liệu, người ta luôn phải thực hiện công việc phát hiện lỗi số liệu
và sửa lỗi trước khi sử dụng ở các công đoạn tiếp theo. Có bốn cách để phát hiện số
liệu lỗi:
ƒ Kiểm tra thủ công: có thể chọn ra một số phiếu đã được điền thông tin từ các
cuộc phỏng vấn và thực hiện phỏng vấn lại đối tượng đã cung cấp thông tin đó.
Cách này thường được sử dụng trong thực tế thông qua giám sát và thu thập số liệu.
ƒ Kiểm tra trong quá trình nhập dữ liệu (kiểm tra sự tương tác): người sử
dụng có thể sử dụng các chức năng hỗ trợ của phần mềm để kiểm tra và sửa lỗi
số liệu ngay trong khi nhập số liệu. Cách này rất hiệu quả với các lỗi nhầm ký
tự, ràng buộc thông tin, giới hạn giá trị và lỗi phỏng vấn.
ƒ Kiểm tra lỗi số liệu sau khi nhập số liệu: số liệu sau khi được nhập cần được
kiểm tra lỗi một lần nữa trước khi chuyển sang công đoạn tiếp theo. Việc kiểm tra
số liệu sau nhập được thực hiện nhờ hỗ trợ của phần mềm.
ƒ So sánh dữ liệu: số liệu có thể được nhập hai lần để tạo ra hai bộ số liệu. Khi
kết thúc nhập liệu, số liệu của hai lần nhập được đem ra so sánh với nhau để
đảm bảo tính nhất quán của quá trình nhập liệu. Cách kiểm tra này nhằm phát
hiện lỗi chuyển vị và lỗi nhầm phím.

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 53
2.3 Kiểm tra lỗi dữ liệu
Khi xây dựng cơ sở dữ liệu, việc chọn kiểu dữ liệu nào trong các kiểu số liệu
(Numeric, Text hay Boolean …) cho một trường số liệu cũng góp phần làm giảm số
liệu lỗi. Ví dụ trường số thứ tự có dạng 1, 2, 3, ….10, 11, ... , khi được khai báo là kiểu
Numeric sẽ hạn chế được số liệu lỗi do nhập nhầm phím ký tự số 0 và phím chữ o.
Ngoài ra, những người phát triển công cụ nhập số liệu cũng có thể thiết lập các ràng
buộc số liệu nhằm hạn chế số liệu lỗi trong khi nhập số liệu. Các ràng buộc có thế
được thiết lập cho các trường số liệu gồm:
ƒ Must – enter Variables (trường bắt buộc phải nhập giá trị): một trường
được thiết lập thuộc tính Must – enter thì khi có nghĩa là giá trị của nó phải
được nhập (không được để trống), nếu số liệu không được nhập vào phần mềm
sẽ không chuyển sang trường khác để tiếp tục nhập.
ƒ Legal values (số liệu được chỉ định trước): một biến được xác định trước
danh mục các giá trị số liệu thì số liệu được nhập vào cho nó chỉ có thể là một
trong các giá trị thuộc danh mục đó.
ƒ Range checks (kiểm tra miền dữ liệu – giới hạn dữ liệu): một biến được chỉ
định miền giới hạn số liệu thì giá trị số liệu nhập vào phải nằm trong miền giới
hạn đó. Ví dụ khi miền số liệu được chỉ định là từ 1 đến 10 thì không cho nhập
giá trị 0, 11, 12, .v.v.
ƒ Repeat Variables (trường lặp): trường được chỉ định là lặp giá trị thì giá trị số
liệu của bản ghi ở lần nhập cuối cùng cho trường sẽ được nhớ và mặc định cho
trường khi nhập bản ghi ở lần tiếp theo.
ƒ Conditional jumps (nhảy có điều kiện) : trường được thiết lập điều kiện nhảy
khi số liệu nhập vào thỏa mãn điều kiện nhảy, một bước nhảy bỏ qua nhập số
liệu của một số trường nào đó sẽ được thực hiện. Ví dụ trường hợp câu SG7
trong bộ câu hỏi của nghiên cứu cúm gia cầm. Nếu giá trị nhập cho câu hỏi này
là “2- không” (không đi đâu ra khỏi địa bàn trong một tháng) thì nhảy đến câu
SG7c, bỏ qua câu SG7b. Thiết lập điều kiện nhảy sẽ đáp ứng được yêu cầu này.
ƒ Programmed checks (kiểm tra bằng mã chương trình): số liệu có thể được
kiểm tra lỗi nhờ những đoạn mã được lập trình khi phát triển công cụ nhập số
liệu. Phần mềm Epidata cũng hỗ trợ cấu trúc lệnh lập trình đơn giản, cho phép

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 54
người sử dụng viết những đoạn mã chương trình để thực hiện các kiểm tra số
liệu.

Thiết lập các ràng buộc số liệu cho biến nhằm hạn chế số liệu lỗi ngay trong khi nhập
số liệu còn được gọi là kiểm tra tương tác và là một cách làm hiệu quả trong việc hạn
chế số liệu lỗi.

3. Thiết lập ràng buộc số liệu với phần mềm Epidata

Epidata có chức năng checks cho phép thực hiện kiểm tra phát hiện số liệu lỗi trong khi
nhập liệu. Các bước thiết lập ràng buộc số liệu bao gồm mở tệp REC, đặt ràng buộc,
ghi lại, đóng cửa sổ checks.

Mở tệp REC

Các bước mở tệp REC thực hiện như sau:

Bước 1: chọn 3.Checks trên thanh công cụ tiến trình sáu bước. Sau đó hộp thoại
“Select data file for checks” sẽ xuất hiện yêu cầu người sử dụng chọn tệp.

Hình 42: Hộp thoại “Select data file for checks”

Bước 2: trên hộp thoại “Select data file for checks”, chọn thư mục chứa tệp REC ở mục
Look in, chọn tệp REC sao cho tên tệp xuất hiện trong mục File name và chọn Open.
Tệp REC được mở sẵn sàng để thiết lập ràng buộc số liệu có hình ảnh như sau:

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 55
Hình 43: Tệp REC được mở ở chế độ check
Thiết ràng buộc số liệu
Trên cửa sổ chương trình có một hộp thoại nhỏ. Hộp thoại này là công cụ cho phép
thiết lập các thuộc tính và ràng buộc số liệu cho trường (biến), là thành phần mà người
sử dụng cần phải nắm được cách làm việc với nó.

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 56
Hình 44: Hộp thoại thiết lập ràng buộc số liệu
Để có thể thiết lập các ràng buộc số liệu sử dụng hộp thoại trên, người sử dụng cần
hiểu được ý nghĩa của các thành phần trên hộp thoại. Ý nghĩa các thành phần trên hộp
thoại đối với việc thiết lập các ràng buộc số liệu như sau:

Cho phép chọn trường để thiết lập ràng buộc số


liệu.

Cho phép chỉ ra danh mục các giá trị số liệu hoặc
miền số liệu. Ví dụ : đặt Range, Legal là 1- 9 thì
các giá trị nhập vào chỉ nằm từ 1 đến 9.

Cho phép thiết lập lệnh nhảy.


Ví dụ: Với trường sg7e trên Mẫu biểu nhập thông
tin nghiên cứu cúm gia cầm viết là:
N> sg8 – nghĩa là nếu giá trị nhập vào là N thì bỏ
qua trường sg7ed và nhảy đến sg8.
N>WRITE – nghĩa là nếu giá trị nhập vào là N sẽ
thực hiện ghi bản ghi.

Cho phép thiết lập thuộc tính bắt buộc nhập giá trị
Yes – Bắt buộc phải nhập giá trị
No - Không bắt buộc

Cho phép thiết lập thuộc tính lặp giá trị


Yes – Tự động điền giá trị cho trường là giá tương
ứng của bản ghi vừa nhập trước đó.
No - Không tự động điền giá trị

Cho phép khai báo chú thích cho các giá trị số
liệu.

Để đảm bảo các ràng buộc số liệu được thiết lập đúng theo thiết kế của bộ câu hỏi,
người sử dụng cần kiểm tra rà soát trên từng câu hỏi để xác định được các ràng buộc
số liệu cho từng trường số liệu tương ứng. Chẳng hạn, với bộ câu hỏi nghiên cứu cúm
gia cầm, các ràng buộc số liệu có thể xác định cho các trường như trong bảng sau:

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 57
c Must enter: Yes (phải nhập giá trị)

i1 Ngay phong van: Must enter: Yes (phải nhập giá trị)
Repeat: Yes (lặp lại giá trị nhập lần trước
đó)

i2 Ho ten nguoi duoc phong Must enter: Yes (phải nhập giá trị)
van:

i3 Ten chu ho: Must enter: Yes (phải nhập giá trị)

sg1 Gioi (khong hoi, quan sat roi Must enter: Yes (phải nhập giá trị)
ghi lai) : Range/Legal: 1,2 (giá trị nhập vào là 1 hoặc
2)

sg2 Anh/chi bao nhieu tuoi? Must enter: Yes (phải nhập giá trị)

sg3 Tinh trang hon nhan cua Must enter: Yes (phải nhập giá trị)
anh/chi? Range/Legal: 1-4 (giá trị nằm trong các giá
1. Doc than trị 1 đến 4)
2. Co gia dinh Value label: marriedstatus (tạo nhãn dữ liệu
3. Li di/Li than có tên là marriedstatus để chứa ý nghĩa của
các giá trị)

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 58
4. Goa

sg4 Noi o hien tai cua anh/chi? Must enter: Yes (phải nhập giá trị)
1. Nong thon Range/Legal: 1,2 (giá trị nhập vào là 1 hoặc
2. Thanh thi 2)

sg5 Trinh do hoc van cao nhat ma Must enter: Yes (phải nhập giá trị)
anh/chi dat duoc? Range/Legal: 1-8 (giá trị nằm trong các giá
1. Khong di hoc/mu chu/ trị 1 đến 8)
2. Biet doc, biet viet/ Value label: education (tạo nhãn dữ liệu có
3. Cap I tên là education để chứa ý nghĩa của các giá
trị)
4. Cap II
5. Cap III
6. Trung cap
7. Cao dang/Dai ho
8. Tren Dai hoc

sg6 Nghe nghiep hien tai cua Must enter: Yes (phải nhập giá trị)
anh/chi: Range/Legal: 1-12 (giá trị nằm trong các giá
1. Ve huu trị 1 đến 12)
2.that nghiep Value label: occupation (tạo nhãn dữ liệu có
3. Sinh vien dai hoc tên là occupation để chứa ý nghĩa của các giá
trị)
4. Noi tro
5. Co mot nghe nao do
6. Nhan vien van phong
7. Nhan vien ban hang/dich
vu
8. Lam nong nghiep

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 59
9. Tho thu cong
10. Ky thuat vien/dieu khien
may moc
11. Nguoi quan ly
12. Khac

sg7 Anh/chi co di dau ra khoi dia Must enter: Yes (phải nhập giá trị)
ban xa noi dang sinh song trong Range/Legal: 1,2 (giá trị nhập vào phải là 1
vong mot thang hoặc 2)
1. Co Jumps: 2>sg7c (nhảy đến biến sg7c bỏ qua
2. Khong không nhập biến sg7b, nếu giá trị nhập vào
là 2)

sg7d Muc do thuong xuyen anh/chi Must enter: Yes (phải nhập giá trị)
di lai giua cac xa nhu the nao? Range/Legal: 1-8 (giá trị nằm trong các giá
1. Hang ngay trị 1 đến 8)
2. Hai, ba lan mot tuan Value label: moving (tạo nhãn dữ liệu có tên
3. Mot tuan mot lan là moving để chứa ý nghĩa của các giá trị)

4. It hon 3 lan hai tuan


5. Hang thang
6. Vai thang mot lan
7. Mot, hai lan mot nam
8. It hon mot lan nam/khong
lan nao

sg7e Anh/chi co thuong di lai giua Must enter: Yes (phải nhập giá trị)
cac tinh, thanh pho, hay nuoc ngoai Jumps: N>sg8 (nhảy đến biến sg8 bỏ qua
khong? không nhập biến sg7ed, nếu giá trị nhập vào
1. Co là N)
2. Khong

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 60
sg9 Anh/chi co hut thuoc la, thuoc Must enter: Yes (phải nhập giá trị)
lao khong? Range/Legal: 1-3 (giá trị nằm trong các giá
1. Chua bao gio hut trị 1 đến 3)
2. Da tung hut Value label: smoking (tạo nhãn dữ liệu có
3. Hien dang hut tên là smoking để chứa ý nghĩa của các giá
trị)

Sau khi các ràng buộc của các trường dữ liệu (biến dữ liệu) được xác định, việc tiếp
theo là sử dụng Epidata thiết lập các ràng buộc cho các trường số liệu. Việc sử dụng
Epidata để thiết lập ràng buộc số liệu rất đơn giản, các ví dụ sau đây sẽ minh họa cách
thiết lập các ràng buộc số liệu.
Ví dụ 1: thiết lập ràng buộc cho biến i1 – ngày phỏng vấn
Trên hộp thoại tham số ràng buộc, mục chọn tên biến, kích nút , chọn biến i1, tiếp
theo chọn Must enter là Yes và Repeat là Yes và chọn Save.

Ví dụ 2: đặt tham số cho biến sg3 – tình trạng hôn nhân


Chọn biến sg3, chọn giá trị cho Yes ở ô Must enter nhập giá trị 1-4 vào ô Range,
Legal, chọn Save. Hình ảnh hộp thoại tham số sau khi chọn như sau:

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 61
Trường SG3 có bốn giá trị số liệu 1, 2, 3, 4 được chấp nhận. Để có thể giúp cho người
nhập liệu có thể xem được chú thích về ý nghĩa của các giá trị này, chú thích giá trị số
liệu (gọi là nhãn số) cần được thiết lập cho trường này. Để thực hiện công việc này,
người sử dụng phải chọn nút trên hộp thoại, viết dòng chú thích theo quy luật của
Epidta vào hộp thoại Edit value labels và chọn accept and close để kết thúc.

Khai báo nhãn giá trị dữ liệu vào đây

Hình 45: Hộp thoại Edit value labels


Đoạn mã khai báo nhãn số liệu cho sg3 được viết như trong hình sau:

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 62
Hình 46: Đoạn mã thiết lập nhãn số liệu
Ví dụ 3: thiết lập ràng buộc dữ liệu cho biến sg7 – anh/chị có đi đâu ra khỏi địa bàn xã
trong vòng một tháng không?
Chọn biến sg7, đặt Must enter là Yes, Range/Legal là “1,2” và jumps là 2>sg7c và
chọn Save. Hình ảnh của hộp thoại sau khi lệnh nhảy được thiết lập như sau :

Chú ý : nếu giá trị của Jumps được viết là 1>V1, 2>V2, 3>Write có nghĩa là chương
trình sẽ nhảy đến V1 nếu giá trị nhập vào là 1, V2 nếu giá trị nhập vào là 2 và ghi và
kết thúc nhập bản ghi nếu giá trị nhập vào là 3.
Đóng cửa sổ checks
[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 63
Sau khi đã thiết lập được các ràng buộc số liệu, để đóng cửa sổ checks, chọn close trên
hộp thoại tham số.

4. Liên kết các tệp dữ liệu liên quan với lệnh RELATE
Liên kết các tệp dữ liệu là kỹ thuật gép các tệp dữ liệu có quan hệ (chứa các thông tin
liên quan) nhằm đảm bảo ràng buộc của dữ liệu liên quan. Một trường thông tin được
sử dụng làm căn cứ cho các bản ghi được ghép chính xác với nhau được gọi là trường
khóa. Chẳng hạn, một cá nhân (một người cụ thể) luôn thuộc vào một hộ gia đình nào
đó. Vì vậy, trường mã số hộ gia đình phải được khai báo ở cả hai tệp số liệu thông tin
hộ gia đình và thông tin cá nhân để chỉ ra mỗi cá nhân trong tệp số liệu cá nhân đều
thuộc vào một hộ gia đình nào đó trong tệp số liệu thông tin hộ gia đình. Một hộ gia
đình luôn có một hoặc nhiều cá nhân. Vì vậy, tương ứng với một bản ghi thông tin hộ
gia đình sẽ có một hoặc nhiều bản ghi thông tin cá nhân. Một mã số hộ gia đình trong
tệp số liệu hộ gia đình là duy nhất, nhưng lại không duy nhất trong tệp số liệu cá nhân.
Trường mã số hộ gia đình được khai báo trong tệp số liệu hộ gia đình được gọi là
trường khóa chính và cũng chính trường này trong tệp số liệu cá nhân được gọi là khóa
ngoài. Nếu như ta thiết kế hai Mẫu biểu nhập liệu riêng biệt để nhập thông tin hộ gia
đình và thông tin cá nhân thì sẽ phải nhập số liệu mã hộ gia đình vào cả hai tệp số liệu.
Chính vì thế, mã số hộ gia đình ở tệp dữ liệu cá nhân có thể bị nhập sai và khi liên kết
hai tệp dữ liệu sẽ có những hộ gia đình thừa hoặc thiếu thành viên. Việc liên kết các
tệp dữ liệu sử dụng lệnh RELATE sẽ tạo ra Mẫu biểu nhập liệu cho phép nhập đồng
thời thông tin hộ gia đình, thông tin cá nhân và tự động lấy giá trị mã số hộ gia đình ở
tệp dữ liệu hộ gia đình điền vào tệp dữ liệu cá nhân ở các bản ghi ở tệp thông tin cá
nhân tương ứng. Liên kết tệp dữ liệu sử dụng lệnh RELATE đảm bảo ràng buộc về
liên kết số liệu. Ví dụ sau đây là một hướng dẫn cụ thể cho thực hành với liên kết tệp
số liệu với lệnh RELATE.
Ta có hai tệp REC với cấu trúc như sau :
/___________________________________________________________________/
Cấu trúc tệp dữ liệu hộ gia đình HOUSE.REC với trường khóa chính là HouseID

No. Name Variable label Field type Width Checks

--------------------------------------------------------------------------------

1 houseid Ma so ho gia Number 5

dinh

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 64
2 address Dia chi Text 32

3 city Thanh pho Text 22

4 bedrooms So giuong ngu Number 2

5 water Su dung nuoc Boolean 1

may khong:

--------------------------------------------------------------------------------

Cấu trúc tệp dữ liệu cá nhân PERSON.REC với trường khóa ngoài là HouseID
No. Name Variable label Field type Width Checks

--------------------------------------------------------------------------------

1 personid Ma so ca nhan ID number 5

2 houseid Ma so ho gia Number 5

dinh

3 name Ten ca nhan Text 33

4 age Tuoi Number 3

5 sex Gioi Boolean 1

--------------------------------------------------------------------------------

/___________________________________________________________________/
Để thực hiện liên kết hai tệp trên với lệnh RELATE, ta thực hiện các bước như sau:
Bước 1: mở tệp HOUSE.REC ở chế độ thiết lập ràng buộc số liệu, hình ảnh như sau:

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 65
Hình 47: Tệp House.rec được mở trong cửa sổ checks

Bước 2: đặt thuộc tính giá trị duy nhất Key Unique cho trường houseid. Để có thể thực
hiện RELATE, cần phải chỉ định houseid là trường khóa duy nhất bằng lệnh KEY
UNIQUE. Người sử dụng, trước tiên phải chọn trường houseid, chọn edit, viết mã lệnh
và chọn accept and close để hoàn tất. Hình sau minh họa cho cách viết lệnh
KEYUNIQUE.

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 66
Hình 48: Viết lệnh KEY UNIQUE
Trong hình trên, lệnh KEY UNIQUE 1 chỉ định trường houseid là trường khóa duy
nhất có số thứ tự là 1.
Bước 3: chọn trường water là trường cuối cùng trên Mẫu biểu và thiết lập lệnh
RELATE. Để đảm bảo rằng khi trường cuối cùng của tệp thông tin hộ gia đình được
nhập thì sau đó, Epidata sẽ chuyển sang Mẫu biểu nhập dữ liệu cá nhân, người sử dụng
phải chọn trường cuối cùng trên Mẫu biểu nhập dữ liệu hộ gia đình. Người sử dụng
phải chọn trường warter, chọn edit để mở cửa sổ viết lệnh, kích accept and close để
hoàn tất.

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 67
Hình 49: Hình ảnh cửa sổ chương trình sau khi trường water được chọn

Hình 48: Đoạn mã lệnh liên kết hai tệp House.REC và Person.REC
Trong đoạn mã lệnh ở hình trên, lệnh AFTER ENTRY ra lệnh cho thực hiện dòng
RELATE houseid PERSON Epidata sau khi trường water được nhập. Dòng lệnh
RELATE houseid PERSON chỉ ra rằng liên kết tệp House.rec với tệp Person.rec sử
dụng trường houseid làm trường khóa. Với một lệnh AFTER ENTRY, luôn có một
lệnh END đi kèm để báo hiệu cho Epidata về điểm kết thúc của đoạn mã lệnh được
viết sau lệnh AFTER ENTRY. Một lệnh nằm sau lệnh END nói trên sẽ không được
thực hiện vào thời điểm các lệnh nằm trong cặp lệnh AFTER ENTRY và END được

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 68
thực hiện. Khi nhập dữ liệu cho hai tệp liên kết, màn hình nhập dữ liệu có dạng như
sau:

Hình 50: Tệp House.rec đang được chọn để nhập số liệu

Hình 51: Tệp Person.rec đang được chọn để nhập số liệu

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 69
Khi thực hiện liên kết các tệp dữ liệu, điều quan trọng mà người sử dụng cần nắm
được là phải xác định được trường khóa và khai báo trong các tệp cần liên kết. Thiết
lập ràng buộc số liệu là những kỹ thuật rất quan trọng trong mục tiêu tạo ra một cơ sở
dữ liệu ít lỗi nhất có thể.
Câu hỏi lượng giá
1.Nêu các bước khai báo bộ câu hỏi và cú pháp khai báo trường dữ liệu.
2. Nêu các nhóm lỗi dữ liệu và các phương pháp kiểm tra lỗi dữ liệu.
3. Kể tên các ràng buộc dữ liệu có thể thiết lập với phần mềm Epidata và các bước
cần thực hiện để thiết lập các ràng buộc dữ liệu với phần mềm Epidata.

[Bộ môn Tin học – Đại học YTCC] | BÀI 3: KHAI BÁO BỘ CÂU HỎI VÀ HẠN CHẾ LỖI SỐ LIỆU 70
BÀI 4: NHẬP DỮ LIỆU
Nhập dữ liệu là khâu đưa thông tin trên phiếu điều tra vào lưu trữ trong tệp REC nhờ
hỗ trợ của phần mềm Epidata. Bài học này cung cấp cho người học những kỹ thuật
cần thiết về nhập số liệu với phần mềm Epidata.

1. Nhập số liệu

Việc nhập số liệu là đánh máy thông tin lấy từ bộ câu hỏi (phiếu phỏng vấn) vào các
mục tương ứng trên Mẫu biểu nhập liệu. Các thao tác với phần mềm mà nhập liệu viên
cần nắm được là mở Mẫu biểu nhập liệu, thêm bản ghi, xóa bản ghi, tìm sửa số liệu và
đóng Mẫu biểu nhập liệu.

Mở Mẫu biểu nhập liệu

Khi khởi động chức năng nhập liệu, Epidata sẽ yêu cầu chọn tệp REC để sinh Mẫu
biểu nhập liệu tương ứng. Để khởi động chức năng nhập liệu chọn nút 4.Enter Data
trên thanh công cụ. Khi hộp thoại Open xuất hiện, việc tiếp theo là chọn tệp REC và
chọn Open để bắt đầu nhập liệu.

Hình 52 : Chọn tệp REC trên hộp thoại Open

[Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 71
Hình 53: Hình ảnh Mẫu biểu nhập liệu sẵn sàng cho nhập liệu
Nhập số liệu
Nhập liệu viên đọc các thông tin lần lượt của từng câu hỏi trên bộ câu hỏi và nhập vào
các câu hỏi (ô hoặc mục) tương ứng trên Mẫu biểu nhập liệu. Khi câu hỏi cuối cùng
được nhập đủ thông tin, Epidata đưa ra hộp thoại yêu cầu xác nhận ghi lại thông tin
vừa nhập. Nếu đồng ý ghi thông tin thì chọn nút Yes và chọn No nếu muốn bỏ qua
không ghi bản ghi này.

Thêm bản ghi


Có ba cách để thêm bản ghi:
ƒ Dùng phím nóng: trên Mẫu biểu nhập liệu nhấn tổ hợp phím Ctrl+N.

[Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 72
ƒ Dùng thực đơn: chọn Goto và chọn New Record trên thanh thực đơn
ƒ Sử dụng nút lệnh thêm bản ghi: trên thanh công cụ chuyển bản ghi
( ), chọn nút .
Khi thực hiện một trong ba thao tác trên, Epidata sẽ đưa ra yêu cầu xác nhận ghi lại
bản ghi đã nhập và tạo bản ghi mới.
Xóa bản ghi
Tại một bản ghi hiện tại trên Mẫu biểu nhập liệu, người nhập có thể sử dụng một trong
ba cách sau để xóa bản ghi đó:
ƒ Dùng phím nóng: trên Mẫu biểu nhập liệu nhấn tổ hợp phím Shift+Del.
ƒ Dùng thực đơn: chọn Goto và chọn Delete Record trên thanh thực đơn
ƒ Sử dụng nút lệnh thêm bản ghi: trên thanh công cụ quản lý danh sách bản ghi
( ), chọn nút .
Chú ý: Bản ghi bị xóa chưa được xóa hẳn khỏi tệp REC mà chỉ được đánh dấu xóa,
bản ghi sẽ bị xóa hản khi người sử dụng lệnh đóng gói số liệu.
Tìm và sửa bản ghi
Trong khi nhập liệu, người nhập liệu cũng có thể tìm đến một bản ghi nào đó và sửa
các thông tin. Để tìm và sửa bản ghi, có thể sử dụng một trong hai cách sau:
ƒ Sử dụng thanh công cụ chuyển bản ghi để chuyển từ bản ghi này sang bản ghi
khác. Thanh công cụ chuyển bản ghi có các nút lệnh - chuyển về bản ghi đầu
tiên, - chuyển về bản ghi trước bản ghi hiện tại, - chuyển đến bản ghi tiếp
theo bản ghi hiện tại, - chuyển đến bản ghi cuối cùng.
ƒ Sử dụng hộp thoại tìm kiếm.
Trong hai cách trên, sử dụng hộp thoại tìm kiếm mềm dẻo hơn, vì cách này cho phép
thiết lập các điều kiện tìm kiếm và thực hiện theo các điều kiện đó.

[Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 73
Hình 55: Hộp thoại tìm bản ghi
Để tìm kiếm bản ghi cần biết ý nghĩa của các thành phần trên hộp thoại. Bảng sau sẽ
giải thích về các thành phần này.

Phần này là nơi để nhập vào điều kiện tìm kiếm, cột
field dùng để nhập tên các biến và cột Criteria dùng
để nhập các giá trị cho điều kiện tìm kiếm. Ví dụ
tìm người có tên là “lan” và có tuổi là 20, ta nhập
tên biến i2 và sg2 vào cột field, nhập chuỗi “*lan”
và giá trị 23 vào cột criteria tương ứng với tên biến
và chọn OK.

Cho biết mẫu các chuỗi tìm kiếm: abcd (=abcd) –


điều kiện tìm kiếm là bằng chuỗi giá điều kiện tìm
kiếm, > (<) - lớn hơn (nhỏ hơn) giá trị tìm kiếm,
*abcd – chuỗi chứa ký tự abcd ở cuối chuỗi, abcd* -
chuỗi chứa ký tự abcd ở đầu chuỗi, *abcd* - chuỗi
chứa abcd.

[Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 74
ƒ Case sensitive: tìm những trường hợp tốt nhất
ƒ Whole words only: cho phép viết điều kiện tìm
kiếm chứa dấu * thay cho một nhóm ký tự bất
kỳ.
ƒ Ignore deleted records: bỏ qua các bản ghi bị
đánh dấu xóa.

ƒ Forward to last record: tìm từ bản ghi hiện tại


cho đến bản ghi cuối cùng
ƒ Backwards to first record: tìm ngược lại cho đến
bản ghi đầu tiên kể từ bản ghi hiện tại
ƒ All records: tìm trên tất cả các bản ghi

Xóa các giá trị điều kiện tìm kiếm đã nhập

Ví dụ 1: để tìm người có mã số 0101003, thiết lập tham số như sau:

Ví dụ 2: để tìm người có tên là lan và tuổi là 23, thiết lập tham số như sau:

[Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 75
Đóng Mẫu biểu nhập liệu

Để đóng Mẫu biểu nhập liệu, chọn file và chọn Close Mẫu biểu trên thanh thực đơn.

Hình 56: Đóng Mẫu biểu nhập liệu

[Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 76
2. Xem dữ liệu

Chức năng xem dữ liệu liệt kê dữ liệu tệp REC ở dạng bảng, tên cột của bảng là tên
trường và mỗi dòng là một bản ghi. Để xem dữ liệu chọn 5. Document, chọn View
data và sau đó chọn tệp REC ở hộp thoại Open và chọn Open.

Hình 57: Xem dữ liệu

3. Xem cấu trúc tệp REC

Như chúng ta đã biết, tệp dữ liệu REC được cấu trúc bởi các trường số liệu. Trường số
liệu có các thuộc tính kiểu, nhãn, kích thước và các thuộc tính khác. Xem cấu trúc tệp
dữ liệu giúp cho người sử dụng hiểu được ý nghĩa của các biến dữ liệu và kiểm tra cấu
cấu trúc dữ liệu khi cần. Để xem cấu trúc dữ liệu chọn 5. Document và chọn File
structure, sau đó trong hộp thoại Open chọn tệp cần REC và chọn Open.

[Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 77
Hình 58: Mô tả cấu trúc tệp dữ liệu nghiên cứu cúm gia cầm

Chú ý: chọn trên thanh công cụ để ghi cấu trúc ra tệp lài liệu và chọn để in ra
máy in.

4. Liệt kê số liệu
Chức năng này cho phép liệt kê số liệu trong tệp REC theo các bản ghi dạng các quan
sát (observation). Để liệt kê dữ liệu chọn 5. Document và chọn List data, sau đó trong
hộp thoại Open chọn tệp cần REC và chọn Open.

[Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 78
Hình 59: Liệt kê số liệu dạng các quan sát

Chú ý: Tương tự như với chức năng xem cấu trúc tệp REC, người sử dụng cũng có thể
lưu các thông tin về dữ liệu đã được liệt kê ra tệp dạng TEXT (tệp .txt) hoặc in ra máy
in.

5. Xem mô tả số liệu

Chức năng này cho phép người sử dụng đưa ra thông tin mô tả tệp số liệu REC. Thông
tin mô tả tệp REC gồm tên trường, nhãn, kiểu và các thông tin thống kê khác về số liệu
theo từng trường trong tệp REC. Đây là những thông tin cần thiết cho người sử dụng
khi làm việc với tệp số liệu. Để đưa ra các thông tin mô tả tệp số liệu, người sử dụng

[Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 79
chọn 5. Document, chọn Codebook. Khi hộp thoại Open xuất hiện, chọn tệp REC và
chọn Open, màn hình xuất hiện hộp thoại Codebook như sau:

Hình 60: Hộp thoại Codebook

Khi hộp thoại codebook xuất hiện, người sử dụng phải chọn các tham số tùy chọn cho
báo cáo mô tả tệp số liệu và chọn OK để sinh báo cáo. Các tham số tùy chọn chính
trên hộp thoại Codebook gồm:

ƒ All records: chỉ định tạo Codebook cho tất cả các bản ghi của tệp số liệu

ƒ From record # to # : Tạo Codebook cho các bản ghi từ số # đến số #

ƒ Select fields: liệt kê danh sách các trường có trong tệp số liệu. Trường nào cần
được mô tả trong tệp tài liệu codebook thì phải được chọn (3) và ngược lại.

Với trường hợp tệp REC của nghiên cứu cúm gà, báo cáo mô tả tệp số liệu có hình ảnh
như sau:

[Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 80
Hình 61: Báo cáo mô tả tệp số liệu cúm gà
Chú ý: Tương tự như với chức năng xem cấu trúc tệp REC, người sử dụng cũng có thể
lưu các thông tin mô tả tệp dữ liệu ra tệp dạng TEXT (tệp .txt) hoặc in ra máy in.
Câu hỏi lượng giá
1. Nêu các thao tác kỹ thuật nhập số liệu với phần mềm Epidata.
2. Khi xem cấu trúc dữ liệu, người sử dụng biết được những thông tin gì?
3. Khi liệt kê số liệu, người sử dụng biết được những thông tin gì?
4. Nội dung của báo cáo mô tả tệp số liệu là gì?

[Bộ môn Tin học – Đại học YTCC] | BÀI 4: NHẬP DỮ LIỆU 81
BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU
Ghép các tệp số liệu và chuyển định dạng của chúng sang các tệp định dạng khác để
các phần mềm phân tích thống kê số liệu khác nhau có thể đọc được là rất cần thiết.
Thực tế, khi làm việc với các tệp số liệu, người ta luôn có nhu cầu thực hiện các công
việc này để tạo ra tệp số liệu có đầy đủ các bản ghi, các trường số liệu mong muốn, từ
nhiều tệp số liệu khác nhau. Chẳng hạn, người sử dụng muốn ghép tệp số liệu hộ gia
đinh và tệp số liệu các cá nhân để có được tệp số liệu có thông tin hộ gia đình và
thông tin và các thành viên trong hộ gia đình, hoặc chuyển tệp REC sang tệp định
dạng Stata để thực hiện phân tích số liệu bằng phần mềm Stata. Bài học giúp cho
người sử dụng có thể hiểu và thực hiện được các công việc trên với phần mềm
Epidata.

1. Ghép tệp số liệu


Ghép các tệp số liệu phục vụ cho phân tích thống kê số liệu là một yêu cầu thường gặp
khi làm việc với số liệu. Số liệu có thể được nhập trên nhiều máy tính khác nhau, do
nhiều người nhập. Kết quả là có nhiều tệp số liệu thành phần của một bộ số liệu. Để có
một bộ số liệu hoàn chỉnh, người sử dụng phải ghép các tệp số liệu này lại với nhau.
Tệp được ghép sẽ có tổng số bản ghi bằng tổng số các bản ghi của các tệp số liệu
thành phần. Một trường hợp khác, khi có hai tệp số liệu là danh sách bệnh nhân HIV
và thông tin khám lần đầu của các bệnh nhân HIV. Tệp số liệu danh sách các bệnh
nhân HIV chứa các thông tin cá nhân như mã số, họ tên, địa chỉ, .v.v. Tệp thông tin
khám lần đầu chứa các thông tin như ngày khám, các thông tin xét nghiệm, các triệu
trứng lâm sàng .v.v. Để có một tệp số liệu có thông tin cá nhân của bệnh nhân HIV và
thông tin khám lần đầu của bệnh nhân phục vụ cho phân tích, ta phải ghép hai tệp số
liệu đó theo trường khóa mã cá nhân. Khi đó, tệp được ghép sẽ có các trường số liệu là
các trường trong tệp thứ nhất và tệp thứ hai được hợp lại theo trường khóa (trường mã
cá nhân). Epidata cung cấp tính năng Append/Merge phục vụ cho hai trường hợp ghép
tệp số liệu với hai phương thức ghép là Append (nối) và Merge (hợp nhất).
ƒ Append là phương thức nối tiếp danh sách các bản ghi của tệp thứ hai vào danh
sách các bản ghi của tệp thứ nhất. Tệp được ghép có số bản ghi bằng tổng số
bản ghi của hai tệp thành phần cộng lại. Tập hợp biến của tệp ghép đầu ra có
thể là hợp của tập hợp biến trong tệp thứ nhất và tập hợp biến trong tệp thứ hai
hợp lại, hoặc chỉ bằng tập hợp biến của tệp thứ nhất, tùy theo tham số tùy chọn
được chọn khi nối hai tệp.

[Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 82
ƒ Merge là phương thức hợp nhất hai tệp số liệu, trong đó, tệp số liệu được tạo ra
có các biến là hợp của tập hợp các biến trong tệp thứ nhất và tập hợp các biến
trong tệp thứ hai hợp lại. Số lượng các bản ghi của tệp ghép có thể là hợp các
bản ghi của hai tệp thành phần, hoặc chỉ bằng số bản ghi của tệp thứ nhất tùy
theo tham số tùy chọn được chọn khi hợp nhất hai tệp. Các bước thực hiện ghép
tệp như sau:
Mở các tệp số liệu cần ghép
Trong cửa sổ của Epidata, chọn Data in/out, chọn Append/Merge

Hình 62: Khởi động chức năng ghép tệp


Khi chức năng Append/Merge được kích hoạt, hộp thoại Append/Merge xuất hiện có
hình ảnh như sau:

Hình 63: Hộp thoại Append/merge data file

[Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 83
Chọn các tệp số liệu thành phần

Trên cửa sổ Append/Merge data files, kích nút lệnh chọn các tệp số liệu cần ghép
thứ nhất và thứ hai và chọn OK, hộp thoại Append/Merge xuất hiện sau đó, như hình
dưới đây:

Hình 64: Hộp thoại Append/merge data file


Chọn phương thức ghép tệp và kết thúc ghép tệp
Tùy theo yêu cầu ghép tệp số liệu mà ta có thể chọn phương thức ghép tương ứng là
Append hay Merge.
Ghép tệp theo phương thức Append: các tham số cần được thiết lập gồm:

ƒ Resulting data file: tên tệp kết quả sẽ được tạo ra


ƒ Thẻ Append: thẻ Append được chọn để thiết lạp tham số ghép tệp
ƒ “Append only data from fields in data file B that also exists in data file A” chỉ
định các trường của tệp kết quả chỉ gồm các trường của tệp A (tệp thứ nhất).

[Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 84
ƒ “Append all fields in data file B” chỉ định tệp kết quả có số trường là số trường
của cả hai tệp thành phần hợp lại.

Các tùy chọn được thiết lập sẽ quy định kết quả tệp ghép được sinh ra. Chẳng hạn, ta
muốn ghép hai tệp women.rec (tệp A) trong thư mục khamthai và tệp women.rec (tệp
B) trong thư mục khác (thư mục khamthai\test1) theo phương thức Append. Yêu cầu
ghép tệp là chỉ ghép những số liệu tồn tại trong các trường của tệp A mà tồn tại trong
tệp B. Các tham số tùy chọn có hình ảnh như sau:

Hình 65: Tham số ghép tệp trên hộ thoại Append/merge data file
Sau khi thiết lập được các tham số cho phương thức ghép tệp, ta chọn nút lệnh Append
để kết thúc việc ghép tệp.
Chú ý: Sau khi chọn Append, Epidata sẽ hỏi đặt nhãn chú thích cho tệp ghép, ta có thể
chọn OK để bỏ qua việc đặt nhãn tệp (nếu muốn đặt nhẵn để ghi chú về tệp như người
tạo, ngày tạo, mục đích sử dụng, … thì có thể gõ vào hộp thoại yêu cầu nhaapj nhãn
tệp).
Ghép tệp theo phương thức Merge: ghép tệp theo phương thức Merge được thực hiện
tương tự như với ghép tệp theo phương thức Append. Sự khác biệt chỉ là các tham số
tùy chọn được thiết lập, các tham số tùy chọn như sau:

[Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 85
ƒ Với phương thức ghép tệp là Append, ta chọn thẻ Append trên hộp thoại. Với
ghép tệp theo phương thức Merge, chọn thẻ Merge.
ƒ Select key fields: cho phép chọn trường khóa được sử dụng làm căn cứ để hợp
nhất hai tệp. Trường khóa được chọn cho ghép tệp phải là một trường đồng
thời có trong cả hai tệp thứ nhất (tệp A) và tệp thứ hai (tệp B).
ƒ Merge only record from data file B that match records in data file A: yêu cầu số
liệu tệp được ghép sẽ gồm toàn bộ các bản ghi của tệp A ghép thêm số liệu
trong tệp B có giá trị trường khóa tương ứng.
ƒ Merge all records from data file B: yêu cầu các bản ghi trong tệp ghép bằng
các bản ghi hai tệp thành phần hợp lại.

Chọn nút lệnh Merge để thực hiện ghép tệp là thao tác cuối cùng sau khi các tham số
tùy chọn đã được thiết lập. Hình ảnh dưới đây là ví dụ của việc ghép hai tệp số liệu
theo phương thức Merge với trường khóa được chỉ định là Personid (mã cá nhân).

Hình 66: Tham số hợp hai tệp trên hộ thoại Append/merge data file

[Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 86
2. Xuất nhập tệp số liệu
Có nhiều phần mềm có thể sử dụng để phân tích số liệu như SPSS, Epi_info, Stata,
SAS.v.v. Các phần mềm này sử dụng các loại tệp có định dạng không giống nhau. Vì
vậy, để phân tích số liệu bằng một phần mềm nào đó thì phải chuyển định dạng tệp số
liệu sang định dạng khác để phần mềm đó có thể đọc được. Nhập xuất tệp số liệu và
chuyển định dạng tệp số liệu là chức năng phần mềm tiện ích được xây dựng nhằm
đáp ứng yêu cầu chuyển định dạng tệp số liệu.

2.1 Xuất tệp số liệu

Sử dụng chức năng xuất tệp số liệu của Epidata, người sử dụng có thể sinh ra một tệp
số liệu có định dạng khác như SPSS, Stata, SAS, Excel. Các bước xuất tệp số liệu gồm
chọn tệp REC, chọn tham số tùy chọn và thực hiện xuất tệp.

Chọn tệp số liệu REC

Chọn Export Data trên thanh công cụ và chọn kiểu định dạng số liệu đầu ra. Nếu số
liệu đầu ra mong muốn có định dạng của SPSS, ta chọn Export Data và chọn SPSS.
Khi hộp thoại Open xuất hiện cần chọn tệp dữ liệu REC và chọn Open.

Hình 67: Xuất tệp số liệu sang định dạng của Spss

Chọn các tham số tùy chọn và xuất tệp số liệu

Khi tệp REC đã được mở, hộp thoại Export Data xuất hiện. Việc tiếp theo là chọn các
tham số tùy chọn và nhấn OK để thực hiện xuất tệp số liệu.

[Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 87
Hình 68: Hộp thoại Export data

Chú ý: Hộp thoại Export Data có các tham số có ý nghĩa như sau:

ƒ All records: Xuất tất cả các bản ghi của tệp dữ liệu

ƒ From record # to # : Chỉ xuất các bản ghi từ số # đến số #

ƒ Select fields: cho phép chọn các trường dữ liệu sẽ xuất hiện ở tệp đầu ra
(trường được tích trong danh sách sẽ xuất hiện trong tệp đầu ra)

2.2 Nhập tệp số liệu

Nếu chức năng xuất tệp số liệu sinh ra tệp số liệu có định dạng khác từ một tệp REC
thì chức năng nhập tệp số liệu của Epidata tạo ra tệp số liệu REC từ tệp số liệu Excel,
dBase hoặc Stata. Để nhập tệp số liệu, chọn Import Data từ thực đơn Data in/out trên
thanh thực đơn, sau đó chọn tệp số liệu đầu vào và chọn OK trên hộp thoại Import
from Stata (dBase/Text).

[Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 88
Hình 69: Khởi động chức năng import tệp Stata

Hình 70: Hộp thoại chọn tệp

Chú ý: trên hộp thoại nhập tệp số liệu, có thể chọn nút để chọn tệp số liệu đầu vào,
sau đó chỉ định tên tệp đầu ra (tệp REC) và nơi lưu tệp ở mục Import to.
Câu hỏi lượng giá
1. Nêu các bước của kỹ thuật ghép các tệp số liệu.
2. Nêu ý nghĩa của hai phương thức ghép tệp số liệu Append và Merge.
3. Vì sao phải thực hiện chuyển định dạng tệp số liệu?
4. Các bước để thực hiện chuyển định dạng tệp số liệu với chức năng Xuất tệp dữ
liệu của Epidata.

[Bộ môn Tin học – Đại học YTCC] | BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 89
BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH
Bài học này hướng dẫn người học sử dụng các chức năng tiện ích của Epidata. Các
chức năng này được phát triển dựa trên những yêu cầu thực tế của công việc quản trị
số liệu, vì vậy, chúng làm cho Epidata trở thành một công cụ hiệu quả đối với người
sử dụng.

1. Sửa tên trường


Thực tế, khi tệp REC được tạo ra, số liệu đã được nhập vào thì người sử dụng lại muốn
sửa lại tên biến (trường). Người sử dụng có thể sửa lại tên trường trong tệp QES và tạo
lại tệp REC từ tệp QES. Tuy nhiên, số liệu đã nhập sẽ bị mất nếu ta làm theo cách này.
Epidata có tính năng sửa tên trường (Rename fields) hỗ trợ đổi tên trường trực tiếp
trên tệp REC, không làm mất số liệu đã nhập. Để sửa tên trường, ta chọn tools, chọn
rename fields trên thanh thực đơn chương trình. Khi hộp thoại Open xuất hiện, ta chọn
tệp REC và chọn Open, hộp thoại change field names sau đó được mở có hình ảnh như
sau:

Hình 71: Hộp thoại đổi tên trường


Hộp thoại trên có ba cột Field name, Label và New field name. Cột Field name chứa
tên hiện tại của các trường số liệu trong tệp REC, cột Label chứa nhãn biến và cột
New field name cho phép nhập vào tên mới của các trường số liệu. Để sửa tên trường
[Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 90
nào, người sử dụng chỉ cần nhập tên mới của các biến vào cột New field name trên
cùng dòng, tương ứng với tên biến cũ và sau đó chọn Save and close để ghi lại tên biến
mới và đóng hộp thoại.

2. Sao chép cấu trúc tệp REC

Chức năng sao chép cấu trúc tệp REC cho phép người sử dụng sao chép cấu trúc tệp
REC, không bao gồm số liệu. Chức năng này giúp cho người sử dụng có thể sử dụng
lại tệp REC để nhập số liệu mà không cần đến tệp QES. Các bước sao chép cấu trúc
tệp REC gồm khởi động chức năng, chọn tệp REC, đặt các tham số tùy chọn và thực
hiện copy.

Khởi động chức năng

Để khởi động chức năng, ta chọn tool, chọn Copy structure trên thanh thực đơn.

Hình 72: Khởi động chức năng copy cấu trúc tệp số liệu

Chọn tệp REC

Epidata yêu cầu chọn tệp REC trên hộp thoại Select data file to copy sau khi chức
năng này được khởi động. Tiếp theo, người sử dụng phải chọn tệp REC để hoàn thành
bước này.

[Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 91
Hình 73: Chọn tệp REC
Đặt các tham số tùy chọn và thực hiện Copy
Khi tệp REC được chọn, Epidata yêu cầu người sử dụng phải chọn các tham số tùy
chọn trên hộp thoại Copy file structure.

Hình 74: Đặt tham số tùy chọn với hộp thoại copy cấu trúc tệp REC
Trong bước này, người sử dụng phải điền vào các tham số tùy chọn trên hộp thoại và
nhấn nút OK để kết thúc. Các tham số tùy chọn trên hộp thoại gồm:

ƒ New data file: tên tệp REC mới


[Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 92
ƒ Don’t copy text field : không copy trường kiểu text

ƒ Copy check file: copy tệp CHK liên quan tệp REC

3. Đếm bản ghi theo trường dữ liệu

Chức năng này đưa ra báo cáo về số lượng bản ghi theo các giá trị số liệu xuất hiện
trong một trường số liệu nào đó, các bước thực hiện gồm khởi động chức năng, chọn
tệp REC, đặt các tham số tùy chọn và kết thúc.

Khởi động chức năng

Để khởi động chức năng, ta chọn 5.Document, chọn Count Records trên thanh thực
đơn.

Hình 75: Khởi động chức năng đếm bản ghi

Chọn tệp REC, các tham số tùy chọn và kết thúc

Sau khi khởi động chức năng, Epidata mở hộp thoại Count record by field, yêu cầu
người sử dụng chọn tệp REC, chọn biến sẽ được sử dụng. Cuối cùng người sử dụng
phải chọn OK để kết thúc.

[Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 93
Hình 76: Hộp thoại Count record by field

Hình 77: Báo cáo kết quả đếm bản ghi theo trường SG1
Chú ý: Các tham số tùy chọn trên hộp thoại gồm:
ƒ Enter filename: tên tệp REC
ƒ Field to evaluate: tên trường sử dụng

[Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 94
4. So sánh hai tệp dữ liệu
Chức năng này cho phép người sử dụng đưa ra báo cáo về các thông tin giống và khác
nhau của số liệu trong hai tệp REC. Chẳng hạn, ta đem so sánh hai tệp thông tin điều
tra cúm gia cầm được nhập ở bởi hai nhóm nhập liệu khác nhau là cumgiacam1.rec và
cumgiacam2.rec, các bước thực hiện như sau:

Khởi động chức năng

Để khởi động chức năng, ta chọn 5.Document, chọn chọn Validate duplicate files.

Chọn tệp REC

Trên hộp thoại Validate files, ta chọn các tệp và chọn OK để chuyển sang bước tiếp
theo.

Hình 78: Hộp thoại chọn tệp Validate files

Chọn các tham số tùy chọn và kết thúc

Trong bước này, người sử dụng phải chọn các trường khóa (select key fields) và các
tham số tùy chọn khác (option) như bỏ qua các bản ghi được đánh dấu xóa (ignore
deleted records), trường kiểu Text (ignore text fields), .v.v. và nhấn OK để đưa ra báo
cáo.

[Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 95
Hình 79: Hộp thoại tùy chọn Validate files

Hình 80: Kết quả so sánh số liệu

5. Đóng gói tệp số liệu


[Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 96
Chức năng đóng gói tệp số liệu tạo ra tệp REC mới từ một tệp REC ban đầu, trong đó,
các bản ghi được đánh dấu xóa không được sao chép sang tệp mới. Để thực hiện đóng
gói, ta chọn Tool và chọn Pack data file trên thanh thực đơn và chọn tệp REC trong
hộp thoại Open. Khi nhấn nút Open để kết thúc bước chọn tệp REC, Epidata đưa ra
thông báo hỏi người sử dụng xác nhận là xóa các bản ghi đã được đánh dấu xóa. Nếu
đồng ý, người sử dụng nhấn OK để kết thúc và nhấn Cancel để hủy bỏ.

6. Tạo tệp QES từ tệp REC

Chức năng này được sử dụng để sinh ra một tệp QES từ một tệp REC. Thực tế, người
sử dụng có thể muốn sinh ra tệp REC có cấu trúc gần giống với tệp REC đang có,
nhưng lại chưa có tệp QES. Để có thể tạo nhanh ra một tệp REC như vậy, người sử
dụng có thể sử dụng chức năng này sinh ra tệp QES từ tệp REC, sửa lại nội dung tệp
QES và sinh ra tệp REC mong muốn. Để sinh tệp QES từ tệp REC, ta chọn Tool trên
thanh thực đơn, chọn QES file from REC file, chọn tệp REC trên hộp thoại Create
QES file from data file và chọn OK để kết thúc.

Câu hỏi lượng giá

Hãy nêu tên các tiện ích được nhắc đến trong bài học và chức năng của các tiện ích
đó.

[Bộ môn Tin học – Đại học YTCC] | BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 97
BÀI TẬP TỔNG KẾT
Giáo trình này đã trình bày những kiến thức và kỹ thuật cần thiết để làm việc với phần
mềm Epidata. Để giúp cho người học củng cố lại những kiến thức và kỹ thuật trong
nội dung giáo trình, chúng tôi đưa ra bài tập tổng kết này. Bộ câu hỏi được đưa ra
dưới đây là một phần trong bộ câu hỏi “Nghiên cứu đánh giá tình trạng hút thuốc lá
thụ động và sự chấp nhận của xã hội với hút thuốc”. Yêu cầu đặt ra cho những người
học là hãy sử dụng phẩn mềm Epidata để tạo ra công cụ nhập số liệu cho bộ câu hỏi
của nghiên cứu này. Các kỹ thuật mà những người học cần thực hiện gồm: khai báo
bộ câu hỏi, tạo tệp REC, thiết lập ràng buộc số liệu và nhập số liệu.
/___________________________________________________________________/

Nghiên cứu đánh giá tình trạng hút thuốc lá thụ động
và sự chấp nhận của xã hội với hút thuốc
(Bộ câu hỏi giành cho phụ nữ)
Họ và tên:................................................................................................................
Họ tên điều tra viên:................................................................................................
Họ tên giám sát viên:.................................................................. ............................
Ngày phỏng vấn:......................................... ............................... ...........................
Đồng ý tham gia phỏng vấn: 1. Có
2. Không
Mức độ hoàn thành bảng hỏi:
1. Hoàn thành
2. Không gặp (ĐTV đến 3 lần không gặp)
3. Không có nhà
4. Không hợp tác
(Chú ý:1. Tiêu chuẩn lựa chọn đối tượng: Phụ nữ độ tuổi 18-55 (theo danh sách).
2. Thay thế đối tượng: Trong trường hợp không gặp, không có nhà, không
hợp tác: chọn đối tượng nhà liền kề bên tay phái)

[Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 98
Chuyển câu
I. THÔNG TIN CHUNG

C1 Năm sinh (dương lịch) .......................

C2 Chị hiện đang sống ở đâu Nông thôn 1

Thành thị (thị trấn/thị xã) 2

C3 Trình độ học vấn cao nhất Chưa bao giờ đi học 1


Chưa học hết hoặc hết cấp I 2
(Với hệ 10 năm: lớp 7 là hết Chưa học hết hoặc hết cấp II 3
cấp II
Chưa học hết hoặc hết cấp III 4
Với hệ 11 năm: lớp 8 là hết cấp
II Trung cấp 5
Với hệ 12 năm: lớp 9 là hết cấp Cao đẳng, đại học 6
II)
Trên Đại học 7

C4 Nghề nghiệp chính (nghề Công chức (đang công tác) 1


mang lại thu nhập chính) Nông dân 2
của chị hiện nay là gì?
Công nhân 3
Thợ xây, Thợ thủ công 4
Học sinh/sinh viên 5
Buôn bán nhỏ 6
Hưu trí 7
Thất nghiệp/Nội trợ 8
Khác, (ghi rõ).......................... 9

C5 Tình trạng hôn nhân hiện Đang sống với chồng 1


tại Độc thân 2

[Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 99
(Xa nhau vì công việc là Ly thân 3
người chồng có mặt ở nhà Ly dị 4
ít hơn 1 tuần/tháng)
Goá 5
Xa nhau vì công việc 6
Khác, (ghi rõ)........................ 7

C6 Hiện tại chị có hút thuốc lá Có 1


/lào không ? Không 2

C7 Trong nhà chị hiện tại có Bố 1


ai hút thuốc lá/lào không Chồng 2
(sống cùng nhà với chị
Anh/em trai 3
trong vòng ít nhất 3 tháng
trở lại đây)? Khác, (ghi rõ)........................ 4

(nhiều lựa chọn) Không ai hút 5 ÆC9

C8 Nếu có, có bất cứ ai trong Có 1


số những người hút thuốc Không 2
ở cùng nhà với chị trong
tuần qua không?

1.1.1. II. Thực trạng hút thuốc thụ động

C9 Trong tuần qua, có bao


nhiêu ngày chị tiếp xúc với Ghi tổng số
khói thuốc ở nhà? ngày.....……………………
(phòng khách, phòng ngủ, (giá trị từ 0 - 7 ngày)
phòng ăn nhà vệ sinh…)
(Chỉ cần tiếp xúc 1 hoặc
một số lần trong ngày)

[Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 100
C10 Trong tuần qua, có bao
nhiêu ngày chị tiếp xúc với Ghi tổng số
khói thuốc ở nơi làm việc? ngày.....……………………
(giá trị từ 0 - 7 ngày)
(Chỉ hỏi với những người
đi làm - được trả lương)
(Chỉ cần tiếp xúc 1 hoặc
một số lần trong ngày)

C11 Trong tuần qua, có bao


nhiêu ngày chị tiếp xúc với Ghi tổng số
khói thuốc ở nơi công ngày.....……………………
cộng (bến tàu xe, nơi tập
(giá trị từ 0 - 7 ngày)
trung đông người...)?
(Chỉ cần tiếp xúc 1 hoặc
một số lần trong ngày)

C12 Con/cháu/trẻ em (nhỏ hơn Có 1


16 tuổi, sống cùng nhà) Không 2
của chị có phải tiếp xúc
Tôi không có con/trẻ con sống 3
với khói thuốc lá của bất
cùng nhà 4
cứ thành viên nào sống
cùng nhà trong tuần qua Không biết/không trả lời
không?

C13 Câu nói nào sau đây mô tả Mọi người có thể tiếp xúc khói 1
đúng nhất tình trạng tiếp thuốc ở bất cứ đâu trong nhà
xúc với khói thuốc của các vào bất cứ lúc nào
2
thành viên trong nhà chị? Mọi người tiếp xúc khói thuốc ở
một số nơi, và/hoặc vào một lúc
(Đọc các phương án trả nào đó 3

[Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 101
lời) Mọi người không bao giờ phải
tiếp xúc khói thuốc trong nhà 4
Không biết/không trả lời

III. Hiểu biết về tác hại của khói thuốc lá

C14 Theo chị khói thuốc của Có 1


người hút thuốc có ảnh Không 2 Æ C16
hưởng tới sức khỏe của
Không biết/ không trả lời 3 Æ C16
người xung quanh không?

C15 Theo chị nếu hít phải khói Bệnh phổi/phế quản/ho & 1
thuốc có thể gây bệnh thì viêm họng 2
đó là bệnh gì? Ung thư phổi 3
(nhiều lựa chọn, để tự trả Lao phổi 4
lời)
Bệnh tim mạch 5
Gày yếu suy nhược 6
Khác (ghi
rõ):…………..................

C16 Theo chị phụ nữ có thai hít Rất có hại 1


phải khói thuốc thì có hại Có hại 2
không?
Không có ý kiến gì/ko chắc chắn 3
Không có hại lắm 4
(để phụ nữ đánh giá mức Hoàn toàn không có hại
5 ÆC18
độ có hại của khói thuốc
thụ động dựa vào thang đo
bên)

C17 Theo chị thì khói thuốc có Sinh con nhẹ cân 1
thể gây ra những bệnh gì

[Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 102
cho phụ nữ có thai và thai Tăng nguy cơ trẻ sinh ra bị ung thư 2
nhi? não, máu trắng
Viêm đường hô hấp cấp tính trẻ em
3
(nhiều lựa chọn, để tự trả Sảy thai/đẻ non 4
lời) Không biết/không trả lời
5
Khác (ghi rõ):................................
6

C18 Theo chị khói thuốc có hại Rất có hại 1


đến sức khỏe của trẻ em Có hại 2
không?
Không có ý kiến gì/không chắc 3
chắn
4
(để phụ nữ đánh giá mức Không có hại lắm
5 ÆC20
độ có hại của khói thuốc Hoàn toàn không có hại
thụ động dựa vào thang đo
bên)

C19 Nếu có hại thì khói thuốc Viêm đường hô hấp 1


có thể gây bệnh gì cho trẻ Tăng nguy cơ các bệnh 2
em? về tim Hen suyễn
3
Viêm tai giữa
4
(nhiều lựa chọn, để tự trả Không biết
5
lời)
Khác (ghi
6
rõ):..........................................

/___________________________________________________________________/

[Bộ môn Tin học – Đại học YTCC] | BÀI TẬP TỔNG KẾT 103
TÀI LIỆU THAM KHẢO
1. Epidata for data entry and documentation, Ziad EI, Clinical Cancer Epidemiology,
2004
2. Jens ML, Michael BR, Epidata Help, The Epidata Association, Odense
Denmark,26/10/2004

[Bộ môn Tin học – Đại học YTCC] | TÀI LIỆU THAM KHẢO 104

You might also like