You are on page 1of 2

Phần 1: Tiền xử lý dữ liệu (Data Reprocessing) *Dùng Excel

1.1. Phát hiện và xử lý lỗi sai (Invalid)


- Vào File Excel (Dữ liệu cho sẵn)
- Kiểm tra và lọc các giá trị sai theo thứ tự biến:
 Tô cột biến  Chọn “Filter”
 Dữ liệu nào sai/dư: Click chọn rồi ghi chú lại (nên tô màu cho dễ nhớ)
 Làm như vậy cho đến hết các biến và điền vào bảng (1.1)
- Tiêu chí loại bỏ các giá trị sai là: Nhập sai, dữ liệu không đầy đủ
- Lưu ý:
 Dum: Định tính
 Còn lại: Định lượng
1.2. Phát hiện và xử lý Missing Value *Dùng Excel
 Phát hiện:
o Những Missing Value thực chát là giá trị sai ban đầu
o Viết tương tự vào bảng (1.2)
 Xử lý:
o Biến định tính: Mode (làm hàm Mode (yếu vị) để tính ra)
o Biến định lượng: Median (làm hàm Median để tính ra) (còn Mean: dành cho giá
trị khuyết) (*vì nó cho ra số nguyên)
 Liên tục:1, 2.1, 3.2, 2.1, 2, … (cân nặng, chiều cao)
 Rời rạc: 1, 2, 3, 4
o Sau đó mình nhập giá trị mới và các giá trị Missing/lỗi
1.3. Nhập liệu và quản lý biến số *Dùng SPSS
1. Vào SPSS
2. Import Data
3. Xem Data View  Xử lý phần dư
4. Chỉnh lại: Variable View – Measure (loại thang đo)
 Biến định tính:
1. Ordinal (có phân biệt thứ bậc, VD: vị trí, bậc lương)
2. Norminal (không phân biệt thứ bậc, VD: giới tính, lợi nhuận/phi lợi nhuận (trừ số
thứ tự)
 Biến định lượng: Scale
1. Khoảng
2. Tỉ lệ
5. Chỉnh lại:
 LABEL  + Mode: STT; + Dum: Giới tính; Còn lại không cần (Label của giá trị,
làm rõ số đó là gì)
6. Chỉnh lại
 VALUE  Dùng cho biến định tính:
1. Nam
2. Nữ

You might also like