Phần 1: Tiền xử lý dữ liệu (Data Reprocessing) *Dùng Excel
1.1. Phát hiện và xử lý lỗi sai (Invalid)
- Vào File Excel (Dữ liệu cho sẵn) - Kiểm tra và lọc các giá trị sai theo thứ tự biến: Tô cột biến Chọn “Filter” Dữ liệu nào sai/dư: Click chọn rồi ghi chú lại (nên tô màu cho dễ nhớ) Làm như vậy cho đến hết các biến và điền vào bảng (1.1) - Tiêu chí loại bỏ các giá trị sai là: Nhập sai, dữ liệu không đầy đủ - Lưu ý: Dum: Định tính Còn lại: Định lượng 1.2. Phát hiện và xử lý Missing Value *Dùng Excel Phát hiện: o Những Missing Value thực chát là giá trị sai ban đầu o Viết tương tự vào bảng (1.2) Xử lý: o Biến định tính: Mode (làm hàm Mode (yếu vị) để tính ra) o Biến định lượng: Median (làm hàm Median để tính ra) (còn Mean: dành cho giá trị khuyết) (*vì nó cho ra số nguyên) Liên tục:1, 2.1, 3.2, 2.1, 2, … (cân nặng, chiều cao) Rời rạc: 1, 2, 3, 4 o Sau đó mình nhập giá trị mới và các giá trị Missing/lỗi 1.3. Nhập liệu và quản lý biến số *Dùng SPSS 1. Vào SPSS 2. Import Data 3. Xem Data View Xử lý phần dư 4. Chỉnh lại: Variable View – Measure (loại thang đo) Biến định tính: 1. Ordinal (có phân biệt thứ bậc, VD: vị trí, bậc lương) 2. Norminal (không phân biệt thứ bậc, VD: giới tính, lợi nhuận/phi lợi nhuận (trừ số thứ tự) Biến định lượng: Scale 1. Khoảng 2. Tỉ lệ 5. Chỉnh lại: LABEL + Mode: STT; + Dum: Giới tính; Còn lại không cần (Label của giá trị, làm rõ số đó là gì) 6. Chỉnh lại VALUE Dùng cho biến định tính: 1. Nam 2. Nữ