Professional Documents
Culture Documents
Bai Demo 10 Xu Ly Va Phan Tich Du Lieu
Bai Demo 10 Xu Ly Va Phan Tich Du Lieu
XỬ LÝ VÀ
PHÂN TÍCH DỮ LIỆU
1
Mục tiêu:
• Hiểu được các khái niệm về xử lý dữ liệu
• Phác thảo các giai đoạn của quá trình xử lý dữ liệu
• Hiểu được bản chất của phân tích và giải thích dữ
liệu
• Xác định và mô tả được các phương pháp phân tích
dữ liệu
• Lựa chọn được các kỹ thuật xử lý dữ liệu
2
Nội dung chương
10.1 Xử lý dữ liệu
3
10.1. Xử lý dữ liệu
4
Khái niệm
5
Quá trình chuyển hóa dữ liệu
Dữ liệu Dữ liệu
thô tinh
6
Quy trình xử lý dữ liệu
7
Công việc chuẩn bị dữ liệu
8
Kiểm tra tính hợp lệ của dữ liệu
9
Hiệu chỉnh dữ liệu
10
Mã hóa dữ liệu
Mã hóa dữ liệu (coding) là quá trình chuyển đổi
các trả lời thành dạng mã số để nhập và xử lý
dễ dàng
11
Mã hóa dữ liệu trên bảng câu hỏi
12
Mã hóa dữ liệu trên bảng câu hỏi
Câu hỏi một lựa chọn (SA)
• Thực hành ví dụ:
Bạn đánh giá mức thu nhập hiện
nay của bạn như thế nào?
quá thấp
thấp
trung bình
cao
rất cao
không trả lời
13
Danh bạ mã hóa
hay sổ mã hóa
• Biến các trả lời thành các mã số, ký hiệu
mà máy tính hiểu được
• Giúp cho việc nhập liệu dễ dàng hơn
• Giúp nhà nghiên cứu trong việc phân tích
và diễn giải dữ liệu
14
Nội dung trong danh bạ mã hóa
• Số thứ tự của câu hỏi.
• Vấn đề của câu hỏi (thường là tóm tắt nội dung câu hỏi).
• Tên của biến số phát sinh từ câu hỏi
• Nhãn của biến số (variable label)
• Các giá trị mã hóa: là các giá trị mà biến số có thể nhận
được để biểu diễn thông tin được trả lời
• Nhãn giá trị mã hoá (Value Label) thường dùng để mô tả ý
nghĩa của các giá trị mã hóa.
15
STT Vấn đề Tên Mô tả Các giá trị Mô tả các giá trị mã
câu câu hỏi biến số biến số mã hóa hóa
hỏi
1 Vùng REGI Vùng địa lý 1 Hà Nội
phỏng vấn 2 Đà Nẵng
3 TP.HCM
4 Cần Thơ
2 Có sử dụng USE 1 Có
sữa rửa 2 Không
mặt không
3 Sử dụng BRAND Nhãn hiệu 1 Pond’s
nhãn hiệu đang dùng 2 Hazeline
nào?
3 Biore
4 Lana
5 Nivea
6 Naco
7 Loại khác
4 Sử dụng TIME Thời điểm 1 Sáng sớm khi thức dậy
sữa rửa sử dụng 2 Buổi sáng
mặt vào khi 3 Buổi trưa
nào?
4 Buổi chiều
5 Tối trước khi ngủ 16
Câu hỏi Ý nghĩa câu hỏi Giá trị Mô tả giá trị mã hóa
(biến) mã hóa
18
19
Các phương pháp xử lý dữ liệu
Phương pháp thủ công
- SPSS
- Excel
Ưu & nhược điểm??? 20
10.2. Phương pháp phân tích và giải
thích dữ liệu
21
Phân tích Phân tích thống kê
thống kê sử dụng nhiều biến
miêu tả số
23
Bảng tần số đơn giản
• Dùng để đếm tần số về các biểu hiện của một
thuộc tính
• Được thực hiện với cả biến định tính và định lượng
• Cần tiến hành gom biến trước khi lập bảng tần số
với các biến định lượng có nhiều giá trị
24
Bảng tần số về tuổi đáp viên
Cumulative 36 8 1.6 59.6
Frequency Percent Percent
Valid
37 6 1.2 60.8
18 9 1.8 1.8
38 16 3.2 64.0
19 8 1.6 3.4
39 14 2.8 66.8
20 16 3.2 6.6
40 18 3.6 70.4
21 19 3.8 10.4
41 10 2.0 72.4
22 22 4.4 14.8
42 16 3.2 75.6
23 26 5.2 20.0
43 7 1.4 77.0
24 29 5.8 25.8
44 6 1.2 78.2
25 21 4.2 30.0
45 10 2.0 80.2
26 15 3.0 33.0
46 12 2.4 82.6
27 13 2.6 35.6
28 19 3.8 39.4 47 7 1.4 84.0
Cumulative
Frequency Percent Valid Percent Percent
Độ tuổi
18-25 150 30.0 30.0 30.0
58.0
26-35 140 28.0 28.0
80.2
36-45 111 22.2 22.2
100.0
46-60 99 19.8 19.8
30
Khái quát về kiểm định giả
thuyết
Các bước thực hiện kiểm định giả thuyết:
Giả thiết (6) Rút ra các kết luận liên quan đến giả thuyết “không”: bác bỏ
“không”: H0 hay chấp nhận giả thuyết này 31
Phương pháp kiểm định giả thiết
32
Phương pháp phân tích thống
kê đa biến
33
Phân tích thống kê hai biến
34
Phân tích thống kê nhiều biến
35
Để đánh giá mối liên hệ biến số độc lập và biến
số phụ thuộc nhà nghiên cứu thường …….
Câu hỏi:
1. Lập bảng tần suất, lập bảng so sánh chéo giới
tính và hành vi mua sắm, tính tỷ lệ phần trăm các
câu trả lời theo giới tính.
2. Kiểm định giả thuyết mức độ hiểu biết về kem
đánh răng P/S với các nhóm giới tính khác nhau với
mức ý nghĩa α = 0,05 (Kiểm định khi bình phương).
37
Gợi ý
- Lập bảng tần suất
Trả lời Tần suất
Biết 380
Không biết 170
Tổng số 550
- Lập bảng so sánh chéo giới tính và hành vi
mua sắm
Biết Không biết Tổng số
Nam 180 70 250
Nữ 200 100 300
Tổng số 380 170 550
38
Gợi ý
-Tính tỷ lệ phần trăm các câu trả lời theo giới
tính
+ Theo dòng
Biết Không biết Tổng số
Nam 72% 28% 100%
Nữ 66,7% 33,3% 100%
+ Theo cột
Biết Không biết
Nam 47,4% 41,2%
Nữ 52,6% 58,8%
Tổng số 100% 100%
39
Gợi ý
2. Kiểm định giả thuyết mức độ hiểu biết về kem
đánh răng P/S với các nhóm giới tính khác nhau
với mức ý nghĩa α = 0,05.