Professional Documents
Culture Documents
TSR101 Bai5 v1.0015108208
TSR101 Bai5 v1.0015108208
11
v1.0015108208
BÀI 5
PHƯƠNG PHÁP XỬ LÍ DỮ LIỆU
v1.0015108208 2
MỤC TIÊU CỦA BÀI
v1.0015108208 3
CÁC KIẾN THỨC CẦN CÓ
v1.0015108208 4
HƯỚNG DẪN HỌC
v1.0015108208 5
CẤU TRÚC NỘI DUNG
v1.0015108208 6
5.1. CÁC KHÁI NIỆM CƠ BẢN
Tóm lược các loại biến cố
Loại biến số Định nghĩa Các hình thức thể hiện khác
Một biến số được đo lường để xác định • Biến thành quả (Outcome)
Phụ thuộc sự tác động (treatment) hay thay đổi
• Biến kết quả (Result)
(Dependent) (manipulation) của biến độc lập như
thế nào. • Biến tiêu chí (Criterion)
v1.0015108208 8
5.2.1. CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU
Thang đo đa phương
Thang Likert
(mutiple item scale)
v1.0015108208 9
5.2.1. CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)
1 2 3 4 5 6 7
v1.0015108208 10
5.2.1. CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)
Thang đo so sánh
So với Bita’s, Biti’s là
1 2 3 4 5 6 7
Thang tổng
Bạn có 100 điểm (trọng số) để phân phối vào các khía cạnh khác nhau của nhà hàng:
• Khung cảnh
• Giá
• Dịch vụ
• Chất lượng thức ăn
100 điểm
v1.0015108208 12
5.2.1. CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)
b. Thang đo đa phương
• Khi thuộc tính cần đo có thể có nhiều thành tố cùng một lúc:
Ví dụ: Năng lực làm việc thể hiện qua nhiều thành tố (item) như:
Điểm số học tập;
Thông minh (IQ);
Khả năng cảm xúc (EQ).
• Một trả lời sẽ không thể hiện hết hoặc thể hiện không đúng nội dung cần đo.
Thang đo tổng thể (summated)
• Thang Likert: Cách đo lường dựa vào mức độ “đồng ý” và không đồng ý về các nội
dung muốn xem xét.
• Phần lớn được dùng nghiên cứu động thái của tổ chức.
v1.0015108208 13
5.2.2. ĐỘ TIN CẬY
v1.0015108208 14
5.2.3. XỬ LÍ DỮ LIỆU
v1.0015108208 15
5.2.4. ĐO LƯỜNG KHUYNH HƯỚNG TẬP TRUNG
• Số bình quân mẫu (Mean) thường được dùng với vai trò ước lượng xu hướng trung
tâm chẳng hạn số bình quân của tổng thể chung. Số bình quân theo nghĩa thông
thường, được gọi chính xác hơn là số bình quân số học để phân biệt với số bình
quân nhân hay số bình quân điều hòa. Nó còn được gọi là số bình quân của mẫu.
• Số trung vị (Median) là một số tách giữa nửa lớn hơn và nửa bé hơn của một mẫu,
một quần thể, hay một phân bố xác suất. Nó là giá trị giữa trong một phân bố, mà số
các số nằm trên hay dưới con số đó là bằng nhau. Điều đó có nghĩa rằng 1/2 quần
thể sẽ có các giá trị nhỏ hơn hay bằng số trung vị, và một nửa quần thể sẽ có giá trị
bằng hoặc lớn hơn số trung vị.
• Mốt (Mode) của một danh sách dữ liệu là giá trị của phần tử có số lần xuất hiện lớn
nhất trong danh sách. Ví dụ, mode của {1, 3, 6, 6, 6, 7, 7, 12, 12, 17} là 6. Khác
với số bình quân số học giản đơn, mode không nhất thiết phải là duy nhất. Mode đặc
biệt hữu dụng khi các giá trị của các quan sát không có thứ tự dễ thấy (thường khi
dữ liệu không phải là số) do các số bình quân và số trung vị có thể không được xác
định. Ví dụ, mode của {táo, táo, chuối, cam, cam, cam, đào} là cam.
v1.0015108208 16
5.2.4. ĐO LƯỜNG KHUYNH HƯỚNG TẬP TRUNG
Mốt (Mode) Số mệnh danh Dữ liệu dưới dạng Màu mắt, hình thức hợp
phân loại. đồng, giới tính.
Trung vị Số thứ tự Dữ liệu bao gồm các Phân hạng trong lớp, thứ
(Median) giá trị cực biên. tự lúc sinh.
Trung bình Miền và tỉ lệ Dữ liệu phù hợp. Tốc độ trả lời, tuổi, mức
(Mean) độ thích.
v1.0015108208 17
5.2.5. KIỂM TRA T-MẪU ĐỘC LẬP (T-TEST)
• Quy trình kiểm tra T-mẫu độc lập so sánh trung bình của 2 nhóm.
Đối tượng cần được phân bổ vào 2 nhóm một cách ngẫu nhiên, vì vậy sự khác
biệt có được là do tác động (hay không chịu tác động) mà không phải do sự ảnh
hưởng của yếu tố khác. Chẳng hạn nếu so sánh thu nhập bình quân giữa nam và
nữ không phù hợp với loại kiểm tra này.
Một người không được phân công ngẫu nhiên thành nam hay nữ. Trong tình
huống như vậy, bạn nên bảo đảm rằng sự khác biệt ở các yếu tố khác không làm
tăng cường hay giảm nhẹ sự khác biệt đáng kể của trung bình.
Khác biệt về thu nhập bình quân có thể chịu ảnh hưởng bởi các yếu tố như học
vấn, chứ không chỉ chịu ảnh hưởng của giới tính.
• Quy trình kiểm tra T một mẫu xác định xem trung bình của một biến nào đó có khác
so với một hằng số cho trước hay không. Ví dụ: Một nhà sản xuất thực phẩm muốn
kiểm tra các hộp thực phẩm của mình có trọng lượng trung bình khác với 300 gram,
với mức tin cậy là 95%.
v1.0015108208 18
5.2.6. PHÂN TÍCH PHƯƠNG SAI MỘT HƯỚNG (ONE-WAY ANOVA)
• Quy trình phân tích phương sai một hướng là lối phân tích phương sai của biến phụ
thuộc bởi một biến số đơn (biến độc lập).
• Phân tích phương sai được dùng để kiểm tra giả thuyết rằng nhiều trung bình là
bằng nhau. Đây là một kĩ thuật mở rộng của phương pháp kiểm tra T hai mẫu
độc lập.
• Bên cạnh việc xác định sự khác biệt giữa các trung bình, bạn cũng đôi khi muốn xác
định xem trung bình nào là khác biệt.
• Có 2 loại kiểm tra để so sánh trung bình:
Đối chiếu ưu tiên là lối kiểm tra tiến hành trước khi tiến hành thực nghiệm;
Kiểm tra hậu kì là lối kiểm tra tiến hành sau khi thực nghiệm.
• Bạn cũng có thể kiểm tra khuynh hướng thay đổi trên nhiều phân loại khác nhau.
Ví dụ: Mức độ tiếp thu bài giảng của học sinh thay đổi khác nhau. Một thực nghiệm
tiến hành với 3 môn học khác nhau: Toán, Lí và Văn. Toán, Lí là môn khoa học suy
luận và Văn là môn diễn đạt.
• Bên cạnh tiến hành kiểm tra mức độ tiếp thu bài giảng tùy thuộc vào loại môn giảng,
bạn cũng có thể xác định mức độ tiếp thu khác biệt giữa các môn suy luận và môn
diễn đạt.
v1.0015108208 19
5.2.7. XÂY DỰNG MÔ HÌNH HỒI QUY
• Phân tích hồi quy là một phân tích thống kê để xác định xem các biến độc lập (biến
thuyết minh) quy định các biến phụ thuộc (biến được thuyết minh) như thế nào.
• Đây là một phương pháp thống kê mà giá trị kì vọng của một hay nhiều biến ngẫu
nhiên được dự đoán dựa vào điều kiện của các biến ngẫu nhiên khác.
• Phân tích hồi quy không chỉ là trùng khớp đường cong (lựa chọn một đường cong
mà vừa khớp nhất với một tập điểm dữ liệu); nó còn phải trùng khớp với một mô
hình với các thành phần ngẫu nhiên và xác định.
• Hồi quy thường được xếp vào loại bài toán tối ưu vì chúng ta nỗ lực để tìm kiếm một
giải pháp để cho sai số và phần dư là tốt nhất. Phương pháp sai số chung nhất được
sử dụng là phương pháp bình phương cực tiểu: Phương pháp này tương ứng với
một hàm hợp lí dạng Gauss của các dữ liệu quan sát khi biết biến ngẫu nhiên (ẩn).
Về một mặt nào đó, bình phương cực tiểu là một phương pháp ước lượng tối ưu:
Xem định lí Gauss-Markov.
v1.0015108208 20
5.3. XỬ LÍ THÔNG TIN ĐỊNH TÍNH
v1.0015108208 21
5.3.1. CÁC KĨ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH
• Sau khi thu thập xong dữ liệu, thông thường tất cả các nhà nghiên cứu đều muốn:
Xác định chủ đề và các tiểu chủ đề;
Xây dựng codebook;
Mô tả lại hiện tượng;
Đưa ra các so sánh;
Xây dựng, thể hiện và kiểm tra các mô hình (các lí thuyết sử dụng trong
nghiên cứu).
• Quá trình phân tích dữ liệu phải đáp ứng được những mục tiêu nêu trên.
v1.0015108208 22
5.3.1. CÁC KĨ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
• Lí thuyết căn bản • Phân tích nội dung • Dân tộc học
• Phân tích giản đồ • Sử dụng nội dung • Quyết định các
• Phân tích quy nạp của các từ điểm mô hình
v1.0015108208 23
5.3.1. CÁC KĨ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
• Phân tích dữ liệu dạng chữ: Kĩ thuật phân tích từ ngữ và các đoạn văn bản bao gồm
Phép phân tích những từ ngữ quan trọng trong hoàn cảnh cụ thể (KWIC);
Đếm từ;
Phân tích những mạng lưới có ý nghĩa.
• Phân tích dữ liệu dạng mã hóa:
Phân tích lí thuyết nền;
Phân tích giản đồ;
Quy nạp phân tích;
Phân tích nội dung căn bản;
Sử dụng từ điển nội dung.
v1.0015108208 24
5.3.1. CÁC KĨ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
Thời điểm thích hợp tiến hành phân tích dữ liệu định tính
• Survey: Dựa trên kiểm định có tiêu chuẩn hoặc những thiết kế cho nghiên cứu thực
nghiệm thì ranh giới giữa thu thập và phân tích dữ liệu khá rõ ràng.
• Nghiên cứu định tính: Ranh giới giữa 2 quá trình này là không rõ ràng vì
Mang tính khám phá;
Thay đổi linh hoạt.
• Ví dụ:
Trong quá trình thực địa, những ý tưởng phân tích sẽ trực tiếp xuất hiện.
Các mẫu hình sẽ dần sắc nét.
Giai đoạn đầu của fieldwork có xu hướng chung chung và dễ thay đổi theo sự
biến đổi của dữ liệu.
v1.0015108208 25
5.3.1. CÁC KĨ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
v1.0015108208 26
5.3.1. CÁC KĨ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
Lời khuyên: Mô tả tập trung
Cùng với quá trình phân tích dữ liệu cần chú ý: Những dữ liệu phong phú, chi tiết và cụ
thể sẽ giúp nghiên cứu định tính.
• Cung cấp cho người đọc khả năng hiểu về thực tế, con người và hoàn cảnh cụ thể
thông qua cách nghiên cứu bối cảnh.
• Các dấu hiệu và ý nghĩa của các sự việc.
• Tạo nền tảng cho tất cả các phần trong báo cáo.
Lời khuyên: Tổ chức dữ liệu
Tổ chức dữ liệu theo hệ thống hợp lí
• Dữ liệu của phương pháp nghiên cứu định tính rất lớn và không có một hệ thống
khuôn mẫu rõ ràng như trong nghiên cứu định lượng.
• Cần phải hoàn thành quá trình thu thập thông tin đủ và thông tin cần trước khi tiến
hành phân tích.
• Dữ liệu nên được ghi chép trong một hệ thống bằng việc gán nhãn cho các phần
dữ liệu.
Lời khuyên: Bảo vệ dữ liệu
Phải có những bản photo dự phòng để ở một nơi khác nhằm giữ an toàn cho dữ liệu
tránh khỏi những sự cố đáng tiếc như: Dữ liệu bị làm xáo trộn, bị mất hoặc bị cháy.
v1.0015108208 27
5.3.1. CÁC KĨ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
Kết luận/
kiểm chứng
thông tin
v1.0015108208 28
5.3.2. XỬ LÍ DỮ LIỆU ĐỊNH TÍNH
Xử lí dữ liệu
định tính
Thể
Tìm
Nhập Phát hiện
kiếm Gán
Phân Tạo và Mã triển mối Chuẩn Kiểm
các nhãn
tích các lưu hóa hệ quan bị chứng
trường cho
ban bản trữ dữ thống hệ báo thông
hợp các
đầu ghi thông liệu dữ giữa cáo tin
điển nhóm
tin liệu các
hình
nhóm
v1.0015108208 29
5.3.2. XỬ LÍ DỮ LIỆU ĐỊNH TÍNH
v1.0015108208 30
5.3.2. XỬ LÍ DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
• Cơ cấu liên kết và giảm mức độ khác nhau (kết nối những nguồn dữ liệu khác nhau
hoặc những phần khác nhau trong quá trình phân tích).
• Cách thức thể hiện dữ liệu:
Tốc độ và quy trình tìm kiếm, thu thập dữ liệu;
Thể hiện những biến đổi quan trọng (bao gồm hoặc không bao gồm ngoại cảnh);
Ghi chép chi tiết (ghi chép lại những phần đã thực hiện).
v1.0015108208 33
TÓM LƯỢC CUỐI BÀI
Trong bài này, chúng ta đã được nghiên cứu các nội dung sau:
• Các khái niệm cơ bản liên quan đến xử lí thông tin định tính
và định lượng;
• Các phương pháp xử lí thông tin định lượng;
• Các phương pháp xử lí thông tin định tính.
v1.0015108208 34