You are on page 1of 10

SPSS 04: KIỂM ĐỊNH MỐI LIÊN HỆ GIỮA HAI BIẾN

CÂU 01- Kiểm định về mối liên hệ giữa hai biến “cách đọc các tờ báo nói chung”
(c6.1) và “trình độ học vấn” (nhomhv) xem thử có tồn tại mối liên hệ giữa hai
biến này trong tổng thể không với mức ý nghĩa 0.05 ?.
Sử dụng SPSS thực hiện kiểm định Chi – bình phương
Để nghiên cứu mối liên hệ giữa trình độ học vấn và cách đọc các tờ báo của người
đọc bằng kiểm định Chi – bình phương, ta lập bảng chéo (Crosstab) để tìm hiểu mối quan
hệ này.
Từ menu Analyze – Descriptive Statistics – Crosstabs…, lệnh này mở ra hộp thoại
Crosstabs như sau:

Dù cho bạn thiết lập vị trí của 2 biến trong bảng như thế nào (tức là dù cho biến
nào được đặt ở hàng hay cột) thì giá trị 2 tính toán được vẫn luôn bằng nhau)
Trong hộp thoại này, nếu đưa biến thứ bậc nhomhv (nhóm học vấn) vào ô cột và
biến định danh c6.1 (cách đọc các tờ báo) vào ô dòng, nhấn nút OK, ta được một bảng
kết hợp của 2 biến trên mà trong các ô là tần số quan sát giống như bảng 2 biến được
lập bằng lệnh Basic Tables.
Để kiểm định giả thuyết về mối liên hệ giữa nhomhv và c6.1, ta đặt giả thuyết
không H0 như sau
H0 : học vấn không có liên hệ với cách đọc báo (cách đọc báo không chịu ảnh
hưởng của học vấn)
Bạn mở lại hộp thoại Crosstab, từ trong hộp thoại Crosstabs nhấn nút Statistics…,
hộp thoại Crosstab: Statistics mở ra:

- Nominal: Các đại lượng kiểm định (dùng cho trường hợp 2 biến dạng định danh)
mà có khả năng đo lường độ mạnh của mối tương quan giữa 2 biến
- Ordinal: Các đại lượng kiểm định (dùng cho trường hợp 2 biến dạng thứ bậc)
Trong hộp thoại này ta đánh dấu chọn đại lượng Chi – square rồi nhấn nút
Continue để trở về hộp thoại Crosstabs. Trong hộp thoại Crosstabs, nhấn tiếp nút Cells…
để mở hộp thoại Crosstabs: Cell Display nhằm xác định các đại lượng thống kê thể hiện
trong từng ô của bảng chéo
- Count: đếm tần số, thông thường người ta hay chọn thể hiện tần số quan sát
(Observed) hơn là thể hiện tần số mong đợi.
- Percentages: thể hiện phần trăm, chọn thể hiện phần trăm theo cột nếu biến
nguyên nhân đặt ở cột.
Lựa chọn xong bạn nhấn Continue, cuối cùng là OK. Kết quả do lệnh Crosstabs
đưa ra gồm 3 bảng: bảng đầu tiên thể hiện những thông tin tổng hợp, thứ 2 là bảng chéo
kết hợp 2 biến mà trong các ô thể hiện đại lượng thống kê bạn đã chọn ở hộp thoại
Crosstab: Cell Display và cuối cùng là bảng tóm lược kết quả kiểm định 2
Bạn sẽ đọc kết quả kiểm định ở dòng đầu tiên Pearson Chi-Square của bảng bên
dưới. Tra bảng Chi – bình phương tìm giá trị giới hạn ở bậc tự do 9 và mức ý nghĩa 0,05
(vì bạn đã chọn độ tin cậy của kiểm định này là 95%) rồi so sánh giá trị Chi – bình phương
tính toán được 20,238 với giá trị giới hạn này 2 > 2(4-1)(4-1); 0,05 =16,9190 < 20,238
Theo tiêu chuẩn quyết định, chúng ta sẽ bác bỏ giả thuyết H 0 và kết luận rằng học
vấn có ảnh hưởng đến cách đọc báo của người đọc.
Có một nguyên tắc khác hay được sử dụng trong kiểm định giả thuyết là dùng giá
trị p-value. P-value là xác suất bạn sẽ phạm phải sai lầm loại I – nghĩa là xác suất loại bỏ
giả thuyết H0 với những thông tin bạn tính toán được, như vậy nó có cùng ý nghĩa với
mức ý nghĩa α. Xác suất này càng cao cho thấy hậu quả của việc phạm sai lầm khi loại
bỏ giả thuyết H0 càng nghiêm trọng (và ngược lại) như vậy quy tắc chung là khong bác
bỏ giả thuyết H 0 nếu p-value quá lớn. Với quy tắc này bạn không cần phải mất công tra
bảng tìm giá trị tới hạn mà chỉ cần xem xét độ lớn của p-value rồi ra quyết định như sau:
- Nếu p-value < 0,1 thì kiểm định của bạn có ý nghĩa với độ tin cậy 90% (khái niệm
“có ý nghĩa” được hiểu là giả thuyết H 0 có thể bị bác bỏ với độ tin cậy 90%)
- Nếu p-value < 0,05 thì kiểm định của bạn có ý nghĩa với độ tin cậy 95% (khái
niệm “có ý nghĩa” được hiểu là giả thuyết H 0 có thể bị bác bỏ với độ tin cậy 95%). Đây là
điều kiện thường xứ dụng.
- Nếu p-value < 0,01 thì kiểm định của bạn có ý nghĩa với độ tin cậy 99% (khái
niệm “có ý nghĩa” được hiểu là giả thuyết H 0 có thể bị bác bỏ với độ tin cậy 99%)
SPSS gọi p-value là Sig. (viết tắt từ Observed significance level – mức ý nghĩa
quan sát). Lúc này thay vì bạn phải tra bảng Chi – bình phương để tìm giá trị tới hạn rồi
so sánh giá trị Chi – bình phương tính toán với giá trị này thì SPSS đã tính ngược lại với
mức ý nghĩa quan sát Sig. ứng với giá trị Chi – bình phương tính toán được 20,238. Ở
đây Sig. = 0,017 (hay 1,7%)
Từ quy tắc của p-value, bạn sẽ quyết định theo nguyên tắc:
- Chấp nhận giả thuyết H0 nếu Sig. > α, vì nếu ta bác bỏ giả thuyết H 0 thì khả năng
phạm sai lầm của ta sẽ lớn hơn mức ý nghĩa cho phép.
- Bác bỏ giả thuyết H 0 nếu Sig. ≤ α, vì lúc này xác suất phạm sai lầm nếu ta bác
bỏ giả thuyết H 0 nhỏ hơn mức ý nghĩa cho phép nên có thể an toàn khi bác bỏ giả thuyết
H0.
Vì ở đây Sig. < α nên ta bác bổ giả thuyết H 0. Ta kết luận rằng với tập dữ liệu
mẫu , có đủ bằng chứng để nói rằng trình độ học vấn có liên hệ với cách đọc báo.
Chúng ta có thể dựa vào các tỉ lệ phần trăm theo cột trong bảng chéo (Crosstabulation)
để mô tả sự liên hệ hay sự khác biệt về cách đọc báo giữa các nhóm học vấn. Quy ước
chung là tính phần trăm từ trên xuống, đọc và so sánh theo hàng ngang. Để thấy được
các & này bạn chọn mục Percentage Column trong hộp thoại Crosstabs: Cell Display.
Giải thích về các đại lượng trên các bảng
Kiểm định Chi – bình phương chỉ có ý nghĩa khi số quan sát đủ lớn, nếu có quá
20% số ô trong bảng chéo có tần số lý thuyết nhỏ hơn 5 thì giá trị 2 nói chung không
còn đáng tin cậy. Lúc này bạn phải nghĩ đến biện pháp gom các biểu hiện trên các biến
lại để tăng số quan sát trong mỗi nhóm lên (thực hiện Recode lại các biến để gom các
biểu hiện trên các biến lại để tăng số quan sát). Cuối bảng Chi – Square Tests, SPSS
luôn đưa ra một dòng thông báo cho bạn biết % số ô có tần suất mong đợi dưới 5 của
bảng. Trong ví dụ của chúng ta không có ô nào có tần suất mong đợi dưới 5 nên ta có
thể tin tường vào độ chính xác của kiểm định.
- Continuity Correction là một dạng biến thể của Pearson Chi-Square để sử dụng
cho những bảng dạng 2x2, tức là bảng kết hợp của 2 biến mà mỗi biến đều chỉ có 2 biểu
hiện.
- Likelihood Ratio là một số thống kê tương tự Pearson Chi-Square, với những cỡ
mẫu lớn kết quả của 2 số thống kê này rất gần nhau.
- Linear-by-Linear Association đo lường mối liên hệ tuyến tính giữa 2 biến, số
thống kê này chỉ hưu dụng khi biến hàng và cột được sắp trật tự từ nhỏ nhất đến lớn
nhất, còn nếu không bạn hãy bỏ qua nó.
- Ngoài ra còn một số thống kê nữa không được thể hiện là kết quả kiểm định
Fisher’s Exact. Fisher’s Exact Test rất phù hợp cho bảng 2x2 với tình huống các tần số
mong đợi tại các ô nhỏ hơn 5. Vì thế khi bạn lập bảng 2x2 thì SPSS mới cung cấp thông
tin của kiểm định Fisher’s Exact cùng với các kết quả của các kiểm định khác.

CÂU 02- Kiểm định mối quan hệ giữa hai biến “cách đọc các tờ báo nói chung” –
c6.1 - và biến tuổi mã hóa – tuoiMH (đã làm). Cho biết kết luận có mối liên hệ nào
giữa học vấn và các đọc báo hay không với mức ý nghĩa 0.05? (LÀM NHƯ TRÊN)
KIỂM ĐỊNH MỐI LIÊN HỆ GIỮA HAI BIẾN THỨ BẬC
CÂU 03- Xét nghiên cứu mối liên hệ giữa tuổi tác (Nhomtuoi) và mức độ quan
tâm đối với chủ đề gia đình trên báo Sài Gòn Tiếp Thị . Cho biết kết luận có
mối liên hệ nào giữa dotuoi (Nhomtuoi) và mức độ quan tâm đến chủ đề gia
đình(c19.3) hay không với mức ý nghĩa 0.05 ?
Trong trường hợp hai yếu tố nghiên cứu là hai biến thu thập từ thang đo thứ bậc,
thay vì dùng đại lượng Chi – bình phương (2), chúng ta có thể dùng một trong các đại
lượng: tau-b của Kendall, d của Somer, gamma của Goodman và Kruskal. Các đại lượng
này giúp phát hiện ra mối liên hệ tốt hơn Chi – bình phương.
Ví dụ: chúng ta cần nghiên cứu mối liên hệ giữa tuổi tác và mức độ quan tâm đối
với chủ đề gia đình trên báo Sài Gòn Tiếp Thị. Cả hai yếu tố này đều là dữ liệu thứ bậc
vì nó được phân hạng như sau:
 Độ tuổi: (18 – 25) tuổi; (26 – 35) tuổi; (36 – 45) tuổi; (46 – 60) tuổi.
 Mức độ quan tâm đến chủ đề gia đình: quan tâm nhất, quan tâm thứ nhì, quan
tâm thứ ba.
 Trước tiên ta lập bảng Crosstabs biểu diễn mối quan hệ giữa tuổi tác và mức
độ quan tâm đến chủ đề gia đình trên báo SGTT. Kết quả thể hiện như sau:

Để thực hiện kiểm định mối liên hệ trong tình huống này ta đặt giả thuyết H0: Tuổi
tác không có liên hệ với mức độ quan tâm đến chủ đề gia đình trên báo Sài Gòn Tiếp
Thị ( hay mức độ quan tâm đến chủ đề gia đình trên báo Sài Gòn Tiếp Thị không khác
nhau giữa các nhóm tuổi).

Vận dụng SPSS để thực hiện kiểm định


Để kiểm định giả thuyết H0 đề ra ở trên, mở hộp thoại Crosstabs. Trong hộp thoại
này đưa biến c19.3 (mức độ quan tâm đến chủ đề gia đình) vào ô Row và biến dotuoi
(nhóm tuổi) vào ô Column. Rồi chọn nút Statistics… Trong hộp thoại Statistics ta chọn
các đại lượng kiểm định như hình bên dưới, sau đó bấm nút Continue trở về hộp thoại
Crosstabs. Chọn nút Cells… Trong hộp thoại Crosstabs: Cell Display ta chọn Row trong
phần Percentages, sau đó bấm nút Continue trở về hộp thoại Crosstabs. và bấm OK.
Hệ số tương quan r Pearson và hệ số tương quan hạng Spearman để đo lường
mức độ tương quan tuyến tính giữa 2 biến định lượng hay thứ bậc khi ta chọn
Correlations
Kết quả kiểm định xuất hiện trong các bảng bên dưới. Ta thấy gamma = 0,077,
SPSS tra ngược bảng giá trị z để tìm phần diện tích nằm dưới đường cong chuẩn giữa
trung bình và giá trị z, từ đó nó suy ra phần diện tích dưới đường cong mà chính là giá
trị p-value
Với mức ý nghĩa Sig. = 0,498 > 0,05 ta không thể bác bỏ giả thuyết H0. Có thể
kết luận rằng với dữ liệu mẫu ta có thì không đủ bằng chứng thống kê cho thấy
tuổi tác có liên quan đến mức độ quan tâm đến chủ đề gia đình. Như vậy có lẽ ở bất
kỳ độ tuổi nào người độc cũng có những mối quan tâm nhất định đối với chủ đề gia đình.
Dùng tau-b ta cũng đi đến kết luận tương tự.

Giá trị Sig. (0.987) từ kiểm định 2 trong trường hợp này lớn hơn giá trị Sig. mà
Gamma đưa ra rất nhiều

You might also like