Professional Documents
Culture Documents
1
Bố cục
o Giới thiệu môn học
o Các khái niệm cơ bản
o Biến và thang đo, chọn mẫu
o Thống kê mô tả
o Thống kê suy diễn
o Phụ lục bảng
2
Mục Đích của Thống Kê
o Tập hợp và mô tả dữ liệu
o Phân tích dữ liệu
o Đưa ra những kết luận từ dữ liệu
3
Thống kê cung cấp phương pháp:
o Thiết kế: lập kế hoạch và tiến hành nghiên
cứu.
o Mô tả: tập hợp và khai thác dữ liệu.
o Suy diễn: đưa ra những dự báo hay khái quát
hóa hiện tượng từ việc phân tích dữ liệu.
4
Thiết kế
o Giúp xác định phương cách tốt nhất để thu
thập dữ liệu nghiên cứu.
o Ví dụ, những yếu tố trong việc thiết kế 1 cuộc
nghiên cứu là xem xét làm thế nào để tiến
hành một cuộc điều tra, bao gồm xây dựng
bảng câu hỏi và chọn mẫu
5
Mô tả
o Mô tả và khai thác dữ liệu – bao gồm những
cách thức tổng hợp và khai thác các đặc trưng
của dữ liệu đã được đo lường.
o Mục đích chính là xác định những số liệu rời
rạc, không có ý nghĩa và trình bày chúng
trong một cách có ý nghĩa và có thể hiểu
được.
6
Suy luận
o Bao gồm những cách để đưa ra các dự báo
dựa trên dữ liệu thu thập được.
o Những sự dự báo này được gọi là những suy
luận thống kê.
7
Vai trò của máy tính trong thống kê
SPSS: Statistical Package for the Social Sciences
o Một công cụ hữu hiệu để phân tích dữ liệu
o Được dùng phổ biến bởi các nhà khoa học xã
hội
8
Vai trò của máy tính trong thống kê
o Tương đối dễ sử dụng
o Đòi hỏi sự thành thạo một vài kiến thức về
phương pháp nghiên cứu
9
Khảo sát lớp học
1. Giới tính
1. Nam 2. Nữ
10
3. Thích ăn loại fast food nào?
1. KFC
2. Lotteria
3. Loại khác
11
4. Điểm trung bình chung năm học vừa qua:
…………/ 100
12
6. Có phải là người thức dậy sớm?
1. Có
2. Không
13
8. Tâm trạng khi học môn Thống kê xã hội
1. Rất lo lắng 4. Thích
2. Lo lắng vừa phải 5. Rất thích
3. Bình thường
14
Các khái niệm cơ bản
o Tổng thể (population): là tập hợp các phần tử
được quan tâm trong một nghiên cứu. Nó có
thể hầu như là mọi thứ.
Ví dụ: dân số Việt Nam, tổng thể sinh viên
của trường ĐH KHXH&NV hay tổng số sinh
viên của một Khoa.
15
Các khái niệm cơ bản (t.t)
o Mẫu (sample): là tập hợp con của tổng thể
được chọn ra để tiến hành thu thập dữ liệu
nghiên cứu.
Khi mẫu được chọn đảm bảo tính đại diện, sẽ
có thể sử dụng để suy rộng ra các đặc trưng
của tổng thể.
16
Ví dụ, một công ty nghiên cứu thị trường tiến
hành khảo sát 650 người tiêu dùng để thu thập
thông tin về thị hiếu dùng sữa của người dân
thành phố HCM.
17
Các khái niệm cơ bản (t.t)
o Biến (variable): là tập hợp các đặc trưng và
giá trị được dùng để chỉ một khái niệm.
19
Các khái niệm cơ bản (t.t)
o Biến độc lập (independent variable): là biến
được dùng để giải thích cho nguyên nhân của
một hiện tượng.
o Biến phụ thuộc (dependent variable): được
coi là biến kết quả, nó chịu sự chi phối của
biến độc lập.
20
o Ví dụ, hút thuốc lá -> biến độc lập
ung thư phổi -> biến phụ thuộc
21
Các khái niệm cơ bản (t.t)
o Thao tác hóa (operationalization): một
phương pháp để quan sát và ghi nhận những
khía cạnh của một cá nhân, khách thể, hay
một sự kiện có liên quan để tiến hành kiểm
định giả thuyết.
22
Ví dụ, khái niệm về kinh tế bền vững, bao
gồm các chỉ báo cấp 1:
- giáo dục
- tỉ lệ xuất khẩu
- nhập khẩu
- hay tỉ lệ tăng trưởng kinh tế
23
Các khái niệm cơ bản (t.t)
o Đo lường (measurement): là cách thức gán
những con số hay giá trị cho các quan sát
theo một quy tắc nhất định.
24
Biến (Variable)
o Hai loại biến: biến định tính (qualitative
variable) và biến định lượng (quantitative
variable).
o Đối với biến định tính, những đặc trưng phân
biệt dựa trên sự khác biệt về đặc tính, chứ
không phải về số lượng hoặc độ lớn.
25
Biến (Variable)
o Các biến được gọi là định lượng khi mà các
giá trị của biến cho thấy sự khác biệt về độ
lớn hay số lượng giữa chúng.
26
Các loại thang đo
o Tương ứng với 02 loại biến định tính và định
lượng, có 02 loại thang đo chính:
29
Thang đo thứ bậc (ordinal scale)
o Là thang đo danh nghĩa nhưng các chỉ báo hay
các phương án trả lời được sắp xếp theo một
trật tự nhất định.
o Nói một cách khác, giữa các chỉ báo này có
quan hệ thứ bậc hơn kém, nhưng thường thì
mức độ hơn kém giữa chúng không xác định
được.
30
Ví dụ
o Thu nhập trung bình hàng tháng
1. Dưới 500 ngàn
2. Từ 500 ngàn đến dưới 1 triệu
3. Từ 1 triệu đến dưới 2 triệu
4. Từ 2 triệu đến dưới 3 triệu
5. Từ 3 triệu trở lên
31
Ví dụ (t.t)
o Kinh tế gia đình so với 5 năm trước
1. Khá hơn rất nhiều
2. Khá hơn chút đỉnh
3. Cũng vậy
4. Tệ hơn chút đỉnh
5. Tệ hơn nhiều
32
Thang đo khoảng cách (interval scale)
33
Thang đo khoảng cách (interval scale)
34
Ví dụ
o Những người có học vấn cao sẽ có thu nhập
cao:
1 2 3 4 5 6 7
rất không rất đồng ý
đồng ý
35
Thang đo tỉ lệ (ratio scale)
o Một thang đo tỉ lệ có tất cả những phẩm chất
của những loại thang đo trước. Ngoài ra thang
đo này có một giá trị 0 “thực”.
36
Ví dụ
o Thu nhập trung bình hàng tháng: ……….
n 5.000.000 đ
37
Biến
Định tính Định lượng
Thang đo Thang đo
định tính định lượng
Các chỉ báo được Khoảng cách giữa các Giá trị 0
sắp xếp theo 1 chỉ số được xác định “thực”
trật tự nhất định một cách cụ thể 38
Thực hành
o Nhận biết thang đo của những câu hỏi sau
đây:
39
Caâu 1: So vôùi 5 naêm tröôùc , ñôøi soáng gia ñình ta coù
toát hôn khoâng?
40
Caâu 2: Xin OÂng (Baø) vui loøng cho bieát ñoà duøng sinh hoaït hieän
coù trong gia ñình (keøm theo quan saùt, neáu thaáy nhöõng gì hieån
nhieân khoâng coù, khoâng neân hoûi)
42
Caâu 4: Trong caùc phöông tieän TTÑC treân, OÂng (Baø) thích
loaïi naøo nhaát ? (khoâng tính ñeán vieäc coù thöôøng xuyeân xem hay
khoâng, chæ choïn moät yù)
Ñoïc baùo Nghe radio Xem truyeàn Xem video Ñoïc saùch Nghe nhaïc
hình (baêng ñóa)
1 2 3 4 5 6
43
Caâu 5: Trong caùc tôø baùo ñaõ ñoïc, OÂng (Baø) thöôøng ñoïc nhöõng
muïc gì nhaát? (Chæ choïn toái ña 3 muïc thöôøng ñoïc nhaát)
44
Caâu 6: (Chæ hoûi nhöõng ngöôøi coù nghe radio) OÂng (Baø) thöôøng
nghe radio nhö theá naøo?
o Thöôøng nghe haàu heát taát caû caùc chöông trình 1
o Ít nghe, neân luùc raûnh gaëp caùi gì nghe caùi ñaáy 2
o Luoân nghe chöông trình quan taâm nhaát 3
45
Caâu 7: Trong caùc chöông trình truyeàn hình, OÂng (Baø) thöôøng
coi chöông trình naøo nhieàu nhaát ? (Chæ choïn toái ña 3 muïc
thöôøng xem nhaát)
Tin töùc trong nöôùc 1 Caùc chöông trình vaên ngheä 7
(cheøo tuoàng, kòch noùi…)
Tin töùc theá giôùi 2 Phim truyeän 8
Theá giôùi ñoù ñaây 3 Chöông trình khaùc 9
Theå thao 4 Ca nhaïc 10
Khoa hoïc kyõ thuaät 5 Toâi haàu nhö khoâng coi ti vi 11
Quaûng caùo 6 Coi haàu heát caùc chöông trình 12
46
Caâu 8: Trong caùc loaïi hình ngheä thuaät noùi chung, OÂng (Baø)
thích loaïi naøo?(bao haøm caû treân caùc PTTTÑC vaø saân khaáu)
Choïn toái ña 3 loaïi hình thích nhaát roài choïn thöù töï öu tieân:
[Maõ soá: thích nhaát:1; thích ôû möùc ñoä thöù nhì:2; thích ôû möùc
ñoä thöù:3]
- Phim
!1 - Ca nhaïc !6
- Cheøo
!2 - Daân ca ! 7
- Caûi löông
!3 - Xieác !8
- Tuoàng, haùt boäi
!4 - Muùa roái !9
- Kòch noùi
!5 - Muùa roái ! 10
- Loaïi hình khaùc (ghi cuï theå):…………………………………
! 11
47
Caâu 9: Trong caùc loaïi nhaïc sau, OÂng (Baø) thích loaïi nhaïc
naøo? (Chæ choïn toái ña 3 loaïi)
48
Caâu 10: Vaø theo OÂng (Baø), ngöôøi Raglay ta caàn phaûi hoïc
ñeán lôùp maáy thì môùi ñöôïc?
Caâu 11: Nhöng treân thöïc teá gia ñình ta coù theå cho con caùi
hoïc ñeán lôùp maáy?
Lôùp: ………………
49
Caâu 12: Theo oâng baø, coù caàn daïy chöõ vieát cuûa ngöôøi Raglai
cho ngöôøi Raglai hay khoâng?
1. Coù 1
2. Khoâng 2
3. Khoù traû lôøi 3 à chuyeån qua caâu 24
50
Caâu 13: Neáu trong gia ñình khoâng coù ñieàu kieän cho taát
caû caùc con ñi hoïc , theo oâng baø neân öu tieân cho con trai
hay con gaùi?
1. Con trai �1
2. Con gaùi �2
51
Caâu 14: Theo oâng baø, khi trong nhaø coù ngöôøi bò beänh coù
caàn môøi thaày cuùng ñeán cuùng ñeå ñöôïc khoûi beänh khoâng?
(PVV khoâng gôïi yù, neáu ngöôøi ñöôïc phoûng vaán khoù traû lôøi
thì neâu caùc phöông phaùp coù theå)
52
Caâu 15: Coù neân laáy ngöôøi khaùc vôùi daân toäc mình khoâng?
1. Coù 1
2. Khoâng 2
3. Khoù traû lôøi 3
53
Caâu 16: Coù neân laáy ngöôøi cuøng hoï vôùi mình khoâng?
1. Coù 1
2. Khoâng 2
3. Khoù traû lôøi 3
54
Caâu 17: Trong gia ñình ta, quyeàn quyeát ñònh cho con caùi
keát hoân laø ai?
55
Caâu 18: Tröôùc khi keát hoân coù caàn xem tuoåi coâ daâu, chuù
reå khoâng?
1. Coù 1
2. Khoâng 2
3. Khoù traû lôøi 3
56
Caâu 19: Khi phuï nöõ mang thai, hoï coù caàn kieâng cöõ
ñieàu gì khoâng? (trong sinh hoaït, aên uoáng)
1. Coù 1
2. Khoâng 2
3. Khoù traû lôøi 3
57
Caâu 20: Tröôùc khi laäp gia ñình, ngöôøi con trai, con gaùi
coù ñöôïc ai ñoù giaûi thích, höôùng daãn nhöõng ñieàu caàn thieát
khi laäp gia ñình khoâng?
(Coù theå choïn nhieàu yù, PVV khoâng ñoïc caùc phöông aùn traû
lôøi)
58
Caâu 21: Trong gia ñình OÂng (Baø) ai laø ngöôøi quyeát ñònh nhöõng vieäc
sau (xaùc ñònh möùc quyeát ñònh cuûa moãi thaønh vieân baèng nhöõng con soá roài
vieát vaøo caùc coät töông öùng sao cho toång möùc quyeát ñònh = 10 phaàn )
Loaïi vieäc Möùc ñoäâ quyeát Möùc ñoä Thaønh
ñònh cuûa quyeát vieân khaùc
choàng ñònh cuûa (ghi roõ)
vôï
1. Vieäc saûn xuaát, laøm aên
2. Mua baùn nhaø cöûa ñaát ñai
3. Xaây döïng, söûa nhaø cöûa
4. Vieäc chi tieâu haøng ngaøy
5. Nhöõng quyeát ñònh coù lieân quan ñeán söùc
khoûe cuûa caùc thaønh vieân
6. Mua caùc ñoà duøng ñaét tieàn (TV, xe
maùy)
7. Caùc vieäc hoïc haønh cuûa con caùi
8. Ngheà nghieäp cuûa con caùi
9. Döïng vôï, gaû choàng cho con caùi
10. Giuùp ñôõ gia ñình beân choàng
11. Giuùp ñôõ gia ñình beân vôï
59
Caâu 22: OÂng (Baø) haõy cho bieát ñaùnh giaù cuûa mình veà nhöõng
nhaän ñònh döôùi ñaây (khoanh vaøo oâ töông öùng sao cho haøng
naøo cuõng coù maõ soá ñöôïc khoanh vaø khoâng truøng nhau)
STT Nhöõng nhaän ñònh Ñoàng Khoâng Khoù
yù ñoàng yù traû
lôøi
1 Trong nhaø chæ coù meï môùi chaêm soùc vaø daïy con toát thoâi 1 2 3
2 Caû cha vaø meï ñeàu coù nghóa vuï vaø traùch nhieäm trong vieäc 1 2 3
chaêm soùc con caùi
3 Coâng vieäc noäi trôï laø coâng vieäc cuûa rieâng ngöôøi phuï nöõ 1 2 3
4 Coâng vieäc gia ñình caàn coù söï chia seû cuûa ngöôøi choàng 1 2 3
5 Ngöôøi phuï nöõ cuõng caàn ñoùng goùp thu nhaäp cho gia ñình 1 2 3
6 Phuï nöõ khoâng caàn kieám tieàn, trong nhaø, ñaøn oâng phaûi laøm 1 2 3
vieäc ñoù.
7 Ngöôøi phuï nöõ coù theå tham gia coâng taùc xaõ hoäi nhö nam giôùi. 1 2 3
8 Phuï nöõ khoâng neân tham gia vaøo coâng vieäc cuûa thoân xoùm, ñoù 1 2 3
laø vieäc cuûa ñaøn oâng
60
Caâu 23: OÂng (Baø) haõy cho bieát möùc ñoä tieáp xuùc vôùi nhöõng
ngöôøi thaân, baïn beø xung quanh nhö theá naøo?
Nhöõng ngöôøi maø ngöôøi traû Thöôøng Thænh Khoâng Khoâng (khoù
lôøi thöôøng noùi chuyeän vôùi xuyeân thoaûng bao giôø traû lôøi)
1.Ngöôøi trong gia ñình 1 2 3 4
2.Hoï haøng 1 2 3 4
3.Baïn beø 1 2 3 4
4.Baø con trong thoân 1 2 3 4
5.Caùn boä thoân 1 2 3 4
6.Caùn boä xaõ 1 2 3 4
61
Caâu 24: Baây giôø toâi seõ ñoïc teân caùc moái quan heä maø chuùng ta
thöôøng coù. OÂng (Baø) haõy laéng nghe vaø cho chuùng toâi bieát
möùc ñoä quan troïng cuûa töøng moái quan heä ñoái vôùi OÂng (Baø)
(Haõy gôïi yù ñeå ngöôøi traû lôøi xaùc ñònh moái quan heä quan troïng nhaát roài noùi:
coøn trong nhöõng quan heä coøn laïi, caùi naøo quan troïng nhaát? Khi coù caâu traû
lôøi, khoanh troøn thöù töï theo töøng haøng)
Hoaøn toaøn khoâng Raát quan
quan troïng troïng
1. Quan heä trong gia ñình 1 2 3 4 5 6 7 8 9 10
2. Quan heä vôùi baø con hoï haøng 1 2 3 4 5 6 7 8 9 10
3. Quan heä vôùi baïn beø 1 2 3 4 5 6 7 8 9 10
4. Quan heä vôùi ñoàng nghieäp 1 2 3 4 5 6 7 8 9 10
5. Quan heä vôùi haøng xoùm 1 2 3 4 5 6 7 8 9 10
6. Quan heä vôùi caáp treân 1 2 3 4 5 6 7 8 9 10
62
Caâu 25: Baø con trong coäng ñoàng coù thöôøng ñeán thaêm
nhaø OÂng (Baø) hay khoâng?
1. Coù 1
2. Khoâng 2 à chuyeån qua caâu 26
Caâu 26: Neáu coù haõy cho bieát möùc ñoä hoï ñeán thaêm cuûa
hoï
1. Vaøi laàn moät tuaàn 1 4. Chöa bao giôø 4
2. Vaøi laàn moät thaùng 2 5. Khoâng traû lôøi 5
3. Vaøi laàn trong naêm 3 6. Khoâng bieát 6
63
Caâu 27: Mức độ thân thiết với ngườ i xóm?
1.Coi nhö ngöôøi trong gia ñình 1 4.Nhö nhöõng ngöôøi xa laï 4
2.Coi nhö baïn beø 2 5.Khoâng traû lôøi 5
3.Nhö laø nhöõng ngöôøi quen bieát 3 6.Khoâng bieát 6
64
Caâu 28: Khi trong nhaø coù ngöôøi bò beänh, thoâng thöôøng
gia ñình OÂng (Baø) thöôøng laøm theá naøo ñeå hoï khoûi
beänh?
65
Caâu 29: OÂng (Baø) coù bieát caùc loaïi leã hoäi töø tröôùc tôùi nay
do coäng ñoàng mình toå chöùc hay khoâng?
(keå caû nhöõng leã hoäi, ngaøy nay khoâng coøn toå chöùc nöõa)
1. Coù 1
2. Khoâng 2
66
Chọn mẫu (sampling)
o Không thể nào tập hợp được tất cả số sinh
viên ở các trường ĐH tại TPHCM để tiến
hành nghiên cứu bởi vì công việc này sẽ mất
rất nhiều thời gian và tốn rất nhiều tiền.
67
Thuaät ngöõ maãu
o Maãu laø moät taäp hôïp caùc yeáu toá (caùc
ñôn vò) ñaõ ñöôïc choïn töø moät toång theå
caùc yeáu toá.
o Toång theå naøy coù theå ñöôïc lieät keâ moät
caùch ñaày ñuû nhöng cuõng coù theå chæ laø
giaû thieát.
68
Mục tiêu chọn mẫu
o Mẫu được chọn phải phản ánh một cách chính
xác về những đặc điểm của nhóm dân số lớn
hơn -> chỉ có vậy mới có thể khái quát hóa về
dân số nghiên cứu.
69
4 lý do chọn mẫu
o Thông tin thu thập sẽ chính xác hơn, cặn kẽ hơn khi tiến
hành nghiên cứu trên một mẫu thay vì toàn bộ dân số.
o Khả năng sai sót trong điều tra nghiên cứu trên mẫu sẽ thấp
hơn khi điều tra trên một tổng thể. Hơn nữa, có khả năng tập
trung được một nhóm chuyên gia có trình độ tham gia vào
cuộc nghiên cứu.
o Sẽ không gặp khó khăn nhiều khi tiến hành nghiên cứu với
các nhóm dân cư có tính biến động cao.
o Khảo sát theo mẫu nhanh hơn và rẻ hơn. Vì mẫu bao giờ
cũng nhỏ hơn so với tổng thể, cho nên việc thu thập sẽ
nhanh hơn, chính xác hơn và kinh tế hơn.
70
Laáy maãu (choïn maãu)
Laø quaù trình löïa choïn phaàn ñaïi dieän
o
cuûa khoái daân cö.
âtraùi ngöôïc vôùi quaù trình lieät keâ ñaày
ñuû (töùc laø moïi thaønh vieân trong khoái
daân cö caàn nghieân cöùu ñeàu ñöôïc ñöa
vaøo)
71
Khoái daân cö
o Khoái daân cö laø toaøn boä moät nhoùm caùc theå
loaïi hoaëc caù nhaân lieân quan caàn nghieân
cöùu.
o Trong cuoäc nghieân cöùu maãu, caàn phaân
bieät hai khoái daân cö: Ñoù laø khoái daân cö
muïc tieâu vaø khoái daân cö laáy maãu.
n Khoái daân cö muïc tieâu laø khoái daân cö maø nhaø
nghieân cöùu caàn coù thoâng tin ñaïi dieän.
n Khoái daân cö laáy maãu laø khoái daân cö maø töø ñoù
moät maãu cuï theå ñöôïc choïn ra döïa treâ
72 n khung
maãu.
Khung maãu (danh saùch)
o Khung maãu laø danh saùch caùc ñôn vò laáy
maãu (caùc caù nhaân) ñaïi dieän cho khoái daân
cö.
o Laø caùi ñöôïc söû duïng ñeå ñaïi dieän cho toång
theå veà maët thöïc nghieäm (töùc laø caùc thaønh
vieân ñaõ naèm trong khung maãu seõ ñöôïc
quan saùt, ñöôïc nghieân cöùu laø nhöõng ngöôøi
thuoäc veà toång theå).
73
Ñôn vò maãu
o Neáu maãu ñöôïc löïa choïn tröïc tieáp trong
khung maãu maø khoâng caàn xem xeùt caùc
thaønh phaàn, caùc yeáu toá trong toång theå thì
moãi moät laàn choïn caùc thaønh vieân cuûa maãu
seõ laø moät ñôn vò.
74
Chọn mẫu
a. Mẫu xaùc suaát (probability sampling)
n Mẫu ngẫu nhiên đơn giản
n Mẫu ngẫu nhiên hệ thống
n Mẫu phân tầng
n Mẫu cụm
b. Maãu phi xaùc suaát (nonprobability
sampling)
75
a. Mẫu xaùc suaát (probability sampling)
76
a. Mẫu xaùc suaát (probability sampling)
77
o Công thức tính k:
78
a. Mẫu xaùc suaát (probability sampling)
79
a. Mẫu xaùc suaát (probability sampling)
4. Mẫu cụm
Chọn mẫu cụm được sử dụng khi chúng ta không có một
khung mẫu cụ thể.
Khác với chọn mẫu phân tầng, các “tầng” là các nhóm đồng
nhất được chọn ra theo những đặc trưng cá nhân như giới
tính, trình độ học vấn, tôn giáo…, “cụm” là sự liên kết của
các nhóm không đồng nhất.
Do đó, “cụm” thường được chọn theo các yếu tố như: vị trí
địa lý, các tổ chức, đơn vị xã hội, các cụm dân cư… sau khi
có danh sách các cụm, tiến hành chọn ngẫu nhiên để xác
định các cụm đại diện, sau đó chọn ngẫu nhiên các phần tử
trong mỗi cụm để lập danh sách mẫu nghiên cứu.80
Choïn maãu bao nhieâu laø ñuû so vôùi
toång theå daân cö?
Trong ñoù :
N: Qui moâ daân soá
e: Möùc sai soá mong muoán (tính baèng tyû leä % töø
coâng thöùc [1 – ñoä tin caäy giaû ñònh])
81
à Baûng quy moâ maãu vôùi caùc möùc sai soá mong muoán
N 1% 2% 3% 4% 5% 10%
500 * * * * 222 83
84
o Dữ liệu thô: Thích loại nước ngọt
3 3 3 3 3 3 3 2 3 3 3 1 3 3 3 3 3 1 3
2 3 3 1 3 3 3 3 3 3 1
85
PP thống kê mô tả dưới dạng bảng
o Phân phối tần suất: 1 bảng trình bày số lần
xuất hiện của một hay nhiều giá trị được quan
sát trong mẫu hoặc tổng thể
86
PP thống kê mô tả dưới dạng bảng
o Các kiểu phân phối tần suất
n Thô (raw)
n Liên hệ (relative): tỉ lệ (proportion) và phần trăm
(percent)
n Lũy tiến (cumulative)
87
Phân phối tần suất
o Một số ký hiệu sử dụng trong tính toán phân
phối tần suất
n n = tổng số mẫu quan sát
n X = biến
n i = giá trị (thành phần) của biến X
n fi = tần suất quan sát của giá trị i
88
Phân phối tần suất (t.t)
o Các thành phần (giá trị) của biến phải:
n Loại trừ lẫn nhau
n Bao phủ hết các trả lời
89
Phân phối tần suất (t.t)
o Bảng phân phối tần suất nên bao gồm:
n Tiêu đề mô tả nội dung của bảng
n Tên biến
n Nhãn giá trị cho các thành phần biến
n Tổng các quan sát của mẫu
n Khai báo nguồn dữ liệu
90
1. Bảng phân phối tần suất thô
Bảng 1. Loại nước ngọt ưa thích của sinh viên lớp TKXH
Loại nước ngọt thích Số đếm được Tần suất
(Tally) (Frequency)
1. Coca – Cola 4 4
2. Pepsi 2 2
3. Khác 24 24
Tổng (n) 30 30
Nguồn: Khảo sát lớp học TKXH, tháng 11, 2007
91
2. Bảng phân phối tần suất liên hệ
Bảng 2. Loại nước ngọt ưa thích của sinh viên lớp TKXH
Loại nước ngọt thích Tần suất - fi Tỉ lệ - pi Phần trăm-%i
(frequency) (proportion) (percent)
93
2. Bảng phân phối tần suất liên hệ
o Công thức:
- Tần suất phần trăm
%i = fi/n * 100
∑%i = 100
94
3. Bảng phân phối tần suất lũy tiến
Bảng 3. Loại nước ngọt ưa thích của sinh viên lớp TKXH
Loại nước ngọt thích Tần suất Phần trăm % lũy tiến
(frequency) (percent)
1. Coca – Cola 4 13,3 13,3
2. Pepsi 2 6,7 20,0
3. Khác 24 80,0 100,0
Tổng 30 100,0
Nguồn: Khảo sát lớp học TKXH, tháng 11, 2007
95
Thử tài
o Tâm trạng khi học Thống kê xã hội
Data:
4 5 4 4 3 2 3 2 2 4 2 3 5 3 3
3 4 3 4 3 1 3 4 4 1 4 5 4 2 2
1 2 3 4 4 1 5 4 3 4 1 2 4 4 3
Lập bảng phân phối tần suất thể hiện: tần suất
(fi), tỉ lệ (pi), phần trăm, và % lũy tiến.
96
Kết quả
Bảng: Bảng phân phối tần suất tâm trạng khi học lớp thống kê
1 68 11 68 21 64
2 71 12 68 22 69
3 80 13 75 23 60
4 69 14 65 24 72
5 77 15 63 25 72
6 55 16 62 26 70
99
7 57 17 66 27 70
Bảng 5.2: Phân bổ tần suất điểm trung bình chung năm học của
SV lớp TK04
Điểm TB chung Tần suất Phần trăm
(số sinh viên)
50 – 55 1 3,3
56 – 60 2 6,7
61 – 65 8 26,7
66 – 70 12 40,0
71 – 75 5 16,6
76 – 80 2 6,7
100
Tổng 30 100,0
Bài tập
Bảng phân phối tần suất
Vấn đề 1: Theo Cục dân số, trong năm 1994 Hoa
Kỳ có 23,6 triệu hộ gia đình (hgđ) chỉ có 1
người; 31,2 tr hgđ có 2 người; 16,9 tr hgđ có
3 người; 15,1 tr hgđ có 4 người; 6,7 tr hgđ có
5 người; 2,2 tr hgđ có 6 người; và 1,4 tr hgđ
có từ 7 người trở lên.
a) Lập bảng tần suất liên hệ
b) Lập bảng tần suất lũy tiến
101
Vấn đề 2: Bảng 2 trình bày số liệu (triệu người)
dân số có quốc tịch Mỹ nhưng sinh ra tại nước
ngoài.
a) Lập bảng phân phối tần suất liên hệ
b) “Nơi sinh” được xem là biến định tính hay
định lượng? Vì sao?
102
Bảng 2:
Nơi sinh Số lượng
Châu Âu 4,0
Liên Xô cũ 0,3
Châu Á 5,0
Canada 0,7
Mexico 4,3
Caribê 1,9
Trung Mỹ 1,1
Nam Mỹ 1,0
Châu Phi 0,4
Châu Đại Dương 0,1
104
Yếu vị (Mode)
o VD1:
2 3 3 3 2 2 2 3 3 2 3 3 2 2 3
2 3 3 2 3 3 4 4 2 3 4 3 2 2 3
à Mode = 3
105
Yếu vị (Mode)
VD2: GPA Ñieå m trung bình naêm hoïc vöøa qua
Cumulative
Frequency Percent Valid Percent Percent
Valid 55 1 3.3 3.3 3.3
57 1 3.3 3.3 6.7
59 2 6.7 6.7 13.3
60 1 3.3 3.3 16.7
63 2 6.7 6.7 23.3
65 6 20.0 20.0 43.3
67 1 3.3 3.3 46.7
68 3 10.0 10.0 56.7
69 3 10.0 10.0 66.7
70 4 13.3 13.3 80.0
72 2 6.7 6.7 86.7
74 2 6.7 6.7 93.3
75 1 3.3 3.3 96.7
78 1 3.3 3.3 100.0
Total 30 100.0 100.0
106
Nguồn: Khảo sát lớp học TK04, tháng 11, 2007
Mô tả độ tập trung biến
(central tendency)
2. Trung vị (Median): là giá trị đứng giữa trong
tập một dữ liệu.
o Giá trị này chia tập quan sát làm hai phần đều
nhau, 50% số quan sát của tập dữ liệu có giá
trị bé hơn giá trị trung vị và 50% lớn hơn giá
trị trung vị.
107
Trung vị (Median)
o Chú ý:
n Muốn xác định giá trị trung vị của một tập dữ
liệu, các quan sát trong tập dữ liệu này trước tiên
phải được sắp xếp theo trật tự (từ nhỏ đến lớn hay
ngược lại)
n Không tính toán giá trị trung vị cho biến có thang
đo danh nghĩa.
108
Trung vị (Median)
o Công thức xác định vị trí của trung vị:
Median x : (n+1)/2
109
- Trong trường hợp n là số chẵn: giá trị trung vị
là giá trị trung bình cộng của 02 quan sát nằm
ở vị trí chính giữa tập dữ liệu.
- VD: (8+1)/2 = 4,5 -> giá trị trung vị rơi vào
giữa giá trị quan sát thứ 4 và quan sát thứ 5
trong tập dữ liệu.
110
Trung vị (Median)
o VD:
63 68 70 78 70 67 57 60 69 74 59
65 55 70 72 69 70 65 65 74 69 65
63 59 75 68 68 65 65 72
111
Trung vị (Median)
o Bước 1: sắp xếp thứ tự tập dữ liệu
55 57 59 59 60 63 63 65 65 65 65
65 65 67 68 68 68 69 69 69 70 70
70 70 72 72 74 74 75 78
112
Trung vị (Median)
o Bước 2: xác định vị trí trung vị
Median x: (30+1)/2 = 15,5
à Giá trị trung vị nằm ở vị trí thứ 15 (68) và thứ
16 (68) trong tập dữ liệu đã được sắp xếp
Giá trị trung vị = (68+68)/2 = 68
113
Trung vị (Median)
o Đối với biến có thang đo thứ bậc: sử dụng
bảng phân phối tần suất lũy tiến để xác định
giá trị trung vị.
114
Trung vị (Median)
VD2:
hocTKXH Taâm traïng khi hoïc Thoáng keâ xaõ hoäi
Cumulative
Frequency Percent Valid Percent Percent
Valid 1 Raá t lo laé ng 2 6.7 6.7 6.7
2 Lo laé ng vöø a phaûi 7 23.3 23.3 30.0
3 Bình thöôø ng 14 46.7 46.7 76.7
4 Thích 7 23.3 23.3 100.0
Total 30 100.0 100.0
= ∑xi/n
116
Trung bình cộng (Mean)
o Ký hiệu:
n : giá trị trung bình
n n : tổng số mẫu quan sát
n xi : giá trị quan sát thứ i
117
Trung bình cộng (Mean)
o Tính giá trị trung bình cho biến có thang đo
thứ bậc
Công thức:
= ∑fi * mi/n
118
Bảng 5.2: Phân bổ tần suất điểm trung bình chung năm học của
SV lớp TKXH
Điểm TB chung f m fm %c
51 – 55 1 53 53 3,3
56 – 60 2 58 116 10,0
61 – 65 8 63 504 36,7
66 – 70 12 68 816 76,7
71 – 75 5 73 365 93,3
76 – 80 2 78 156 100,0
Tổng
= [(53* 30
1)+ (58*2)+(63*8)+(68*12)+(73*5)+(78*2)]/30
119 = 67
c10.2 Möùc ñoä nghe radio
Cumulative
Frequency Percent Valid Percent Percent
Valid 1 Haø ng ngaøy 161 23.4 23.5 23.5
2 Tuaàn vaø i laàn 93 13.5 13.6 37.0
3 Thaù ng vaøi laà n 66 9.6 9.6 46.6
4 Raá t hieám hoi ( naêm vaøi laàn) 49 7.1 7.1 53.8
5 Khoâ ng bao giôø thöôû ng thöù c 317 46.1 46.2 100.0
Total 686 99.7 100.0
Missing System 2 .3
Total 688 100.0
Nguồn: Số liệu điều tra của Khoa Xã hội học tháng 05/2002
123
Vấn đề 2
a. Lập bảng tần suất liên hệ và lũy tiến
b. Xác định giá trung vị và yếu vị
c. Nếu biến Y= mức độ thường xuyên đọc báo
như được mô tả ở trên. Chúng ta có thể tìm
giá trị trung bình của Y hay không? Tại sao?
Nếu được, hãy tính giá trị trung bình.
124
Vấn đề 3
o 10 hộ gia đình được chọn ngẫu nhiên tại tiểu
bang Florida, Hoa Kỳ và 10 hộ gia đình khác
được chọn ngẫu nhiên ở tiểu bang Alabama.
Bảng 3 trình bày thông tin tổng hợp về thu
nhập trung bình hộ gia đình.
125
Vấn đề 3
o Thu nhập trung bình tại Alabama thì cao hơn
Florida ở cả hai khu vực nông thôn và thành
thị. Hãy so sánh thu nhập trung bình chung (ở
cả nông thôn và thành thị) của hộ gia đình tại
02 tiểu bang.
126
Bảng 3
127
Mô tả độ phân tán biến
(dispersed tendency)
1. Giá trị lớn nhất (Max), giá trị nhỏ nhất (Min)
n Giá trị lớn nhất là giá trị có điểm số cao nhất
trong tập dữ liệu
n Giá trị nhỏ nhất là giá trị có điểm số thấp nhất
trong tập dữ liệu
128
2. Cách độ (Range) -R
129
2. Cách độ (Range) -R
130
Bảng 4. Khoảng cách đi từ nhà đến trường
của sinh viên
R = 20 – 2 = 18 km 131
3. Phương sai (Variance)
132
3. Phương sai (Variance)
133
3. Phương sai (t.t)
= 10
134
3. Phương sai (t.t.)
135
3. Phương sai (t.t.)
o Để khắc phục vấn đề này, các giá trị lệch giữa
giá trị quan sát và giá trị trung bình sẽ được
bình phương (làm cách này, những giá trị âm
sẽ không còn nữa), sau đó cộng tất cả các giá
trị bình phương này lại.
136
3. Phương sai (Variance)
137
3. Phương sai (Variance)
Công thức:
138
3. Phương sai (t.t.)
(x - ) (x - )2 (x - ) (x - )2
2-10 =-8 64 11-10 =+1 1
4-10 =-6 36 13-10 =+3 9
4-10 =-6 36 13-10 =+3 9
4-10 =-6 36 14-10 =+4 16
5-10 =-5 25 15-10 =+5 25
7-10 =-3 9 19-10 =+9 81
9-10 =-1 1 20-10 =+10 100
10-10 =0 0
∑=0 ∑ = 448
n=15
S2= 448 /14 = 32,0 139
3. Phương sai (t.t)
o Mặc dù phương sai được xem như là một
trong những phép tính thống kê để đo lường
độ phân tán, tuy nhiên nó không có ý nghĩa
nhiều.
o Giá trị này chỉ thực sự có ý nghĩa khi nó được
chuyển hóa thành một giá trị khác gọi là độ
lệch chuẩn (Standard Deviation)
140
4. Độ lệch chuẩn
(Standard Deviation) - s
o Độ lệch chuẩn chính là giá trị căn bậc hai của
phương sai. SD được dùng để đo lường độ
phân tán của các quan sát xung quanh giá trị
trung bình.
s = √ S2 = √32 = 5,660
o Độ lệch chuẩn tương ứng với các giá trị quan
sát trong tập dữ liệu càng lớn thì độ biến thiên
của tập dữ liệu càng lớn.
141
4. Độ lệch chuẩn
(Standard Deviation) - s
o Giải thích SD:
Ä Ứng với khoảng cách trung bình từ nhà đến
trường của các sinh viên là 10 km, các giá trị
quan sát có độ lệch chuẩn là 5,66 km.
142
5. IQV (Index of Qualitative Variation)
o Sử dụng để đo lường độ phân tán của dữ liệu
định tính
143
o Đại lượng IQV nhận các giá trị từ 0 đến 1
n 0 -> cho thấy không có sự biến thiên trong mẫu
n 1 -> có sự phân bổ đều nhau giữa các giá trị
(không tồn tại yếu vị mode)
144
Đo lường Đo lường
Thang đo độ tập trung độ phân tán
145
Bài tập
Đo lường độ phân tán của biến
Vấn đề 6. Một công ty tiến hành nghiên cứu về thói
quen sử dụng các phương tiện giao thông công
cộng thông qua xác định quãng đường đi của
nhân viên mình trong một ngày cụ thể. Mười
người được chọn ngẫu nhiên để xác định quãng
đường đi này có số liệu như sau (dặm): 0, 0, 4,
0, 0, 0, 10, 0, 6, 0
146
Vấn đề 6
a. Tính và giải thích các giá trị sau: trung bình,
trung vị, yếu vị, cách độ, phương sai và độ
lệch chuẩn.
b. Một người nữa sống tại một thành phố khác
được chọn để nghiên cứu, đi 90 dặm một ngày
bằng phương tiện giao thông công cộng. Tính
toán lại các giá trị trung bình, trung vị và độ
lệch chuẩn. Cho biết tác động của quan sát
ngoại lệ này.
147
Vấn đề 7
o Một giáo sư dạy thống kê nhận thấy rằng sinh
viên của ông ta thường phàn nàn về cảm giác
lo lắng về tài liệu trong khóa học. Vị giáo sư
quyết định tiến hành đánh giá sự trải nghiệm
lo lắng trong lớp học của mình và sinh viên
một lớp Ngữ văn Anh. Dữ liệu thu thập được
như sau:
148
Vấn đề 7
Lớp Thống kê
23 22 18 26 29 27 30 25 10 11 15
17 19 18 19 20 21 18 14 20 13 22
149
Vấn đề 7
Lớp NV Anh
1 6 11 20 39 1 13 16 19 35 29
24 5 20 29 34 31 39 27 1 9 21
150
Vấn đề 7
a. Tìm giá trị trung bình, trung vị và yếu vị của
mỗi lớp
b. Tìm khoảng biến thiên (range), phương sai và
độ lệch chuẩn của mỗi lớp
151
Vấn đề 7
c. So sánh kết quả của 02 lớp, chúng ta có thể kết
luận điều gì về sự trải nghiệm lo lắng giữa
sinh viên 02 lớp này.
d. Nhóm nào biểu hiện một sự đồng nhất hơn.
152
Phần 2. Thống kê suy diễn
(Statistical Inference)
o Kiểm định giả thuyết là một công cụ của thống
kê suy diễn.
o Mục đích chính của hầu hết các nghiên cứu là
để kiểm tra có hay không việc những dữ liệu
thu thập từ các cuộc điều tra phù hợp với
những dự báo về một vấn đề cụ thể. Những dự
báo này chính là các giả thuyết (hypothesis) về
tham số được đo lường trong nghiên cứu.
153
Thống kê suy diễn
154
Những yếu tố của một kiểm định ý nghĩa
155
Những yếu tố của một kiểm định ý nghĩa
b. Phương pháp chọn mẫu: các kiểm định thường
đòi hỏi các phương pháp chọn mẫu xác suất.
c. Dung lượng mẫu: Tính giá trị của các kiểm
định càng cao khi dung lượng mẫu càng lớn.
156
Những yếu tố của một kiểm định ý nghĩa
157
Những yếu tố của một kiểm định ý nghĩa
158
Những yếu tố của một kiểm định ý nghĩa
159
Kiểm định ý nghĩa cho giá trị trung bình
160
Kiểm định ý nghĩa cho giá trị trung bình
o Giả thuyết:
H0 : Không có sự khác biệt ý nghĩa về trung
bình giữa hai biến
1= 2
Ha: Có sự khác biệt giữa hai giá trị trung bình
1≠ 2
161
Kiểm định ý nghĩa cho giá trị trung bình
o Ví dụ, giả sử rằng chúng ta muốn so sánh và
đưa ra kết luận về số lượng các vụ tai nạn giao
thông xảy ra trung bình một ngày ở hai thành
phố lớn: Hà Nội và TPHCM.
162
Kiểm định ý nghĩa cho giá trị trung bình
o Giả thuyết:
H0 : Không có sự khác biệt ý nghĩa về trung
bình số lượng các vụ tai nạn giao thông xảy ra
một ngày giữa Tp HN & TpHCM
1= 2
Ha: Có sự khác biệt giữa hai giá trị trung bình
1≠ 2
163
Kiểm định ý nghĩa cho giá trị trung bình
164
Kiểm định ý nghĩa cho giá trị trung bình
165
Kiểm định ý nghĩa cho giá trị trung bình
166
Kiểm định ý nghĩa cho giá trị trung bình
o Ví dụ về tai nạn giao thông, giả sử rằng chúng
ta có số vụ tai nạn giao thông xảy ra trung
bình mỗi ngày của TPHCM là 10 và của Hà
Nội là 8. Kết quả chỉ ra rằng số vụ tai nạn
giao thông xảy ra trung bình mỗi ngày của
TPHCM cao hơn của Hà Nội. Do vậy, chúng
ta suy ra rằng TPHCM xảy ra tai nạn giao
thông cao hơn Hà Nội.
167
Kiểm định ý nghĩa cho giá trị trung bình
168
Kiểm định t-Test cho mẫu độc lập
o Kiểm định t-Test cho mẫu độc lập được dùng
để xem xét sự khác biệt ý nghĩa về trung bình
giữa hai mẫu nghiên cứu độc lập
169
Kiểm định t-Test cho mẫu độc lập
1. Dung lượng mẫu nhỏ (n< 30)
Trong trường hợp có ít nhất một trong hai
mẫu nghiên cứu có dung lượng nhỏ hơn 30,
chúng ta sẽ sử dụng công thức sau:
Công thức:
170
Kiểm định t-Test cho mẫu độc lập
o Trong đó
171
Các bước tiến hành kiểm định
o Bước 1: Xây dựng giả thuyết
172
Các bước tiến hành kiểm định
o Bước 2: Tìm tobtained theo công thức
173
Các bước tiến hành kiểm định
o Bước 3: Xác định giá trị tới hạn tcritical
Vì có ít nhất một mẫu với dung lượng n < 30, giá
trị tới hạn tcritical được tính dựa trên bậc tự do df
df = n1 + n2 - 2
174
Các bước tiến hành kiểm định
o Bước 4: So sánh với giá trị tcritical
to ≥ tc -> p ≤ 0,01 hoặc p ≤ 0,05 => bác bỏ H0
to < tc -> p > 0,01 hoặc p> 0,05 => chấp nhận H0
175
o Ví dụ:
Một nghiên cứu quan tâm sự khác biệt về mức
độ tham gia các sự kiện xã hội được tổ chức
hàng tháng giữa nhóm SV có tham gia sinh
hoạt Đoàn với nhóm SV không tham gia sinh
hoạt Đoàn trong một Trường ĐH, kết quả
khảo sát như sau:
176
Nhóm SH Đoàn Nhóm không SH Đoàn
Số sự kiện XH tham gia
trung bình 1 = 15 2 = 11
Độ lệch chuẩn s1 = 3 s2 = 3
Dung lượng mẫu chọn
n1 = 33 n2 = 29
α=0,01
177
2. Kiểm định t-Test cho mẫu độc lập
2.2. Dung lượng mẫu lớn (n≥ 30)
Trong trường hợp ta có dung lượng của cả hai
mẫu nghiên cứu đều lớn hơn hoặc bằng 30,
công thức để kiểm định t-Test sẽ thay đổi,
công thức mới này được gọi là kiểm định z-
Test cho hai mẫu độc lập
178
o Công thức
179
Các bước tiến hành kiểm định
o Bước 1: Xây dựng giả thuyết
180
Các bước tiến hành kiểm định
o Bước 2: Tìm zobtained theo công thức
181
Các bước tiến hành kiểm định
o Bước 3: Xác định giá trị tới hạn zcritical
zc = 2.58 & p99%= 0,01 với 99% độ tin cậy
zc = 1.96 & p95%= 0,05 với 95% độ tin cậy
182
Các bước tiến hành kiểm định
o Bước 4: So sánh với giá trị zcritical
zo ≥ zc -> p ≤ 0,01 hoặc p ≤ 0,05 => bác bỏ H0
zo < zc -> p > 0,01 hoặc p> 0,05 => chấp nhận H0
o Bước 5: Kết luận
183
Bài tập
Vấn đề 4. Trong cuộc tổng điều tra XH của Hoa
Kỳ năm 1982, 350 người tham gia trả lời thời
gian mỗi ngày dành cho việc xem truyền hình.
Thời gian trung bình của mẫu là 4,1 giờ, với
độ lệch chuẩn là 3,3. Năm 1994, có 1965
người trả lời câu hỏi này với kết quả: thời gian
trung bình là 2,8 giờ và độ lệch chuẩn là 2,0
184
Vấn đề 4
185
Vấn đề 5
o 10 sinh viên năm I được chọn ngẫu nhiên để
tham gia kiểm tra năng khiếu toán trước và
sau khi trải qua một khóa tập huấn nâng cao.
Điểm của mỗi sinh viên được ghi nhận trước
và sau khóa học như sau:
186
Vấn đề 5
Sinh viên Trước Sau
1 60 70
2 73 80
3 42 40
4 88 94
5 66 79
6 77 86
7 90 93
8 63 71
9 55 70
10 96 97
187
Vấn đề 5
a. So sánh điểm trung bình trước và sau khóa tập
huấn i) sự khác biệt của trung bình mẫu, ii)
trung bình của điểm khác biệt
b. Xây dựng giả thuyết và kiểm định ý nghĩa sự
khác biệt về điểm trung bình trước và sau
khóa học với khoảng tin cậy 90% và 99%. Kết
luận gì?
188
Vấn đề 6
o 30 nữ trợ lý giáo sư được chọn ngẫu nhiên từ
khoa Nghệ thuật và khoa Khoa học của một
trường ĐH lớn Hoa Kỳ, có mức lương trung
bình một năm học là 41.000 USD. Cũng
tương tự vậy, 50 nam trợ lý có mức lương
trung bình là 41.800 USD. Độ lệch chuẩn mẫu
lần lượt là 3.000 USD và 3.400 USD.
189
Vấn đề 6
a. Trình bày kiểm định ý nghĩa để xác định có
hay không sự khác biệt mức lương trung bình
giữa nam và nữ, với độ tin cậy α = 0,05
b. Ở độ tin cậy 99%, có thể kết luận điều gì?
190
3. Kiểm định sự độc lập- Chi-Square
o Kiểm định độc lập hay còn gọi là kiểm định
Chi-Square được sử dụng để xem xét có hay
không tồn tại mối quan hệ giữa hai biến định
tính.
o Yêu cầu:
- Biến định tính
- Các giá trị của biến loại trừ lẫn nhau
191
Bảng tương quan
Bảng 4.1 Tương quan giữa giới tính và thích KFC
Thích KFC
Tổng 45 55 100
192
Bảng tương quan
o Dữ liệu trên được trình bày dưới dạng bảng
tương quan 2x2
o Bảng 2x2 biểu thị một biến gồm 2 nhóm (nam
và nữ) trong mối quan hệ với một biến khác
cũng bao gồm 2 phương án trả lời (thích hay
không thích)
o Cần xác định rõ mối quan hệ giữa hai biến:
độc lập – phụ thuộc
193
Quy trình kiểm định
o Bước 1: Xây dựng giả thuyết
H0: Không có mối quan hệ giữa hai biến
Ha: Hai biến có mối quan hệ ý nghĩa với
nhau
194
Quy trình kiểm định
o Bước 2: Tính giá trị tần suất mong đợi
Công thức:
fe = (tổng dòng)*(tổng cột)/tổng mẫu
o Trong đó:
fe: tần suất mong đợi (expected frequency), là
giá trị tần suất giả định rằng hai biến kiểm
định là độc lập
195
Quy trình kiểm định
o Bước 3: Tìm giá trị χ2obtained theo công thức:
197
Quy trình kiểm định
o Bước 5: So sánh χ2obtained với χ2critical
χ2obtained ≥ χ2critical -> p ≤ 0,01 hoặc p ≤ 0,05
=> bác bỏ H0
χ2obtained < χ2critical -> p > 0,01 hoặc p > 0,05
=> chấp nhận H0
198
Quy trình kiểm định
o Bước 6: Kết luận
-Bác bỏ H0 (p ≤ 0,01 hoặc p ≤ 0,05): tồn tại
mối quan hệ có ý nghĩa thống kê giữa hai biến.
Nói một cách khác, biến nghiên cứu này có
quan hệ với biến nghiên cứu kia.
199
Quy trình kiểm định
- Chấp nhận H0 (p > 0,01 hoặc p > 0,05): chúng
ta chưa có đủ bằng chứng thống kê để bác bỏ
H0. Nói một cách khác, chưa có đủ bằng
chứng để kết luận hai biến có quan hệ với
nhau.
200
Bài tập
Vấn đề 7. Bảng 1 trình bày kết quả cuộc khảo sát
thực hiện năm 1992 học sinh lớp 12 ở thành
phố Dayton, bang Ohio, Hoa Kỳ
201
Bảng 1
Hút thuốc
Có Không
Uống rượu bia Có 1449 500
Không 46 281
202
Vấn đề 7
203
Vấn đề 7
204
Vấn đề 8
o Bảng 2 trình bày kết quả tổng hợp về mối
quan hệ giữa người phạm tội và nạn nhân theo
giới tính của Bộ Tư pháp Hoa Kỳ năm 2003
205
Bảng 2
Giới tính nạn nhân
Nữ Nam
206
Vấn đề 8
a. Lập bảng tương quan tỉ lệ phần trăm với biến
“Giới tính nạn nhân” được xem như là biến
trả lời (biến phụ thuộc)
b. Thực hiện kiểm định ở độ tin cậy 95% và
99% để xác định có hay không mối quan hệ
về giới tính giữa người phạm tội và nạn nhân.
207
Bảng tương quan: Giữa giới tính và sở thích nghe
nhạc đồng quê a
Nam Nữ
Tổng
Tần suất % Tần suất %
Thích 100 52.6 50 45.5 150
02/05/12
Bảng tương quan tỷ lệ phần trăm tình trạng hôn nhân theo
giới tính người trả lời