Professional Documents
Culture Documents
Chapter 1 - Tong Quan SPSS
Chapter 1 - Tong Quan SPSS
Hồ Chí Minh
Khoa Quản trị Kinh doanh
1
Học kỳ 2 – 2011-2012
Nội dung
1. SPSS là gì?
2. Các bộ phận của hệ thống SPSS
3. Phân loại dữ liệu
4. Các loại thang đo
5. Nguyên tắc mã hóa và nhập liệu
6. Tạo khuôn nhập liệu
2
Tài liệu tham khảo
[1] Hà Trọng Quang, “Xử lý dữ liệu nghiên cứu với SPSS for windows”, Đại
học Công Nghiệp Tp.HCM, 2008.
[2] Hoàng Trọng, “Xử lý dữ liệu nghiên cứu với SPSS ”, Đại học Kinh tế tp.
HCM, 2008.
[3] Lê Văn Huy, “Phân tích dữ liệu với SPSS”, Đại học Kinh tế Đà Nẵng, 2009.
[4] Susan B. Gerber, Kristin Voelkl Finn, “Using SPSS For Windows Data
Analysis and Graphics”, Springer Science+Business Media, 1999.
[5] Nguyễn Duy Tâm, “Phân tích dữ liệu”,
http://sites.google.com/site/tam0505/spss, 2011.
3
Giới thiệu tổng quát về công trình
nghiên cứu xã hội
Trình
Xử lý bày
và báo
Tiến phân cáo
hành tích khoa
Thiết thông học
kế tin
4
Quy trình nghiên cứu xử lý
thông tin Tiến trình 7 bước theo David Luck
5
Xử lý thông tin trong nghiên cứu
kinh tế - xã hội
Xử lý Diễn giải
Dữ liệu thô Dữ liệu tinh
Xử lý thủ công.
Xử lý bằng máy vi tính
6
Các giai đoạn xử lý dữ liệu
Giá trị hóa dữ liệu
Hiệu chỉnh lại các câu trả lời có thể chấp nhận được
7
1. SPSS là gì?
SPSS - Statistical Package for the Social
Sciences, là phần mềm trọn gói về tính
toán thống kê dùng trong nghiên cứu khoa
học xã hội.
SPSS là một hệ thống phần mềm thống kê
toàn diện được thiết kế để thực hiện tất cả
các bước trong các phân tích thống kê từ
những thông kê mô tả (liệt kê dữ liệu, lập
đồ thị) đến thống kê suy luận (tương quan,
hồi quy…)
8
2. Các bộ phận của hệ thống
SPSS cho Windows là một gói phần mềm
máy tính linh hoạt mà sẽ thực hiện một loạt
các thủ tục thống kê. Bốn loại của các cửa
sổ là:
Data Editor Window
Output Viewer Window
Chart Editor Window
Syntax Editor Window
9
2. Các bộ phận của hệ thống
10
2. Các bộ phận của hệ thống
The Main Menu
File
Edit
View
Data
Transform
Analyze
Graphs
Utilities
Window
Help
11
CÁC LOẠI DỮ LIỆU VÀ
THANG ĐO
13
Các giai đoạn xử lý dữ liệu
Giá trị hóa dữ liệu
Hiệu chỉnh lại các câu trả lời có thể chấp nhận được
14
Mã hóa
Quá trình chuyển dịch câu hỏi trả lời thực
của người trả lời vào từng nhóm, từng mẫu
với các giá trị tương ứng.
Mục đích: tạo nhãn cho các câu trả lời,
thường bằng các con số.
Ví dụ
1: Nam 0: Nữ
1: Đồng ý 0: Không đồng ý
1: Rất không đồng ý 7: Rất đồng ý
15
Mã hóa
Định biến
Biến (variable)
Tập hợp những trả lời cho 1 câu hỏi
Biến 1 trả lời: Biến dành cho câu hỏi có
1 trả lời.
Biến nhiều trả lời: các biến dành cho
nhiều câu trả lời trả lời đồng thời trong
câu hỏi nhiều trả lời.
16
Các loại biến số
Các hiện tượng mà ta muốn quan sát được
gọi là các biến số (variables). Một biến là
những đại lượng có thể mang các giá trị
khác nhau như học vấn, thu nhập, tính
cách, khí chất… Các biến này có thể thuộc
loại định tính (qualitative) hay định lượng
(quantitative).
Trong nghiên cứu người ta thường phân
biệt 2 loại biến số chính yếu khác nữa: Biến
độc lập (independent variables) và biến phụ
thuộc (dependent variables)
17
PHÂN LOẠI DỮ LIỆU
Döõ Lieäu
18
Kiểu dữ liệu
DL định lượng (quantitative data): Các dl thể hiện bằng
những con số, biến thiên liên tục (continuous) hoặc rời rạc
(discrete).
DL định tính (qualitative data): Phản ánh tính chất, sự hơn
kém, không tính được trị trung bình. Có nhiều cách thể
hiện các dữ liệu định tính, như màu sắc, giới tính. Vì vậy
người ta còn phân ra dl định loại (categorical data), dữ
liệu thứ tự (ordered data), dl duy danh (nominal data)…
19
Biến định tính
(quatitative variables)
Là những biến mà người ta gán cho các giá
trị để phân biệt hay phân loại các quan sát.
Đây là biến định loại (categorical variables),
trị số của chúng được xác định bằng các
thang đo định danh hoặc thang đo thứ bậc
dưới dạng mã số hoặc chuỗi ngắn.
Vídụ:
Giới tính (nam, nữ);
Trình độ họcvấn (Mù chữ, tiểu học, trung học,
cao đẳng, đại học, trên đại học)…;
Thu nhập (thấp, trung bình, khá, cao…)
20
Biến định lượng
(quantitative variables)
Là những biến mà các giá trị của chúng
được xác định bằng các thang đo khoảng
nên trị số của chúng luôn để dưới dạng số.
Vídụ:
Thu nhập ( 200.000đ; 220.000đ; 211.000đ…),
Tuổi (15; 17; 19; 18; 16…),
Số lượng tài sản có trong gia đình: Tivi; tủ lạnh,
xe máy…
21
Biến độc lập
(independent variable)
Biến độc lập là một đặc tính được lựa chọn
để nghiên cứu. Biến độc lập được giả thuyết
là một biến mà sự biến đổi của nó có ảnh
hưởng chi phối hoặc gây ra những biến đổi
kéo theo ở một biến khác.
22
Biến phụ thuộc
(dependent variable)
Biến phụ thuộc là một biến mà sự biến đổi
của nó chịu sự chi phối (đáp ứng) của 1
biến khác. Một biến được gọi là biến phụ
thuộc khi giá trị của nó tuỳ thuộc vào giá trị
của biến độc lập. Nó chính là hiệu quả giả
định của biến độc lập.
Lưu ý: Việc xác định một biến là độc lập và phụ thuộc thường có
tính chất tương đối. Một biến có thể được xem là phụ thuộc trong
phạm vi phân tích này lại là độc lập trong phạm vi phân tích khác.
Trong nghiên cứu còn có những yếu tố ảnh hưởng không được kiểm
soát (hay không được quan sát một cách có hệ thống) được gọi là
các biến bổ trợ.
23
4. Những cấp độ đo lường
(Measurement)
24
Thang đo định danh
Các con số được sử dụng đơn thuần như
một giá trị xác định một loại, dạng
(category) khác nhau và chỉ được dùng như
một cái tên hay nhãn cho loại, hạng đó. Đối
với loại thang đo định danh các giá trị số
được sử dụng như là ký số nhận dạng và
không có giá trị về mặt số học như so sánh
cộng, trừ, nhân, chia.
Những phép toán thống kê: đếm, phần
trăm tần suất xuất hiện, mode, kiểm
nghiệm nhị thức, Chi-bình phương.
25
DẠNG CÂU HỎI
Câu hỏi mở
Câu hỏi đóng
Câu hỏi phân đôi (Dichtomous)
Câu hỏi liệt kê một lựa chọn (Sigle response)
Câu hỏi liệt kê nhiều lựa chọn (Multiple
respenses)
Câu hỏi xắp hạng (Ranking)
Câu hỏi phân mức (Scale)
Câu hỏi chấm điểm
26
Thang đo định danh
Nominal scale
Anh/chị/ông/bà thường đọc báo ở đâu?
(CHỈ CHỌN TỐI ĐA 2 TRẢ LỜI)
1. Nhà
2. Cơ quan, văn phòng, nơi làm việc
3. Nơi bán hàng
4. Nơi khác (ghi cụ thể) ………
Anh/chị có sử dụng điện thoại di động
không?
1.Có 2. Không
28
Thanh đo thứ tự
Dữ liệu được xắp xếp thứ tự các giá trị theo
1 tiêu chuẩn nào đó. Mỗi giá trị có vị trí cao
hơn hoặc thấp hơn so với gt khác, nhưng
không diễn tả được cao hay thấp hơn bao
nhiêu.
Thông tin định danh + quan hệ thứ tự giữa
các giá trị (không đo được khoảng cách
giữa các giá trị đó).
A-B≠B-C
30
Thang đo thứ bậc - Ordinal scale
Hãy xếp hạng các chủ đề sau đây trên báo
SGTT tùy theo mưc độ quan tâm của
Anh/chị/ông/bà đối với từng loại chủ đề? (chủ
đề nào quan tâm nhất thì ghi số 1, quan tâm
thứ nhì thì ghi số 2, quan tâm thứ ba thì ghi
số 3)
- Thông tin thị trường __________
- Mua sắm __________
- Gia đình __________
32
Thang đo thứ bậc - Ordinal scale
Tôi có thang điểm từ 1 đến 5. 1 là tốt nhất,
3 là bình thường, 5 là rất tệ. Chị vui lòng
cho biết nhận xét chung của Chị về bột giặt
Tide, Omo và Viso?
35
Thang đo khoảng cách
Interval scale
Theo Anh/chị/ông/bà, tầm quan trọng của các yếu tố sau đây
như thế nào đối với cuộc sống của một người? (1 = không quan
trọng, 7 = rất quan trọng)
1. Coù nhieàu tieàn 1 2 3 4 5 6 7
2. Ñaït trình ñoä hoïc vaán cao 1 2 3 4 5 6 7
3. Coù ñòa vò trong xaõ hoäi 1 2 3 4 5 6 7
4. Coù baïn beø toát 1 2 3 4 5 6 7
5. Gia ñình oån ñònh 1 2 3 4 5 6 7
6. Coù töï do caù nhaân 1 2 3 4 5 6 7
7. Coù söùc khoûe toát 1 2 3 4 5 6 7
8. Coù ngheà nghieäp thích hôïp 1 2 3 4 5 6 7
9. Coù tình yeâu 1 2 3 4 5 6 7
10. Ñöôïc moïi ngöôøi toân troïng 1 2 3 4 5 6 7
11. Soáng coù ích cho ngöôøi khaùc 1 2 3 4 5 6 7
12. Ñöôïc höôûng thuï nhieàu thuù vui trong cuoäc soáng 1 2 3 4 5 6 7
36
Thang đo tỷ lệ
Thang đo có đủ các đặc tính thứ tự và
khoảng cách. Ngoài ra việc xác định tỷ số
giữa các giá trị là có thể thực hiện do ở
thang đo này, điểm 0 được xác định 1 cách
có ý nghĩa.
38
Thang đo tỉ lệ – Ratio scale
Nếu gia đình Anh/chị/ông/bà có mua báo
SGTT, thì số lượng người đọc báo SGTT trong
gia đình trung bình là bao nhiêu người (kể cả
Anh/chị/ông/bà)? Trong đó số người thường
xuyên xem các trang quảng cáo là bao nhiêu
người?
Số người đọc:_________;
Số người xem quảng cáo_________
39
Sự khác biệt
Loại dữ liệu
Điểm 0 có ý
Phân loại, Phân loại, Sai biệt giữa
nghĩa và có
đếm tần số, xếp hạng các giá trị có
thể so sánh
tính tỉ lệ ý nghĩa
tỉ lệ
40
NHẬP DỮ LIỆU, ĐỊNH
BIẾN VÀ CÁC THAO TÁC
TRÊN BIẾN
41
Nhập dữ liệu, định biến và các thao
tác trên biến
Nhập dữ liệu
Cột
Quản lý các biến (variables). Mỗi cột sẽ đại diện cho 1
câu trả lời trong bảng câu hỏi.
Loại biến 1 trả lời: Mỗi cột trong bảng tính sẽ là biến
đại diện cho kết quả duy nhất của câu hỏi 1 trả lời.
Loại biến nhiều trả lời: Sử dụng nhiều cột để quản lý
cho các kết quả khác nhau có thể có cho câu hỏi nhiều
trả lời.
Dòng
42
Nhập dữ liệu, định biến và các thao
tác trên biến
Nhập dữ liệu
Dòng _ Case (trường hợp/chủ thể)
Các quan sát là các trường hợp/chủ thế (case).
Một chủ thể bao gồm các thông tin cho một đơn vị của
phép phân tích.
Ví dụ: 1 người với tư cách là 1 chủ thể (case) bao gồm
các thông tin mà nhà nghiên cứu cần quan tâm như: tuổi,
giới tính, trình độ văn hoá, những thái độ ứng xử, quan
niệm, hành động…
43
NGUYEÂN TAÉC MAÕ HOÙA VAØ NHAÄP LIEÄU
Chæ maõ hoùa thang ño ñònh tính
Caâu hoûi chæ choïn moät traû lôøi, chæ caàn taïo moät
bieán.
Caâu hoûi coù theå choïn nhieàu traû lôøi, caàn phaûi
coù nhieàu bieán
Moãi ñoái töôïng traû lôøi (quan saùt)hay với một
bảng phỏng vấn töông öùng vôùi 1 doøng (1 case)
Nhaäp lieäu töø traùi qua phaûi treân cöûa soå data
cuûa SPSS (theo töøng doøng)
44
TAÏO KHUOÂN NHAÄP LIEÄU
Ñeå taïo bieán môùi phaûi laøm beân cöûa soå Variable
View
• Name: goõ teân bieán caàn ñaët (ñoä daøi khoâng
quaù 8 kyù töï hay kyù soá
• Type: Khai baùo loaïi bieán kieåu soá hay kieãu
chuoãi
• Label: Khai baùo yù nghóa cuûa bieán
• Value label: Hoäp thoaïi khai baùo nhaõn bieán
• Missing Value: Ñònh caùc giaù trò khuyeát
(neáu caàn)
45
TAÏO KHUOÂN NHAÄP LIEÄU
Biến (variables)
Mỗi chủ thể được thể hiện qua các biến. Biến
(variable) là thông tin hoặc thuộc tính được thu
thập cho từng chủ thể.
Vídụ: tuổi, giới tính, học vấn, nhận thức, thái
độ...
Variable name (tên biến)
Mỗi biến được đặt tên và không có 2 biến có tên
giống hệt nhau trong một tập tin.
Mỗi tên biến có tối đa là 8 ký tự
Vídụ: Cau1; Cau2; gioi, tuoi, thunhap...
46
6. TAÏO KHUOÂN NHAÄP LIEÄU
Variable label (nhãn biến)
Dùng để mô tả cho tên đầy đủ của biến.
Tối đa 120 ký tự.
Value label (Nhãn của giá trị biến)
Dùng để mô tả những biểu hiện riêng biệt của từng biến
định tính.
Tối đa 60 ký tự.
47
Mã hóa dữ liệu
Nữ: 2
Nam: 1
10
3
11
…
14
48
Mã hóa dữ liệu
49
Bảng phỏng vấn đơn giản
1. Loại điện thoại di động mà bạn sử dụng chính?
Nokia (1)
Samsung (2)
Motorola (3)
Khác (4)
2. Mức độ hài lòng chung của bạn khi sử dụng loại điện thoại
trên?
Rất không hài lòng 1 2 3 4 5 Rất hài lòng
3. Chi tiêu trung bình một tháng cho việc gọi điện thoại di động
……….ngàn đồng
4. Bạn theo dõi thông tin về các loại điện thoại mới như thế nào?
Không bao giờ (1) Ít khi (2)
Thỉnh thoảng (3) Thường xuyên (4)
5. Bạn thường sử dụng tính năng nào
Nghe - gọi Tin nhắn Nghe nhạc
Quay phim, chụp hình Games Khác
6. Giới tính: Nam (1) Nữ (0) 50
Khai báo biến
51
Khai báo biến
52
Nhập liệu
53
Hỏi & Đáp …
54