You are on page 1of 48

Trường Đại Học Công nghiệp Tp.

Hồ Chí Minh
Khoa Quản trị Kinh doanh

Chương 1: Tổng quan về


SPSS
Giáo trình điện tử

Biên soạn bởi: Nguyễn Minh Toàn

1
Học kỳ 2 – 2011-2012
Nội dung
1. SPSS là gì?
2. Các bộ phận của hệ thống SPSS
3. Phân loại dữ liệu
4. Các loại thang đo
5. Nguyên tắc mã hóa và nhập liệu
6. Tạo khuôn nhập liệu

2
Tài liệu tham khảo
 [1] Hà Trọng Quang, “Xử lý dữ liệu nghiên cứu với SPSS for windows”, Đại
học Công Nghiệp Tp.HCM, 2008.
 [2] Hoàng Trọng, “Xử lý dữ liệu nghiên cứu với SPSS ”, Đại học Kinh tế tp.
HCM, 2008.
 [3] Lê Văn Huy, “Phân tích dữ liệu với SPSS”, Đại học Kinh tế Đà Nẵng, 2009.
 [4] Susan B. Gerber, Kristin Voelkl Finn, “Using SPSS For Windows Data
Analysis and Graphics”, Springer Science+Business Media, 1999.
 [5] Nguyễn Duy Tâm, “Phân tích dữ liệu”,
http://sites.google.com/site/tam0505/spss, 2011.

3
Giới thiệu tổng quát về công trình
nghiên cứu xã hội

Trình
Xử lý bày
và báo
Tiến phân cáo
hành tích khoa
Thiết thông học
kế tin
4
Quy trình nghiên cứu xử lý
thông tin Tiến trình 7 bước theo David Luck

1. Xác định vấn đề cần nghiên cứu


Lập kế hoạch
nghiên cứu
2. Xác định loại thông tin cần thu thập

3. Nhận diện nguồn gốc của thông tin

4. Phương án thu thập thông tin Thu thập thông tin


và xử lý thông tin
5. Thu thập và xử lý thông tin

Diễn giải kết


6. Phân tích diễn giải dữ liệu đã xử lý
quả nghiên cứu
và báo cáo
7. Trình bày và báo cáo kết quả

5
Xử lý thông tin trong nghiên cứu
kinh tế - xã hội

Xử lý Diễn giải
Dữ liệu thô Dữ liệu tinh

 Xử lý thủ công.
 Xử lý bằng máy vi tính

6
Các giai đoạn xử lý dữ liệu
Giá trị hóa dữ liệu

Hiệu chỉnh lại các câu trả lời có thể chấp nhận được

Mã hóa các câu trả lời

Nhập dữ liệu vào máy tính

Làm sạch dữ liệu

Lưu trữ dữ liệu phân tích

Phân tích dữ liệu

7
1. SPSS là gì?
 SPSS - Statistical Package for the Social
Sciences, là phần mềm trọn gói về tính
toán thống kê dùng trong nghiên cứu khoa
học xã hội.
 SPSS là một hệ thống phần mềm thống kê
toàn diện được thiết kế để thực hiện tất cả
các bước trong các phân tích thống kê từ
những thông kê mô tả (liệt kê dữ liệu, lập
đồ thị) đến thống kê suy luận (tương quan,
hồi quy…)

8
2. Các bộ phận của hệ thống
 SPSS cho Windows là một gói phần mềm
máy tính linh hoạt mà sẽ thực hiện một loạt
các thủ tục thống kê. Bốn loại của các cửa
sổ là:
 Data Editor Window
 Output Viewer Window
 Chart Editor Window
 Syntax Editor Window

9
2. Các bộ phận của hệ thống

10
2. Các bộ phận của hệ thống
 The Main Menu
 File
 Edit
 View
 Data
 Transform
 Analyze
 Graphs
 Utilities
 Window
 Help
11
CÁC LOẠI DỮ LIỆU VÀ
THANG ĐO

13
Các giai đoạn xử lý dữ liệu
Giá trị hóa dữ liệu

Hiệu chỉnh lại các câu trả lời có thể chấp nhận được

Mã hóa các câu trả lời

Nhập dữ liệu vào máy tính

Làm sạch dữ liệu

Lưu trữ dữ liệu phân tích

Phân tích dữ liệu

14
Mã hóa
 Quá trình chuyển dịch câu hỏi trả lời thực
của người trả lời vào từng nhóm, từng mẫu
với các giá trị tương ứng.
 Mục đích: tạo nhãn cho các câu trả lời,
thường bằng các con số.
 Ví dụ
 1: Nam 0: Nữ
 1: Đồng ý 0: Không đồng ý
 1: Rất không đồng ý 7: Rất đồng ý

15
Mã hóa
 Định biến
 Biến (variable)
 Tập hợp những trả lời cho 1 câu hỏi
 Biến 1 trả lời: Biến dành cho câu hỏi có
1 trả lời.
 Biến nhiều trả lời: các biến dành cho
nhiều câu trả lời trả lời đồng thời trong
câu hỏi nhiều trả lời.

16
Các loại biến số
 Các hiện tượng mà ta muốn quan sát được
gọi là các biến số (variables). Một biến là
những đại lượng có thể mang các giá trị
khác nhau như học vấn, thu nhập, tính
cách, khí chất… Các biến này có thể thuộc
loại định tính (qualitative) hay định lượng
(quantitative).
 Trong nghiên cứu người ta thường phân
biệt 2 loại biến số chính yếu khác nữa: Biến
độc lập (independent variables) và biến phụ
thuộc (dependent variables)
17
PHÂN LOẠI DỮ LIỆU
Döõ Lieäu

Döõ lieäu Döõ lieäu


Ñònh tính Ñònh löôïng

Thang ño Thang ño Thang ño Thang ño


Danh nghóa Thöù baäc Khoaûng Tæ leä
caùch

18
Kiểu dữ liệu
 DL định lượng (quantitative data): Các dl thể hiện bằng
những con số, biến thiên liên tục (continuous) hoặc rời rạc
(discrete).
 DL định tính (qualitative data): Phản ánh tính chất, sự hơn
kém, không tính được trị trung bình. Có nhiều cách thể
hiện các dữ liệu định tính, như màu sắc, giới tính. Vì vậy
người ta còn phân ra dl định loại (categorical data), dữ
liệu thứ tự (ordered data), dl duy danh (nominal data)…

19
Biến định tính
(quatitative variables)
 Là những biến mà người ta gán cho các giá
trị để phân biệt hay phân loại các quan sát.
Đây là biến định loại (categorical variables),
trị số của chúng được xác định bằng các
thang đo định danh hoặc thang đo thứ bậc
dưới dạng mã số hoặc chuỗi ngắn.
 Vídụ:
 Giới tính (nam, nữ);
 Trình độ họcvấn (Mù chữ, tiểu học, trung học,
cao đẳng, đại học, trên đại học)…;
 Thu nhập (thấp, trung bình, khá, cao…)
20
Biến định lượng
(quantitative variables)
 Là những biến mà các giá trị của chúng
được xác định bằng các thang đo khoảng
nên trị số của chúng luôn để dưới dạng số.
 Vídụ:
 Thu nhập ( 200.000đ; 220.000đ; 211.000đ…),
 Tuổi (15; 17; 19; 18; 16…),
 Số lượng tài sản có trong gia đình: Tivi; tủ lạnh,
xe máy…

21
Biến độc lập
(independent variable)
 Biến độc lập là một đặc tính được lựa chọn
để nghiên cứu. Biến độc lập được giả thuyết
là một biến mà sự biến đổi của nó có ảnh
hưởng chi phối hoặc gây ra những biến đổi
kéo theo ở một biến khác.

22
Biến phụ thuộc
(dependent variable)
 Biến phụ thuộc là một biến mà sự biến đổi
của nó chịu sự chi phối (đáp ứng) của 1
biến khác. Một biến được gọi là biến phụ
thuộc khi giá trị của nó tuỳ thuộc vào giá trị
của biến độc lập. Nó chính là hiệu quả giả
định của biến độc lập.

Lưu ý: Việc xác định một biến là độc lập và phụ thuộc thường có
tính chất tương đối. Một biến có thể được xem là phụ thuộc trong
phạm vi phân tích này lại là độc lập trong phạm vi phân tích khác.
Trong nghiên cứu còn có những yếu tố ảnh hưởng không được kiểm
soát (hay không được quan sát một cách có hệ thống) được gọi là
các biến bổ trợ.

23
4. Những cấp độ đo lường
(Measurement)

 4.1 Thang ño ñònh danh - Nominal scale


 4.2 Thang ño thöù baäc - Ordinal scale
 4.3 Thang ño khoaûng - Interval scale
 4.4 Thang ño tæ leä – Ratio scale

24
Thang đo định danh
 Các con số được sử dụng đơn thuần như
một giá trị xác định một loại, dạng
(category) khác nhau và chỉ được dùng như
một cái tên hay nhãn cho loại, hạng đó. Đối
với loại thang đo định danh các giá trị số
được sử dụng như là ký số nhận dạng và
không có giá trị về mặt số học như so sánh
cộng, trừ, nhân, chia.
 Những phép toán thống kê: đếm, phần
trăm tần suất xuất hiện, mode, kiểm
nghiệm nhị thức, Chi-bình phương.
25
DẠNG CÂU HỎI
 Câu hỏi mở
 Câu hỏi đóng
 Câu hỏi phân đôi (Dichtomous)
 Câu hỏi liệt kê một lựa chọn (Sigle response)
 Câu hỏi liệt kê nhiều lựa chọn (Multiple
respenses)
 Câu hỏi xắp hạng (Ranking)
 Câu hỏi phân mức (Scale)
 Câu hỏi chấm điểm

26
Thang đo định danh
Nominal scale
 Anh/chị/ông/bà thường đọc báo ở đâu?
(CHỈ CHỌN TỐI ĐA 2 TRẢ LỜI)
1. Nhà
2. Cơ quan, văn phòng, nơi làm việc
3. Nơi bán hàng
4. Nơi khác (ghi cụ thể) ………
 Anh/chị có sử dụng điện thoại di động
không?
1.Có 2. Không

28
Thanh đo thứ tự
 Dữ liệu được xắp xếp thứ tự các giá trị theo
1 tiêu chuẩn nào đó. Mỗi giá trị có vị trí cao
hơn hoặc thấp hơn so với gt khác, nhưng
không diễn tả được cao hay thấp hơn bao
nhiêu.
 Thông tin định danh + quan hệ thứ tự giữa
các giá trị (không đo được khoảng cách
giữa các giá trị đó).
A-B≠B-C

30
Thang đo thứ bậc - Ordinal scale
Hãy xếp hạng các chủ đề sau đây trên báo
SGTT tùy theo mưc độ quan tâm của
Anh/chị/ông/bà đối với từng loại chủ đề? (chủ
đề nào quan tâm nhất thì ghi số 1, quan tâm
thứ nhì thì ghi số 2, quan tâm thứ ba thì ghi
số 3)
- Thông tin thị trường __________
- Mua sắm __________
- Gia đình __________

32
Thang đo thứ bậc - Ordinal scale
 Tôi có thang điểm từ 1 đến 5. 1 là tốt nhất,
3 là bình thường, 5 là rất tệ. Chị vui lòng
cho biết nhận xét chung của Chị về bột giặt
Tide, Omo và Viso?

Nhaõn Raát Bình Raát


Hieäu Toát Toát Thöôøng Teä Teä
TIDE 1 2 3 4 5
OMO 1 2 3 4 5
VISO 1 2 3 4 5
33
Thang đo khoảng cách
 Giống đặc tính thang đo thứ tự, nhưng giữa
các giá trị có khoảng cách. Tuy nhiên do
thang đo quãng không xác định điểm 0, do
đó ta chỉ có thể nói giá trị này lớn hơn giá
trị kia bao nhiêu đơn vị nhưng không thể
kết luận giá trị đó lớn hơn giá trị kia bao
nhiêu lần.
B-A=C-B.
 Phép thống kê: tính khoảng , số trung bình,
độ lệch chuẩn,…

35
Thang đo khoảng cách
Interval scale
Theo Anh/chị/ông/bà, tầm quan trọng của các yếu tố sau đây
như thế nào đối với cuộc sống của một người? (1 = không quan
trọng, 7 = rất quan trọng)
1. Coù nhieàu tieàn 1 2 3 4 5 6 7
2. Ñaït trình ñoä hoïc vaán cao 1 2 3 4 5 6 7
3. Coù ñòa vò trong xaõ hoäi 1 2 3 4 5 6 7
4. Coù baïn beø toát 1 2 3 4 5 6 7
5. Gia ñình oån ñònh 1 2 3 4 5 6 7
6. Coù töï do caù nhaân 1 2 3 4 5 6 7
7. Coù söùc khoûe toát 1 2 3 4 5 6 7
8. Coù ngheà nghieäp thích hôïp 1 2 3 4 5 6 7
9. Coù tình yeâu 1 2 3 4 5 6 7
10. Ñöôïc moïi ngöôøi toân troïng 1 2 3 4 5 6 7
11. Soáng coù ích cho ngöôøi khaùc 1 2 3 4 5 6 7
12. Ñöôïc höôûng thuï nhieàu thuù vui trong cuoäc soáng 1 2 3 4 5 6 7
36
Thang đo tỷ lệ
 Thang đo có đủ các đặc tính thứ tự và
khoảng cách. Ngoài ra việc xác định tỷ số
giữa các giá trị là có thể thực hiện do ở
thang đo này, điểm 0 được xác định 1 cách
có ý nghĩa.

38
Thang đo tỉ lệ – Ratio scale
Nếu gia đình Anh/chị/ông/bà có mua báo
SGTT, thì số lượng người đọc báo SGTT trong
gia đình trung bình là bao nhiêu người (kể cả
Anh/chị/ông/bà)? Trong đó số người thường
xuyên xem các trang quảng cáo là bao nhiêu
người?
Số người đọc:_________;
Số người xem quảng cáo_________

39
Sự khác biệt
Loại dữ liệu

Định tính Định lượng

Định danh Thứ bậc Khoảng Tỉ lệ

Điểm 0 có ý
Phân loại, Phân loại, Sai biệt giữa
nghĩa và có
đếm tần số, xếp hạng các giá trị có
thể so sánh
tính tỉ lệ ý nghĩa
tỉ lệ
40
NHẬP DỮ LIỆU, ĐỊNH
BIẾN VÀ CÁC THAO TÁC
TRÊN BIẾN
41
Nhập dữ liệu, định biến và các thao
tác trên biến
 Nhập dữ liệu
 Cột
 Quản lý các biến (variables). Mỗi cột sẽ đại diện cho 1
câu trả lời trong bảng câu hỏi.
 Loại biến 1 trả lời: Mỗi cột trong bảng tính sẽ là biến
đại diện cho kết quả duy nhất của câu hỏi 1 trả lời.
 Loại biến nhiều trả lời: Sử dụng nhiều cột để quản lý
cho các kết quả khác nhau có thể có cho câu hỏi nhiều
trả lời.
 Dòng

42
Nhập dữ liệu, định biến và các thao
tác trên biến
 Nhập dữ liệu
 Dòng _ Case (trường hợp/chủ thể)
 Các quan sát là các trường hợp/chủ thế (case).
 Một chủ thể bao gồm các thông tin cho một đơn vị của
phép phân tích.
 Ví dụ: 1 người với tư cách là 1 chủ thể (case) bao gồm
các thông tin mà nhà nghiên cứu cần quan tâm như: tuổi,
giới tính, trình độ văn hoá, những thái độ ứng xử, quan
niệm, hành động…

43
NGUYEÂN TAÉC MAÕ HOÙA VAØ NHAÄP LIEÄU
Chæ maõ hoùa thang ño ñònh tính
Caâu hoûi chæ choïn moät traû lôøi, chæ caàn taïo moät
bieán.
Caâu hoûi coù theå choïn nhieàu traû lôøi, caàn phaûi
coù nhieàu bieán
Moãi ñoái töôïng traû lôøi (quan saùt)hay với một
bảng phỏng vấn töông öùng vôùi 1 doøng (1 case)
Nhaäp lieäu töø traùi qua phaûi treân cöûa soå data
cuûa SPSS (theo töøng doøng)
44
TAÏO KHUOÂN NHAÄP LIEÄU
Ñeå taïo bieán môùi phaûi laøm beân cöûa soå Variable
View
• Name: goõ teân bieán caàn ñaët (ñoä daøi khoâng
quaù 8 kyù töï hay kyù soá
• Type: Khai baùo loaïi bieán kieåu soá hay kieãu
chuoãi
• Label: Khai baùo yù nghóa cuûa bieán
• Value label: Hoäp thoaïi khai baùo nhaõn bieán
• Missing Value: Ñònh caùc giaù trò khuyeát
(neáu caàn)
45
TAÏO KHUOÂN NHAÄP LIEÄU
 Biến (variables)
 Mỗi chủ thể được thể hiện qua các biến. Biến
(variable) là thông tin hoặc thuộc tính được thu
thập cho từng chủ thể.
 Vídụ: tuổi, giới tính, học vấn, nhận thức, thái
độ...
 Variable name (tên biến)
 Mỗi biến được đặt tên và không có 2 biến có tên
giống hệt nhau trong một tập tin.
 Mỗi tên biến có tối đa là 8 ký tự
 Vídụ: Cau1; Cau2; gioi, tuoi, thunhap...

46
6. TAÏO KHUOÂN NHAÄP LIEÄU
 Variable label (nhãn biến)
 Dùng để mô tả cho tên đầy đủ của biến.
 Tối đa 120 ký tự.
 Value label (Nhãn của giá trị biến)
 Dùng để mô tả những biểu hiện riêng biệt của từng biến
định tính.
 Tối đa 60 ký tự.

47
Mã hóa dữ liệu

Nữ: 2
Nam: 1

10
3
11

14

48
Mã hóa dữ liệu

49
Bảng phỏng vấn đơn giản
1. Loại điện thoại di động mà bạn sử dụng chính?
 Nokia (1)
 Samsung (2)
 Motorola (3)
 Khác (4)
2. Mức độ hài lòng chung của bạn khi sử dụng loại điện thoại
trên?
Rất không hài lòng 1 2 3 4 5 Rất hài lòng
3. Chi tiêu trung bình một tháng cho việc gọi điện thoại di động
……….ngàn đồng
4. Bạn theo dõi thông tin về các loại điện thoại mới như thế nào?
 Không bao giờ (1)  Ít khi (2)
 Thỉnh thoảng (3)  Thường xuyên (4)
5. Bạn thường sử dụng tính năng nào
 Nghe - gọi  Tin nhắn  Nghe nhạc
 Quay phim, chụp hình  Games  Khác
6. Giới tính: Nam (1) Nữ (0) 50
Khai báo biến

51
Khai báo biến

52
Nhập liệu

53
Hỏi & Đáp …

54

You might also like