You are on page 1of 54

TIN HỌC THỐNG KÊ

APPLIED INFORMATICS IN STATISTICS

University of Economics and Finance www.uef.edu.vn 1


PHẦN 3: PHÂN TÍCH DỮ LIỆU
THỐNG KÊ BẰNG SPSS
CHƯƠNG 6.
PHÂN LOẠI DỮ LIỆU, MÃ HÓA,
NHẬP LIỆU VÀ XỬ LÝ TRÊN BIẾN

University of Economics and Finance www.uef.edu.vn 2


Nội dung
1. PHÂN LOẠI DỮ LIỆU

2. CÁC LOẠI THANG ĐO

3. MÃ HÓA DỮ LIỆU

4. CỬA SỔ LÀM VIỆC CỦA SPSS

5. MỘT SỐ XỬ LÝ TRÊN BIẾN

University of Economics and Finance www.uef.edu.vn 3


1. Phân loại dữ liệu
Thang đo định danh
(Nominal scale)
Dữ liệu định tính
(Qualitative)
Thang đo thứ bậc
(Ordinal scale)
Dữ liệu
Thang đo khoảng cách
(Interval scale)
Dữ liệu định lượng
(Quantitative)
Thang đo tỷ lệ
(Ratio scale)

University of Economics and Finance www.uef.edu.vn 4


1. Phân loại dữ liệu

University of Economics and Finance www.uef.edu.vn 5


1. Phân loại dữ liệu
Examples
Qualitative Data Quantative Data
(Categorical) (Numerical)

1. Happiness rating 1. Height of 1st graders


2. Gender 2. Weight of sumo wrestlers
3. Pass/Fail 3. Duration of red lights
4. Ege Color 4. Age of Olympians
5. Interview transcript 5. Distance of planets
6. Categories of plants 6. Money in 401k plans
7. Descriptive temperature of coffee 7. Temperature of coffee
(“Very hot”, ) (200o F)

University of Economics and Finance www.uef.edu.vn 6


1. Phân loại dữ liệu
 Dữ liệu định tính: Loại dữ liệu này phản ánh tính chất, sự hơn
kém, ta không tính được trị trung bình của dữ liệu dạng định tính
 Dữ liệu định lượng: Loại dữ liệu này phản ánh mức độ, mức độ
hơn kém, tính được trị trung bình. Nó thể hiện bằng con số thu
thập được ngay trong quá trình điều tra khảo sát, các con số này
có thể ở dạng biến thiên liên tục hay rời rạc

University of Economics and Finance www.uef.edu.vn 7


2. Các loại thang đo

University of Economics and Finance www.uef.edu.vn 8


3. Mã hóa dữ liệu
Các biến
Giới tính Tuổi Nghề nghiệp Những dữ liệu không phải
1 Nữ 21 Sinh viên
ký số như “nữ” hay “sinh
viên” cần phải được tạo
Những người trả lời

2 Nữ 32 Nhân viên văn phòng một con số mã hóa


3 Nam 53 Về hưu
… … … …
n Nam 42 Nghề khác

Các biến
Giới tính Tuổi Nghề nghiệp
1 2 21 10
Những người trả lời
Chỉ mã hóa thông tin 2 2 32 3
thu thập bằng 3 1 53 11
thang đo định tính … … … …
n 1 42 14

University of Economics and Finance www.uef.edu.vn 9


3. Mã hóa dữ liệu
 Trong SPSS, các dữ liệu được lưu trữ dưới dạng các biến (variable)
 Với các câu hỏi khảo sát chỉ có một kết quả trả lời, ta chỉ tạo 1
biến. Ví dụ: Tuổi chỉ nhận về một thông tin (một con số) nên chỉ
cần một biến
 Đối với các câu hỏi có nhiều lựa chọn, cần phải có nhiều biến
3. Chuyên ngành bạn đang theo học
 Kế toán  Marketing
 Quản trị kinh doanh  Luật thương mại
 Tài chính  Kinh tế học
 Quản trị nhân sự  Chính sách công
 Kinh doanh quốc tế  Chuyên ngành khác: ………………………

University of Economics and Finance www.uef.edu.vn 10


Bài tập
Xác định các biến cần khai báo cho khảo sát dưới đây:
Câu 1: Anh chị đã và đang dùng điện thoại thương hiệu gì?
1. iPhone 4. Sony
2. SamSung 5. Huawei
3. Oppo 6. Nokia
7. Khác (kể tên):.......
Câu 2: Anh chị thường đi chợ ở đâu?
1. Siêu thị
2. Cửa hàng tiện lợi
3. Chợ

University of Economics and Finance www.uef.edu.vn 11


4. Cửa sổ làm việc SPSS

University of Economics and Finance www.uef.edu.vn 12


Variable View
 Variable View: Kiểu nhìn dùng để khai báo biến

University of Economics and Finance www.uef.edu.vn 13


Data View
 Data View: Kiểu nhìn dùng để nhập liệu và xem dữ liệu đã nhập

University of Economics and Finance www.uef.edu.vn 14


File
Giúp ta khởi tạo file mới,
mở các file có sẵn, lưu
file, in ấn, thoát…

University of Economics and Finance www.uef.edu.vn 15


Edit
Gồm các lựa chọn Undo,
Redo Cắt/Dán, Tìm kiếm/
Thay thế, Thiết lập các
mặc định

University of Economics and Finance www.uef.edu.vn 16


View
Cho hiện dòng trạng
thái, thanh công cụ, chọn
font chữ, cho hiện giá trị
nhập vào (Value) hay
nhãn ý nghĩa của các giá
trị nhập…

University of Economics and Finance www.uef.edu.vn 17


Data
Bao gồm các lựa chọn phục
vụ công tác về dữ liệu như
chèn thêm biến, tìm nhanh
một quan sát trong một tập
hợp dữ liệu có nhiều quan
sát, xếp thứ tự các quan sát,
ghép file, chia file, chọn
quan sát…
University of Economics and Finance www.uef.edu.vn 18
Transform
Gồm các lệnh giúp chuyển
đổi dữ liệu, tính toán, mã
hóa lại các biến…

University of Economics and Finance www.uef.edu.vn 19


Analyze
Thực hiện các thủ tục thống
kê như: Tóm tắt dữ liệu, lập
bảng tổng hợp, so sánh trung
bình, phân tích phương sai ,
tương quan và hồi qui, phân
tích phi tham số, phân tích
đa biến…

University of Economics and Finance www.uef.edu.vn 20


Graphs
Tạo các biểu đồ và đồ thị

University of Economics and Finance www.uef.edu.vn 21


Utilities
Tìm hiểu thông tin về các
biến, file…

University of Economics and Finance www.uef.edu.vn 22


Windows
Sắp xếp các cửa sổ
làm việc trong SPSS,
di chuyển giữa các
cửa sổ làm việc…

University of Economics and Finance www.uef.edu.vn 23


Khai báo biến
 Vào cửa sổ Variable View để khai báo biến
 Name
 Tên biến, cần ngắn gọn, mô tả đủ ý nghĩa dữ liệu của biến
 Tên biến không có kí tự đặc biệt và không được bắt đầu bằng một
kí số
 Thông thường ta hay đặt tên biến (Variable name) gần với câu
hỏi mà biến đó mô tả, ví dụ với câu hỏi 3 thì ta đặt tên biến đại
diện là c3. Sau khi tạo xong tên biến thì chuyển qua ô kế bên phải
để khai báo kiểu biến

University of Economics and Finance www.uef.edu.vn 24


Khai báo biến
 Type (kiểu biến): Mặc định
chương trình sẽ chọn kiểu
định lượng (Numeric). Muốn
thay đổi kiểu biến hay thay
đổi độ rộng của biến hoặc số
lượng số thập phân của biến
định lượng, hãy nhấn chuột
vào nút … trong ô Type để mở
hộp thoại Type

University of Economics and Finance www.uef.edu.vn 25


Khai báo biến
 Width
 Độ rộng của biến là số ký số hay ký tự tối đa có thể nhập
 Decimals
 Số lẻ sau dấu phẩy
Lưu ý: Nếu lựa chọn những định dạng về Width và Decimals trong
hộp Variable Type thì không cần khai báo mục này trên cửa sổ
Variable View nữa
 Label
 Label: Nhãn cho biến, là phần mô tả chi tiết cho tên biến

University of Economics and Finance www.uef.edu.vn 26


Khai báo biến
 Value: Là thuộc tính quan trọng, dùng để khai báo các giá trị có
thể có của biến kèm mô tả cho các số mã hóa
 Value: Mã hóa các
thang đo định tính
 Value label: Nhãn giải
thích ý nghĩa của mã
số đã nhập

University of Economics and Finance www.uef.edu.vn 27


Khai báo biến
 Missing: Khai báo các loại giá trị khuyết
 Ví dụ: Ta quy ước số 99 cho nhãn “không trả lời”
 Cần chú ý chọn giá trị missing tránh gây nhằm lẫn với các giá trị khác
 System missing là giá trị khuyết của hệ thống, hiển thị bằng dấu “.”

University of Economics and Finance www.uef.edu.vn 28


Khai báo biến
 Columns: Độ rộng cột, thường chọn là 8
 Align: Canh lề dữ liệu
 Measure: Thang đo dữ liệu
 Nominal: Thang danh nghĩa
 Ordinal: Thang thứ bậc
 Scale: Chọn cho Interval và Ratio scale
(khoảng cách và tỉ lệ)

Lưu ý: Có thể copy biến để tạo nhanh biến mới


University of Economics and Finance www.uef.edu.vn 29
Bài tập
Hãy khai báo biến trong SPSS để lưu trữ các dữ liệu khảo sát bên dưới:
Câu 1: Anh chị đã và đang dùng điện thoại thương hiệu gì?
1. iPhone 4. Sony
Khi khai báo biến
2. SamSung 5. Huawei trong SPSS , chú ý
3. Oppo 6. Nokia copy những biến
7. Khác (kể tên):....... tương tự nhau
Câu 2: Anh chị thường đi chợ ở đâu?
1. Siêu thị
2. Cửa hàng tiện lợi
3. Chợ

University of Economics and Finance www.uef.edu.vn 30


Bài tập
 Nhập dữ liệu vào SPSS chi tiết khảo sát cho câu 1 như bên dưới
 Người 1 chọn: 1, 2, 5 (iPhone, Samsung, Huawei)
 Người 2 chọn: 1, 3, 4, 5, 6
 Người 3 chọn: 1, 2, 4, 5
 Người 4 chọn: 2, 3 ,7
 Đối với câu 2, nếu có đi địa điểm nào thì sẽ mã hóa thành 1, không có là 0.
Nhập giá trị vào tương ứng
Hai cách mã
 Người 1 chọn: 1 0 0 hóa – nhập liệu
 Người 2 chọn: 0 1 1 đối với câu hỏi
 Người 3 chọn: 0 0 1 nhiều lựa chọn
 Người 4 chọn: 0 1 1
University of Economics and Finance www.uef.edu.vn 31
Lưu trữ file dữ liệu
 Chọn định dạng là SPSS Statistics (*.sav)

University of Economics and Finance www.uef.edu.vn 32


5. Một số xử lý trên biến
 Mã hóa lại biến
 Nhằm mục đích giảm thiểu số biểu hiện của biến định tính
 Cần phân biệt việc mã hóa lại biến với việc mã hóa biến định danh
trong quá trình nhập liệu
 Ví dụ
 Mã hóa biến định danh: Gom nhóm các tỉnh thành lại theo khu vực
địa lý như Tây Nguyên, Đông Nam Bộ, Tây Nam Bộ
 Mã hóa lại biến: Gom chung các biểu hiện thu nhập từ 6-10tr và trên
10 triệu thành một nhóm chung là thu nhập gia trình trên 6 triệu
 Cần chuyển biến định lượng thành biến định tính  phân tổ
University of Economics and Finance www.uef.edu.vn 33
Mã hóa lại biến - Recode
 1. Vào menu Transform  Recode into Different Variables

Chuyện gì xảy ra
nếu chọn Recode
into Same Variables

University of Economics and Finance www.uef.edu.vn 34


Recode 3. Nhập thông
tin biến mới
 2. Trong hộp thoại
Recode Into Different
Variables bạn chọn biến
muốn recode (ở đây là
biến tuổi) đưa sang khung
Numeric Variable
4. Nhấn nút Old
2. Chọn biến cần and New Values...
Recode để xác định sự
chuyển đổi

University of Economics and Finance www.uef.edu.vn 35


Recode
 Trong hộp thoại này,
lần lượt khai báo
phần giá trị cũ (Old Khoảng từ giá trị
Khoảng từ nhỏmột
nhất giáđến một
Value bên tay trái), trị xác địnhgiáđược
trị xác định
tương ứng với từng nhập vào đến
Value:được giánhập
Từng trị
giá vào
giá trị mới (New lớnGiá
trị cũ
Range: Một giá
nhất
trị rạc
rời khuyết
trị ứng của hệ
Value bên tay phải), cũ ứng thống
vớivới
1 giá hoặc
mộttrị mới do người
có các loại giá trị cũ giá trị sử
mớidụng định nghĩa
có thể được recode
như sau:

University of Economics and Finance www.uef.edu.vn 36


Recode
 Mỗi lần bạn xác định
xong một cặp giá trị cũ
và chỉ định giá trị mới ,
nút Add sẽ hiện sáng
lên, hãy nhấn vào nút
này
 Nhấp nút Continue để
trở về hộp thoại trước
đó
 Nhấn OK để thực hiện
mã hóa lại
University of Economics and Finance www.uef.edu.vn 37
Recode
 Cần định nghĩa các giá trị cho biến mới để việc hiển thị bảng tần
số được rõ ràng

University of Economics and Finance www.uef.edu.vn 38


Recode
 Bảng tần số mới

University of Economics and Finance www.uef.edu.vn 39


Recode
 Bảng tần số cũ với 42 độ tuổi

University of Economics and Finance www.uef.edu.vn 40


Bài tập
Mã hóa lại biến
sudungHDH bằng cách
phân nhóm ra 3 nhóm: Sử
dụng iOS, sử dụng
Android, khác

University of Economics and Finance www.uef.edu.vn 41


Category to Dichotomy
 Biến dạng Category là biến phân loại có thể có nhiều trị số mã hóa
tượng trưng cho nhiều trạng thái, biểu hiện khác nhau
 Ví dụ: Đạo Phật, đạo Thiên Chúa, đạo Tin Lành, đạo Cao Đài…
 Biến Dichotomy là biến phân loại chỉ có 2 trị số mã hóa tượng
trưng cho 2 trạng thái hay 2 biểu hiện khác nhau
 Ví dụ: Có tôn giáo hay không có tôn giáo, đồng ý hay không đồng ý
 Sử dụng chức năng Transform  Count Values within Vases

University of Economics and Finance www.uef.edu.vn 42


Ví dụ
 Trong câu hỏi về các loại báo một người thường đọc, người được
hỏi có thể nhắc đến nhiều loại báo khác nhau chứ không chỉ một
loại báo, thông tin về các loại báo thường đọc sẽ được thể hiện
trong 9 biến từ c2a1 – c2a9
 Dữ liệu thu thập từ biến c2a1 đến c2a9 cho biết nhu cầu đọc báo
Tuổi Trẻ thường xuyên đến đâu.
 Chúng ta cần một biến mới mô tả việc có hay không có đọc báo
Tuổi Trẻ. 1 biến mới với 2 biểu hiện (biến Dichotomy): Biểu hiện
1 với người có đọc báo Tuổi Trẻ, và 0 với người không bao giờ
đọc báo Tuổi Trẻ
University of Economics and Finance www.uef.edu.vn 43
Cách
thực hiện
1. Vào menu Transform
 Count Values within
Cases
University of Economics and Finance www.uef.edu.vn 44
Cách thực hiện
2. Khai báo tên biến Dichotomy muốn tạo trong khung Target
Variable và nhãn biến trong khung Target Label
3. Đưa các biến từ c2a1 đến c2a9 vào khung Numeric Variables
4. Nhấp nút Define Values… mở hộp thoại Count Values Within
Cases: Values to Count

University of Economics and Finance www.uef.edu.vn 45


Cách thực hiện
5. Nhập số 7 (là con số được mã hóa cho báo
Tuổi Trẻ trong các biến từ (c2a1 đến c2a9)
vào khung Value rồi bấm nút Add để đưa
nó sang khung Values to Count, ở bước này
bạn đã yêu cầu SPSS đếm tất cả các trường
hợp quan sát dọc theo các biến từ c2a1 đến
c2a9 để xem có gặp giá trị 7 không, nếu
gặp thí SPSS sẽ gán một con số 1 ở biến
docTTre, nếu không thì nó để giá trị 0
6. Bấm Continue trở lại hộp thoại chính và
OK.

University of Economics and Finance www.uef.edu.vn 46


Cách thực hiện

Kết Quả

University of Economics and Finance www.uef.edu.vn 47


Cách thực hiện
7. Nhập Values cho biến
docTTre

University of Economics and Finance www.uef.edu.vn 48


Bài tập
Mã hóa lại biến useIPhone
bằng cách đếm các con số
“1” xuất hiện trong các
biến chứa kết quả trả lời
của câu 1 (c1.1 đến c1.7)

University of Economics and Finance www.uef.edu.vn 49


Compute Variable
 Transform  Compute Variable
 Lệnh Compute được sử dụng để
tính toán dữ liệu một biến dựa
trên các biến khác

University of Economics and Finance www.uef.edu.vn 50


Bài tập
Nhập dữ liệu cho điểm
thi Toán, Lý, Hóa của
sinh viên, tính toán biến
Điểm Trung Bình =
(Toán * 2 + Lý + Hóa)/4

University of Economics and Finance www.uef.edu.vn 51


Một số thay đổi mặc định
 Vào Edit  Options
 Measurement system: Thường dùng cm
 Cách thể hiện nhãn

University of Economics and Finance www.uef.edu.vn 52


Một số thay đổi mặc định
 Trong thẻ Pivot Table chọn các kiểu định dạng bảng có sẵn

University of Economics and Finance www.uef.edu.vn 53


HẾT
University of Economics and Finance www.uef.edu.vn 54

You might also like