You are on page 1of 48

ỨNG DỤNG SPSS

TRONG XỬ LÝ DỮ LIỆU THỐNG KÊ


NỘI DUNG

1 GIỚI THIỆU CHUNG VỀ SPSS VÀ QUẢN LÝ DỮ LIỆU

2 MÔ TẢ DỮ LIỆU THỐNG KÊ

3 MỘT SỐ PHƯƠNG PHÁP THỐNG KÊ SUY LUẬN


Bài 1
GIỚI THIỆU CHUNG VỀ SPSS VÀ QUẢN LÝ DỮ LIỆU

GIỚI THIỆU
II
CHUNG VỀ SPSS

QUẢN LÝ DỮ LIỆU
Giới thiệu chung về SPSS

SPSS
(Statistical Package for Social Sciences)

Là phần mềm chuyên dụng xử lý thông tin


sơ cấp (thông tin được thu thập trực tiếp
từ đối tượng nghiên cứu thông qua một
bảng câu hỏi được thiết kế sẵn).
Các màn hình SPSS
Phần mềm SPSS có 4 dạng màn hình
• Màn hình quản lý dữ liệu (data view): là nơi lưu trữ
dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao
gồm cột, hàng và các ô giao nhau giữa cột và hàng.
• Màn hình quản lý biến (variables view): là nơi quản lý
các biến cùng với các thông số liên quan đến biến.
• Màn hình hiển thị kết quả (output): cho phép ta xem
và lưu giữ các kết quả phân tích (có đuôi là .SPO).
• Màn hình cú pháp (syntax): cho phép ta xem và lưu
giữ những cú pháp của một lệnh phân tích.
Các menu chính
File: tạo file mới, mở file sẵn có, ghi file, in, thoát,…
Edit: undo, cắt, dán, tìm kiếm thay thế, xác lập các mặc định,…
View: hiện dòng trạng thái, thanh công cụ, chọn font chữ,…
Data: các vấn đề liên quan đến dữ liệu,…
Transform: chuyển đổi dữ liệu, tính toán, mã hóa lại các biến,…
Analyze: các phân tích thống kê,…
Graphs: biểu đồ và đồ thị,…
Utilities: thông tin về các biến và file,…
Window: sắp xếp và di chuyển các cửa sổ làm việc
Help: trợ giúp
Quản lý dữ liệu

Ø Tạo lập Cơ sở dữ liệu


Ø Biến đổi dữ liệu
Ø Mã hóa lại dữ liệu
Ø Lựa chọn các quan sát
Ø Tách dữ liệu
Ø Tập hợp dữ liệu
Ø Lựa chọn quyền số cho các quan sát
Tạo lập cơ sở dữ liệu

Cơ sở dữ liệu được hiểu theo cách định nghĩa


kiểu kỹ thuật thì nó là một tập hợp thông tin có
cấu trúc.
Thành phần của CSDL
- Quan sát (Observation): chứa thông tin về 1 đối
tượng điều tra.
- Biến (Variable): thể hiện các thuộc tính của
quan sát.
Khai báo biến: Name, Type, Width, Measure…
Khai báo biến trong SPSS

• Variable Name: Tên biến là duy nhất, được bắt đầu


bằng một chữ cái; viết không dấu; có thể viết hoa
hoặc không; các ký tự còn lại có thể là chữ cái hoặc
chữ số; độ dài tối đa là 8 ký tự.
• Variable Type: Kiểu biến thể hiện dạng của dữ liệu
(dạng số và dạng chuỗi). Có các kiểu biến sau:
Numeric, Comma, Date, String…
• Width: Độ rộng của biến xác định số lượng ký tự hiển
thị.
• Decimals: số lượng con số sau dấu phẩy được hiển
thị.
• Label: Nhãn biến dùng để giải thích rõ ý nghĩa cho
từng biến và hiện thị ở kết quả chạy dữ liệu.
Khai báo biến trong SPSS

Values: Giá trị của từng mã hoá dùng để giải thích rõ


ý nghĩa từng giá trị và hiện thị kết quả khi chạy dữ liệu
Missing: Giá trị khuyết dùng để loại những giá trị
không có ý nghĩa. Các giá trị khuyết sẽ không tham gia
vào quá trình phân tích.
Columns: định ra kích cỡ cho cột
Align: định ra vị trí hiển thị các giá trị
Measure: thang đo, có 3 loại: thang đo định danh
(Nominal), thang đo thứ bậc (Ordinal), thang đo
khoảng và tỷ lệ (Scale)
Nhập dữ liệu

Có thể nhập dữ liệu theo đối tượng (bản ghi) hoặc


theo biến
Mở một tệp tin {file} Excel

- Tại cửa sổ Data View, từ thanh menu chọn: File / Open / Data...
- Trong hộp thoại Open File, chọn file mà bạn muốn mở
- Trong hộp thoại Open File, chọn nơi lưu giữ file (Look in); chọn loại file
(Files of type) và sau đó chọn tên file (File name)
- Nhấp Open
Biến đổi dữ liệu
Transform > Compute

Tạo ra một biến mới


theo biểu thức mô tả
(expression)

Nếu tính theo một điều


kiện nào đó thì nhấn
vào if (đặt điều kiện
vào tính toán cho biểu
thức).
Mã hóa lại dữ liệu
Transform/ Recode

Chọn các biến muốn mã hóa,


nếu chọn nhiều biến, chúng
phải có cùng dạng (chuỗi hoặc
số).
Nhắp vào old and new values
và định rõ cách mã hóa lại trị
số.
Sau đó nhấn Change

Nhấn If để xác định một nhóm


các đối tượng cũng giống như
đã được mô tả trong mục tính
toán biến (compute
variables).
Lựa chọn các quan sát
Data/ Select cases
Khi muốn lựa chọn
ra các quan sát thỏa
mãn điều kiện nào
đó thì nhấn If
condition. Sau đó
đặt điều kiện cần
lọc.
Khi muốn lựa chọn
ngẫu nhiên các
quan sát thì nhấn
vào Random
Sample of cases
Tách dữ liệu
• Data/Split file

- Chuyển biến được chọn


làm cơ sở để tách dữ liệu
sang cửa sổ Groups
Based on
-Muốn các kết quả phân
tích được tách riêng theo
từng nhóm chọn Organize
output by groups
- Khi thực hiện xong việc
phân tích theo nhóm, trở về
bằng cách chọn Analyze all
case
Tập hợp dữ liệu
Data/ Aggregate Data
- Chuyển biến được chọn làm cơ sở
để tập hợp dữ liệu sang cửa sổ
Break Variable(s)
- Chuyển biến muốn tập hợp sang cửa sổ
Summaries of Variables
- Chọn Funtion để xác định các
hàm tập hợp
- Vào Name & Label để đặt tên và
nhãn cho biến mới

Để biến mới tập hợp trong file dữ


liệu hiện tại
Tạo file dữ liệu mới cho kết quả tập
hợp
Lựa chọn quyền số cho các quan sát
• Mặc định SPSS coi mỗi bản ghi là một quan
sát, khi mỗi quan sát đại diện cho một số lượng
các quan sát, sử dụng quyền số.
• Data / Weight cases

Chọn Weight case by


và đưa biến làm quyền
số vào ô Frequency
variable
BÀI 2
MÔ TẢ DỮ LIỆU THỐNG KÊ

Ø TRÌNH BÀY DỮ LIỆU THỐNG KÊ

Ø MÔ TẢ DỮ LIỆU ĐỊNH LƯỢNG


TRÌNH BÀY DỮ LIỆU THỐNG KÊ

Ø KIỂM TRA DỮ LIỆU

Ø LẬP BẢNG THỐNG KÊ

Ø VẼ ĐỒ THỊ THỐNG KÊ
KIỂM TRA DỮ LIỆU (Explore)

Để nhận dạng và phát hiện sai sót trong dữ liệu


thường sử dụng 3 cách hiển thị dữ liệu như sau:
•Sơ đồ thân lá (Stem and leaf plot)
• Biểu đồ Histogram
• Biểu đồ hộp ria mèo (Box Plot)
Analyze > Descriptive Statistics > Explore...

Chọn một hay nhiều biến đưa vào ô Dependent list. Có thể tách
các quan sát thành các nhóm nhỏ riêng biệt để kiểm tra dựa vào
các giá trị của các biến kiểm soát sẽ được đưa vào ô Factor List.
Ô Display, cho phép chọn cách hiển thị kết quả.
LẬP BẢNG THỐNG KÊ
Bảng đơn biến

Analyze /Descriptive Statistics / Frequencies…


Lập bảng đa biến
Analyze > Tables > Custom Tables...

Đưa các biến chủ đề vào Rows các biến giải thích vào Columns
Nhấn vào biến đã đưa sang sau đó chọn Catagories and Total để thêm tổng
số hoặc thêm/bớt biểu hiện nào đó không cần thiết
Đối với biến định lượng, chọn Summary Statistic... để tính các tham số thống
kê của biến
Xoay bảng
Double Click vào bảng sau đó chọn Pivot controls>
Pivoting Trays...
Đồ thị thống kê

Graphs > Legacy > Dialogs


• + Bar: Đồ thị thanh/cột (biểu diễn phân phối của dữ liệu)
• + Line: Đồ thị đường gấp khúc (biểu diễn xu hướng)
• + Area: Đồ thị diện tích
• + Pie: Đồ thị hình tròn (biểu diễn cơ cấu)
• + Boxplot: Đồ thị hộp (biểu diễn phân phối, xác định
Outliers)
• + Population Pyramid: Tháp dân số (Đặc trưng dân số
theo tuổi và giới tính)
• + Scatter/Dot: Đồ thị điểm (biểu diễn mối liên hệ giữa các
biến)
• + Histogram: Đồ thị tần số (biểu diễn phân phối của dữ
liệu)
MÔ TẢ DỮ LIỆU ĐỊNH LƯỢNG

Các tham số

Các tham số đo độ biến thiên


Các mức độ trung tâm

Số trung bình Khoảng biến thiên

Số trung vị Khoảng tứ phân vị

Mốt Phương sai

Phân vị Độ lệch tiêu chuẩn

Tứ phân vị Hệ số biến thiên


THỰC HÀNH BẰNG SPSS
Analyze > Descriptive Statistics > Descriptives…
Analyze > Descriptive Statistics > Explore …

THỰC
HÀNH
BẰNG SPSS

Đưa các biến cần tính toán các tham số sang Dependent List
Muốn phân tích theo biến nào đó thì đưa sang biến sang Factor List
Trong mục Display chọn Statistics hoặc Both
BÀI 3
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Ø Kiểm định và so sánh giá trị trung bình


Ø Kiểm định tỷ lệ
Kiểm định giá trị trung bình của 1 tổng thể
Analyze > Compare Means > One-Sample T Test...

Đưa các biến cần kiểm định giá trị trung bình vào Test Variable (s)
Nhập giá trị cần kiểm định trung bình vào Test Value
Nhấn Options...
So sánh trung bình của 2 mẫu
Trường hợp 2 mẫu độc lập

Analyze > Compare Means > Independent-Samples T Test...

Đưa các biến cần kiểm


định giá trị trung bình
vào Test Variable (s)
Đưa biến phân loại vào
Grouping Variable
Nhấn Define Groups...
Để định nghĩa nhóm
So sánh trung bình của 2 mẫu
Trường hợp 2 mẫu phụ thuộc
Analyze > Compare Means > Paired-Samples T Test...

Đưa các cặp biến


cần kiểm định giá
trị trung bình vào
Paired Variable(s)
Kiểm định tỷ lệ
Analyze > Nonparametric Tests > Legacy Dialog > Binomial...
Chọn các biến cần
kiểm định tỷ lệ sang
Test Variable List
Chọn tỷ lệ kiểm định
tại ô Test Proportion
Nếu dữ liệu là biến nhị
phân thì chọn Get
from data
Nếu dữ liệu chưa phải
là biến nhị phân thì
chọn Cut point và đưa
giá trị điểm cắt
BÀI 4
PHÂN TÍCH HỒI QUY TƯƠNG QUAN
1 2 3

XÂY DỰNG MÔ PHÂN TÍCH DỰ ĐOÁN DỰA


HÌNH HỒI QUY TƯƠNG QUAN VÀO MÔ HÌNH
TUYẾN TÍNH ĐƠN HỒI QUY
Xây dựng mô hình hồi quy tuyến tính đơn
Analyze > Regression > Linear...

Đưa biến phụ thuộc


sang Dependent
Đưa một biến độc lập
sang Independent(s)
Dự đoán dựa vào mô hình hồi quy

Analyze/ Regression/ Linear Regression -> Nhấn save

Dự đoán điểm

Dự đoán bằng khoảng tin cậy


Xây dựng mô hình hồi quy bội
• Analyze > Regression> Linear...

Đưa biến phụ


thuộc sang
Dependent
Đưa các biến độc
lập sang
Independent (s)
BÀI 5
PHÂN TÍCH DÃY SỐ THỜI GIAN

I
II
Phương pháp
biểu diễn xu hướng
biến động của hiện Phương pháp
tượng dự đoán
thống kê

39
Định nghĩa yếu tố thời gian
Data>Define Dates..

40
Tập hợp số liệu từ quý (tháng) sang năm (quý)

Data > Agreegate...

41
Xây dựng hàm xu thế

Hàm xu thế làm hàm số dùng để biểu diễn các mức độ


của hiện tượng qua thời gian

Dạng tổng quát: ŷi = f ( ti )

Trong đó, ti: là thứ tự thời gian

42
Xây dựng hàm xu thế
Analyze > Regression > Curve Estimation…

43
Chỉ số thời vụ

Sử dụng khi dãy số thời gian có xu thế rõ ràng theo thời gian
và biến động mùa vụ
Mô hình kết hợp cộng yˆ t = f (t ) + I s

Mô hình kết hợp nhân yˆt = f (t ) ´ I s


Trong đó Is là các chỉ số ở thời vụ thứ s
Chỉ số thời vụ

Analyze > Forecasting > Seasonal Decomposition…

45
Dự đoán dựa vào hàm xu thế

Analyze>Regression > Curve Estimation…

46
Dự đoán dựa vào hàm xu thế

Analyze > Regression > Curve Estimation > Save …

47
CHÚC CÁC EM ĐẠT KẾT QUẢ TỐT!

You might also like