Huong Dan - Xuly Dulieu Tren Spss

NGUYỄN VĂN CANG
Nguyễn Văn Cang 1 Xử lý dữ liệu trên SPSS

1. Nhập liệu
1.1. Chuẩn bị dữ liệu
Dữ liệu chéo là dữ liệu phổ biến nhất dùng trong SPSS. Dạng tổng quát của dữ
liệu chéo như sau:
Đơn vị
Tiêu thức 1 Tiêu thức 2 … Tiêu thức k
tổng thể
1 x11 x12 x1k
2 x21 x22 x2k
3 x31 x32 x3k
… … … …
n xn1 xn2 xnk
Trong bảng trên, dữ liệu của một đơn vị tổng thể được thể hiện trên một dòng.
Ví dụ: Có dữ liệu mẫu về 18 đơn thư khiếu nại của khách hàng được chọn ngẫu
nhiên.
Số Giới Gía trị Yêu

thứ Tuổi
của tính Nơi sản Ngày
Số ngày
bảo Loại cầu
tự khách của mua phẩm mua hành sự cố của
đơn hàng khách còn lại khách
thư hàng (tr.đ) hàng
1 22 Nữ A 2,5 20/10/06 72 Kêu B.T
2 26 Nam B 1,8 04/06/05 24 Bể Đổi
3 25 Nam A 12,5 10/02/07 37 Rỉ Đổi
4 27 Nữ B 4,5 24/08/05 13 Nứt B.T
5 26 Nữ B 2,8 12/04/05 58 Cháy B.T
6 26 Nữ D 6,4 16/05/07 64 Hỏng B.T
7 25 Nam F 10,2 22/08/06 45 Kêu Sửa
8 27 Nữ A 3,5 05/02/05 81 Nứt Đổi
9 26 Nam C 6,8 18/06/06 69 Hỏng B.T
10 48 Nữ C 5,5 04/8/06 21 Rỉ Đổi
11 26 Nam A 4,7 02/04/07 12 Bể Sửa
12 25 Nam A 8,2 08/06/07 48 Kêu Đổi
13 26 Nam C 9,1 15/03/07 57 Rỉ Sửa
14 25 Nữ B 7,4 24/02/07 92 Bể B.T
15 60 Nam A 5,8 27/05/07 102 Cháy Sửa
16 27 Nữ B 4,4 15/01/07 34 Nứt B.T
17 26 Nữ B 9,7 22/04/07 68 Bể B.T
18 27 Nam C 2,6 25/12/06 39 Kêu Sửa
Kí hiệu: B.T: Bồi thường

1.2. Khai báo nhập liệu
Kích hoạt biểu tượng SPSS trên Desktop hay Start  Program  SPSS. Ta
được màn hình gốc như sau:
Bấm
chọn Bấm
Data
chọn
View để
Variable
chuyển
View để
qua màn
chuyển
hình
qua màn
nhập liệu
hình khai
báo nhập
liệu
Ta phải khai báo khuôn mẫu của dữ liệu trước khi nhập.
+ Chọn Variable View ở đáy màn hình để chuyển qua màn hình khai báo nhập
liệu như ở trang sau.
+ Khai báo lần lượt từng tiêu thức, mỗi tiêu thức một dòng (trên máy gọi là
một variable). Trong đó:
* Name: Đánh vào tên rút gọn của tiêu thức (tối đa 8 ký tự không có ký tự đặc
biệt). Tên này sẽ được hiển thị ở đầu vào và sử dụng trong quá trình xử lý trên máy
cho tiện.
* Type: Chọn kiểu dữ liệu cho tiêu thức như số, chuổi, ngày…
* Width: Xác định độ rộng (ký tự) cho dữ liệu.

Nhập
giá trị
mã hóa
Nhập
giá trị
gốc
Nút chuyển
từng giá trị
đã mã hóa
vào ô kết
quả bên cạnh
Nhập giá trị

mã hóa
Missing

* Decimals: Số chữ số thập phân của kiểu dữ liệu số.
* Label: Khai báo tên gốc của tiêu thức. Tên này dài hơn Name ở trên cho dể nhận
diện ở dữ liệu đầu ra.
* Values: Nếu nhập đầy đủ giá trị gốc thì chọn None. Với các tiêu thức định tính
(thuộc tính), để nhập liệu nhanh chóng, người ta thường mã hóa các giá trị của tiêu
thức bằng các số nguyên. Ví dụ, tiêu thức ‘Yêu cầu của khách hàng’ được mã hóa
như sau:
Giá trị gốc Giá trị mã hóa
(Value Label) (Value)
- Bồi thường 1
- Đổi 2
- Sửa 3
Ta khai báo từng Value và Value Label tương ứng rồi chọn add đưa vào ô
chứa. Chọn OK để kết thúc khai báo.
* Missing: Khai báo giá trị mã hóa đặc biệt cho những giá trị bị khuyết (không
có số liệu) nếu có của tiêu thức. Nên chọn những giá trị không có thực nhưng đúng
kiểu dữ liệu đã khai báo cho tiêu thức đó. Chẳng hạn, với tiêu thức ‘Tuổi’, -1 nghĩa là
không thu thập được, -2 nghĩa là chờ bổ sung. Tất cả các giá trị có mã khai báo ở ô
này sẽ không tham gia vào quá trình xử lý dữ liệu của máy.
Nếu chọn mặc định None thì khi có giá trị bị khuyết (nhập liệu cho tiêu thức
khác ở đơn vị tổng thể nào đó mà không nhập cho tiêu thức có mặc định none) máy
sẽ gán dấu phẩy hệ thống. Đây là mã system missing và nó cũng không tham gia vào
quá trình xử lý dữ liệu của máy.
* Column: Khai báo độ rộng cho cột nhập dữ liệu.
* Align: Chọn định vị trái, giữa hay phải cho cột dữ liệu.
* Measure: Chọn loại thang đo dữ liệu của tiêu thức: danh định (Nominal), thứ
bậc (Ordinal) và khoảng cách hay tỉ lệ (Scale).
+ Sau khi khai báo xong tất cả các tiêu thức, nếu chưa muốn nhập liệu ngay, ta
vào File  Save as để lưu. Nếu muốn nhập liệu ngay, bấm chọn Data View ở đáy
màn hình để chuyển qua màn hình nhập liệu:

Bấm chọn nút
này để nhập
các giá trị mã
hóa
Bấm chọn ô
này để chuyển
qua màn hình
nhập liệu
Trên màn hình này, ta nhập dữ liệu của một đơn vị tổng thể trên một dòng màn
hình. Nhập dần dần cho đến đơn vị tổng thể cuối cùng. Vào File  Save as để lưu dữ
liệu.
1.3. Nhập liệu
1.3.1. Mã hóa dữ liệu định tính: Để việc nhập liệu được nhanh chóng và chính
xác, dữ liệu của các tiêu thức thuộc tính cần được mã hóa. Mỗi biểu hiện của tiêu
thức (biến) được mã hóa bằng một con số duy nhất. Các con số mã hóa thường được
dùng nhất là 0, 1, 2, …, 8, 9.
Ví dụ: Xin cho biết anh chị thuộc nghề nghiệp nào sau đây:
□ Công chức Được mã hóa là 1
□ Doanh nhân Được mã hóa là 2
□ Công nhân Được mã hóa là 3
□ Nông dân Được mã hóa là 4
□ Nghề khác Được mã hóa là 5
Việc mã hóa cần được tiến hành tập trung, do một số ít người phụ trách để
tránh sự thiếu thống nhất.
Trật tự các cột biến cần được nhập theo đúng trật tự các câu hỏi trong bản câu
hỏi. Trật tự các dòng dữ liệu, mỗi dòng tương ứng với một bản câu hỏi điều tra, cần
được nhập theo đúng trật tự các bản câu hỏi điều tra để tiện việc tìm kiếm, tra cứu khi
cần.

1.3.2. Nhập liệu với câu hỏi có thể chọn nhiều trả lời: Mỗi mục chọn của câu hỏi
cần được nhập thành một biến phụ có dạng biến thay phiên 9 (hay biến đếm có hai
giá trị 1 và 0). Để máy tính có thể đếm được trong quá trình xử lý, biến phụ này phải
được khai báo là biến số (định lượng). Nó thường được mã hóa giá trị “1” tương ứng
với mục đó được chọn, giá trị “0” tương ứng với mục đó không được chọn.
Ví dụ: Câu 12. Bạn đã dùng loại bút bi nào sau đây (chọn một hoặc nhiều):
□ Bến nghé Được nhập theo biến có tên c12c1
□ Thiên long Được nhập theo biến có tên c12c2
□ Loại khác Được nhập theo biến có tên c12c3
Câu hỏi trên được nhập thành ba biến phụ định lượng dạng thay phiên. Biến
c12c1 có giá trị “1” tương ứng với Bến nghé được chọn, giá trị “0” tương ứng với
Bến nghé không được chọn. Biến c12c2 có giá trị “1” tương ứng với Thiên long được
chọn, giá trị “0” tương ứng với Thiên long không được chọn. Biến c12c3 có giá trị
“1” tương ứng với Loại khác được chọn, giá trị “0” tương ứng với Loại khác không
được chọn.
Mỗi biến phụ nói trên có thể được sử dụng để phân tích như một biến bình
thường. Tuy nhiên chúng thường được ghép thành biến ghép cho câu hỏi chính của
chúng.
2. Tạo biến mới từ biến đã có
2.1. Sử dụng Compute
Ví dụ, ta cần thiết lập biến mới có tên ‘lngtsp’ bằng cách lấy logarit cơ số tự
nhiên của biến có tên ‘gtsp’ đã có.
Bấm chọn Transform  Compute. Ta có cửa sổ:
Chọn biến cũ để tính

biến mới Chọn hàm hổ trợ

+ Trong ô Target variable: Khai báo tên rút gọn của biến mới (Name);
+ Trong ô Type&Lable: Khai báo kiểu dữ liệu (Type) và nhãn của biến mới
(Lable).
+ Trong ô Numeric Expression: Khai báo biểu thức tính giá trị biến mới từ các
biến cũ.
+ Nếu cần lọc dữ liệu, chọn ô If bên dưới để khai báo các điều kiện lọc.
Chọn OK để có kết quả của biến mới.
Chú ý: Các giá trị Missing của biến cũ sẽ được tự động gán giá trị khuyết hệ
thống System Missing (dấu phẩy hệ thống) cho biến mới.
2.2. Sử dụng Recode  Into different variables.
Bấm chọn Transform  Recode  Into different variables.
Nhập tên,
nhãn biến mới
Chọn Change để khẳng

định tên, nhãn biến mới
Chọn biến cũ
cần chuyển đổi
Sau khi khai báo như hình trên, bấm chọn ô Old and New Values để khai báo
các chuyển đổi từ biến cũ sang biến mới.
Ví dụ, ta cần phân tổ tiêu thức ‘Tuổi’ thành 3 tổ: dưới 30, từ 30 đến 40, 40 trở
lên. Ta khai báo như sau, ưu tiên tổ có giá trị cao khai báo trước:
Old Value New Value
40 through highest 3
30 through 40 2
Lowest through 30 1
+ Trong ô Old value, chọn lựa khai báo từng tổ theo biến cũ. Trong ô New value
khai báo ‘giá trị mã hóa của tổ’ tương ứng với tổ đã khai báo ở Old value, như hướng
dẫn trong hình ở trang sau:
+ Chú ý: Việc khai báo phải được tiến hành dần từng tổ và phải được xác nhận
bằng nút Add, một lần cho một tổ; khai báo trước sẽ ưu tiên nhận giá trị mới trước.
+ Để sửa một khai báo trong ô Old  New: Chọn dòng muốn sửa trong ô này rồi
chọn ô Change;
+ Để gở bỏ một khai báo trong ô Old  New: Chọn dòng muốn gở bỏ trong ô
này rồi chọn ô Remove;
+ Chọn Continue để quay lại, chọn OK để kết thúc.
Mã của tổ
Tổ chỉ gồm tương ứng
một giá trị
TổMissing
có giới hạn
Missing
dưới và trên
Tổ chỉ có
giới hạn trên Xác nhận
từng tổ
Tổ chỉ có
giới hạn dưới
Tổ gồm tất Chọn kiểu

cả các giá dữ liệu định
trị còn lại danh cho tổ
3. Thống kê mô tả
3.1. Sắp xếp các đơn vị tổng thể theo một tiêu thức nào đó
Bấm chọn Data  Sort case.
Chọn tiêu thức

cần sắp xếp
Chọn tiêu thức muốn sắp xếp đưa vào ô Sort by. Chọn OK.
3.2. Mô tả thống kê theo một tiêu thức
Bấm chọn Analyze  Descriptive Statistic  Frequency.

Chọn các
thống kê
Chọn tiêu thức
cần mô tả Chọn biểu đồ
Bảng phân
phối tần số
Khi bấm chọn ô Statistics ta có cửa sổ sau:
Tứ phân vị
Độ lệch chuẩn
đã hiệu chỉnh Quay lại
̂
Phương sai đã
hiệu chỉnh ˆ 2
Khi bấm chọn ô Charts ta có cửa sổ sau:
Chọn
phân
phối đồ
Quay lại

Màn hình kết quả như sau:
Bấm chọn mục cần xem
Bấm
chọn ô
Bấm này để
chọn ô trở lại
này để màn
trở lại hình
màn kết
hình quả
dữ liệu
Chú ý: Dữ liệu định tính không mô tả được bằng các số đo thống kê mô tả

(statistics) dù được mã hóa bằng các con số.
3.3. Mô tả một tiêu thức định lượng bằng biểu đồ cành và lá, hộp với ria,
phân phối đồ
Bấm chọn Analyze  Descriptive Statistic  Explore.
Tiêu thức
cần mô tả
Tiêu thức
Chọn loại phân nhóm
biểu đồ tiêu thức cần
mô tả ở trên
(nếu cần)

Chọn đưa tiêu thức định lượng cần mô tả vào ô Dependent Lit. Nếu cần mô tả
tiêu thức này theo các phân nhóm khác nhau thì chọn đưa tiêu thức phân nhóm vào ô
Factor List. Bấm chọn loại biểu đồ mong muốn trong ô Plots. Sau đó chọn OK.
3.4. Mô tả thống kê theo hai (hay nhiều) tiêu thức kết hợp
Bấm chọn Analyze  Descriptive Statistic  Crosstabs.
Chọn đưa hai tiêu thức cần phân tổ kết hợp vào các ô Row(s) và Column(s).
Nếu phân tổ kết hợp từ ba tiêu thức trở lên thì đưa lần lượt các tiêu thức này vào ô
Layer of bằng nút chọn Next.
Tiêu thức phân

tổ theo dòng
Tiêu thức phân

tổ theo cột Các thống kê mô tả
riêng và kết hợp
Tiêu thức phân tổ thứ
3 (nếu cần)
Kết quả:
gioi tinh Total
nam nu
yeu cau boi thuong 1 7 8
khach hang doi 3 2 5
sua 5 5
Total 9 9 18
Symmetric Measures
Value Approx. Sig.
Nominal by Phi .734 .008
Nominal Cramer's V .734 .008
Contingency .592 .008
Coefficient

4. Ước lượng Thống kê
4.1. Ước lượng Số trung bình của chọn ngẫu nhiên đơn thuần
Bấm chọn Analyze  Descriptive Statistic  Explore. Ta được cửa sổ sau.
Thực hiện các thao tác như trong hình.
Chọn tiêutần
Hiển thị thức
cần
suấtước lượng
% theo cột
Chỉ định
Chọn hiển thị kết độ tin cậy
quả ước lượng
Chọn độ
tin cậy
Kết quả
Statistic Std. Error
tuoi Mean 36.67 2.57
95% Confidence Interval Lower 31.25
for Mean Bound
Upper 42.08
Bound
5% Trimmed Mean 36.52
Median 37.50
Variance 118.471
Std. Deviation 10.88
Minimum 22
Maximum 54
Có thể tiến hành theo cách khác như sau:
Bấm chọn Analyze  Compare Means  One-Sample-TTest. Ta được cửa

sổ sau. Thực hiện các thao tác như trong hình.
Chọn tiêu thức
Hiển thị tần
Chọn 0 để cần ước lượng
suất % theo
ước lượng
Kết quả
Test Value = 0
t df Sig. (2- Mean 95% Confidence
tailed) Difference Interval of the
Difference
Lower Upper
tuoi 14.292 17 .000 36.67 31.25 42.08
4.2. Ước lượng Tỉ lệ của chọn ngẫu nhiên đơn thuần

Vì thực chất tỉ lệ là số trung bình của biến đếm (1,0) nên ta có thể ước lượng tỉ
lệ thông qua ước lượng trung bình biến đếm.
Trước hết, ta tiến hành như mục 2.2 để tạo biến đếm với giá trị 1 cho các giá trị
đang quan tâm, giá trị 0 cho tất cả các giá trị còn lại. Sau đó, tiến hành như mục 4.1
trên biến đếm.
Ví dụ: Ta cần ước lượng tỉ lệ sản phẩm có giá trị từ 5.8 đến 8.2 triệu đồng
trong dữ liệu 18 đơn khiếu nại.
Bấm chọn Transform  Recode  Into different variables.
Khai báo tên

Chọn biến cần biến đếm
ước lượng Khai báo giá
trị biến đếm
Ta có thể khai báo giá trị biến đếm như sau:

Old Value New Value
(*) Range: 5.8 through 8.2 1
(*) All other values 0
Màn hình kết xuất biến đếm:
Biến đếm
Biến gốc kết xuất
Bấm chọn Analyze  Compare Means  One-Sample-TTest.
Biến đếm dùng

để ước lượng
Kết quả ước lượng:

Test Value = 0
t df Sig. (2- Mean 95% Confidence
tailed) Difference Interval of the
Difference
Lower Upper
Ti le sp tu 5.8 den 8.2 2.557 17 .020 .2778 4.858E-02 .5070
5. Kiểm định tham số và sự khác biệt

5.1. Kiểm định giả thuyết về số trung bình một tổng thể
- Với dữ liệu chéo đã có sẵn:
Ví dụ kiểm định giả thuyết cho rằng tuổi trung bình của những người khiếu nại
là 30 tuổi qua mẫu 18 đơn thư.
Analyze  Compare Means  One-Sample T-Test.
Chọn tiêu
thức cần
Nhập µo kiểm định
Kết quả: One-Sample Test

Test Value = 30
95% Confidence
Sig. (2- Mean
t df Interval of the
tailed) Difference
Difference
Lower Upper
tuoi 2.599 17 .019 6.67 1.25 12.08
Sig. (2-tailed) < 0.05 : Bác bỏ giả thuyết hai phía

Chú ý: Sig.(1-tailed) = Sig.(2-tailed) / 2
- Với dữ liệu đã được sắp xếp rút gọn có tần số:
Tuổi 23 25 27 28 31
Tần số 5 8 12 10 4
Ta nhập dữ liệu này theo hai biến. Biến thứ nhất ‘Tuoi’ nhập các giá trị rút gọn
của tiêu thức. Biến thứ hai ‘ts’ nhập tần số. Sau đó, chỉ định tần số cho dữ liệu bằng
cách bấm chọn Data  Weight Cases.
Chỉ định có
tần số
Chọn biến
tần số
Sau đó, các thao tác kiểm định khác tiến hành bình thường như trên.
5.2. Kiểm định giả thuyết về sự bằng nhau giữa hai số trung bình của hai
tổng thể, mẫu độc lập
- Trường hợp so sánh giữa hai nhóm của cùng một tiêu thức nào đó trên cùng
một dữ liệu chéo đã có.
Ví dụ kiểm định giả thuyết về sự bằng nhau của giá trị sản phẩm trung bình
giữa nam và nữ trong dữ liệu về 18 đơn thư khiếu nại.
Bấm chọn:
Analyze  Compare Means  Independent-Samples T-Test.
Thao tác như trong hình. Sau đó, bấm chọn OK.
Chọn tiêu
thức cần
kiểm định
Chỉ định Chọn tiêu thức

hai nhóm làm căn cứ
cần so sánh phân nhóm
- Trường hợp dữ liệu đã được sắp xếp rút gọn có tần số:
Mẫu của tổng thể thứ nhất Mẫu của tổng thể thứ hai
Tuổi Tần số Tuổi Tần số
23 5 23 5
25 8 25 8
27 12 27 12
28 10 28 10
31 4 31 4
Ta nhập dữ liệu này theo ba biến. Biến thứ nhất ‘Tuoi’ nhập các giá trị rút gọn
của Tuổi ở cả hai mẫu. Biến thứ hai ‘ts’ nhập Tần số tương ứng ở cả hai mẫu. Biến
thứ ba ‘Mau’ nhập giá trị 1 cho mẫu thứ nhất, giá trị 2 cho mẫu thứ hai. Sau đó, chỉ
định tần số cho dữ liệu này như ở mục 5.1.
Các thao tác kiểm định khác tiến hành như trường hợp trên. Cần lưu ý là biến
‘Mau’ được dùng để phân nhóm.
5.3. Kiểm định giả thuyết về sự bằng nhau giữa hai số trung bình của hai
tổng thể, mẫu cặp
Dữ liệu mẫu cặp có dạng:
Đơn vị mẫu Mẫu 1 Mẫu 2
1 27 22
2 32 34
. . .
. . .
. . .
n 34 28
Ta nhập hai biến ‘mau1’ và ‘mau2’ như dữ liệu chéo thông thường. Tuy nhiên
cần lưu ý hai biến này là cùng loại, trật tự dữ liệu phải được giữ nguyên. Sau đó bấm
chọn:
Analyze  Compare Means  Paired-Samples T-Test.
Chọn
cả hai
biến
Chọn cả hai biến cùng một lúc đưa vào ô Paired Variables. Bấm chọn OK ta
được kết quả kiểm định.
5.4. Kiểm định giả thuyết về phương sai hai hay nhiều tổng thể: Kiểm định
Levene
Bấm chọn: Analyze  Compare Means  One-Way ANOVA
Chọn
biến
Chọn
phân
biến
nhóm
cần Chọn
kiểm kiểm
định định

Chọn
kiểm
định
phương
sai
Kết quả:
Test of Homogeneity of Variances
Gia tri san pham theo Số lần khiếu nại
Levene Statistic df1 df2 Sig.
.076 2 15 .927
Sig > 0.05 : Chưa đủ cơ sở bác bỏ giả thuyết Phương sai ba loại Số lần khiếu
nại bằng nhau.
6. Kiểm định phi tham số
6.1. Kiểm định giả thuyết về sự giống nhau của hai tổng thể, mẫu cặp
Nhập liệu tương tự mục 5.3. Sau đó bấm chọn:
Analyze  Nonparametric Tests  2 Ralated Samples.
Chọn
loại
Chọn kiểm
cả hai định
biến
Chọn cả hai biến cùng một lúc (bấm chọn biến thứ nhất, nhấn Shift rồi bấm
chọn biến thứ hai) đưa vào ô Test Pair(s) List. Bấm chọn loại phương pháp kiểm
định. Cuối cùng bấm chọn OK ta được kết quả.
Chú ý: Sig.(1-tailed) = Sig.(2-tailed) / 2
6.2. Kiểm định giả thuyết về sự giống nhau của hai tổng thể, mẫu độc lập
Kiểm định hạng Mann-Whitney
Trường hợp so sánh giữa hai nhóm của cùng một tiêu thức nào đó trên cùng
một dữ liệu chéo đã có. Bấm chọn:
Analyze  Nonparametric Tests  2 Independent Samples.

Chọn
Chọn
biến
loại
cần
kiểm
kiểm
định
định
Chọn
biến
phân
nhóm
Chọn
hai
nhóm
cần so
sánh
Thao tác như trong hình trên. Cuối cùng bấm chọn OK.
Trường hợp dữ liệu đã được sắp xếp rút gọn có tần số: Các thao tác nhập liệu
tương tự mục 5.2. Tuy nhiên, cần lưu ý, biến dùng để phân nhóm phải có kiểu dữ liệu
Numeric. Các thao tác kiểm định khác tiến hành như trên.
6..3. Kiểm định giả thuyết về sự giống nhau của nhiều tổng thể, mẫu độc lập
Kiểm định hạng Kruskal-Wallis
Trường hợp so sánh giữa ba nhóm trở lên của cùng một tiêu thức nào đó
trên cùng một dữ liệu chéo đã có. Bấm chọn:
Analyze  Nonparametric Tests  K Independent Samples.
Chọn Chọn
loại biến
kiểm cần
định kiểm
định
Chọn
biến
phân
nhóm

Chọn
các
nhóm
cần so
sánh
Trường hợp dữ liệu đã được sắp xếp rút gọn có tần số: Các thao tác nhập liệu
tương tự mục 5.2. Tuy nhiên, cần lưu ý, biến dùng để phân nhóm phải có kiểu dữ liệu
Numeric và có từ 3 giá trị khác nhau trở lên. Các thao tác kiểm định khác tiến hành
như trên.
6.4. Kiểm định giả thuyết về tương quan giữa hai tiêu thức định lượng
Bấm chọn: Analyze  Correlate  Bivariate.
Chọn loại
kiểm định
Hai tiêu
thức cần
kiểm định
6.5. Kiểm định tương quan giữa hai tiêu thức định tính:
Bấm chọn: Analyze  Descriptive Statistics  Crosstabs.
Hai tiêu
thức cần
kiểm định

Chọn kiểm
Chọn kiểm định liên hệ
định liên hệ biến thứ bậc
biến danh định
6.6. Kiểm định giả thuyết về phân phối tổng thể: Phương pháp kiểm định Khi
bình phương.
Ví dụ, có dữ liệu về thu nhập (triệu đồng) ở một thị trường như sau:
Mức thu nhập Tần số thực tế (ni) Tần suất giả thuyết % (poi)
Dưới 1 25 10
1-2 38 20
2-4 52 40
4 - 10 18 15
10 - 20 12 10
Trên 20 5 5
Tổng 150 100
Nhập dữ liệu theo hai biến: Tần số thực tế ‘tstt’ và Tần suất giả thuyết
‘tsuatgt’. Sau đó tạo thêm biến thứ ba ‘tsgt’ như mục 2 với: tsgt = 150*(tsuatgt/100).
Và, chỉ định ‘tstt’ là tần số bằng cách bấm chọn: Data  Weight Cases
Chỉ định
tần số
Chọn biến
tần số
Sắp xếp ‘tstt’ theo thứ tự tăng dần: Data  Sort cases

Chọn biến
sắp xếp
Bấm chọn: Analyze  Nonparametric Tests  Chi-Square Test.
Đưa ‘tstt’ vào

ô kiểm định
Nhập cột ‘tsgt’,

từng số, từ trên
xuống dưới
6.7. Kiểm định giả thuyết về phân phối chuẩn: Phương pháp kiểm định
Kolmogorov-Smirnov:
Bấm chọn: Analyze  Nonparametric Tests  1-Sample K-S...
Chọn phân
phối chuẩn Chọn tiêu thức
cần kiểm định

Kết quả:
One-Sample Kolmogorov-Smirnov Test
gia tri san pham
N 18
Normal Mean 6.0222
Parameters
Std. 3.0245
Deviation
Most Extreme Absolute .113
Differences
Positive .113
Negative -.081
Kolmogorov- .481
Smirnov Z
Asymp. Sig. (2- .975
tailed)
Asymp. Sig. (2-tailed) > 0.05 : Chưa đủ cơ sở bác bỏ giả thuyết về phân phối
chuẩn của Giá trị sản phẩm.
7. Phân tích phương sai
7.1. Phân tích phương sai một chiều (One-Way Analysis)
Trường hợp so sánh Số trung bình giữa các nhóm khác nhau trên cùng một
tiêu thức nào đó của cùng một dữ liệu chéo. Bấm chọn:
Analyze  Compare Means  One-Way ANOVA.
Chọn tiêu thức

phân nhóm Chọn tiêu thức
cần so sánh
Chọn so sánh
bội (nếu cần)
Lưu ý: Tiêu thức phân nhóm phải có kiểu Numeric. Nếu cần, có thể đổi kiểu dữ
liệu sang kiểu Numeric như được trình bày ở phần nhập liệu.
Nếu bấm chọn so sánh bội, ta có của sổ:

Chọn loại so
sánh bội
Nhập α
Bấm chọn loại phương pháp so sánh bội. Nhập độ ý nghĩa α. Cuối cùng bấm
chọn Continue để quay lại cửa sổ One-Way ANOVA.
Ta thu được kết quả so sánh bội có dạng như sau:
Student-Newman-Keuls
Subset for alpha = .05
‘lsc’ N
1 2
1 5 29,0000
2 5 46,0000
4 5 69,6000
3 5 83,4000
Sig. ,078 ,146
Từ 2 cột cuối ta biết được sự bằng nhau của hai cặp nhóm ‘lsc’ sau :
lsc1 lsc2 lsc4 lsc3
Trường hợp so sánh Số trung bình từ dữ liệu của một thiết kế ngẫu nhiên
hoàn toàn.
Ta nhập dữ liệu của thiết kế này theo 2 biến kiểu Numeric sau:
- Biến ‘X’: Nhập toàn bộ dữ liệu (xij) của thiết kế;
- Biến ‘T’: Nhập số thứ tự 1, 2,… t của t xử lý tương ứng với xij.
Sau đó, các thao tác kiểm định khác được tiến hành tương tự như trên.
7.2. Phân tích phương sai hai chiều không tương tác (Two-Way Analysis
without interaction) cho thiết kế khối ngẫu nhiên
Từ dữ liệu thiết kế khối ngẫu nhiên, ta nhập 3 biến kiểu Numeric sau:
- Biến ‘t’: Nhập số thứ tự 1, 2,… t của t xử lý tương ứng với các xij.
- Biến ‘b’: Nhập số thứ tự 1, 2,… b của b tác nhân ngoại lai tương ứng với xij;

Sau khi nhập liệu xong, bấm chọn:
Analyze  General Linear Model  Univariate.
Trong cửa sổ Univariate.
Chọn biến ‘X’
Chọn biến ‘t’

và ‘b’ làm yếu
tố mô hình

Trên cửa sổ Univariate chọn biến ‘x’ chuyển sang ô Dependent Variable, chọn
biến ‘b’, ‘t’ chuyển sang ô Fixed Factor(s). Sau đó, bấm chọn ô Model để vào cửa sổ
Univariate: Model.
Chỉ định
mô hình
Chọn biến
Chọn
‘b’ vàbiến
‘t’
‘B’
làm các‘T’
và yếu
làm cáchình Chọn Main
tố mô effects
Trong cửa sổ Univariate: Model, trước hết ta chỉ định mô hình bằng cách chọn
Custom. Tiếp đến, chọn biến ‘t’ và ‘b’ trong ô Facstors & Covariantes chuyển sang
ô Model. Sau đó, chọn Main effects. Chọn Continue để quay lại cửa sổ Univariate.
Chú ý: Phải chọn ô Include intercept in model nếu không mô hình sẽ bị sai.
Cuối cùng chọn OK. Ta được kết quả phân tích phương sai như trong phần in
đậm ở bảng dưới:
Dependent Variable: X
Type III Mean
Source df F Sig.
Sum of quares Square
Corrected Model 5455,50 6 909,3 14,25 ,000
Intercept 57840,25 1 57840,3 906,51 ,000
B 5392,75 3 1797,6 28,17 ,000
T 62,75 3 20,9 ,33 ,805
Error 574,25 9 63,8
Total 63870,00 16
Corrected
6029,75 15
Total
Phần in đậm trong bảng trên là những thông tin cần thiết của phương pháp
phân tích phương sai cho mô hình thiết kế khối.

Chú ý: Nếu muốn so sánh bội, trong cửa sổ Univariate ở trang trước, bấm
chọn Post Hoc ta được cửa sổ sau:
Chọn
Chọnyếuyếutốtố
sososánh
sánhbội
bội
Chọn phương
pháp so sánh bội
Sau khi thao tác như hình trên. Bấm chọn ô Continue để quay lại cửa sổ
Univariate. Chọn OK.
Kết quả so sánh bội có dạng như sau:
Subset
‘b’ N
1 2 3
1 4 35,2500
2 4 50,2500
3 4 73,7500
4 4 81,2500
Sig. 1,000 1,000 ,217
Từ cột Subset ta biết được chỉ có cặp Blocks 3 và 4 là bằng nhau:
B1 B2 B3 B4
7.3. Phân tích phương sai ba chiều không tương tác (Three-Way Analysis
without interaction) cho thiết kế vuông ngẫu nhiên
Từ dữ liệu thiết kế vuông ngẫu nhiên, ta nhập 4 biến sau:
- Biến ‘r’: Nhập số thứ tự 1, 2,… t của các tác nhân ngoại lai theo dòng tương
ứng với các xij;
- Biến ‘c’: Nhập số thứ tự 1, 2,… t của các tác nhân ngoại lai theo cột tương
ứng với các xij;
- Biến ‘t’: Nhập số thứ tự 1, 2,… t của các xử lý tương ứng với các xij.
Sau đó, bấm chọn: Analyze  General Linear Model  Univariate.
Chọn biến ‘x’
Chọn biến
‘t’, ‘c’ và
‘r’ làm yếu
tố mô hình

Bấm chọn ô Model, ta vào cửa sổ:
Chỉ định
mô hình
Chọn
Chọnbiếnbiến‘t’,
‘B’
‘c’vàvà‘T’
‘r’làm
làmcác
yếu
yếutốtốmô của
hình
mô
Chọn Main effects
Các thao tác trên hình tương tự mục 7.2.
Ta được kết quả phân tích phương sai như trong phần in đậm ở bảng dưới:
Type III Mean
Source df F Sig.
Sum of Squares Square
Corrected Model 5636,625 9 626,292 9,559 ,006
Intercept 57840,250 1 57840,250 882,776 ,000
R 181,125 3 60,375 ,921 ,485
C 62,750 3 20,917 ,319 ,812
T 5392,750 3 1797,583 27,435 ,001
Error 393,125 6 65,521
Total 63870,000 16
Corrected 6029,750 15
Total
Nếu chọn so sánh bội giữa các Xử lý (Treatments), bấm chọn ô Post Hoc rồi
thao tác như ở mục 7.1 ta được kết quả:
Subset
‘t’ N
1 2 3
3 4 35,2500
2 4 50,2500
1 4 73,7500
4 4 81,2500
Sig. 1,000 1,000 ,238
Từ cột Subset ta biết được chỉ có cặp xử lý 1 và 4 là bằng nhau:
T3 T2 T1 T4
7.4. Phân tích phương sai hai chiều và tương tác (Two-Way Analysis with
interaction) cho thiết kế thừa số ngẫu nhiên
Từ dữ liệu thiết kế thừa số ngẫu nhiên, ta nhập 3 biến sau:
- Biến ‘X’: Nhập toàn bộ dữ liệu (xijk) của thiết kế;
- Biến ‘A’: Nhập số thứ tự 1, 2,… a của a tác nhân của yếu tố A tương ứng với
xijk;
- Biến ‘B’: Nhập số thứ tự 1, 2,… b của b tác nhân của yếu tố B tương ứng với
xijk.
Sau khi nhập liệu xong, bấm chọn:

Analyze  General Linear Model  Univariate.

Chọn biến ‘x’
Chọn biến ‘a’

và ‘b’ làm yếu
tố mô hình
Chỉ định
mô hình
Các thao tác trên cửa sổ Univariate tương tự mục 7.2. Trong cửa sổ
Univariate: Model chỉ cần chỉ định mô hình là Full factorial.
Ta được kết quả phân tích phương sai như trong phần in đậm ở bảng dưới:
Type III
Mean
Source Sum of df F Sig.
Square
Squares
Corrected Model 166,447 8 20,806 4,569 ,004
Intercept 7540,053 1 7540,053 1655,941 ,000
A 144,109 2 72,054 15,825 ,000
B 14,907 2 7,453 1,637 ,222
A*B 7,431 4 1,858 ,408 ,800
Error 81,960 18 4,553
Total 7788,460 27
Corrected 248,407 26
Total
Nếu muốn so sánh bội, bấm chọn ô Post Hoc rồi thao tác như ở mục 7.1
8. Hồi qui
8.1. Hồi qui mối liên hệ giữa hai tiêu thức định lượng
Dựa trên dữ liệu chéo, ta tiến hành hồi qui như sau:
Bấm chọn : Analyze  Regression  Curve Estimation.
Chọn tiêu thức

phụ thuộc
Chọn các
mô hình
mong muốn
Chọn
tiêu
thức
độc lập
Chọn kiểm định
độ phù hợp
Chú ý:
* Chỉ có các tiêu thức kiểu Mumeric mới hồi qui được;
* Muốn biết dạng toán học của một mô hình cần chọn thì để trỏ chuột lên chữ
của mô hình đó và ấn nút chuột phải;
* Nếu chưa biết chắc mô hình cần hồi qui thì nên bấm chọn hồi qui thử trên
nhiều mô hình cùng một lúc (chưa nên bấm chọn Display ANOVA table và Save).
Dựa vào bảng kết quả hồi qui thử cho các mô hình, mô hình nào có hình dáng phù
hợp và có Adjusted R Square lớn thì mới được chọn chính thức. Sau đó, bấm chọn
Reset để hủy các thao tác hồi qui lần đầu, tiến hành trở lại đầy đủ các thao tác ở
hình trên cho mô hình đã được lựa chọn.
* Các kết quả dự đoán chỉ tính trên các giá trị hiện có của tiêu thức độc lập.
Các kết quả dự đoán được kết xuất trên cửa sổ dữ liệu.
Nếu muốn dự đoán bấm chọn ô Save, ta được cửa sổ:

Chọn dự
đoán điểm
Chọn dự
đoán khoảng
Bấm chọn ô Continue để quay lại.

8.2. Hồi qui mối liên hệ tuyến tính giữa nhiều tiêu thức định lượng
Dựa trên dữ liệu chéo, ta tiến hành hồi qui như sau:
Bấm chọn : Analyze  Regression  Linear. Ta có cửa sổ sau:
Chọn Chọn tiêu thức

các tiêu phụ thuộc
thức
độc lập Chọn
cách
Chọn kiểm
tiếp cận
tra vi phạm
mô hình
các giả thiết
Chú ý:
- Chỉ có các tiêu thức kiểu Mumeric mới hồi qui được;
- Có các cách tiếp cận mô hình hồi qui bội sau:
* Enter: Đưa vào mô hình hồi qui tất cả các biến độc lập;
*Backward: Loại trừ dần dần các biến độc lập không phù hợp;
*Forward: Đưa dần các biến độc lập vào cho đến khi mô hình thu được vẫn
còn bảo đảm ý nghĩa;
* Stepwise: Kết hợp giữa Backward và Forward.

Phát hiện
đa cộng
tuyến
Phát hiện
tự tương
quan
Thao tác như trong hình trên. Cuối cùng chọn OK.
Nếu muốn dự đoán bấm chọn ô Save, ta có cửa sổ sau:
Dự đoán
phần dư
Dự đoán điểm tiêu

thức phụ thuộc
Dự đoán khoảng
tiêu thức phụ thuộc
Sau khi thao tác như hình trên, bấm chọn Continue để quay lại cửa sổ Linear
Regression.
Chú ý:
* Các kết quả dự đoán chỉ tính trên các giá trị hiện có của tiêu thức độc lập.
Các kết quả dự đoán được kết xuất trên cửa sổ dữ liệu.
* Nếu mô hình yêu cầu không có hệ số chặn (dùng trên dữ liệu biến đổi để
khắc phục hiện tượng phương sai không đồng nhất), bấm chọn ô Options để vào cửa
sổ sau:
Chọn có hay không

có hệ số chặn
Sau khi thao tác như hình trên, bấm chọn Continue để quay lại cửa sổ Linear
Regression.
9. Kiểm soát chất lượng bằng thống kê
9.1. Biểu đồ kiểm soát số trung bình và độ lệch chuẩn
Nhập dữ liệu theo hai biến: Biến xij phản ảnh giá trị j của mẫu i; Biến “mau”
phản ảnh thứ tự mẫu.

Bấm chọn : Analyze  Quality Control  Control charts. Ta có cửa sổ sau:
Chọn loại
Chọn loại biểu đồ
dữ liệu
Chọn các
khai báo
Chọn biến
kiểm soát
Chọn biến
các mẫu
Chọn chỉ số
năng lực
Chọn biểu đồ
trung bình
Chọn biểu
đồ 

Nhập các
giới hạn
Chọn chỉ
số năng
lực
9.2. Biểu đồ kiểm soát tỉ lệ

Ta nhập dữ liệu theo ba biến như sau:
Mẫu Lỗi Tần số

1 1 1
1 0 299
2 1 5
2 0 295
… … …
20 1 1
20 0 299
Trong đó, Lỗi =1: sản phẩm có lỗi, Lỗi =0: sản phẩm không có lỗi.
Sau đó, chỉ định tần số cho dữ liệu bằng cách bấm chọn Data  Weight
Cases.
Chọn tần
số

Bấm chọn : Analyze  Quality Control  Control charts. Ta có cửa sổ sau:
Chọn loại
Chọn loại biểu đồ
dữ liệu
Chọn các
khai báo
Chọn biến
kiểm soát
Chọn giá
trị kiểm
soát lỗi
Chọn biến
mẫu kiểm
tra
Chọn loại
biểu đồ
Chọn OK. Kết quả thu được như sau:


Huong Dan - Xuly Dulieu Tren Spss

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Huong Dan - Xuly Dulieu Tren Spss

Uploaded by

Copyright:

Available Formats

NGUYỄN VĂN CANG

Nguyễn Văn Cang 1 Xử lý dữ liệu trên SPSS

Số Giới Gía trị Yêu

Nguyễn Văn Cang 2 Xử lý dữ liệu trên SPSS

* Width: Xác định độ rộng (ký tự) cho dữ liệu.

Nhập giá trị

Nguyễn Văn Cang 4 Xử lý dữ liệu trên SPSS

* Column: Khai báo độ rộng cho cột nhập dữ liệu.

Nguyễn Văn Cang 5 Xử lý dữ liệu trên SPSS

Nguyễn Văn Cang 6 Xử lý dữ liệu trên SPSS

Chọn biến cũ để tính

Nguyễn Văn Cang 7 Xử lý dữ liệu trên SPSS

Chọn Change để khẳng

Tổ gồm tất Chọn kiểu

Chọn tiêu thức

Nguyễn Văn Cang 9 Xử lý dữ liệu trên SPSS

Khi bấm chọn ô Statistics ta có cửa sổ sau:

Khi bấm chọn ô Charts ta có cửa sổ sau:

Nguyễn Văn Cang 10 Xử lý dữ liệu trên SPSS

Bấm chọn mục cần xem

Chú ý: Dữ liệu định tính không mô tả được bằng các số đo thống kê mô tả

Nguyễn Văn Cang 11 Xử lý dữ liệu trên SPSS

Tiêu thức phân

Tiêu thức phân

Nguyễn Văn Cang 12 Xử lý dữ liệu trên SPSS

Có thể tiến hành theo cách khác như sau:

Bấm chọn Analyze  Compare Means  One-Sample-TTest. Ta được cửa

4.2. Ước lượng Tỉ lệ của chọn ngẫu nhiên đơn thuần

Khai báo tên

Ta có thể khai báo giá trị biến đếm như sau:

Bấm chọn Analyze  Compare Means  One-Sample-TTest.

Biến đếm dùng

Kết quả ước lượng:

5. Kiểm định tham số và sự khác biệt

Kết quả: One-Sample Test

Sig. (2-tailed) < 0.05 : Bác bỏ giả thuyết hai phía

Chỉ định Chọn tiêu thức

Nguyễn Văn Cang 18 Xử lý dữ liệu trên SPSS

Nguyễn Văn Cang 19 Xử lý dữ liệu trên SPSS

Nguyễn Văn Cang 20 Xử lý dữ liệu trên SPSS

Nguyễn Văn Cang 21 Xử lý dữ liệu trên SPSS

Nguyễn Văn Cang 22 Xử lý dữ liệu trên SPSS

Bấm chọn: Analyze  Nonparametric Tests  Chi-Square Test.

Đưa ‘tstt’ vào

Nhập cột ‘tsgt’,

Nguyễn Văn Cang 23 Xử lý dữ liệu trên SPSS

Chọn tiêu thức

Nếu bấm chọn so sánh bội, ta có của sổ:

Nguyễn Văn Cang 24 Xử lý dữ liệu trên SPSS

Nguyễn Văn Cang 25 Xử lý dữ liệu trên SPSS

Chọn biến ‘t’

Nguyễn Văn Cang 26 Xử lý dữ liệu trên SPSS

Nguyễn Văn Cang 27 Xử lý dữ liệu trên SPSS

Chọn biến ‘x’

Nguyễn Văn Cang 29 Xử lý dữ liệu trên SPSS

Các thao tác trên hình tương tự mục 7.2.

Sau khi nhập liệu xong, bấm chọn:

Nguyễn Văn Cang 31 Xử lý dữ liệu trên SPSS

Chọn biến ‘a’

Chọn tiêu thức

Nguyễn Văn Cang 33 Xử lý dữ liệu trên SPSS

Bấm chọn ô Continue để quay lại.

Chọn Chọn tiêu thức