Professional Documents
Culture Documents
Tke SPSS PDF
Tke SPSS PDF
NỘI DUNG
1 Giới thiệu chung về phân tích và dự đoán thống kê
2 Mô tả dữ liệu thống kê
1
30/11/2018
BÀI 1
GIỚI THIỆU CHUNG VỀ PHÂN TÍCH VÀ DỰ ĐOÁN THỐNG KÊ
I II III
1. Thống kê học:
2
30/11/2018
1. Thống kê học:
Phương pháp
thống kê
Thống Thống kê
kê mô tả suy luận
3
30/11/2018
4
30/11/2018
Chỉ tiêu thống kê phản ánh mặt lượng gắn với chất
của các hiện tượng trong điều kiện thời gian và địa
điểm cụ thể.
THANG ĐO KHOẢNG
Có gốc 0
(Interval Scale)
Tiêu thức
Số lượng
THANG ĐO TỶ LỆ
(Ratio Scale)
5
30/11/2018
11
12
6
30/11/2018
Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao
13
gồm cột, hàng
Dùng để quản lý các biến và các thông tin liên quan đến biến, cơ
sở dữ liệu được lưu trữ dưới dạng *.SAV 14
7
30/11/2018
Các kết quả có thể copy hoặc copy object hoặc export sang các
phần mềm khác như word hay Excel,... Màn hình này cho phép ta
xem và lưu giữ các kết quả phân tích (*.SPO)
15
Màn hình này cho phép ta xem/soạn thảo cú pháp của các lệnh
phân tích (các câu lệnh). Các cú pháp được lưu trữ với phần
mở rộng (*.SPS) 16
8
30/11/2018
17
18
9
30/11/2018
20
10
30/11/2018
Mỗi biểu hiện sẽ hình thành một biến với 2 giá trị (có và không)
22
11
30/11/2018
23
24
12
30/11/2018
26
13
30/11/2018
27
28
14
30/11/2018
Các giá trị khuyết sẽ không tham gia vào quá trình phân tích
29
30
15
30/11/2018
Width (Xác định số lượng ký tự hiện thị cho giá trị - chỉ có
giá trị với biến String)
Decimals (số lượng số hiện thị sau dấu phẩy)
Column format (Định kích cỡ cho cột- độ rộng của cột)
Align (Định ra vị trí hiện thị các giá trị - căn phải/trái/giữa)
31
Ví dụ thực hành
Tạo cơ cở dữ liệu
32
16
30/11/2018
33
Nhập dữ liệu
17
30/11/2018
• Trong mục File of type chọn định dạng file phù hợp hoặc
chọn All Files (*.*)
35
-Tại cửa sổ Data View, từ thanh menu chọn: File / Open / Data...
- Trong hộp thoại Open File, chọn file mà bạn muốn mở
- Trong hộp thoại Open File, chọn nơi lưu giữ file (Look in); chọn loại
file (Files of type) và sau đó chọn tên file (File name)
- Nhắp Open
36
18
30/11/2018
37
38
19
30/11/2018
39
40
20
30/11/2018
41
42
21
30/11/2018
43
44
22
30/11/2018
45
5. Tách dữ liệu
Theo mặc định SPSS sẽ tính toán trên toàn bộ dữ liệu, muốn tính theo
từng nhóm nào đó sử dụng công cụ tách dữ liệu
Data > Split File
46
23
30/11/2018
6. Gộp dữ liệu
Data/ Aggregate Data
Lệnh này giúp gộp dữ liệu (các quan sát) theo 1 (một số) biến nào đó:
47
48
24
30/11/2018
BÀI 2
MÔ TẢ DỮ LIỆU THỐNG KÊ
I II III
50
25
30/11/2018
2. Các phân vị
51
( xi x )2 xi2 nx 2
- Phương sai: S2 i 1
i 1
n 1 n 1
S
- Sai số chuẩn trung bình: x
n
52
26
30/11/2018
Hệ số này có giá trị càng gần 0 thì phân phối của dãy số lại
càng đối xứng qua giá trị μ. Khi hệ số này nhỏ hơn 0, dãy số
phân phối chuẩn lệch trái. Khi hệ số này lớn hơn 0, dãy số
phân phối chuẩn lệch phải.
53
Đối với phân phối chuẩn thì giá trị của hệ số Kurtosis
bằng 3.
4
n
xi x
n( n 1 )
i 1 S 3( n 1 ) 2
K
( n 1 )( n 2 )( n 3 ) ( n 2 )( n 3 )
Khi giá trị này bằng 0 thì đó là phân phối chuẩn, nếu
giá trị mang dấu dương thì phân phối nhọn hơn so với
phân phối chuẩn và ngược 54
27
30/11/2018
56
28
30/11/2018
57
58
29
30/11/2018
IQR
1.5 IQR 1.5 IQR 1.5 IQR 1.5 IQR
Bài 2 59
30
30/11/2018
62
31
30/11/2018
32
30/11/2018
33
30/11/2018
Bảng thống kê là một hình thức trình bày các tài liệu thống
kê một cách có hệ thống, hợp lý và rõ ràng, nhằm nêu lên các
đặc trưng về mặt lượng của hiện tượng nghiên cứu
TIÊU ĐỀ BẢNG
Tiêu đề cột
Tiêu đề
dòng
Dữ liệu
34
30/11/2018
35
30/11/2018
36
30/11/2018
Chọn các thống kê cần hiện thị chuyển sang mục Display
Đặt lại nhãn (Label) thay đổi định dạng (Format, Decimal)
Nhấn Apply to Selection
Sắp xếp các biểu hiện chọn Sort categories by (value, count,….) và theo thứ tự tang
(Ascending) hoặc giảm (Descending)
Nhấn Apply
37
30/11/2018
38
30/11/2018
39
30/11/2018
Đồ thị thống kê
Đồ thị thanh (Bar) Graphs > Lagacy > Dialogs > Bar...
Simple đồ thị thanh cho 1 biến
Clustered đồ thị thanh kết hợp 2 biến (theo
nhóm với nhiều cột cạnh nhau)
Stacked Đồ thị thanh kết hợp 2 biến (biến
được biệu hiện trên 1 cột)
Summaries for groups cases Mỗi thanh
của đồ thị thể hiện số lượng các quan sát có
cùng 1 giá trị của biến
Summaries for separate variables Mỗi
thanh của đồ thị thể hiện giá trị thống kê
của biến
Value of individual cases Mỗi thanh của
đồ thị thể hiện giá trị 1 quan sát của biến
40
30/11/2018
Đồ thị thống kê
Đồ thị thanh (Bar) Graphs > Lagacy > Dialogs > Bar...
BÀI 3
ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
I II III
41
30/11/2018
42
30/11/2018
• Quy luật phân phối xác suất của biến ngẫu nhiên là sự
tương ứng giữa giá trị có thể có của nó và xác suất
tương ứng với giá trị đó.
85
43
30/11/2018
44
30/11/2018
Bác bỏ H0 Bác bỏ H0
45
30/11/2018
Kết luận
Thực tế Chấp nhận H0 Bác bỏ H0
46
30/11/2018
Mức ý nghĩa của kiểm định () là xác suất mắc sai
lầm loại I
= P(Bác bỏ H0/H0 đúng)
47
30/11/2018
48
30/11/2018
a Kiểm định giả thiết về giá trị trung bình của một tổng thể
b Kiểm định hai giá trị trung bình của hai tổng thể
97
H0: = 0
H1: ≠ 0
Tiêu chuẩn kiểm định
( x 0 )
T ~ t ( n 1)
S/ n
98
49
30/11/2018
99
100
50
30/11/2018
H0: 1 = 2
H1: 1 ≠ 2
- Hai mẫu độc lập
- Hai mẫu phụ thuộc
101
102
51
30/11/2018
S12
Tiêu chuẩn kiểm định F 2 ~ ( , n1 1, n2 1)
S2
n (z i i z ) 2 /( k 1)
i 1
F k ni
~ f ( , k 1, n k )
( z ij zi ) 2 /( n k )
i 1 j 1
ni
1 1 k ni
zij xij xi zi
ni
z
j 1
ij z zij
n i 1 j 1
xij – là giá trị của đơn vị thứ j nhóm thứ i (i=1,k) (j=1,ni)
52
30/11/2018
T
x1 x 2 ~ t , v
2 2
S S1 2
n1 n 2
2
S 12 S 22
1n n 2
Trong đó v 2 2
1 S 12 1 S 22
n1 1 n1 n 2 1 n 2 106
53
30/11/2018
107
108
54
30/11/2018
H0: d = 0 hay 1 - 2 = 0
H1: d ≠ 0
Trong đó: di = x1i - x2i
Tiêu chuẩn kiểm định
( d 0)
T ~ t ( n 1)
Sd / n
109
110
55
30/11/2018
1 2 ... i ... k
56
30/11/2018
MSF
- Tiêu chuẩn kiểm định F ~ f ( k 1, n k )
MSE
SSF SSE
MSF MSE
k 1 nk 113
x x
2
SST ij
Total Sum of Squares)
j 1 i 1
k nj
57
30/11/2018
115
116
58
30/11/2018
117
118
59
30/11/2018
119
60
30/11/2018
Hộ nghèo 20 50 25
61
30/11/2018
62
30/11/2018
Ví dụ
ĐP
Loại hộ A B C Tổng
20 50 25 95
Hộ nghèo 26,39 52,78 15,83
1,547 0,146 5,307
180 350 95 625
Hộ không
173,61 347,22 104,17
nghèo
0,235 0,022 0,807
Tổng 200 400 120 720
63
30/11/2018
Ví dụ
2
qs2
n
ij n ij
8,064
i j nij
qs2 02,05;2
Bác bỏ giả thuyết H0 (->Tỷ lệ hộ nghèo ở các địa
phương là khác nhau)
128
64
30/11/2018
129
130
65
30/11/2018
Ví dụ: - Nghiên cứu tỷ lệ nhân viên ở các khu vực như nhau?
- Tỷ lệ nhân viên nam gấp 2 lần tỷ lệ nữ?
- Trình độ đào tạo trung cấp gấp 3 lần đại học và gấp 5 lần sau ĐH
131
132
66
30/11/2018
133
BÀI 4
PHÂN TÍCH HỒI QUY TƯƠNG QUAN
I II
67
30/11/2018
cov( x, y ) xy x. y
r
x y x y
135
136
68
30/11/2018
-1 0 +1
137
69
30/11/2018
139
140
70
30/11/2018
Phương trình hồi quy: là phương trình xác định vị trí của
đường hồi quy lý thuyết
y
Đường hồi quy lý thuyết
0 x
71
30/11/2018
E ( y / xi ) 0 1 xi
• β0: phản ánh ảnh hưởng của các nguyên nhân khác
(ngoài nguyên nhân x) tới kết quả y
• β1: phản ánh ảnh hưởng trực tiếp của nguyên nhân x tới
kết quả y. Cụ thể, khi x tăng thêm 1 đơn vị thì giá trị trung
bình của y thay đổi là β1 đơn vị
- β1 > 0: x và y có mối liên hệ thuận (cùng chiều)
- β1 < 0: x và y có mối liên hệ nghịch (ngược chiều)
72
30/11/2018
x
0
S ( yˆ i y i ) 2 min 146
73
30/11/2018
S ( yi b0 b1 xi ) 2 min
S
2( yi b0 b1.xi )(1) 0
b0 yi n.b0 b1.xi
S 2
2( yi b0 b1.xi )( xi ) 0 yi .xi b0 xi b1.xi
b1
147
148
74
30/11/2018
149
2
ei ( yi yˆ i ) 2
n2 n2 150
75
30/11/2018
n i 1
SSR yˆ y
1
i
2
x
0
76
30/11/2018
( yˆ i y ) 2
F ~ F (1, n 2)
( yi yˆ i ) 2
n2
154
77
30/11/2018
yˆ i b0 b1 x i
Khoảng tin cậy ước lượng giá trị trung bình với độ tin
cậy (1-α)
1 ( x0 x ) 2
yˆ 0 t ( n/ 2 2 ) . . n
n
( xi x ) 2
i 1
155
( n2) 1 ( x0 x ) 2
yˆ 0 t / 2 . . 1 n
n 2
i ( x x )
i 1
156
78
30/11/2018
157
158
79
30/11/2018
Phản ánh ảnh hưởng thuần của nguyên nhân xj tới kết
quả y (khi các yếu tố khác không đổi). Cụ thể, khi xj
tăng thêm 1 đơn vị thì y thay đổi trung bình là βj đơn vị
159
• Giả thuyết: H 0 : j *j
b j *j
• Tiêu chuẩn kiểm định: T
se(b j )
• Nếu H0 đúng thống kê T sẽ tuân theo quy luật phân phối
student với (n-k-1) bậc tự do.
80
30/11/2018
81
30/11/2018
163
R 2 /( k 1)
F ~ F ( k 1, ( n k 1)
(1 R 2 ) /( n k 1)
164
82
30/11/2018
165
166
83
30/11/2018
167
Khi biến độc lập là biến định danh (biến phân loại)
Biến giả là biến có 2 giá trị 0 và 1 phụ thuộc vào việc các quan sát
có chứa các tính chất được quan tâm hay không.
Ví dụ: tiêu thức giới tính (nam, nữ)
D1 = 0 nếu là nữ
D1 = 1 nếu là nam
168
84
30/11/2018
Tiêu thức có k biểu hiện thì sẽ dùng k-1 biến giả, biểu hiện được
gán trị trị 0 ở các biến giả được gọi là cơ sở
169
85
30/11/2018
Giả sử nghiên cứu phương trình giữa thu nhập (biến phụ thuộc) với
biến tuổi và giới tính (Nam, nữ)
Yˆi b0 b1 X 1i b 2 D1i
Nữ: Yˆi b0 b1 X 1i b 2 .0 b0 b1 X 1i
Nam: Yˆi b0 b1 X 1i b 2 .1 (b0 b 2 ) b1 X 1i
Nam (D1=1)
Nữ (D1=0)
b2
b0
171
Giả sử nghiên cứu phương trình giữa thu nhập (biến phụ thuộc) với
biến tuổi và Khu vực (Thành thị, nông thôn, miền núi)
Yˆi b0 b1 X 1i b2 D1i b3 D 2 i
Miền núi: Yˆi b0 b1 X 1i b2 .0 b3 . 0 b0 b1 X 1i
Nông thôn: Yˆi b0 b1 X 1i b2 .1 b3 .0 ( b0 b2 ) b1 X 1i
Thành thị: Yˆi b0 b1 X 1i b2 .0 b3 . 1 ( b0 b3 ) b1 X 1i
Thành thị (D1=0;
D2=1)
b0
172
86
30/11/2018
Giả sử nghiên cứu phương trình giữa thu nhập (biến phụ thuộc) với
biến tuổi, bằng cấp (có, không) và biến tương tác (tuổi và bằng cấp)
Yˆi b0 b1 X 1i b2 D1i b3 X 1i * D1i
Không BC: Yˆi b 0 b1 X 1i b 2 . 0 b3 . X 1i * 0 b 0 b1 X 1i
Có BC: Yˆ b b X b .1 b . X * 1 (b b ) (b b ) X
i 0 1 1i 2 3 1i 0 2 1 3 1i
b2
b0
173
174
87
30/11/2018
175
88
30/11/2018
y 1 e (ˆ ˆxi ) 1
i
xi yi xi 1 e (ˆ ˆxi )
Yi là biến phụ thuộc (biến nhị phân – 1 là xảy ra biến cố,
0 là không xảy ra biến cố)
177
Như vậy, khi x tăng lên một đơn vị thì làm cho khả năng (xác
suất) biến cố xảy ra bằng e lần (so với với cũ) 178
89
30/11/2018
Quy tắc đưa ra kết luận như quy tắc kiểm định
179
-2LL càng nhỏ thể hiện độ phù hợp mô hình càng cao
(bằng 0 tức là không có sai số)
Cũng có thể đánh giá mô hình dựa vào bảng phân loại
(clasification table)
180
90
30/11/2018
181
182
91
30/11/2018
183
BÀI 5
PHÂN TÍCH DÃY SỐ THỜI GIAN VÀ DỰ ĐOÁN THỐNG KÊ
I II III IV
92
30/11/2018
Có số liệu về giá trị hàng hoá dự trữ của một doanh nghiệp
trong năm 2017 như sau:
Ngày 1/1 1/4 1/7 1/10 31/12
Gtrị(trđ) 300 320 360 340 380
93
30/11/2018
94
30/11/2018
95
30/11/2018
n
2. Lượng tăng i
(giảm) tuyệt đối i yi yi 1 i yi y1 i i
i2
i
n y y1
i2 n
n 1 n 1 n 1
3. Tốc độ phát i
yi y
(100) Ti i (100) Ti ti t n1 ti n1 Tn n1 yn
n
triển
ti
yi 1 y1 i 2 i2 y 1
4 Tốc độ tăng
(giảm) yi yi 1 y y1
ai (100) Ai i (100)
yi 1 y1 x
i (100)
i (100)
a t (%) 1(100)
yi 1 y1
t i (%) 1(100) Ti (%) 1(100)
Thời vụ/chu
Các yếu tố
kỳ (S)
ngẫu
nhiên (I)
Xu hướng (T)
96
30/11/2018
97
30/11/2018
98
30/11/2018
y k
... yi ... y k
i 0,5 i 0,5
2 2 k k
Nếu k lẻ: yi i ( 0,5; n 0,5)
2 2
k
y k
... yi ... y k
i i 1
2 2 k k
Nếu k chẵn: yi i ( 1; n 1)
2 2
k
99
30/11/2018
350
300
250
200
150
100
50
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
b. Hàm xu thế
yˆ i b0 b1ti
Hàm số biểu hiện các
mức độ của hiện yˆ i b0 b1t i b 2 t i2
tượng qua thời gian
b1
yˆ i f ( t i ) yˆ i b 0
ti
100
30/11/2018
yˆ i b0 b1ti
yi n.b0 b1.ti
2
ti yi b0ti b1.ti
yˆ i b0 b1ti b2ti2
n n n
2
yi n.b0 b1 ti b2 ti
i 1 i 1 i 1
n n n n
2 3
ti . yi b0 ti b1 ti b2 ti
i 1 i 1 i 1 i 1
n 2 n
2
n
3
n
4
ti . yi b0 ti b1 t i b2 ti
i 1 i 1 i 1 i 1
101
30/11/2018
y i yˆ i
2
SE min
n p
102
30/11/2018
Data>Define Dates..
205
206
103
30/11/2018
104
30/11/2018
y
i 1
ij y i 1
ij
yj n n
Sj m
m n
y0
y
j 1
j y
j 1 i 1
ij
m mn
105
30/11/2018
106
30/11/2018
- Đối với mô hình cộng: Tính bình quân cộng giản đơn
Cách xác định
- Đối với mô hình nhân: Tính bình quân cộng trung tâm
(Medial average – Trung bình cộng của các lượng biến
loại trừ lượng biến nhỏ nhất và lớn nhất)
107
30/11/2018
- Đối với mô hình cộng: Tổng chỉ số thời vụ bằng không (0).
Cách xác định
Mức độ điều chỉnh bằng tổng chỉ số thời vụ chia cho m
Chỉ số thời vụ
Analyze>Forecasting > Seasonal Decomposition…
216
108
30/11/2018
218
109
30/11/2018
220
110
30/11/2018
Hoặc yˆ t 1 . yt (1 ). yˆt
Thay yˆt . yt 1 (1 ).yˆt 1
yˆ t 1 . yt (1 ). . yt 1 (1 ). yˆ t 1 . yt (1 ). . yt 1 (1 ) 2 . yˆ t 1
Tiếp tục thay thế, ta có:
ŷt1 .yt .(1 ).yt1 .(1 )2 .yt2 .1 .yt3 .....1 .y1 (1 )t .ŷ1
3 t 1
221
200
Number
VAR00001-Model_1
150
100
50
Q1 1996
Q2 1996
Q3 1996
Q4 1996
Q1 1997
Q2 1997
Q3 1997
Q4 1997
Q1 1998
Q2 1998
Q3 1998
Q4 1998
Q1 1999
Q2 1999
Q3 1999
Q4 1999
Q1 2000
Q2 2000
Q3 2000
Q4 2000
Date
222
111
30/11/2018
yˆt h Lt bt .h
Lt . yt (1 )(Lt 1 bt 1)
bt Lt Lt 1 (1 ).bt 1
0 1
Thông thường chọn L1 y1 và b1 y 2 y1
223
200
Number
VAR00001-Model_1
150
100
50
Q1 1996
Q2 1996
Q3 1996
Q4 1996
Q1 1997
Q2 1997
Q3 1997
Q4 1997
Q1 1998
Q2 1998
Q3 1998
Q4 1998
Q1 1999
Q2 1999
Q3 1999
Q4 1999
Q1 2000
Q2 2000
Q3 2000
Q4 2000
Date
224
112
30/11/2018
yˆ t h Lt bt .h .St s h
y
Lt . t (1 ).( Lt 1 bt 1 )
St s
bt .Lt Lt 1 (1 ).bt 1
y
S t . t (1 ).S t s
Lt
225
1
L4 y1 y 2 y3 y 4
4
1 y 4 1 y1 y 4 2 y 2 y 4 3 y3 y 4 4 y 4
b4
4 4 4 4 4
y1 y2
S1 S2
L4 L4
y y4
S3 3 S4
L4 L4
226
113
30/11/2018
250
200
Number
VAR00001-Model_1
150
100
50
Q1 1996
Q2 1996
Q3 1996
Q4 1996
Q1 1997
Q2 1997
Q3 1997
Q4 1997
Q1 1998
Q2 1998
Q3 1998
Q4 1998
Q1 1999
Q2 1999
Q3 1999
Q4 1999
Q1 2000
Q2 2000
Q3 2000
Q4 2000
Date
227
yˆ t h Lt bt .h St s h
Lt . yt S t s (1 ).(Lt 1 bt 1 )
bt .Lt Lt 1 (1 ).bt 1
S t . yt Lt (1 ).S t s
228
114
30/11/2018
250
200
Number
VAR00001-Model_1
150
100
50
Q1 1996
Q2 1996
Q3 1996
Q4 1996
Q1 1997
Q2 1997
Q3 1997
Q4 1997
Q1 1998
Q2 1998
Q3 1998
Q4 1998
Q1 1999
Q2 1999
Q3 1999
Q4 1999
Q1 2000
Q2 2000
Q3 2000
Q4 2000
229
Date
230
115
30/11/2018
231
232
116
30/11/2018
233
234
117