You are on page 1of 38

1.

Cách kiểm tra biến đột xuất:

Vào Anlyze Descriptive stastistic  Explore  chọn số liệu  Statistic

 Kích chọn Outliers và Percentiles.

Percentiles

Percentiles

5 10 25 50 75 90 95

Weighted Average(Definition
salnow 7680,00 8400,00 9600,00 11550,00 14865,00 23880,00 28087,50
1)
Tukey's Hinges salnow 9600,00 11550,00 14820,00

 5% người có lương thấp hơn 7680tr


 10% người có lương thấp hơn 8400tr
 25% người có lương thấp hơn 9600tr
 50% người có lương thấp hơn 11550tr
 75% người có lương thấp hơn 14865tr
 90% người có lương thấp hơn 23880tr
 95% người có lương thấp hơn28087tr

Extreme Values

Case Number Value

1 96 54000

2 160 44250

Highest 3 176 41500

4 154 41400

5 183 40000
salnow
1 5 6300

2 59 6360

Lowest 3 56 6480

4 30 6480

5 15 6480

 Người có mức lương cao nhất là 54000tr ở stt 96


 Nguowig có mức lương thấp nhất là 6300tr ở stt 5
2. Vẽ biểu đồ, bảng tần số:
Analyzw  descriptive statistics  Frequencies
 Chọn biến chuyển xag
 Phần Statistics chỉ cần cho biến định lượng
 Phần Chats có phần biểu đồ Histogram chỉ dùng cho biến định lượng.
3. Bảng kết hợp biến định tính và biến định lượng

Anlyze  Table  Custom table

 Chọn các biến vào row và colum.


4. Phân phối của các tham số
Analyze  Descriptive statistisc  Frequencies ( dùng được cho cả biến định
đinh tính và định lượng)
hoặc Descriptive (dùng cho biến định lượng)
 Chọn stastistics, tích vào các ô bến cần biết

 Phần Persentile value: Quartiles là tứ phân vị, nếu muốn chọn phân vị khác
thì chọn Cut points for.
 Vào Chats chọn sơ đồ muốn biểu diễn
 Cách phân biệc biểu đồ lệch trái lệnh phải
C1: dựa vào Me Mo Mean
C2: dựa vào các tham số skewness, Kurtosis
Hệ số Skewness càng gần 0 thì phân bố càng chuẩn, <0 lệch phải
C3: dựa vào hộp dia mèo

Statistics
salbeg

Valid 474 Mẫu N=474 ng công nhân


N
Missing 0
Mean 6806,43 Tiền lương khởi điêm trung bình
Std. Error of Mean 144,604
Trung vị
Median 6000,00
Mode 6000
Std. Deviation 3148,255 Độ lệch tuyệt đối
Variance 9911511,193
Skewness 2,853
Std. Error of Skewness ,112
Kurtosis 12,390
Std. Error of Kurtosis ,224
Range 28392
Minimum 3600
Maximum 31992
25 4980,00 Tứ phân vị 25% 50% 75%
Percentiles 50 6000,00

75 7047,00

5. Kiểm định 1 tổng thể.


Analyze  Compare Means  One-sample T test

Bảng 1

One-Sample Statistics

N Mean Std. Deviation Std. Error Mean

salbeg 474 6806,43 3148,255 144,604

 N: số CN 474
 Mean: tiền lương khởi điểm trung điểm
 Std. Deviation: sai số tuyệt đói
 Std. Error Mean: sai số chuẩn

Bảng 2

One-Sample Test

Test Value = 7000

t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the


Difference

Lower Upper

salbeg -1,339 473 ,181 -193,565 -477,71 90,58


Cặp giả thuyết :
H0: μ =7000
H1: μ ≠ 7000
Bậc tự do df= n-1= 473, t = -1,339 là giá trị quan sát
Mức ý nghĩa : ∝ = 0.05
Tiêu chuẩn kiểm định : t
P value < 0.05 => bác bỏ H0
P vaue > 0,05 => chưa có bằng chứng để bác bỏ H0

T-test: age
Bảng 1

One-Sample Statistics

N Mean Std. Deviation Std. Error Mean

age 474 37,186 11,7872 ,5414

Bảng 2

One-Sample Test

Test Value = 30

t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the


Difference

Lower Upper

age 13,273 473 ,000 7,1861 6,122 8,250

Cặp kiểm định


H0: μ = 30
H1: μ ≠30

6. Kiểm định 2 tổng thể độc lập


Analyze  Compare Mean  Independent- Sample test
 Bài 3: Kiểm định sự khác nhau về tiền lương khởi điển TB của 2 giới tính

Bảng 1

Group Statistics
sex N Mean Std. Deviation Std. Error Mean

0 258 16576,71 7799,685 485,587


salnow
1 216 10412,77 3023,209 205,703

Bảng 2

(Kiểm định phương sai nếu phươn sai = nhau thì nhìn dòng trên
K thì nhìn dòng dưới)
 Kiểm định so sánh phương sai:
H0: δ 1 = δ 2
H1: δ 1 ≠ δ 2
+ P value< 0.05 => Bác bỏ H0 => Phương sai 2 mẫu k bằng nhau
 Kiểm định giá trung bình của 2 mẫu:
H0: μ1 = μ 2
H1 : μ1 ≠ μ 2
+ P value <0.05 => bác bỏ H0 => Tiền lương hiện hành trung bình của 2 mẫu
khác nhau

 Bài 4:Kiểm định sự khác nhau về tiền lương khởi điển TB có gự khác
biệt giữa 2 nhóm tuổi dưới 40 và trên 40.
Bảng 1

Group Statistics

age N Mean Std. Deviation Std. Error Mean

>= 40,0 156 11861,78 6621,937 530,179


salnow
< 40,0 318 14702,87 6745,744 378,283
Bảng 2

 Kiểm định phương sai của 2 mẫu:


H0: δ 1= δ 2
H1: δ 1 ≠ δ 2
+ P value (= 0.019)<0.05 => phương sai của 2 mẫu k bằng nhau
 Kiểm định giá trị trung bình của hai mẫu:
H0: μ1 = μ 2
H1: μ 1≠ μ 2
+ P value (=0.000) < 0.05 => bác bỏ H0

 Bài 5: Kiểm định sự khác nhau về tiền lương khởi điển TB

7. Kiểm định của 2 tổng thể phụ thuộc


Analyze  Compare Mean  Paired- Sample T test

Paired Samples Statistics

Mean N Std. Deviation Std. Error Mean

salbeg 6806,43 474 3148,255 144,604


Pair 1
salnow 13767,83 474 6830,265 313,724

Paired Samples Correlations

N Correlation Sig.

Pair 1 salbeg & salnow 474 ,880 ,000


Sô liệu cuối cùng của bảng 2 là P value: P value < 0.05 => bác bỏ H0
8. Kiểm đinh tỉ lệ
Analyze  Nonparametric tests  Legacy Dialog  Binomial

 Chọn biến chuyển sang


 Phần Define Dichotomy: phần Get from data ( dùng cho các dạng dữ liệu đã
phân chia r như sex). Phần Cut point ( dùng cho dạng muốn kiểm định)

Binomial Test

Category N Observed Prop. Test Prop. Exact Sig. (2-


tailed)

Group 1 0 258 ,54 ,50 ,060

sex Group 2 1 216 ,46

Total 474 1,00

 Số cuối cùng ở ô cuối cùng là P value: nếu P value < 0.05 => bác bỏ giả thuyết
H0
9. Xây dụng mô hình hồi quy đơn
Analyze  Regressing  Linear

Bảng 1
Model Summary

Model R R Square Adjusted R Std. Error of the


Square Estimate

1 ,880a ,775 ,774 3246,142

a. Predictors: (Constant), salbeg

 R= 0.88 =>Hệ số tương quan (cường độ mối quan hệ) mối quan hệ giữa lượng
biến hiện hành và lượng biến khới điểm là khá chặt chẽ (càng gần 1 càng chặt
chẽ)
 R2= 0.776 => Hệ số xác định (sự phù hợp của mô hành) sự thay đổi lượng
biến hiện hành đcược giải thích bởi lượng biến khởi điểm là 77.5%.
 SE = 3246,142, sai sô chuẩn của mô hình.
Bảng 2

ANOVAa

Model Sum of Squares df Mean Square F Sig.

17092967800,0 17092967800,0
Regression 1 1622,118 ,000b
20 20

4973671469,79
1 Residual 472 10537439,555
5

22066639269,8
Total 473
14

a. Dependent Variable: salnow


b. Predictors: (Constant), salbeg

Xem R2 có thật sự có ý nghĩ hay k thì thực hiện kiểm định


Ta kiểm định GT: H0: R2 = 0
H1: R2 ≠ 0
+
P value = 0.000<0.05 => bác bỏ H0
(Nếu chưa thể bác bỏ Ho thì k cần kiểm định xag bảng 3
Bảng 3)

Coefficientsa
Model Unstandardized Coefficients Standardized t Sig.
Coefficients

B Std. Error Beta

(Constant) 771,282 355,472 2,170 ,031


1
salbeg 1,909 ,047 ,880 40,276 ,000

a. Dependent Variable: salnow

Kiểm đinh hệ số hồi quy


Ta KDGT : H0: β 1=0
H1: β 1 ≠ 0
+ P value= 0,000<0.05 => bác bỏ H0

Salnow= 771,282 + 1,909*sanlbeg

Nếu P value > 0.05 => biến số k có ý nghĩa, k ảnh hưởng.


Giải thích hệ số

 Ảnh hưởng của kinh nghiệm đến mức lương hiện hành
Bảng 1

Model Summary

Model R R Square Adjusted R Std. Error of the


Square Estimate

1 ,084 a
,007 ,005 6813,278

a. Predictors: (Constant), time

ANOVAa

Model Sum of Squares df Mean Square F Sig.

Regression 156044445,816 1 156044445,816 3,362 ,067b

21910594823,9
Residual 472 46420751,746
1 98

22066639269,8
Total 473
14

a. Dependent Variable: salnow


b. Predictors: (Constant), time
Coefficientsa

Model Unstandardized Coefficients Standardized t Sig.


Coefficients

B Std. Error Beta

(Constant) 9137,330 2544,886 3,590 ,000


1
time 57,089 31,138 ,084 1,833 ,067

a. Dependent Variable: salnow

10. Hồi quy bội

Analyze  Regression  Linear


 Vào Stastistics: chọn Estimate:

Model Summaryb

Model R R Square Adjusted R Std. Error of the Durbin-Watson


Square Estimate

1 ,897a ,805 ,804 3026,073 2,030

a. Predictors: (Constant), age, salbeg, time


b. Dependent Variable: salnow

ANOVAa

Model Sum of Squares df Mean Square F Sig.

17762795017,3 5920931672,46
Regression 3 646,594 ,000b
83 1

4303844252,43
1 Residual 470 9157115,431
1

22066639269,8
Total 473
14

a. Dependent Variable: salnow


b. Predictors: (Constant), age, salbeg, time

Coefficientsa

Model Unstandardized Coefficients Standardized t Sig. Correlatio


Coefficients
B Std. Error Beta Zero-order Partia

(Constant) -2173,326 1236,930 -1,757 ,080

time 73,870 13,851 ,109 5,333 ,000 ,084 ,2


1
salbeg 1,911 ,044 ,881 43,223 ,000 ,880 ,8

age -82,171 11,821 -,142 -6,952 ,000 -,146 -,3

a. Dependent Variable: salnow

11. Hàm xu thế theo thời gian


Analyze  Regression  Curve Estimates

Model Summary

R R Square Adjusted R Std. Error of the


Square Estimate

,887 ,787 ,778 170,133

R= 0,887 có mối quan hệ chặt chẽ


R2= 0.787 phản án số lượng khách phản ánh 78,7% qua thời gian
ANOVA

Sum of Squares df Mean Square F Sig.

Regression 2357956,002 1 2357956,002 81,462 ,000


Residual 636796,956 22 28945,316
Total 2994752,958 23

Kiểm định R
Coefficients

Unstandardized Coefficients Standardized t Sig.


Coefficients

B Std. Error Beta

Case Sequence 45,281 5,017 ,887 9,026 ,000


(Constant) 809,025 71,686 11,286 ,000

Kiểm định hệ số
 Hàm su thế đi lên, hàm thực tế có mối quan hệ chặt chẽ
 Để cho chắc thì nên cọn nhiều hàm xem cái nào có sai số nhỏ nhất sẽ đc chọn
 Khi chọn hàm trong Curve Estimate chọn nhiều hàm hơn như Quadratic (bình
phương), Cubic (hàm bậc 3), Power (hàm mũ)..
12.Xác định chỉ số thới vụ
Analyze  Forecasting  Seasonal Decomposition

Bảng 1

Model Description

Model Name MOD_3


Model Type Multiplicative
Series Name 1 sokhach
Length of Seasonal Period 4
Span equal to the
Computing Method of Moving Averages periodicity and all
points weighted equally

Applying the model specifications from MOD_3

Bảng 2
Kiểm định Crochback Alpha: kiểm đinh, do lường độ tin cậy của thang đo, nhất
quán của thang đo
Các biến quan sát
Chỉ dùng cho kiểu thang đo linkert
Giá trị cảu tổng thể có đc giải thích bởi các biến kia k(tức là biến con phải gần
tương quan với biến tổng thể

Để xem các các biến có phù hợp k


Đầu tiên phải đọc các biến kĩ
Thứ 2, phải tham khảo các nguồn tài liệu
Thứ 3 là thang đo có phù hợp k
biến tiền ẩn là biến k đo trực tiếp đc cần phải đo lường qua nhiều nhiến khác có
thể quan sát đc.
0,791 ddoangs góp cho giá trị thực

Crochbach alpha càng cao càng tin cậy


P= số câu hỏi trong 1 thang đo (vd 4 câu hỏi)

K thể =1 đo lường thông qua nhiều khía cạnh khác nhua nên các câu trl k thể hoàn
toàn nhất quán với nhau
Bảng 1
Bảng 2: xem số liệu ở đây để so sách cái bảng có 0.95, o,7… ở trên ý
Nếu nó lớn hơn 0,7 thì k cần quan tâm đến bảng 3

bảng 3 (khi mà bảng 2 có cột đâu


Cột thứ4 tương quan giữa câu hỏi này vs câu hỏi khác (duwois 0,3)
Kiểm đinh E
Tìm hiểu xem thực chất có bn biến tìn ẩn có thể nêu dựa trên các câu hỏi của cta
Chuỗi dữ liệu phân nhóm qua những đặc tính
K dựa theo lý thuyết dựa theo đặc điểm r xem có tương quan với nhau cao k (cao
là tốt)
Quan tâm Biến độc lập cùng 1 vế
cho tất cả các biến độc lập vào
xếp theo thứ tự
Mõi biến có 5 câu hỏi

You might also like