Analisis regresi linier dalam SPSS

This example is based on the FBI's 2006 crime statistics. Contoh ini didasarkan pada 2006, FBI statistik kejahatan. Particularly we are interested in the relationship between size of the state, various property crime rates and the number of murders in the city. Terutama kita tertarik dalam hubungan antara ukuran negara, tingkat kejahatan dan berbagai properti jumlah pembunuhan di kota itu. It is our hypothesis that less violent crimes open the door to violent crimes and also that even we account for some effect of the city size by comparing crime rates per 100,000 inhabitants that there still is an effect left. Ini adalah hipotesis kami bahwa kejahatan kekerasan kurang terbuka pintu untuk kejahatan kekerasan dan juga bahwa bahkan kita account untuk beberapa efek dari luas kota dengan membandingkan tingkat kejahatan per 100.000 penduduk yang masih ada efek kiri. First we need to check whether there is a linear relationship between the independent variables and the dependent variable in our multiple linear regression model. Pertama kita perlu memeriksa apakah ada hubungan linier antara variabel independen dan variabel dependen dalam kita linier regresi berganda model. We check the scatter plots. Kami memeriksa scatter plot. The scatter plots indicate a good linear relationship between murder rate and burglary and motor vehicle theft rates, and only weak relationships between population and larceny. The scatter plot menunjukkan hubungan linear yang baik antara tingkat pembunuhan dan perampokan dan tingkat pencurian kendaraan bermotor, dan hanya hubungan yang lemah antara populasi dan pencurian.

Secondly we need to check for multivariate normality. Kedua kita perlu untuk memeriksa normalitas multivariat. In our example we find that multivariate normality might not be present in the population data (which is not surprising since we truncated variability by selecting the 70 biggest cities to begin with). Dalam contoh kita kita menemukan bahwa normalitas multivariat mungkin tidak hadir di data kependudukan (yang tidak mengejutkan karena kita terpotong variabilitas dengan memilih 70 kota terbesar untuk memulai dengan).

We will ignore this violation of the assumption, and conduct the multiple linear regression analysis. Kami akan mengabaikan pelanggaran asumsi ini, dan melakukan analisis regresi linier berganda. Multiple linear regression is found in SPSS in Analyze/Regression/Linear… Regresi linier ditemukan di SPSS di Menganalisis / Regresi / Linier ...

In our example we need to enter the variable murder rate as the dependent variable to our multiple linear regression model and the population, burglary, larceny, vehicle theft as independent variables. Dalam contoh kita kita harus memasukkan tingkat pembunuhan variabel sebagai variabel tergantung untuk model regresi linier dan penduduk, perampokan,

pencurian, pencurian kendaraan sebagai variabel independen. We also select stepwise as the method. Kami juga memilih bertahap sebagai metode. The default method for the multiple linear regression analysis is 'Enter', that means that all variables are forced to be in the model. Metode standar untuk analisis regresi linier berganda adalah 'Enter', yang berarti bahwa semua variabel yang terpaksa dalam model. But since over fitting is a concern of ours, we want only the variables in the model that explain additional variance. Tapi karena lebih pas adalah perhatian kita, kita ingin hanya variabel dalam model yang menjelaskan varians tambahan.

In the field options we can set the stepwise criteria. Dalam opsi bidang kita dapat mengatur kriteria stepwise. We want to include variables in our multiple linear regression model that increase F by at least 0.05 and we want to exclude them if the increase F by less than 0.1. Kami ingin memasukkan variabel dalam model regresi linier kami yang meningkatkan F oleh setidaknya 0,05 dan kita ingin mengecualikan mereka jika F meningkat kurang dari 0,1.

The field statistics allows us to include additional statistics that we need to assess the validity of our linear regression analysis. Statistik lapangan memungkinkan kita untuk memasukkan statistik tambahan yang kita butuhkan untuk menilai validitas analisis regresi linier kami.

It is advisable to additionally include the collinearity diagnostics and the Durbin-Watson test for autocorrelation. Dianjurkan untuk tambahan mencakup diagnostik collinearity dan uji Durbin-Watson untuk autokorelasi. To test the assumption of homoscedasticity and normality of residuals we also include a special plot in the Plots menu. Untuk menguji asumsi normalitas homoscedasticity dan residu kami juga termasuk plot khusus di menu Plot.

The first table tells us the variables in our analysis. Tabel pertama memberitahu kita variabel dalam analisis kami. Turns out that only motor vehicle theft is useful to predict the murder rate. Ternyata bahwa pencurian kendaraan bermotor hanya berguna untuk

memprediksi tingkat pembunuhan.

The next table shows the multiple linear regression model summary and overall fit statistics. Tabel berikut menunjukkan ringkasan model regresi linier berganda dan statistik cocok secara keseluruhan. We find that the adjusted R² of our model is 0.398 with the R² = .407 that means that the linear regression explains 40.7% of the variance in the data. Kami menemukan bahwa adjusted R ² model kita adalah 0,398 dengan R ² = 0,407 yang berarti bahwa regresi linier menjelaskan 40,7% dari varians dalam data. The DurbinWatson d = 2.074, which is between the two critical values of 1.5 < d < 2.5 and therefore we can assume that there is no first order linear autocorrelation in our multiple linear regression data. The Durbin-Watson d = 2,074, yaitu antara dua nilai kritis dari 1,5 <d <2,5 dan karena itu kita bisa berasumsi bahwa tidak ada autokorelasi urutan pertama linier dalam data kami regresi linier berganda.

If we would have forced all variables (Method: Enter) into the linear regression model we would have seen a little higher R² and adjusted R² (viz. 0.424 and .458). Jika kita akan memaksa semua variabel (Metode: Masukkan) ke dalam model regresi linier kita akan melihat sedikit lebih tinggi dan disesuaikan R ² R ² (yakni 0,424 dan 0,458).

The next table is the F-test , the linear regression's F-test has the null hypothesis that there is no linear relationship between the variables (in other words R²=0). Tabel berikutnya adalah F-test , regresi linier's F-test memiliki hipotesis nol bahwa tidak ada hubungan linear antara variabel-variabel (dengan kata lain R ² = 0). The F-test is highly significant, thus we can assume that there is a linear relationship between the variables in our model. F-test sangat penting, sehingga kita dapat mengasumsikan bahwa ada hubungan linear antara variabel-variabel dalam model kami.

The next table shows the multiple linear regression estimates including the intercept and the significance levels. Tabel berikut menunjukkan perkiraan regresi linier berganda termasuk mencegat dan tingkat signifikansi. In our stepwise multiple linear regression analysis we find a non-significant intercept but highly significant vehicle theft coefficient, which we can interpret as for every 100 vehicle thefts per 100,000 inhabitants we will see 2 additional murders per 100,000. Dalam analisis regresi linier berganda kita kita menemukan intercept yang tidak bermakna tapi sangat pencurian kendaraan signifikan koefisien, yang kita dapat menafsirkan sebagai untuk setiap 100 pencurian kendaraan per 100.000 penduduk kita akan melihat 2 pembunuhan tambahan per 100.000.

If we force all variables into the multiple linear regression the Beta weights and collinearity are interesting. Jika kita memaksa semua variabel dalam regresi linier berganda bobot Beta dan collinearity yang menarik. Beta expresses the relative importance of each independent variables in standardized terms. Beta mengungkapkan kepentingan relatif dari setiap variabel independen dalam hal standar. Firstly we find that only burglary and motor vehicle theft are significant predictors, secondly we find that motor vehicle theft has a higher impact than burglary (beta = .507 and beta = .333). Pertama kita menemukan bahwa hanya perampokan dan pencurian kendaraan bermotor adalah penaksir signifikan, kedua kita menemukan bahwa pencurian kendaraan bermotor memiliki dampak yang lebih tinggi dari pencurian (beta = 0,507 dan beta = 0,333).

This table also checks for multicollinearity in our multiple linear regression model. Tabel ini juga memeriksa multikolinearitas dalam model regresi linier kami. Tolerance should be > 0.1 (or VIF < 10) for all variables, which they are. Toleransi harus> 0,1 (atau VIF <10) untuk semua variabel, yang mereka. As the Goldfeld-Quandt test is not supported in SPSS we check is the homoscedasticity and normality of residuals with the QQ-Plot of z*pred and z*presid. Sebagai uji GoldfeldQuandt tidak didukung di SPSS kita cek adalah homoscedasticity dan normalitas residu dengan QQ-Plot z * pred dan presid * z. The plot indicates that in our multiple linear regression analysis there is no tendency in the error terms. plot menunjukkan bahwa dalam analisis regresi linier kita tidak ada kecenderungan dalam istilah kesalahan. If that happens you see a graph that looks like a staircase. Jika itu terjadi Anda melihat grafik yang terlihat seperti tangga.

Related Pages Halaman Terkait
• • • •

SPSS Modules Modul SPSS F-Test F-Test Selection Process for Multiple Regression Seleksi Proses Multiple Regresi Stepwise Regression Stepwise Regresi

Sign up to vote on this title
UsefulNot useful