You are on page 1of 5

TUGAS 3 STATISTIKA MULTIVARIAT

NAMA : TANIA THEODORA


NIM : 163012100015
DOSEN : PAK DEDY

KASUS MULTIPLE LINEAR REGRESSION


 untuk memprediksi keuntungan (profit) start-up berdasarkan jumlah uang yang dikeluarkan untuk
penelitian dan pengembangan (R&D), administrasi, pemasaran (marketing) dalam satuan dollar
($USD) di kota New York, California, dan Florida.
 sumber : https://www.kaggle.com/code/kavita5/linear-regression-50-startup/notebook

R&D Spend Administration Marketing Spend State Profit


165,349 136,898 471,784 New York 192,262
162,598 151,378 443,899 California 191,792
153,442 101,146 407,935 Florida 191,050
144,372 118,672 383,200 New York 182,902
142,107 91,392 366,168 Florida 166,188
131,877 99,815 362,861 New York 156,991
134,615 147,199 127,717 California 156,123
130,298 145,530 323,877 Florida 155,753
120,543 148,719 311,613 New York 152,212
123,335 108,679 304,982 California 149,760
101,913 110,594 229,161 Florida 146,122
100,672 91,791 249,745 California 144,259
93,864 127,320 249,839 Florida 141,586
91,992 135,495 252,665 California 134,307
119,943 156,547 256,513 Florida 132,603
114,524 122,617 261,776 New York 129,917
78,013 121,598 264,346 California 126,993
94,657 145,078 282,574 New York 125,370
91,749 114,176 294,920 Florida 124,267
86,420 153,514 0 New York 122,777
76,254 113,867 298,664 California 118,474
78,389 153,773 299,737 New York 111,313
R&D Spend Administration Marketing Spend State Profit
73,995 122,783 303,319 Florida 110,352
67,533 105,751 304,769 Florida 108,734
77,044 99,281 140,575 New York 108,552
64,665 139,553 137,963 California 107,404
75,329 144,136 134,050 Florida 105,734
72,108 127,865 353,184 New York 105,008
66,052 182,646 118,148 Florida 103,282
65,605 153,032 107,138 New York 101,005
61,994 115,641 91,131 Florida 99,938
61,136 152,702 88,218 New York 97,484
63,409 129,220 46,085 California 97,428
55,494 103,057 214,635 Florida 96,779
46,426 157,694 210,798 California 96,713
46,014 85,047 205,518 New York 96,480
28,664 127,056 201,127 Florida 90,708
44,070 51,283 197,029 California 89,949
20,230 65,948 185,265 New York 81,229
38,559 82,982 174,999 California 81,006
28,754 118,546 172,796 California 78,240
27,893 84,711 164,471 Florida 77,799
23,641 96,190 148,001 California 71,498
15,506 127,382 35,534 New York 69,759
22,178 154,806 28,335 California 65,200
1,000 124,153 1,904 New York 64,926
1,315 115,816 297,114 Florida 49,491
0 135,427 0 California 42,560
542 51,743 0 New York 35,673
0 116,984 45,173 California 14,681
UJI REGRESI LINEAR
Uji dilakukan untuk membuat model persaman regresi dalam memprediksi nilai profit start-up
(variabel dependen). Variabel independen yang akan diuji adalah R&D spent, administration,
marketing, dan state. Berdasarkan hasil perhitungan dengan Minitab, diperoleh beragam nilai R-
squared untuk berbagai variabel independen yang diuji.
Tabel ringkasan hasil uji
Variabel Variabel
R-squared P-value
dependen independen
Profit R&D Spend 94.65% 0
Profit Administration 4.03% 0.162
Profit Marketing Spend 55.92% 0
R&D Spend 0.289
Profit 94.78%
Administration 0
Administration 0.017
Profit 60.97%
Marketing Spend 0
R&D Spend 0
Marketing Spend 0.123
Profit Administration 94.52% 0.608
Florida 0.953
State
New York 0.99
R&D Spend 0
Administration 0.301
Profit 94.80%
Florida 0.748
State
New York 0.991

 Nilai R-squared terrendah berada saat variabel independen yang diuji hanyalan administration.
Hal ini menunjukkan bahwa administration saja tidak berperan signifikan terhadap profit.
 Nilai R-squared tertinggi sebesar 94.8% terjadi ketika variabel independen yang diuji adalah
R&D spend, administration, dan state. Nilai p value pada variabel independen yang kurang dari
significance level (0,05) menunjukkan predictor tersebut berpengaruh signifikan atau nyata.
Terlihat bahwa hanya R&D Spend yang memiliki nilai p value yang kurang dari 0,05 berarti
variabel tersebut berpengaruh signifikan. Namun, nilai P-Value dari kota / state menunjukkan
angka > 0.05, berarti variabel kota tidak berpengaruh signifikan.
 Perusahaan perlu mengedepankan alokasi biaya untuk R&D, karena variabel tersebut memiliki
pengaruh signifikan terhadap besarnya profit.
 Berikut adalah persamaan regresi profit untuk kota California, Florida, dan New York:
UJI ASUMSI KLASIK
1. Uji normalitas

Pada data profit dilakukan uji normalitas. Berdasarkan data deskriptif, diketahui bahwa data
memiliki nilai skewness dan kurtosis yang hampir mendekati nol. Hal ini juga tergambarkan
dari histogram dengan kurva yang berbentuk simetris. Selain itu, dilakukan juga pengujian
kenormalan dengan menggunakan Anderson Darling. Dapat dilihat pada grafik sebelah kanan
bahwa titik-titik menyebar di cukup dekat sepanjang garis normal serta diperoleh nilai p-value
sebesar 0,15 (lebih besar dari 0,05), maka dapat disimpulkan bahwa asumsi normalitas
terpenuhi. ✅

2. Uji Homoskedastisitas
Pada pengujian asumsi homoskedastisitas dengan pendekatan analisis grafik, dilihat apakah
titik-titik membentuk pola tertentu / pola seperti corong terbuka maupun tertutup.

Berdasarkan grafik detrended normal Q-Q plot di atas, terlihat bahwa sebaran ragam residual
dalam grafik menyebar secara acak di sekitar 0, tidak adanya pembentukan pola tertentu atau
bentuk corong, maka diindikasikan bahwa tidak terjadi heteroskedastisitas. ✅
3. Uji Multikolonieritas
Multikolonieritas dapat menjadi masalah karena berpotensi meningkatkan nilai varians dari
koefisien regresi, membuatnya menjadi tidak stabil dan sulit diinterpretasikan.
Nilai VIF ketika seluruh variabel independen dipilih

Nilai VIF ketika variabel independen terpilih hanya R&D Spend

Nilai Variance Inflation Factors (VIF) menjadi parameter pengukuran. Nilai VIF = 1
menyatakan bahwa tidak terjadi multikolonieritas, nilai 1 < VIF < 5 menyatakan bahwa ada
korelasi ringan, nilai VIF 5 hingga 10 menyatakan korelasi tinggi, dan nilai VIF > 10
mengindikasikan adanya multikolonieritas.

Saat seluruh variabel independen dipilih untuk diuji terhadap profit, terlihat bahwa nilai VID
R&D (VIF = 2,5) sedikit lebih tinggi daripada ketika variabel terpilih hanyalah R&D (VIF =
1). Berdasarkan hasil uji yang terlihat pada gambar di atas, nilai VIF tidak lebih dari 10,
sehingga dapat disimpulan bahwa tidak terjadi multikolonieritas. ✅

4. Uji Autokorelasi
Uji ini dilakukan dengan nilai statistik Durbin Watson (DW). Jika nilai berada pada rentang -2
< DV < 2, maka dikatakan non-autokorelasi. Pada pengujian R&D spent (variabel independen)
terhadap profit (variabel dependen), diperoleh dilai DW sebesar, 1,11591 sehingga dapat
disimpulkan bahwa tidak ada autokorelasi. ✅

You might also like