Professional Documents
Culture Documents
PROBLEM SET 7
“REGRESI LINEAR SEDERHANA”
Oleh:
NUR ANISYAH HANDAYANI HASIBUAN
25321018
3. Lakukan analisis awal untuk mengetahui apakah terdapat hubungan di antara kedua
parameter (2 cara diagnosa). Berikan keterangan dari hasil analisis awal yang anda
lakukan serta rencana langkah selanjutnya.
Analisis korelasi antara Alkalinitasdan konsentrasi Calcium dijelaskan
menggunakan 2 metode, yaitu Scatterplot dan analisis korelasi menggunakan software
R. Adapun hasil dari analisis korelasinya sebagai berikut:
a. Scatterplot
Scatterplot dilakukan untuk menganalisa korelasi antara konsentrasi Calcium
dengan Alkalinitas. Hasil data awal yang diperoleh adalah sebagai berikut:
a. Konsentrasi Calcium
Analisis statistik yang diperoleh dengan menggunakan software R memperlihatkan
bahwa konsentrasi Calcium memiliki nilai mean sebesar 1.353013, standar deviasi
0,03021961. Selanjutnya dilakukan uji normaltias data konsentrasi Calcium dengan
menggunakan Lilliefors test software R.
Gambar 5. Uji Normalitas Liliefors (Kolmogrov –Smirnov) Konsentrasi Calcium
b. Konsentrasi Alkalinitas
Analisis statistik yang diperoleh dengan menggunakan software R memperlihatkan
bahwa konsentrasi Alkalinitas memiliki nilai mean sebesar 2,983080, standar deviasi
2,01347737. Selanjutnya dilakukan uji normaltias data konsentrasi Calcium dengan
menggunakan Lilliefors test di software R.
Untuk dapat mengetahui ada atau tidaknya kecocokan antara model regresi
dengan data dapat ditentukan melalui perbandingan nilai t-test hasil analisis dengan
nilai t statistic (t tabel). Apabila nilai t-test < t tabel maka H0 diterima, kesimpulannya
terdapat hubungan yang linear konsentrasi Calcium dan Alkalinitas. Pada problem set
ini terdapat 252 data yang dilakukan analisisnya dengan tingkat kepercayaan 95%.
Untuk mengetahui nilai t statistic (t tabel) dilihat angka derajat kebebasan (df) dan
tingkat kepercayaan (α). Pada problem set ini nilai df ialah sebesar 194 dan α/2 sebesar
0,025 (2 sisi) yang menunjukkan kesalahan 2,5%, sehingga didapatkan nilai t tabel
berdasarkan tabel sebesar 1,97227.
Sumber : http://ledhyane.lecture.ub.ac.id/files/2013/04/tabel-t.pdf
Dapat dilihat pada Gambar 8, pada koefisien intercept (β) menunjukkan titik
potong yang berpengaruh apabila slope yang dihasilkan sama dengan nol. Estimasi
intercept adalah 5,935 dengan standar error sebesar 6,470. T-value sebesar 0,917 yang
menunjukkan bahwa t-hitung > t-tabel 1,97227., maka hipotesis untuk t-test diperoleh
hasil Ho ditolak. Hal ini berarti bahwa terdapat hubungan linear antara konsentrasi
Calcium dan Alkalinitas.
Pada koefisien slope atau β1 (konsentrasi Total Nitrogen) yang merupakan
koefisien yang berpengaruh pada setiap kenaikan 1 unit konsentrasi Alkalinitas.
Estimasi slope (β1) yang diperoleh adalah -2,182, dengan standar error sebesar 4,781.
T-value sebesar -0,456 yang menunjukkan bahwa t-hitung < t-tabel 1,97227, maka
hipotesis untuk t-test diperoleh hasil Ho diterima. Hal ini berarti bahwa tidak terdapat
hubungan linear antara konsentrasi Calcium dan Alkalinitas
Y = 5,935 – 2,182x
Koefisien regresi yang diperoleh adalah – 2,182. Interpretasi dari koefisien regresi
ini adalah konsentrasi Alkalinitas(Y) akan naik sebesar – 2,182 jika konsentrasi
Calciumdinaikkan 1 unit. Standar error yang didapatkan sebesar 4,781. T-value sebesar
-0,456 yang menunjukkan bahwa t-hitung < t-tabel 1,97227, maka hipotesis untuk t-
test diperoleh hasil Ho diterima. Hal ini berarti bahwa tidak terdapat hubungan linear
antara konsentrasi Calcium dan Alkalinitas.
Koefisien Determinasi
Nilai koefisien determinasi adalah besarnya nilai pada variabel X mampu
menjelaskan variasi dari nilai pada variabel Y. Berdasarkan Gambar 6, nilai Koefisien
determinasi (r2 ) atau multiple R squared sebesar 0,00172 atau sebesar 0,172%. Maka
dapat disimpulkan bahwa konsentrasi Calcium(Variabel X) dapat menjelaskan variasi
dari konsentrasi Alkalinitas(Variabel Y) sebesar 0,172%. artinya bahwa 99,828%
terdapat faktor lain yang mempengaruhi konsentrasi Loss on Ignition. Nilai koefisien
determinasi adalah besarnya nilai pada variabel X mampu menjelaskan variasi dari nilai
pada variabel Y. Berdasarkan Gambar 6, nilai Koefisien determinasi (r2 ) atau multiple R
squared sebesar 0,00172 atau sebesar 0,172%. Maka dapat disimpulkan bahwa
konsentrasi Calcium(Variabel X) tdapat menjelaskan variasi dari konsentrasi Alkalinitas
(Variabel Y) sebesar 0,172%. artinya bahwa 99,828% terdapat faktor lain yang
mempengaruhi konsentrasi Alkalinitas.
Koefisien Korelasi
𝑟 = √𝑘𝑜𝑒𝑓𝑖𝑠𝑖𝑒𝑛 𝑑𝑒𝑡𝑒𝑟𝑚𝑖n𝑎𝑠𝑖
𝑟 = √0,00172
𝑟 = 0,041
Nilai koefisien korelasi menunjukkan asosiasi dan kekuatan hubungan dari kedua
variabel yaitu konsentrasi Calcium dan Alakalinitas. Hasil dari perhitungan koefisien
korelasi sebesar 0,041 yang menunjukkan bahwa adanya tidak adanya hubungan
antara konsentrasi Calcium dan Alkalinitas sebesar 0,041 pada signifikansi 0,05.
Diperoleh nilai p-value sebesar > 0,6468 maka H0 diterima, berarti terdapat tidak
hubungan yang signifikan antara konsentrasi Calcium dan Alkalinitas.
Interpretasi nilai r (koef. korelasi) adalah secara teori dapat dilihat pada Tabel 2.
Tabel 2. Kriteria Penafsiran Koefisien Korelasi Menurut D.A De Vaus
6. Buktikan dengan test kesesuaian (aptness) untuk mengecek bahwa model anda
memenuhi asumsi untuk persamaan linier. Berikan penjelasan dari hasil tes aptness
tersebut.
a. Residual vs Fitted
Plot residual vs fitted menjelaskan tentang non linearitas. Plot pada gambar
menjelaskan bahwa terdapat hubungan yang non linier. Dari 194 data yang
digunakan dapat dilihat bahwa terdapat 3 data yang outlier yaitu pada data ke 50,
77, dan 161 tepatnya pada data 50 (state MN), data 77 (state NM) dan data 161
(state MI).
b. Normal Q-Q
Dapat dilihat dari hasil plot normal QQ, garis diagonal dalam grafik
menggambarkan keadaan ideal dari data yang mengikuti distribusi normal dan
terdapat titik-titik yang tidak mengikuti garis, serta terdapat outlier pada data ke
50, 77, dan 161 tepatnya pada data 50 (state MN), data 77 (state NM) dan data
161 (state MI). Maka dapat disimpulkan bahwa distribusi data normal. Hal ini juga
didukung dengan hasil uji normalitas sebelumnya.
c. Scale Location
Scale Location dapat membantu untuk mengidentifikasi homosdasticity. Dapat
dilihat bahwa data tidak homosdasticity yang berarti data tidak menyebar merata.
d. The residuals vs Leverage
The residuals vs Leverage ini dapat membantu mengidentifikasikan data yang
kemungkinan data yang outlier. Dapat terlihat data yang memiliki pengaruh
terbesar pada data ke 67 dan 68 (State NM) dan 164 pada (state MI).
Berdasarkan hasil test kesesuaian, maka disimpulkan bahwa model regresi linier
sederhana tidak dapat digunakan dalam penelitian pengukuran Kualitas Air tanah dari
Proyek Kualitas Air Nasional dari Program Kualitas Air Nasional SuRvei Geologi AS
7. Lakukan tes hipotesis terhadap nilai estimasi ß yang anda peroleh (tuliskan hipotesis
nul dan alternatifnya), berikan hasil tes hipotesis serta narasi kesimpulan (inferensi)
dari hasil test tersebut.
Untuk dapat mengambil kesimpulan dari hipotesis yang telah dibuat, dilakukan
uji t (t-test) untuk membandingkan nilai t-test (t hitung) dengan t statistik (t tabel).
Apabila nilai t hitung < t tabel maka H0 diterima.
Untuk intercept, nilai t statistik didapatkan berdasarkan tabel nilai kritis
distribusi t dengan plot nilai derajat kebebasan (194) dan tingkat kepercayaan 95%
(α=0,025 karena 2 sisi). Kemudian didapatkan nilai t statistik atau t tabel sebesar
1,97227. Hasil perbandingan t hitung (0,917) < t tabel (1,97227) maka H0 diterima,
yang berarti β=0.
Untuk slope, nilai t statistik didapatkan berdasarkan tabel nilai kritis distribusi t
dengan plot nilai derajat kebebasan (194) dan tingkat kepercayaan 95% (α=0,025
karena 2 sisi). Kemudian didapatkan nilai t statistik atau t tabel sebesar 1,97227. Hasil
perbandingan t hitung (0,917 > t tabel (1,97227) maka H0 diterima yang berarti tidak
terdapat bukti bahwa konsentrasi Calciummempengaruhi konsentrasi Loss on Ignition.
Y = 5,935 – 2,182x
Dimana, b0 = 5,935
B1 = -2,182
9. Berikan rentang kepercayaan dari estimasi nilai mean variabel dependen. Di manakah
nilai tersebut memiliki nilai rentang terkecil dan sebutkan alasannya.
Ŷ𝑖 ± 𝑡𝑛−2 . 𝑆𝑌𝑋 . √ℎ
√
1 (X 1−x )²
+
Dimana ℎ𝑖 = n n
∑ ( X 1−x) ²
i=1
Y = 5,935 – 2,182x
Y = 5,935 – 2,182 (19,5)
Y = -36,614
Nilai konsentrasi Alkalinitaspada saat survey selanjutnya apabila nilai konsentrasi
Calcium 19,5 adalah -36,614 atau absolut 36,614.