Tugas IV ADK

TUGAS ANALISIS DATA KATEGORI
Exercises Chapter 4 and Chapter 6

Disusun untuk memenuhi salah satu syarat tugas mata kuliah Analisis Data Kategori
Dosen Pengampu:
Anna Chadidjah, Dra., MS.
Disusun oleh:
Ignes Novi Silviani (140610160009)
Aghna Nurshifa (140610160019)
Salsa Nurdini (140610160076)
Desriana Rosya (140610160077)
Friesda Azizah Septianiputri (140610160085)
Kelas : A
PROGRAM STUDI STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS PADJADJARAN
JATINANGOR
2019
Exercises Chapter 4
4.1 A study used logistic regression to determine characteristics associated with Y = whether
a cancer patient achieved remission (1 = yes). The most important explanatory variable
was a labeling index (𝐿𝐼) that measures proliferative activity of cells after a patient
receives an injection of tritiated thymidine. It represents the percentage of cells that are
“labeled.” Table 4.8 shows the grouped data. Software reports Table 4.9 for a logistic
regression model using 𝐿𝐼 𝑡o predict 𝜋 = 𝑃 (𝑌 = 1).
Table 4.8. Data for Exercise 4.1 on Cancer Remission
Number
Number Number of Number Number of Number
LI LI LI of
of Cases Remissions of Cases Remissions of Cases
Remssions
8 2 0 18 1 1 28 1 1
10 2 0 20 3 2 32 1 0
12 3 0 22 2 1 34 1 1
14 3 0 24 1 0 38 3 2
16 3 0 26 1 1
5.1 Source: Reprinted with permission from E. T. Lee, Computer Prog. Biomed., 4: 80-92,1974.
Jawab:
Diketahui : 𝜶 = −𝟑. 𝟕𝟕𝟕𝟏 ; 𝜷 = 𝟎. 𝟏𝟒𝟒𝟗
Maka :
̂ = 𝟎. 𝟎𝟔𝟖 when 𝑳𝑰 = 𝟖.
a. Show how software obtained 𝝅
Jawab :
𝑒 𝜶+𝜷 (𝑥𝑖 )
𝜋̂𝑖 =
[1 + 𝑒 𝜶+𝜷 (𝑥𝑖 ) ]
𝑒 −3.7771+0.1449(8)
Maka ketika LI = 8, 𝜋̂ = [1+𝑒 −3.7771+0.1449(8)] = 0.068
̂ = 𝟎. 𝟓𝟎 when 𝑳𝑰 = 𝟐𝟔. 𝟎.
b. Show that 𝝅
−∝ ̂ 3.7771
𝜋̂ = 0.50 saat = = 26
𝛽̂ 0.1449
̂ is 0.009 when 𝑳𝑰 = 𝟖 and is 0.036 when 𝑳𝑰 =
c. Show that the rate of change in 𝝅
𝟐𝟔.
𝑒 −3.7771+0.1449(8)
At 𝐿𝐼 = 8, 𝜋̂ = [1+𝑒−3.7771+0.1449(8) ] = 0.068, maka perkiraan perubahan dari peluang
per kenaikan x dalam satu satuan adalah 𝛽̂𝜋̂(1 − 𝜋̂) = 0.1449(0.068)(0.932) =

0.009.
𝑒 −3.7771+0.1449(26)
At 𝐿𝐼 = 26, 𝜋̂ = [1+𝑒 −3.7771+0.1449(26)] = 0.5, maka perkiraan perubahan dari peluang
per kenaikan x dalam satu satuan adalah 𝛽̂𝜋̂(1 − 𝜋̂) = 0.1449(0.5)(0.5) =

0.036225
̂ increases
d. The lower quartile and upper quartile for 𝑳𝑰 are 14 and 28. Show that 𝝅
by 0.42, form 0.15 to 0.57, between those values.
𝑒 −3.7771+0.1449(14)
At 𝐿𝐼 = 14, 𝜋̂ = [1+𝑒 −3.7771+0.1449(14)] = 0.15.
𝑒 −3.7771+0.1449(28)
At 𝐿𝐼 = 28, 𝜋̂ = [1+𝑒 −3.7771+0.1449(28)] = 0.57
0.57 – 0.15 = 0.42

e. When 𝑳𝑰 increases by 1, show the estimated odds of remission multiply by 1.16.
̂
Saat LI = 1, maka 𝑒 𝛽1 = 𝑒 0.1449 = 1.16
̂
Saat LI = 2, maka 𝑒 𝛽2 = 𝑒 0.1449(2) = 1.34
̂
Saat LI = 3, maka 𝑒 𝛽3 = 𝑒 0.1449(3) = 1.54
̂ ̂
𝑒 𝛽2 1.34 𝑒 𝛽3 1.54
̂1 = = 1.155 ≈ 1.16 ̂2 = = 1.16
𝑒𝛽 1.16 𝑒𝛽 1.34
Jadi, terbukti bahwa jika LI meningkat sebesar satu satuan, maka besarnya odds
remission akan meningkat sebesar 1.16 kali.
4.2 Refer to the previous exercise. Using information from Table 4.9:
a. Conduct a Wald test for the 𝑳𝑰 effect. Interpret.
Hipotesis:
𝐻0 : 𝛽 = 0 ; LI tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; LI memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
̂ 2
𝛽 0.1449 2
Wald Statistic = 𝑧 2 = (𝑆𝐸) = (0.0593) = 5.96.
Dengan 𝑑𝑓 = 1, 𝑑𝑖𝑑𝑎𝑝𝑎𝑡 𝑃 − 𝑣𝑎𝑙𝑢𝑒 = 0.0146

Kriteria Uji : Tolak H0 jika P-value lebih kecil dari alpha.
Kesimpulan : Dari output diatas didapat P-value sebesar 0.0146 yang lebih kecil dari
alpha = 0.05, maka H0 ditolak. Artinya LI memberikan efek yang signifikan.
b. Construct a Wald confidence interval for the odds ratio corresponding to a 1-
unit increase in 𝑳𝑰. Interpret.
Interval kepercayaan untuk odds ratio adalah exp(𝛽̂1 ± 𝑧1−∝𝑆𝐸𝛽̂1 ).
2
Jika LI = 1, maka exp(0.14492 ± (1.96)(0.0593)) = exp(0.14492 ± 0.116228),

yang akan menghasilkan interval kepercayaan [1.03;1.30]. Jadi, nilai odds of
remission pada saat 𝐿𝐼 = 𝑥 + 1 diestimasi akan jatuh diantara 1.03 dan 1.30 kali dari
dari odds of remission pada saat 𝐿𝐼 = 𝑥.
c. Conduct a likelihood-ratio test for the 𝑳𝑰 effect. Interpret.
Hipotesis:
𝐻0 : 𝛽 = 0 ; LI tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; LI memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Uji Rasio Likelihood
Pada tabel 4.9 terdapat LR Statistic dengan Chi-Square sebesar 8.30.
Dengan 𝑑𝑓 = 1, 𝑑𝑖𝑑𝑎𝑝𝑎𝑡 𝑃 − 𝑣𝑎𝑙𝑢𝑒 = 0.004
Kriteria Uji : Tolak H0 jika P-value lebih kecil dari alpha atau D𝜒 2.
alpha = 0.05 maka H0 ditolak. Artinya LI memberikan efek yang signifikan.
d. Construct the likelihood-ratio confidence interval for the odds ratio. Interpret.
Dari tabel 4.9 di bawah Likelihood Ratio 95% Conf. Limits didapat batas bawah dan
atasnya sebesar 0.0425 dan 0.2846. Maka exp(0.0425;0.2846) = [1.04;1.33]. Nilai
odds of remission pada saat 𝐿𝐼 = 𝑥 + 1 diestimasi akan jatuh di antara 1.04 dan 1.33
kali dari odds of remission pada saat 𝐿𝐼 = 𝑥.
4.5 For the 23 space shuttle flights before the Challenger mission disaster in 1986, Table 4.10
shows the temperature (°F) at the time of the flight and whether at least one primary O-
ring suffered thermal distress.
a. Use logistic regression to model the effect of temperature on the probability of

thermal distress. Interpret the effect.
Dengan software R didapat:
𝑒 𝜶+𝜷 (𝑥𝑖)
𝜋̂𝑖 =
[1+𝑒 𝜶+𝜷 (𝑥𝑖) ]
𝑙𝑜𝑔𝑖𝑡 𝜋̂𝑖 = 𝜶 + 𝜷 𝑋 = 15.0429 − 0.2322𝑋

Dimana 𝜋̂𝑖 adalah peluang dari tekanan termal pada saat suhu tertentu. Jadi, peluang
dari tekanan termal akan turun sebesar 0.2322 seiring dengan kenaikan suhu sebesar
satu satuan.
b. Estimate the probability of thermal distress at 31°F, the temperature at the time
of the Challenger flight.
𝑒 𝟏𝟓.𝟎𝟒𝟐𝟗−𝟎.𝟐𝟑𝟐𝟐 (31)
𝜋̂𝑖 = [1+𝑒𝟏𝟓.𝟎𝟒𝟐𝟗−𝟎.𝟐𝟑𝟐𝟐 (31)] = 0.9996
Berdasarkan model diatas, jika suhu berada di titik 31°F maka peluang tekanan termal
sebesar 0.9996.
c. At what temperature does the estimated probability equal 0.50? At that
temperature, give a linear approximation for the change in the estimated
probability per degree increase in temperature.
𝜋̂(𝑥 ) = 15.0429 − 0.2322𝑋
𝑙𝑜𝑔𝑖𝑡(0.50) = 15.0429 − 0.2322𝑋
0.5 15.0429
Karena 𝑙𝑜𝑔𝑖𝑡(0.50) = log ( ) = log(1) = 0, maka 𝑋 = = 64.78
0.5 0.2322
Jadi, peluang tekanan termal akan sebesar 0.50 pada saat suhu berada di titik 64.78°F.
d. Interpret the effect of temperature on the odds of thermal distress.
̂
Saat suhu = , maka 𝑒 𝛽1 = 𝑒 −0.2322 = 0.793
Jadi, jika suhu meningkat sebesar satu satuan, maka besarnya odds dari tekanan termal
akan meningkat sebesar 0.793 kali.
e. Test the hypothesis that temperature has no effect, using (i) the Wald test, (ii) the
likelihood-ratio test.
(i) Wald test
Hipotesis:
𝐻0 : 𝛽 = 0 ; Temperatur tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; Temperatur memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Wald Statistic
Pada software SAS didapat nilai Wald Statistic sebesar 4.6 dengan p-value
sebesar 0.032 dan 𝑑𝑓 = 1.
Kesimpulan : Dari output diatas didapat P-value sebesar 0.032 yang lebih
kecil dari alpha = 0.05, maka H0 ditolak. Artinya temperatur memberikan efek
yang signifikan terhadap peluang tekanan termal.
(ii) Likelihood-Ratio Test
Hipotesis:
𝐻0 : 𝛽 = 0 ; Temperatur tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; Temperatur memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Likelihood-Ratio Test
Pada software SAS didapat nilai Likelihood-Ratio Test sebesar 7.95 dengan p-
value sebesar 0.0048 dan 𝑑𝑓 = 1.
Kesimpulan : Dari output diatas didapat P-value sebesar 0.0048 yang lebih
kecil dari alpha = 0.05, maka H0 ditolak. Artinya temperatur memberikan efek
yang signifikan terhadap peluang tekanan termal.
4.7 Hastie and Tibshirani (1990, p. 282) described a study to determine risk factors for
kyphosis, which is severe forward flexion of the spine following corrective spinal
surgery. The age in months at the time of the operation for the 18 subjects for whom
kyphosis was present were 12, 15, 42, 52, 59, 73, 82, 91, 96, 105, 114, 120, 121, 128,
130, 139, 139, 157 and for the 22 subjects for whom kyphosis was absent were 1, 1, 2, 8,
11, 18, 22, 31, 37, 61, 72, 81, 97, 112, 118, 127, 131, 140, 151, 159, 177, 206.
a. Fit a logistic regression model using age as a predictor of whether kyphosis is
present. Test whether age has a significant effect.
Didapat 𝐿𝑜𝑔𝑖𝑡(𝜋̂(𝑥 )) = 𝛼 + 𝛽𝑥 = −0.572693 + 0.004296𝑥 dimana 𝑥 adalah usia.
Untuk menguji apakah usia memberi efek yang signifikan terhadap faktor risiko
terkena kifosis, diuji sebegai berikut:
Hipotesis:
𝐻0 : 𝛽 = 0 ; Usia tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; Usia memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Didapat p-value sebesar 0.463
Kesimpulan : Dari output diatas didapat P-value sebesar 0.463 yang lebih besar dari
alpha = 0.05, maka H0 diterima. Artinya usia tidak memberikan efek yang signifikan
terhadap faktor risiko terkena kifosis.
b. Plot the data. Note the difference in dispersion of age at the two levels of kyphosis.
Dari plot di atas, terlihat bahwa usia tampak memiliki dispersi yang sedikit lebih
tinggi.
c. Fit the model logit[π(x)] = α + β1x + β2x2. Test the significance of the squared
age term, plot the fit, and interpret. (The final paragraph of Section 4.1.6 is
relevant to these results.
Didapat 𝐿𝑜𝑔𝑖𝑡(𝜋̂(𝑥 )) = −2.0462547 + 0.0600398𝑥 − 0.0003279𝑥 2 .
Dilakukan uji signifikansi sebagai berikut:
Hipotesis:
𝐻0 : 𝛽 = 0 ; Usia tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; Usia memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Didapat p-value sebesar 0.036
alpha = 0.05, maka H0 ditolak. Artinya usia tmemberikan efek yang signifikan
terhadap faktor risiko terkena kifosis.
4.8 For the horseshoe crab data (Table 3.2, available at www.stat.ufl.edu/∼aa/intro-
cda/appendix.html), fit the logistic regression model for 𝜋 = probability of a satellite,
using weight as the predictor.
a. Report the ML prediction equation.
Dengan menggunakan software R, maka diperoleh hasil sebagai berikut :
>
crabs=read.table("http://www.stat.ufl.edu/~dathien/STA6505/crabdata.
txt", header=TRUE)
> attach(crabs)
The following objects are masked _by_ .GlobalEnv:
color, weight
The following objects are masked from crabs (pos = 3):
color, satellite, spine, weight, width

> crabs$Sat=crabs$satellite>0
> crabs$Sat=ifelse(satellite>0,1,0)
> W=(crabs$weight)/1000
> kepiting.1=glm(Sat~W,family=binomial(),data=crabs)
> summary(kepiting.1)
Call:
glm(formula = Sat ~ W, family = binomial(), data = crabs)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.1108 -1.0749 0.5426 0.9122 1.6285
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.6947 0.8802 -4.198 2.70e-05 ***
W 1.8151 0.3767 4.819 1.45e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 225.76 on 172 degrees of freedom

Residual deviance: 195.74 on 171 degrees of freedom
AIC: 199.74
Number of Fisher Scoring iterations: 4
𝑒 𝜶+𝜷 (𝑥𝑖) 𝑒 −𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 𝑋

Didapat 𝜋̂𝑖 = = [1+𝑒−𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 𝑋]
[1+𝑒 𝜶+𝜷 (𝑥𝑖) ]
Maka model prediksi ML yang diperoleh adalah sebagai berikut :

𝑙𝑜𝑔𝑖𝑡(𝜋̂) = −3.695 + 1.815𝑋.
Dimana 𝜋 adalah peluang dari satellite dan X adalah berat.
̂ at the weight values 1.20, 2.44, and 5.20 kg, which are the sample
b. Find 𝝅
minimum, mean, and maximum.
Dengan menggunakan perhitungan manual, maka diperoleh :
𝑒 −𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 (1.2)
Jika x = 1.2, maka 𝜋̂1.2 = [1+𝑒−𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 (1.2)] = 0.1799657
𝑒 −𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 (2.44)
Jika x = 2.44, maka 𝜋̂2.44 = [1+𝑒−𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 (2.44)] = 0.65757140
𝑒 −𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 (5.2)
Jika x = 5.2, maka 𝜋̂5.2 = [1+𝑒 −𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 (5.2) ] = 0.9968077
Perhitungan ini pun dapat didukung oleh perhitungan dari software R. Dengan
menggunakan software R, maka diperoleh hasil sebagai berikut :
> bb=data.frame(W=c(1.20,2.44,5.20))
> bb
W
1 1.20
2 2.44
3 5.20
> predict(kepiting.1,bb,type="response")
1 2 3
0.1799697 0.6757320 0.9968084
Sehingga akan diperoleh sample minimum sebesar 1.2, mean sebesar 2.44, dan sample
maximum sebesar 5.2 kg.
̂ = 0.50.
c. Find the weight at which 𝝅
𝑒 −𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 𝑋
𝜋̂𝑖 = [1+𝑒 −𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 𝑋] = 0.5
0.5 −3.6933
Karena 𝑙𝑜𝑔𝑖𝑡(0.50) = log (0.5) = log(1) = 0, maka berat (X) = − =
1.8145
2.0355.
> x=unname(-kepiting.1$coefficients[1]/kepiting.1$coefficients[2])
> x
[1] 2.0355
Maka, berat kepiting betina dengan peluang satellite 0.5 adalah sebesar 2.0355 kg.
d. At the weight value found in (c), give a linear approximation for the estimated
effect of (i) a 1 kg increase in weight. This represents a relatively large increase,
so convert this to the effect of (ii) a 0.10 kg increase, and (iii) a standard deviation
increase in weight (0.58 kg).
(i) Pada X = 2.04, 𝜋̂𝑖 = 0.5
Pada X naik sebesar 1 kg menjadi 3.04, maka 𝜋̂𝑖 = 0.8599825
> new.x=data.frame(W=x+1)
> predict(kepiting.1,new.x,type="response")
1
0.8599825
Artinya, untuk setiap kenaikan berat kepiting sebesar 1 kg, maka dapat
diprediksi bahwa peluang kepiting memiliki satellite akan naik sebesar
0.3599825.
(ii) Dengan menggunakan software R, maka diperoleh hasil sebagai berikut :
> new.x=data.frame(W=x+0.1)
1
0.5452544
Artinya, untuk setiap kenaikan berat kepiting sebesar 0.10 kg, maka dapat
0.0452544.
(iii) Dengan menggunakan software R, maka diperoleh hasil sebagai berikut :
> new.x=data.frame(W=x+0.58)
1
0.7413091
Artinya, untuk setiap kenaikan berat kepiting sebesar 0.58 kg, maka dapat
0.2413091.
e. Construct a 95% confidence interval to describe the effect of weight on the odds
of a satellite. Interpret.
Interval kepercayaan untuk 𝛽 adalah 1.815 ± 1.96(0.3767) = 1.815 ±
0.738332 =[1.077; 2.5535]. Dan interval kepercayaan untuk odds adalah
exp(1.077;2.5535) adalah [2.9;12.9].
Dengan interval kepercayaan 95%, kemungkinan kepiting betina memiliki jantan
yang lain (satellite) meningkat 2.9 sampai dengan 12.9 kali lipat untuk setiap kenaikan
berat kepiting betina sebesar 1kg. Dlam interval tidak mencakup angka 1, maka dapat
disimpulkan bahwa terdapat asosiasi antara berat kepiting betina terhadap banyaknya
kepiting betina yang memiliki jantan lain (satellite).
f. Conduct the Wald or likelihood-ratio test of the hypothesis that weight has no
effect. Report the P-value, and interpret.
(i) Wald test
Hipotesis:
𝐻0 : 𝛽 = 0 ; Berat tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; Berat memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Wald Statistic
Didapat nilai Wald Statistic sebesar 𝑧 2 = 23.4 dengan 𝑑𝑓 = 1.
Kriteria Uji : Tolak H0 jika P-value lebih kecil dari alpha atau 𝑧 2 lebih besar
dari 𝜒 2.
Kesimpulan : Dari output diatas didapat 𝑧 2 = 23.4 yang lebih besar dari
𝜒 2=3.84, maka H0 ditolak. Artinya berat memberikan efek yang signifikan
terhadap peluang satellite.
(ii) Likelihood-Ratio Test
Hipotesis:
𝐻0 : 𝛽 = 0 ; Berat tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; Berat memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Didapat nilai Likelihood-Ratio Test (D) sebesar 30 dengan 𝑑𝑓 = 1.
Kriteria Uji : Tolak H0 jika P-value lebih kecil dari alpha atau D lebih besar
dari 𝜒 2.
Kesimpulan : Dari output diatas didapat D sebesar 30 yang lebih besar dari
𝜒 2=3.84, maka H0 ditolak. Artinya berat memberikan efek yang signifikan
terhadap peluang satellite.
4.12 Exercise 2.33 mentioned a study in Florida that stated that the death penalty was given
in 19 out of 151 cases in which a white killed a white, in 0 out of 9 cases in which a
white killed a black, in 11 out of 63 cases in which a black killed a white, and in 6 out of
103 cases in which a black killed black. Table 4.11 shows results of fitting a logit model
for death penalty as the response (1 = yes), with defendant’s race (1 = white) and victims’
race (1 = white) as indicator predictors.
a. Based on the parameter estimates, which group is most likely to have the “yes”
response? Estimate the probability in that case.
Pada output diatas terdapat kelompok pelaku/defendant (def) yang memiliki nilai
Estimate sebesar -0.8678, hal ini mengindikasikan bahwa ketika pelaku (defendat)
berasal dari ras berkulit putih maka ada penurunan probabilitas sebesar 0.8678 pada
jawaban “Ya” dibanding ketika pelaku berasal dari ras berkulit hitam. Hal ini juga
menggambarkan bahwa pelaku yang berasal dari ras berkulit hitam lebih sering
terkena hukuman mati.
b. Interpret the parameter estimate for victim’s race.
Pada output diatas terdapat kelompok korban/victim (vic) yang memiliki nilai
Estimate sebesar 2.4044, hal ini mengindikasikan bahwa ketika korban berasal dari
ras berkulit putih terdapat kenaikan pada jawaban “Ya” sebesar 2.4044 kali dibanding
pada saat korban berasal dari ras berkulit hitam. Hal ini menggambarkan bahwa ketika
korban berasal dari ras berkulit putih maka pelakunya lebih mungkin untuk terkena
hukuman mati (apapun ras dari pelakunya) dibanding saat korban berasal dari ras
berkulit hitam.
c. Using information shown, construct and interpret a 95% likelihood-ratio
confidence interval for the conditional odds ratio between the death penalty
verdict and victim’s race.
Berdasarkan output diatas pada bagian Likelihood Ratio 95% Conf. Limits terdapat
batas bagi kelompok korban/victim (vic) yaitu antara 1.3068 dan 3.7175. Maka
interval keperdayaan dari conditional odds ratio antara hukuman mati dengan ras
korban adalah exp(1.3068; 3.7175) = [3.694; 41.161]. Pada interval tersebut tidak
mencakup angka 1 maka dapat disimpulkan bahwa adanya asosiasi antara hukuman
mati dan ras korban.
d. Test the effect of victim’s race, controlling for defendant’s race, using a Wald
test or likelihood-ratio test. Interpret.
Hipotesis:
𝐻0 : 𝛽 = 0 ; Ras korban tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; Ras korban memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Pada output tabel 4.11 didapat nilai LR Statistic Chi-Square untuk kelompok def
sebesar 5.01 dengan P-value sebesar 0.0215 dan 𝑑𝑓 = 1.
alpha = 0.05, maka H0 ditolak. Artinya ras korban memberikan efek yang signifikan
terhadap jatuhnya hukuman mati.
4.17 Refer to the previous exercise. Table 4.14 shows the fit of the model with only E/I and
T/F as predictors.
̂ for someone of personality type introverted and feeling.

a. Find 𝝅
𝑒 𝜶+𝜷𝟏 (𝑥1)+𝜷𝟐(𝑥2) 𝑒 −2.83+0.58(0)+0.597(0)
𝜋̂𝑖 = [1+𝑒𝜶+𝜷𝟏 (𝑥1)+𝜷𝟐(𝑥2) ] =1+𝑒−2.83+0.58(0)+0.597(0) = 0.056
b. Report and interpret the estimated conditional odds ratio between E/I and the
response.
Odds ratio=𝑒 0.5805 = 1.79.
Jadi, seorang yang ekstrovert lebih sering minum 1.79 kali daripada seorang introvert.
c. Use the limits reported to construct a 95% likelihood-ratio confidence interval
for the conditional odds ratio between E/I and the response. Interpret.
Pada output diatas terlihat pada kolom Likelihood Ratio 95% Conf. Limits untuk E/I
adalah 0.159 dan 1.008, maka interval kepercayaan untuk odds ratio dari E/I adalah
(𝑒 0.159 , 𝑒 1.008) = [1.17; 2.74].
d. The estimates shown use E for the first category of the E/I scale. Suppose you
instead use I for the first category. Then, report the estimated conditional odds
ratio and the 95% likelihood-ratio confidence interval. Interpret.
1
Odds ratio =1.79 = 0.56.
Jad, seorang yang introvert lebih sering minum 0.56 kali daripada seoraang ekstrovert.
1 1
Interval kepercayaan dari odds ratio untuk introvert adalah (2.74 , 1,17) =
[0.36; 0.85].
e. Show steps of a test of whether E/I has an effect on the response, controlling for
T/F. Indicate whether your test is a Wald or a likelihood-ratio test.
Hipotesis:
𝐻0 : 𝛽 = 0 ; E/I tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; E/I memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Dari output pada tabel 4.14 didapat nilai Chi-Square sebesar 7.28 dengan 𝑑𝑓 = 1 dan
P-value sebesar 0.007.
Kriteria Uji : Tolak H0 jika P-value lebih kecil dari alpha atau D lebih besar dari 𝜒 2.
alpha=0.05, maka H0 ditolak. Artinya E/I memberikan efek yang signifikan terhadap
respon T/F.
4.20 Table 4.16 shows results of an eight-center clinical trial to compare a drug to placebo for
curing an infection. At each center, subjects were randomly assigned to groups.
a. Analyze these data, describing and making inference about the group effect,
using logistic regression.
> treatment=c("Drug","Control")
> Success=c(11,10,16,22,14,7,2,1,6,0,1,0,1,1,4,6)
> Failure=c(25,27,4,10,5,12,14,16,11,12,10,10,4,8,2,1)
> #Tanpa Pembobotan
>
glm2=glm(cbind(Success,Failure)~treatment,family=binomial(),data=
respon)
> summary(glm2)
Call:
glm(formula = cbind(Success, Failure) ~ treatment, family =
binomial(),
data = respon)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.093 -2.491 -0.913 1.594 4.145
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.7142 0.1780 -4.012 6.03e-05 ***
treatmentDrug 0.4040 0.2514 1.607 0.108
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)

Null deviance: 93.555 on 15 degrees of freedom
Residual deviance: 90.960 on 14 degrees of freedom
AIC: 133.35
Number of Fisher Scoring iterations: 4
Berdasarkan hasil perhitungan diatas, maka kita memperoleh model regresi logistik
yaitu :
𝑒 𝛽1 +𝛽2𝑥𝑖
𝜋𝑖 =
1 + 𝑒𝛽1 +𝛽2 𝑥𝑖
𝑒 −0.7142+0.4040𝑥𝑖
𝜋𝑖 =
1 + 𝑒 −0.7142+0.4040𝑥𝑖
Nilai taksiran odds ratio antara penggunaan obat dengan respon yaitu 𝑒 0.4040 =
1.498, sehingga dapat disimpulkan bahwa pasien yang diberi obat akan berisiko bebas
dari infeksi 49.8% lebih tinggi daripada pasien yang tidak diberi obat
b. Conduct the Cochran–Mantel–Haenszel test. Specify the hypotheses, report the

P-value, and interpret.
Hipotesis:
𝐻0 : 𝜃𝑥𝑦(𝑘) = 1, ∀ 𝑘 (Response dengan Treatment Conditional Independent untuk
center tertentu).
𝐻1 : 𝜃𝑥𝑦(𝑘) ≠ 1, 𝑢𝑛𝑡𝑢𝑘 𝑏𝑒𝑏𝑒𝑟𝑎𝑝𝑎 𝑘 (Response dengan Treatment Conditional
Dependent untuk center tertentu).
Alpha (𝛼) : 5%
Statistik Uji :
Cochran Mantel Haenszel
2
[∑𝐾(𝑛11𝑘 −𝜇11𝑘 )]
𝐶𝑀𝐻 = ∑𝑘 𝑉𝑎𝑟(𝑛11𝑘 )
~ 𝜆2
Kriteria Uji :
Tolak 𝐻0 jika 𝜆2 > 𝜆 𝑡𝑎𝑏𝑒𝑙, terima dalam hal lainnya.
Hasil Analisis :
Response
Center Treatment Sample Odds Ratio 𝜇11𝑘 Var (𝜇11𝑘 )
Success Failure
1 Drug 11 25 1.19 10.36 3.80
Control 10 27
2 Drug 16 4 1.82 14.62 2.47
Control 22 10
3 Drug 14 5 4.80 10.5 2.41
Control 7 12
4 Drug 2 14 2.29 1.45 0.70
Control 1 16
5 Drug 6 11 tak hingga 3.52 1.20
Control 0 12
6 Drug 1 10 tak hingga 0.52 0.25
Control 0 10
7 Drug 1 4 2.0 0.71 0.42
Control 1 8
8 Drug 4 2 0.33 4.62 0.62
Control 6 1
∑ 𝑛11𝑘 = 11 + 16 + 14 + ⋯ + 4 = 55
∑ 𝜇11𝑘 = 10.36 + 14.62 + ⋯ + 4.62 = 46.3
∑ 𝑣𝑎𝑟(𝑛11𝑘 ) = 3.80 + 2.47 + ⋯ + 0.62 = 11.87

2
[∑𝐾(𝑛11𝑘 −𝜇11𝑘 )]
Maka 𝐶𝑀𝐻 = ∑𝑘 𝑉𝑎𝑟(𝑛11𝑘 )
~ 𝜆2
[55 − 46.3]2
𝐶𝑀𝐻 = ~ 𝜆2
11.87
𝐶𝑀𝐻 = 6.37 ~ 𝜆2
Dimana 𝜆0.05(1) = 3.841
Sehingga 𝜆2 = 6.37 > 𝜆0.05(1) = 3.841 maka 𝐻0 ditolak.
Kesimpulan : Dengan taraf signifikan 5% dapat disimpulkan bahwa nilai 𝜆2 = 6.37 >
𝜆0.05(1) = 3.841 maka 𝐻0 ditolak artinya bahwa Response dengan Treatment
Conditional Dependent untuk center tertentu
4.37 For data from Florida on 𝑌 = whether someone convicted of multiple murders receives
the death penalty (1 = yes, 0 = no), the prediction equation is 𝑙𝑜𝑔𝑖𝑡𝜋̂ = −2.06 +
.87𝑑 − 2.40𝑣, where 𝑑 and 𝑣 are defendant’s race and victims’ race (1 = black, 0 =
white). The following are true–false questions based on the prediction equation.
a. The estimated probability of the death penalty is lowest when the defendant is
white and victims are black.
Answer: Benar
b. Controlling for victims’ race, the estimated odds of the death penalty for white
defendants equal 0.87 times the estimated odds for black defendants. If we
instead let 𝒅 = 𝟏 for white defendants and 0 for black defendants, the estimated
coefficient of 𝒅 would be 𝟏/𝟎. 𝟖𝟕 = 𝟏. 𝟏𝟓 instead of 0.87.
Answer: Salah
c. The lack of an interaction term means that the estimated odds ratio between the
death penalty outcome and defendant’s race is the same for each category of
victims’ race.
Answer: Benar
d. The intercept term −2.06 is the estimated probability of the death penalty when
the defendant and victims were white (i.e., 𝒅 = 𝒗 = 𝟎).
Answer: Salah
e. If there were 500 cases with white victims and defendants, then the model fitted
count (i.e., estimated expected frequency) for the number who receive the death
𝟓𝟎𝟎𝒆−𝟐.𝟎𝟔
penalty equals 𝟏 + 𝒆−𝟐.𝟎𝟔 .
Answer: Benar
Chapter 6
1. Dibawah ini merupakan data tabel 6.1 tentang ukuran panjang 59 aligator Florida (dalam
meter) dan pilihan makanannya.
Data yang dianalisis merupakan data jenis makanan utama yang ditemukan pada 59 perut
buaya alam liar. Terdapat tiga kategori jenis makanan utama, yaitu ikan, invertebrata (siput,
serangga, dan udang), dan lainnya (amfibi, mamalia, tanaman, batu, puing-puing, dan reptil).
Dengan Y = jenis makanan utama dan X = panjangnya ukuran buaya. Pada kasus ini jenis
makanan utama diketahui sebagai respon yang bersifat nominal, dimana kategori lainnya
(other) digunakan sebagai kategori acuan (baseline).
Pada tabel 6.2 terdapat hasil analisis untuk model logit kategori baseline dari data aligator
pada tabel 6.1.
Data yang dianalisis merupakan data jenis makanan utama yang ditemukan pada 59 perut
buaya alam liar. Terdapat tiga kategori jenis makanan utama, yaitu ikan, invertebrata (siput,
serangga, dan udang), dan lainnya (amfibi, mamalia, tanaman, batu, puing-puing, dan reptil).
Dengan Y = jenis makanan utama dan X = panjangnya ukuran buaya. Pada kasus ini jenis
makanan utama diketahui sebagai respon yang bersifat nominal, dimana kategori lainnya
(other) digunakan sebagai kategori acuan (baseline).
Bagian Analysis of Maximum Likelihood Estimates menunjukkan estimate, standard

error, wald chi-square, dan p-value. Dari output ini kita dapat membentuk model logit. Maka
model logit dengan satu kovariat X untuk kategori selain kategori acuan dapat dinyatakan
sebagai berikut:
𝜋𝑗
𝑙𝑜𝑔𝑖𝑡(𝜋𝑗 ) = 𝑙𝑜𝑔 (𝜋 ) dengan j = 2, …, J.
1
Pada kasus ini berdasarkan output diatas maka didapat model taksiran ML sebagai
berikut:
̂
𝜋 ̂
𝜋
𝑙𝑜𝑔 ( ̂ 𝐹 ) = 1.618 − 0.11𝑥 dan 𝑙𝑜𝑔 (̂ 𝐼 ) = 5.697 − 2.4654𝑥.
𝜋𝑂 𝜋𝑂
Lalu taksiran log odds respon ikan (Fish) dibandingkan invertebrata adalah sebagai
berikut:
̂
𝜋
𝑙𝑜𝑔 ( 𝜋̂𝐹 ) = (1.618 − 6.697) + [−0.11 − (−2.465)]𝑥 = −4.08 + 2.355𝑥.
𝐼
Dari model ini kita bisa melihat bahwa besarnya odds ratio antara ikan dan invertebrata
adalah exp(2.355) = 10.54, artinya setiap buaya (alligator) yang memiliki panjang sebesar x+1
meter, diestimasikan akan memilih makanan ikan (fish) sebesar 10.54 kali dari perkiraan odds
pada alligator sepanjang x meter.
Model taksiran reglog multinom untuk masing-masing kategori pilihan makanan dapat
dinyatakan sebagai berikut:
1
𝜋̂𝑜 = 1+𝑒1.62−0,11𝑥 +𝑒5.7−2.47𝑥 (untuk kategori lainnya (other))
𝑒 1.62−0,11𝑥
𝜋̂𝐹 = 1+𝑒1.62−0,11𝑥 +𝑒5.7−2.47𝑥 (untuk kategori ikan (fish))
𝑒 5.7−2.47𝑥
𝜋̂𝐼 = 1+𝑒1.62−0,11𝑥 +𝑒5.7−2.47𝑥 (untuk kategori invertebrata)
Dari tabel 6.1 dapat dilihat bahwa ukuran maksimal dari panjang aligator pada data
tersebut adalah sebesar 3.89 meter, maka dengan model taksiran diatas, didapat 𝜋̂𝑜 = 0.23, 𝜋̂𝐹
= 0.76, dan 𝜋̂𝐼 = 0.005. Dari ketiga hasil tersebut terlihat bahwa taksiran probabilitas aligator
memilih makanan paling besar adalah untuk kategori ikan (fish), artinya dapat dikatakan bahwa
aligator yang memiliki ukuran lebih panjang akan lebiih memilih untuk memakan ikan
dibanding invertebrata atau lainnya.
Pada bagian Global Null Hypothesis yaitu uji kecocokan model unuk Likelihood-ratio,
score, dan wald.
Dengan hipotesis:
𝐻0 : 𝛽1 = 𝛽2 = 0 ; Pilihan makanan independen dengan panjang aligator

𝐻1 : paling sedikit ada satu tanda “=” yang berlaku ; Pilihan makanan dependen dengan
panjang alligator.
Alpha (α) = 0.05
Statistik Uji :
(i) Likelihood-Ratio Test

Pada output diatas didapat nilai Chi-Square sebesar 16.8006 dan P-value sebesar
0.0002 dan df sebesar 2.
(ii) Score Test
(iii) Wald Test
Kesimpulan : Dari output diatas didapat P-value dari semua pengujian adalah lebih
kecil dari alpha = 0.05, maka H0 ditolak. Artinya pilihan makanan dependen dengan panjang
alligator.
Pada output diatas terdapat 95% Wald Confidence Limits. Untuk kategori makanan ikan,
interval kepercayaan jatuh diantara 0.325 sampai dengan 2.468. Dengan tingkat kepercayaan
sebesar 95% , interval kepercayaan odds ratio untuk memilih memakan ikan adalah antara
0.325 sampai dengan 2.468 kali dibanding memilih untuk memakan makanan lainnya.
Sedangkan untuk kategori makanan invertebrata, interval kepercayaan jatuh diantara
0.015 sampai dengan 0.496. Dengan tingkat kepercayaan sebesar 95% , interval kepercayaan
odds ratio untuk memilih memakan invertebrata adalah antara 0.015 sampai dengan 0.496 kali
dibanding memilih untuk memakan makanan lainnya.
2. Dibawah ini merupakan data tabel 6.7 tentang Ideologi Politik dari Survey Sosial Umum.
Data yang dianalisis merupakan data dari Survey Sosial Umum mengenai kaitan ideologi
politik dengan partai politik. Ideologi politik memiliki lima kategori yang berskala ordinal,
yaitu Very Liberal, Slightly Liberal, Moderate, Slightly Conservative dan Very Conservative.
X merupakan variabel indikator untuk partai politik, x = 1 untuk demokrat dan x = 0 untuk
republik. Regresi logistik multinomial berskala ukur ordinal memiliki beberapa model, yaitu :
 Cumulative Logit Models

 Proportional Odds Ratio
 Adjacents Categories Logit
 Continuation Ratio Logit.
Diketahui :
Yj = Ideologi politik (Very Liberal, Slightly Liberal, Moderate, Slightly Conservative,

and Very Conservative)
Xi = Afiliasi partai politik (Democrate and Republic)

Dari output diatas didapat nilai estimate 𝛽̂ = 0.975 dan SE = 0.129. Untuk setiap j,
estimasi odds yang menyatakan respon Democrat pada arah liberal dibanding konserfatif
adalah exp(0.975) = 2.65 kali daripada estimasi odds untuk Republicans. Jadi dapat
disimpulkan bahwa Democrats cenderung lebih liberal dibanding Republicans.
Model kumulatif dapat dinyatakan sebagai berikut:
exp(𝛼𝑗 + 𝛽𝑥)
𝑃 (𝑌 ≤ 𝑗 ) =
[1 + exp(𝛼𝑗 + 𝛽𝑥)]
̂ 1 = −2.469, estimasi peluang kumulatif untuk Democrats (x = 1) adalah

Untuk ∝
exp(−2.469 + 0.975(1))
𝑃̂(𝑌 ≤ 1) = = 0.18
[1 + exp(−2.469 + 0.975(1))]
Dengan cara yang sama, maka didapat 𝑃̂(𝑌 ≤ 2) = 0.38, 𝑃̂ (𝑌 ≤ 3) = 0.77 dan
𝑃̂(𝑌 ≤ 4) = 0.89.
e−2,469+0,9745(1)
𝑃̂ (Y ≤ 1) = = 0,1833
1 + e−2,469+0,9745(1)
e−1,4745+0,9745(1)
𝑃̂(Y ≤ 2) = = 0,3776
1 + e−1,4745+0,9745(1)
e0,2371+0,9745(1)
𝑃̂ (Y ≤ 1) = = 0,7706
1 + e0,2371+0,9745(1)
e1,0695+0,9745(1)
𝑃̂ (Y ≤ 1) = = 0,8853
1 + e1,0695+0,9745(1)
Dengan estimasi peluang kumulatif dimana Democrats adalah sebagai moderat adalah
sebagai berikut:
̂ (𝑌 = 3) = 𝑃
𝜋̂3 = 𝑃 ̂ (𝑌 ≤ 3) − 𝑃
̂ (𝑌 ≤ 2) = 0.393
Karena kita memperoleh nilai Standar Errornya pada output di atas, kita juga dapat
mencari taksiran intervalnya sebagai berikut:

CI= ˆ  z / 2  SE ˆ
CI= 0.975  1.96  0.129

̂ adalah
Sehingga taksiran interval untuk β
CI=[0,72 ; 1,23]
̂ terletak diantara 0,72 sampai
Dengan tingkat kepercayaan sebesar 95%, nilai taksiran β
dengan 1,23.
CI(Odds Ratio) = [𝑒 0,72 ; 𝑒 1,23 ]
CI=[2,1; 3,4]
Maka, dengan tingkat kepercayaan sebesar 95%, nilai taksiran Odds Ratio dari peluang
kumulatif terletak diantara 2,1 sampai dengan 3,4. Hal ini menggambarkan bahwa odds pada
tingkat akhir dari liberal pada skala ideologi politik setidaknya dua kali lebih tinggi untuk
Democrats dibandingkan Republicans.
Pada bagian Testing Global Null Hypothesis, hasil output tersebut untuk mengetahui
apakah secara umum variabel independent berpengaruh terhadap variable dependen. Dengan
hipotesis sebagai berikut:
H 0 :   0 ; (afiliasi partai politik tidak berpengaruh terhadap ideologi politik)
H1 :   0 ; (afiliasi partai politik berpengaruh terhadap ideologi politik)
α = 5%
Statistik Uji:
(i) Likelihood-Ratio Test

Pada output diatas didapat nilai Chi-Square sebesar 58.6451 dan P-value lebih
kecil dari 0.0001 dan df sebesar 1.
(ii) Score Test
(iii) Wald Test
Kesimpulan : Dari output diatas didapat P-value dari semua pengujian adalah lebih
kecil dari alpha = 0.05, maka H0 ditolak. Artinya dengan tingkat kepercayaan sebesar 95%
bahwa afiliasi partai politik berpengaruh terhadap ideologi politik.
Pada bagian Deviance and Pearson Goodness of Fit Statistics terdapat uji kecocokan
model dengan menggunakan statistik devians atau pearson. Dengan hipotesis sebagai berikut:
H 0 : (model yang digunakan sudah cocok/fit )
H1 : (ada model lain yang lebih cocok)
α = 5%
Statistik Uji:
(i) Deviance
Pada output diatas didapat nilai sebesar 3.6877 dan P-value sebesar 0.2972 dan df
sebesar 3.
(ii) Score Test
Pada output diatas didapat nilai sebesar 3.6629 dan P-value sebesar 0.3002 dan df
sebesar 3.
Kriteria Uji : Tolak H0 jika p-value ≤ α, terima dalam hal lainnya.
Kesimpulan :
Sehingga dapat disimpulkan bahwa dari kedua pengujian baik statistik devians maupun
pearson didapat P-value lebih besar dari alpha = 0.05 yang berarti H0 diterima, dengan
demikian model yang digunakan sudah cocok.
3. Tabel 6.9 menjelaskan sebuah studi tentang kesehatan mental untuk sampel acak dari
penduduk dewasa di Alachua, Florida. Kelompok respon atau Y adalah gangguan mental yang
bersifat ordinal dengan kategori (baik, pembentukan gejala ringan, pembentukan gejala sedang,
terganggu). Penelitian ini menghubungkan Y = gangguan mental dengan dua variabel penjelas,
yaitu indeks peristiwa kehidupan (X1) adalah ukuran gabungan dari jumlah dan tingkat
keparahan peristiwa kehidupan penting seperti kelahiran anak, pekerjaan baru, perceraian, atau
kematian dalam keluarga yang terjadi pada subjek dalam tiga tahun terakhir. Dalam sampel ini
memiliki rata-rata 4.3 dan standar deviasi 2.7. Status sosial ekonomi/SES (X2) diukur sebagai
biner (1 = tinggi, 0 = rendah). Disajikan tabel penurunan mental disebabkan oleh SES dan
peristiwa kehidupan sebagai berikut:
Pada tabel 6.10 terdapat hasil analisis untuk model logit kumulatif dari data pada tabel
6.9.
Untuk kasus diatas dengan dua buah variabel kovariat X dengan variabel respon
sebanyak J buah yang bersifat ordinal, model kumulatif logit dinyatakan sebagai berikut:
𝑙𝑜𝑔𝑖𝑡[𝑃 (𝑌 ≤ 𝑗)] = 𝛼𝑗 + 𝛽1 𝑋1 + 𝛽2 𝑋2
Dimana berdasarkan output diatas diperoleh nilai intercept yaitu 𝛼1 = −0.2819, 𝛼2 =

1.2128, 𝛼3 = 2.2094 serta nilai 𝛽̂1 = −0.319 dan 𝛽̂2 = 1.111. Maka bentuk persamannya
dalah sebagai berikut:
 Untuk Y ≤ 1, 𝑙𝑜𝑔𝑖𝑡[𝑃(𝑌 ≤ 1)] = −0.2819 − 0.3189𝑋1 + 1.1112𝑋2

 Untuk Y ≤ 2, 𝑙𝑜𝑔𝑖𝑡[𝑃(𝑌 ≤ 2)] = 1.2128 − 0.3189𝑋1 + 1.1112𝑋2
 Untuk Y ≤ 3, 𝑙𝑜𝑔𝑖𝑡[𝑃(𝑌 ≤ 3)] = 2.2094 − 0.3189𝑋1 + 1.1112𝑋2
Estimasi peluang kumulatif pada saat skor peristiwa kehidupan (X1 = 1) dan SES tinggi
(X2 =1) perkiraan peluang gangguan mental adalah exp(1.111) = 3 kali dari estimasi Odds ada
saat SES rendah.
𝒆𝜶𝒋+𝜷𝟏 𝑿𝟏 +𝜷𝟐𝑿𝟐
̂ (𝒀 ≤ 𝒋) =
𝑷
𝟏 + 𝒆𝜶𝒋 +𝜷𝟏𝑿𝟏 +𝜷𝟐 𝑿𝟐
 Untuk Y ≤ 1
𝑒 −0.2819−0.3189(1)+1.1112(1)
𝑃̂(𝑌 ≤ 1) = = 0.6249002
1 + 𝑒 −0.2819−0.3189(1)+1.1112(1)
 Untuk Y ≤ 2
𝑒 1.2128−0.3189(1)+1.1112(1)
𝑃̂ (𝑌 ≤ 2) = = 0.8813315
1 + 𝑒 1.2128−0.3189(1)+1.1112(1)
 Untuk Y ≤ 3
𝑒 2.2094−0.3189(1)+1.1112(1)
𝑃̂ (𝑌 ≤ 3) = = 0.9526509
1 + 𝑒 2.2094−0.3189(1)+1.1112(1)
Dari hasil perhitungan estimasi peluang kumulatif di atas dapat dicari nilai peluangnya
adalah sebagai berikut :
𝜋̂2 = 𝑃̂(𝑌 = 2) = 𝑃̂ (𝑌 ≤ 2) − 𝑃̂ (𝑌 ≤ 1) = 0.2564313
Estimasi peluang untuk seseorang yang mengalami pembentukan gejala ringan dalam
gangguan mental dengan skor peristiwa kehidupan 1 dan SES tinggi adalah sebesar 0.2564.
𝜋̂3 = 𝑃̂(𝑌 = 3) = 𝑃̂ (𝑌 ≤ 3) − 𝑃̂ (𝑌 ≤ 2) = 0.0713194
Estimasi peluang untuk seseorang yang mengalami pembentukan gejala sedang dalam
gangguan mental dengan skor peristiwa kehidupan 1 dan SES tinggi adalah sebesar 0.0713.
Pada bagian Score Test for the Proportional Odds Assumption yaitu uji kecocokan model
dengan Score Test. Dengan hipotesis:
𝐻0 = Setiap efek adalah sama untuk setiap model logit kumulatif

𝐻1 = Setiap efek adalah tidak sama untuk setiap logit kumulatif
Alpha (α)= 0.05
Statistik Uji :
Pada output tabel 6.10 didapat Chi-Square sebesar 2.3255 dengan P-value sebesar 0.6761
dan df = 4.
Kesimpulan : Dari output diatas didapat P-value adalah lebih besar dari alpha = 0.05,
maka H0 diterima. Artinya setiap efek adalah sama untuk setiap model logit kumulatif atau
lebih kompleks model tersebut, maka tidak akan menjadi lebih baik secara signifikan.
Interval kepercayaan untuk 𝛽̂1 = −0.3189 dapat dibentuk sebagai berikut:
𝐶𝐼 = 𝛽̂1 ± 𝑍𝛼 × 𝑆𝐸
2
𝐶𝐼 = −0.3189 ± 1.96 × 0.1210

𝐶𝐼 = [−0.55606 ; −0.08174]
Dengan tingkat kepercayaan sebesar 95% diperoleh interval kepercayaan untuk 𝛽̂1 adalah
antara -0.55606 sampai dengan -0.08174.
𝐶𝐼 = [𝑒 −0.55606 ; 𝑒 −0.08174]
𝐶𝐼 = [0.5734641 ; 0.9215115]
Dengan tingkat kepercayaan sebesar 95% , skor peristiwa kehidupan pada tingkat SES
yang tinggi, perkiraan peluang gangguan mental di bawah tingkat tetap mana pun adalah antara
0.5734641 sampai dengan 0.9215115 kali dari perkiraan peluang skor peristiwa kehidupan
yang rendah. Dalam interval ini tidak mencakup angka 1 maka dapat disimpulkan bahwa
terdapat asosiasi antara gangguan mental dengan skor peristiwa kehidupan.
Sedangkan untuk 𝛽̂2 = 1.1112, interval kepercayaan dapat dibentuk sebagai berikut:
𝐶𝐼 = 𝛽̂1 ± 𝑍𝛼 × 𝑆𝐸
2
𝐶𝐼 = 1.1112 ± 1.96 × 0.6109

𝐶𝐼 = [−0.086164 ; 2.308564]
Dengan tingkat kepercayaan sebesar 95% diperoleh interval kepercayaan untuk 𝛽̂1 adalah
antara -0.086164 sampai dengan 2.308564.
𝐶𝐼 = [𝑒 −0.086164 ; 𝑒 2.308564 ]
𝐶𝐼 = [0.9174438 ; 10.05997]
Dengan tingkat kepercayaan sebesar 95% , skor peristiwa kehidupan pada tingkat SES
yang tinggi, perkiraan peluang gangguan mental di bawah tingkat tetap mana pun adalah antara
0.9174438 sampai dengan 10.05997 kali dari perkiraan peluang SES yang rendah. Dalam
interval ini mencakup angka 1 maka dapat disimpulkan bahwa tidak terdapat asosiasi antara
gangguan mental dengan SES.

Tugas IV ADK

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Tugas IV ADK

Uploaded by

Copyright:

Available Formats

TUGAS ANALISIS DATA KATEGORI

Exercises Chapter 4 and Chapter 6

PROGRAM STUDI STATISTIKA

per kenaikan x dalam satu satuan adalah 𝛽̂𝜋̂(1 − 𝜋̂) = 0.1449(0.068)(0.932) =

per kenaikan x dalam satu satuan adalah 𝛽̂𝜋̂(1 − 𝜋̂) = 0.1449(0.5)(0.5) =

0.57 – 0.15 = 0.42

Dengan 𝑑𝑓 = 1, 𝑑𝑖𝑑𝑎𝑝𝑎𝑡 𝑃 − 𝑣𝑎𝑙𝑢𝑒 = 0.0146

Jika LI = 1, maka exp(0.14492 ± (1.96)(0.0593)) = exp(0.14492 ± 0.116228),

a. Use logistic regression to model the effect of temperature on the probability of

𝑙𝑜𝑔𝑖𝑡 𝜋̂𝑖 = 𝜶 + 𝜷 𝑋 = 15.0429 − 0.2322𝑋

The following objects are masked from crabs (pos = 3):

color, satellite, spine, weight, width

The following objects are masked from crabs (pos = 4):

color, satellite, spine, weight, width

The following objects are masked from crabs (pos = 5):

color, satellite, spine, weight, width

color, satellite, spine, weight, width

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 225.76 on 172 degrees of freedom

Number of Fisher Scoring iterations: 4

𝑒 𝜶+𝜷 (𝑥𝑖) 𝑒 −𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 𝑋

Maka model prediksi ML yang diperoleh adalah sebagai berikut :

̂ for someone of personality type introverted and feeling.

(Dispersion parameter for binomial family taken to be 1)

Number of Fisher Scoring iterations: 4

b. Conduct the Cochran–Mantel–Haenszel test. Specify the hypotheses, report the

∑ 𝜇11𝑘 = 10.36 + 14.62 + ⋯ + 4.62 = 46.3

∑ 𝑣𝑎𝑟(𝑛11𝑘 ) = 3.80 + 2.47 + ⋯ + 0.62 = 11.87

Dimana 𝜆0.05(1) = 3.841

Sehingga 𝜆2 = 6.37 > 𝜆0.05(1) = 3.841 maka 𝐻0 ditolak.

Bagian Analysis of Maximum Likelihood Estimates menunjukkan estimate, standard

𝐻0 : 𝛽1 = 𝛽2 = 0 ; Pilihan makanan independen dengan panjang aligator

(i) Likelihood-Ratio Test

 Cumulative Logit Models

Yj = Ideologi politik (Very Liberal, Slightly Liberal, Moderate, Slightly Conservative,

Xi = Afiliasi partai politik (Democrate and Republic)

Model kumulatif dapat dinyatakan sebagai berikut:

̂ 1 = −2.469, estimasi peluang kumulatif untuk Democrats (x = 1) adalah

CI= 0.975  1.96  0.129

H 0 :   0 ; (afiliasi partai politik tidak berpengaruh terhadap ideologi politik)

H1 :   0 ; (afiliasi partai politik berpengaruh terhadap ideologi politik)

(i) Likelihood-Ratio Test

H 0 : (model yang digunakan sudah cocok/fit )

H1 : (ada model lain yang lebih cocok)

Kriteria Uji : Tolak H0 jika p-value ≤ α, terima dalam hal lainnya.

Dimana berdasarkan output diatas diperoleh nilai intercept yaitu 𝛼1 = −0.2819, 𝛼2 =

 Untuk Y ≤ 1, 𝑙𝑜𝑔𝑖𝑡[𝑃(𝑌 ≤ 1)] = −0.2819 − 0.3189𝑋1 + 1.1112𝑋2

𝐻0 = Setiap efek adalah sama untuk setiap model logit kumulatif

𝐶𝐼 = −0.3189 ± 1.96 × 0.1210

𝐶𝐼 = 1.1112 ± 1.96 × 0.6109

You might also like