Professional Documents
Culture Documents
Dosen Pengampu:
Anna Chadidjah, Dra., MS.
Disusun oleh:
Ignes Novi Silviani (140610160009)
Aghna Nurshifa (140610160019)
Salsa Nurdini (140610160076)
Desriana Rosya (140610160077)
Friesda Azizah Septianiputri (140610160085)
Kelas : A
Number
Number Number of Number Number of Number
LI LI LI of
of Cases Remissions of Cases Remissions of Cases
Remssions
8 2 0 18 1 1 28 1 1
10 2 0 20 3 2 32 1 0
12 3 0 22 2 1 34 1 1
14 3 0 24 1 0 38 3 2
16 3 0 26 1 1
5.1 Source: Reprinted with permission from E. T. Lee, Computer Prog. Biomed., 4: 80-92,1974.
Jawab:
Diketahui : 𝜶 = −𝟑. 𝟕𝟕𝟕𝟏 ; 𝜷 = 𝟎. 𝟏𝟒𝟒𝟗
Maka :
̂ = 𝟎. 𝟎𝟔𝟖 when 𝑳𝑰 = 𝟖.
a. Show how software obtained 𝝅
Jawab :
𝑒 𝜶+𝜷 (𝑥𝑖 )
𝜋̂𝑖 =
[1 + 𝑒 𝜶+𝜷 (𝑥𝑖 ) ]
𝑒 −3.7771+0.1449(8)
Maka ketika LI = 8, 𝜋̂ = [1+𝑒 −3.7771+0.1449(8)] = 0.068
̂ = 𝟎. 𝟓𝟎 when 𝑳𝑰 = 𝟐𝟔. 𝟎.
b. Show that 𝝅
−∝ ̂ 3.7771
𝜋̂ = 0.50 saat = = 26
𝛽̂ 0.1449
̂ is 0.009 when 𝑳𝑰 = 𝟖 and is 0.036 when 𝑳𝑰 =
c. Show that the rate of change in 𝝅
𝟐𝟔.
𝑒 −3.7771+0.1449(8)
At 𝐿𝐼 = 8, 𝜋̂ = [1+𝑒−3.7771+0.1449(8) ] = 0.068, maka perkiraan perubahan dari peluang
𝑒 −3.7771+0.1449(28)
At 𝐿𝐼 = 28, 𝜋̂ = [1+𝑒 −3.7771+0.1449(28)] = 0.57
Jadi, terbukti bahwa jika LI meningkat sebesar satu satuan, maka besarnya odds
remission akan meningkat sebesar 1.16 kali.
4.2 Refer to the previous exercise. Using information from Table 4.9:
a. Conduct a Wald test for the 𝑳𝑰 effect. Interpret.
Hipotesis:
𝐻0 : 𝛽 = 0 ; LI tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; LI memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
̂ 2
𝛽 0.1449 2
Wald Statistic = 𝑧 2 = (𝑆𝐸) = (0.0593) = 5.96.
4.5 For the 23 space shuttle flights before the Challenger mission disaster in 1986, Table 4.10
shows the temperature (°F) at the time of the flight and whether at least one primary O-
ring suffered thermal distress.
Berdasarkan model diatas, jika suhu berada di titik 31°F maka peluang tekanan termal
sebesar 0.9996.
c. At what temperature does the estimated probability equal 0.50? At that
temperature, give a linear approximation for the change in the estimated
probability per degree increase in temperature.
𝜋̂(𝑥 ) = 15.0429 − 0.2322𝑋
𝑙𝑜𝑔𝑖𝑡(0.50) = 15.0429 − 0.2322𝑋
0.5 15.0429
Karena 𝑙𝑜𝑔𝑖𝑡(0.50) = log ( ) = log(1) = 0, maka 𝑋 = = 64.78
0.5 0.2322
Jadi, peluang tekanan termal akan sebesar 0.50 pada saat suhu berada di titik 64.78°F.
d. Interpret the effect of temperature on the odds of thermal distress.
̂
Saat suhu = , maka 𝑒 𝛽1 = 𝑒 −0.2322 = 0.793
Jadi, jika suhu meningkat sebesar satu satuan, maka besarnya odds dari tekanan termal
akan meningkat sebesar 0.793 kali.
e. Test the hypothesis that temperature has no effect, using (i) the Wald test, (ii) the
likelihood-ratio test.
(i) Wald test
Hipotesis:
𝐻0 : 𝛽 = 0 ; Temperatur tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; Temperatur memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Wald Statistic
Pada software SAS didapat nilai Wald Statistic sebesar 4.6 dengan p-value
sebesar 0.032 dan 𝑑𝑓 = 1.
Kriteria Uji : Tolak H0 jika P-value lebih kecil dari alpha.
Kesimpulan : Dari output diatas didapat P-value sebesar 0.032 yang lebih
kecil dari alpha = 0.05, maka H0 ditolak. Artinya temperatur memberikan efek
yang signifikan terhadap peluang tekanan termal.
(ii) Likelihood-Ratio Test
Hipotesis:
𝐻0 : 𝛽 = 0 ; Temperatur tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; Temperatur memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Likelihood-Ratio Test
Pada software SAS didapat nilai Likelihood-Ratio Test sebesar 7.95 dengan p-
value sebesar 0.0048 dan 𝑑𝑓 = 1.
Kriteria Uji : Tolak H0 jika P-value lebih kecil dari alpha.
Kesimpulan : Dari output diatas didapat P-value sebesar 0.0048 yang lebih
kecil dari alpha = 0.05, maka H0 ditolak. Artinya temperatur memberikan efek
yang signifikan terhadap peluang tekanan termal.
4.7 Hastie and Tibshirani (1990, p. 282) described a study to determine risk factors for
kyphosis, which is severe forward flexion of the spine following corrective spinal
surgery. The age in months at the time of the operation for the 18 subjects for whom
kyphosis was present were 12, 15, 42, 52, 59, 73, 82, 91, 96, 105, 114, 120, 121, 128,
130, 139, 139, 157 and for the 22 subjects for whom kyphosis was absent were 1, 1, 2, 8,
11, 18, 22, 31, 37, 61, 72, 81, 97, 112, 118, 127, 131, 140, 151, 159, 177, 206.
a. Fit a logistic regression model using age as a predictor of whether kyphosis is
present. Test whether age has a significant effect.
Didapat 𝐿𝑜𝑔𝑖𝑡(𝜋̂(𝑥 )) = 𝛼 + 𝛽𝑥 = −0.572693 + 0.004296𝑥 dimana 𝑥 adalah usia.
Untuk menguji apakah usia memberi efek yang signifikan terhadap faktor risiko
terkena kifosis, diuji sebegai berikut:
Hipotesis:
𝐻0 : 𝛽 = 0 ; Usia tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; Usia memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Didapat p-value sebesar 0.463
Kriteria Uji : Tolak H0 jika P-value lebih kecil dari alpha.
Kesimpulan : Dari output diatas didapat P-value sebesar 0.463 yang lebih besar dari
alpha = 0.05, maka H0 diterima. Artinya usia tidak memberikan efek yang signifikan
terhadap faktor risiko terkena kifosis.
b. Plot the data. Note the difference in dispersion of age at the two levels of kyphosis.
Dari plot di atas, terlihat bahwa usia tampak memiliki dispersi yang sedikit lebih
tinggi.
c. Fit the model logit[π(x)] = α + β1x + β2x2. Test the significance of the squared
age term, plot the fit, and interpret. (The final paragraph of Section 4.1.6 is
relevant to these results.
Didapat 𝐿𝑜𝑔𝑖𝑡(𝜋̂(𝑥 )) = −2.0462547 + 0.0600398𝑥 − 0.0003279𝑥 2 .
Dilakukan uji signifikansi sebagai berikut:
Hipotesis:
𝐻0 : 𝛽 = 0 ; Usia tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; Usia memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Didapat p-value sebesar 0.036
Kriteria Uji : Tolak H0 jika P-value lebih kecil dari alpha.
Kesimpulan : Dari output diatas didapat P-value sebesar 0.036 yang lebih kecil dari
alpha = 0.05, maka H0 ditolak. Artinya usia tmemberikan efek yang signifikan
terhadap faktor risiko terkena kifosis.
4.8 For the horseshoe crab data (Table 3.2, available at www.stat.ufl.edu/∼aa/intro-
cda/appendix.html), fit the logistic regression model for 𝜋 = probability of a satellite,
using weight as the predictor.
a. Report the ML prediction equation.
Dengan menggunakan software R, maka diperoleh hasil sebagai berikut :
>
crabs=read.table("http://www.stat.ufl.edu/~dathien/STA6505/crabdata.
txt", header=TRUE)
> attach(crabs)
The following objects are masked _by_ .GlobalEnv:
color, weight
> crabs$Sat=crabs$satellite>0
> crabs$Sat=ifelse(satellite>0,1,0)
> W=(crabs$weight)/1000
> kepiting.1=glm(Sat~W,family=binomial(),data=crabs)
> summary(kepiting.1)
Call:
glm(formula = Sat ~ W, family = binomial(), data = crabs)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.1108 -1.0749 0.5426 0.9122 1.6285
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.6947 0.8802 -4.198 2.70e-05 ***
W 1.8151 0.3767 4.819 1.45e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
̂ at the weight values 1.20, 2.44, and 5.20 kg, which are the sample
b. Find 𝝅
minimum, mean, and maximum.
Dengan menggunakan perhitungan manual, maka diperoleh :
𝑒 −𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 (1.2)
Jika x = 1.2, maka 𝜋̂1.2 = [1+𝑒−𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 (1.2)] = 0.1799657
𝑒 −𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 (2.44)
Jika x = 2.44, maka 𝜋̂2.44 = [1+𝑒−𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 (2.44)] = 0.65757140
𝑒 −𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 (5.2)
Jika x = 5.2, maka 𝜋̂5.2 = [1+𝑒 −𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 (5.2) ] = 0.9968077
Perhitungan ini pun dapat didukung oleh perhitungan dari software R. Dengan
menggunakan software R, maka diperoleh hasil sebagai berikut :
> bb=data.frame(W=c(1.20,2.44,5.20))
> bb
W
1 1.20
2 2.44
3 5.20
> predict(kepiting.1,bb,type="response")
1 2 3
0.1799697 0.6757320 0.9968084
Sehingga akan diperoleh sample minimum sebesar 1.2, mean sebesar 2.44, dan sample
maximum sebesar 5.2 kg.
̂ = 0.50.
c. Find the weight at which 𝝅
𝑒 −𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 𝑋
𝜋̂𝑖 = [1+𝑒 −𝟑.𝟔𝟗𝟓+𝟏.𝟖𝟏𝟓 𝑋] = 0.5
0.5 −3.6933
Karena 𝑙𝑜𝑔𝑖𝑡(0.50) = log (0.5) = log(1) = 0, maka berat (X) = − =
1.8145
2.0355.
Dengan menggunakan software R, maka diperoleh hasil sebagai berikut :
> x=unname(-kepiting.1$coefficients[1]/kepiting.1$coefficients[2])
> x
[1] 2.0355
Maka, berat kepiting betina dengan peluang satellite 0.5 adalah sebesar 2.0355 kg.
d. At the weight value found in (c), give a linear approximation for the estimated
effect of (i) a 1 kg increase in weight. This represents a relatively large increase,
so convert this to the effect of (ii) a 0.10 kg increase, and (iii) a standard deviation
increase in weight (0.58 kg).
(i) Pada X = 2.04, 𝜋̂𝑖 = 0.5
Pada X naik sebesar 1 kg menjadi 3.04, maka 𝜋̂𝑖 = 0.8599825
Dengan menggunakan software R, maka diperoleh hasil sebagai berikut :
> new.x=data.frame(W=x+1)
> predict(kepiting.1,new.x,type="response")
1
0.8599825
Artinya, untuk setiap kenaikan berat kepiting sebesar 1 kg, maka dapat
diprediksi bahwa peluang kepiting memiliki satellite akan naik sebesar
0.3599825.
(ii) Dengan menggunakan software R, maka diperoleh hasil sebagai berikut :
> new.x=data.frame(W=x+0.1)
> predict(kepiting.1,new.x,type="response")
1
0.5452544
Artinya, untuk setiap kenaikan berat kepiting sebesar 0.10 kg, maka dapat
diprediksi bahwa peluang kepiting memiliki satellite akan naik sebesar
0.0452544.
(iii) Dengan menggunakan software R, maka diperoleh hasil sebagai berikut :
> new.x=data.frame(W=x+0.58)
> predict(kepiting.1,new.x,type="response")
1
0.7413091
Artinya, untuk setiap kenaikan berat kepiting sebesar 0.58 kg, maka dapat
diprediksi bahwa peluang kepiting memiliki satellite akan naik sebesar
0.2413091.
e. Construct a 95% confidence interval to describe the effect of weight on the odds
of a satellite. Interpret.
Interval kepercayaan untuk 𝛽 adalah 1.815 ± 1.96(0.3767) = 1.815 ±
0.738332 =[1.077; 2.5535]. Dan interval kepercayaan untuk odds adalah
exp(1.077;2.5535) adalah [2.9;12.9].
Dengan interval kepercayaan 95%, kemungkinan kepiting betina memiliki jantan
yang lain (satellite) meningkat 2.9 sampai dengan 12.9 kali lipat untuk setiap kenaikan
berat kepiting betina sebesar 1kg. Dlam interval tidak mencakup angka 1, maka dapat
disimpulkan bahwa terdapat asosiasi antara berat kepiting betina terhadap banyaknya
kepiting betina yang memiliki jantan lain (satellite).
f. Conduct the Wald or likelihood-ratio test of the hypothesis that weight has no
effect. Report the P-value, and interpret.
(i) Wald test
Hipotesis:
𝐻0 : 𝛽 = 0 ; Berat tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; Berat memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Wald Statistic
Didapat nilai Wald Statistic sebesar 𝑧 2 = 23.4 dengan 𝑑𝑓 = 1.
Kriteria Uji : Tolak H0 jika P-value lebih kecil dari alpha atau 𝑧 2 lebih besar
dari 𝜒 2.
Kesimpulan : Dari output diatas didapat 𝑧 2 = 23.4 yang lebih besar dari
𝜒 2=3.84, maka H0 ditolak. Artinya berat memberikan efek yang signifikan
terhadap peluang satellite.
(ii) Likelihood-Ratio Test
Hipotesis:
𝐻0 : 𝛽 = 0 ; Berat tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; Berat memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Likelihood-Ratio Test
Didapat nilai Likelihood-Ratio Test (D) sebesar 30 dengan 𝑑𝑓 = 1.
Kriteria Uji : Tolak H0 jika P-value lebih kecil dari alpha atau D lebih besar
dari 𝜒 2.
Kesimpulan : Dari output diatas didapat D sebesar 30 yang lebih besar dari
𝜒 2=3.84, maka H0 ditolak. Artinya berat memberikan efek yang signifikan
terhadap peluang satellite.
4.12 Exercise 2.33 mentioned a study in Florida that stated that the death penalty was given
in 19 out of 151 cases in which a white killed a white, in 0 out of 9 cases in which a
white killed a black, in 11 out of 63 cases in which a black killed a white, and in 6 out of
103 cases in which a black killed black. Table 4.11 shows results of fitting a logit model
for death penalty as the response (1 = yes), with defendant’s race (1 = white) and victims’
race (1 = white) as indicator predictors.
a. Based on the parameter estimates, which group is most likely to have the “yes”
response? Estimate the probability in that case.
Pada output diatas terdapat kelompok pelaku/defendant (def) yang memiliki nilai
Estimate sebesar -0.8678, hal ini mengindikasikan bahwa ketika pelaku (defendat)
berasal dari ras berkulit putih maka ada penurunan probabilitas sebesar 0.8678 pada
jawaban “Ya” dibanding ketika pelaku berasal dari ras berkulit hitam. Hal ini juga
menggambarkan bahwa pelaku yang berasal dari ras berkulit hitam lebih sering
terkena hukuman mati.
b. Interpret the parameter estimate for victim’s race.
Pada output diatas terdapat kelompok korban/victim (vic) yang memiliki nilai
Estimate sebesar 2.4044, hal ini mengindikasikan bahwa ketika korban berasal dari
ras berkulit putih terdapat kenaikan pada jawaban “Ya” sebesar 2.4044 kali dibanding
pada saat korban berasal dari ras berkulit hitam. Hal ini menggambarkan bahwa ketika
korban berasal dari ras berkulit putih maka pelakunya lebih mungkin untuk terkena
hukuman mati (apapun ras dari pelakunya) dibanding saat korban berasal dari ras
berkulit hitam.
c. Using information shown, construct and interpret a 95% likelihood-ratio
confidence interval for the conditional odds ratio between the death penalty
verdict and victim’s race.
Berdasarkan output diatas pada bagian Likelihood Ratio 95% Conf. Limits terdapat
batas bagi kelompok korban/victim (vic) yaitu antara 1.3068 dan 3.7175. Maka
interval keperdayaan dari conditional odds ratio antara hukuman mati dengan ras
korban adalah exp(1.3068; 3.7175) = [3.694; 41.161]. Pada interval tersebut tidak
mencakup angka 1 maka dapat disimpulkan bahwa adanya asosiasi antara hukuman
mati dan ras korban.
d. Test the effect of victim’s race, controlling for defendant’s race, using a Wald
test or likelihood-ratio test. Interpret.
Likelihood-Ratio Test
Hipotesis:
𝐻0 : 𝛽 = 0 ; Ras korban tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; Ras korban memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Likelihood-Ratio Test
Pada output tabel 4.11 didapat nilai LR Statistic Chi-Square untuk kelompok def
sebesar 5.01 dengan P-value sebesar 0.0215 dan 𝑑𝑓 = 1.
Kriteria Uji : Tolak H0 jika P-value lebih kecil dari alpha.
Kesimpulan : Dari output diatas didapat P-value sebesar 0.0215 yang lebih kecil dari
alpha = 0.05, maka H0 ditolak. Artinya ras korban memberikan efek yang signifikan
terhadap jatuhnya hukuman mati.
4.17 Refer to the previous exercise. Table 4.14 shows the fit of the model with only E/I and
T/F as predictors.
b. Report and interpret the estimated conditional odds ratio between E/I and the
response.
Odds ratio=𝑒 0.5805 = 1.79.
Jadi, seorang yang ekstrovert lebih sering minum 1.79 kali daripada seorang introvert.
c. Use the limits reported to construct a 95% likelihood-ratio confidence interval
for the conditional odds ratio between E/I and the response. Interpret.
Pada output diatas terlihat pada kolom Likelihood Ratio 95% Conf. Limits untuk E/I
adalah 0.159 dan 1.008, maka interval kepercayaan untuk odds ratio dari E/I adalah
(𝑒 0.159 , 𝑒 1.008) = [1.17; 2.74].
d. The estimates shown use E for the first category of the E/I scale. Suppose you
instead use I for the first category. Then, report the estimated conditional odds
ratio and the 95% likelihood-ratio confidence interval. Interpret.
1
Odds ratio =1.79 = 0.56.
Jad, seorang yang introvert lebih sering minum 0.56 kali daripada seoraang ekstrovert.
1 1
Interval kepercayaan dari odds ratio untuk introvert adalah (2.74 , 1,17) =
[0.36; 0.85].
e. Show steps of a test of whether E/I has an effect on the response, controlling for
T/F. Indicate whether your test is a Wald or a likelihood-ratio test.
Likelihood-Ratio Test
Hipotesis:
𝐻0 : 𝛽 = 0 ; E/I tidak memberikan efek yang signifikan
𝐻1 : 𝛽 ≠ 0 ; E/I memberikan efek yang signifikan
Alpha (α) = 0.05
Statistik Uji :
Likelihood-Ratio Test
Dari output pada tabel 4.14 didapat nilai Chi-Square sebesar 7.28 dengan 𝑑𝑓 = 1 dan
P-value sebesar 0.007.
Kriteria Uji : Tolak H0 jika P-value lebih kecil dari alpha atau D lebih besar dari 𝜒 2.
Kesimpulan : Dari output diatas didapat P-value sebesar 0.007 yang lebih kecil dari
alpha=0.05, maka H0 ditolak. Artinya E/I memberikan efek yang signifikan terhadap
respon T/F.
4.20 Table 4.16 shows results of an eight-center clinical trial to compare a drug to placebo for
curing an infection. At each center, subjects were randomly assigned to groups.
a. Analyze these data, describing and making inference about the group effect,
using logistic regression.
Dengan menggunakan software R, maka diperoleh hasil sebagai berikut :
> treatment=c("Drug","Control")
> Success=c(11,10,16,22,14,7,2,1,6,0,1,0,1,1,4,6)
> Failure=c(25,27,4,10,5,12,14,16,11,12,10,10,4,8,2,1)
> #Tanpa Pembobotan
>
glm2=glm(cbind(Success,Failure)~treatment,family=binomial(),data=
respon)
> summary(glm2)
Call:
glm(formula = cbind(Success, Failure) ~ treatment, family =
binomial(),
data = respon)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.093 -2.491 -0.913 1.594 4.145
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.7142 0.1780 -4.012 6.03e-05 ***
treatmentDrug 0.4040 0.2514 1.607 0.108
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Berdasarkan hasil perhitungan diatas, maka kita memperoleh model regresi logistik
yaitu :
𝑒 𝛽1 +𝛽2𝑥𝑖
𝜋𝑖 =
1 + 𝑒𝛽1 +𝛽2 𝑥𝑖
𝑒 −0.7142+0.4040𝑥𝑖
𝜋𝑖 =
1 + 𝑒 −0.7142+0.4040𝑥𝑖
Nilai taksiran odds ratio antara penggunaan obat dengan respon yaitu 𝑒 0.4040 =
1.498, sehingga dapat disimpulkan bahwa pasien yang diberi obat akan berisiko bebas
dari infeksi 49.8% lebih tinggi daripada pasien yang tidak diberi obat
Kriteria Uji :
Tolak 𝐻0 jika 𝜆2 > 𝜆 𝑡𝑎𝑏𝑒𝑙, terima dalam hal lainnya.
Hasil Analisis :
Response
Center Treatment Sample Odds Ratio 𝜇11𝑘 Var (𝜇11𝑘 )
Success Failure
1 Drug 11 25 1.19 10.36 3.80
Control 10 27
2 Drug 16 4 1.82 14.62 2.47
Control 22 10
3 Drug 14 5 4.80 10.5 2.41
Control 7 12
4 Drug 2 14 2.29 1.45 0.70
Control 1 16
5 Drug 6 11 tak hingga 3.52 1.20
Control 0 12
6 Drug 1 10 tak hingga 0.52 0.25
Control 0 10
7 Drug 1 4 2.0 0.71 0.42
Control 1 8
8 Drug 4 2 0.33 4.62 0.62
Control 6 1
∑ 𝑛11𝑘 = 11 + 16 + 14 + ⋯ + 4 = 55
[55 − 46.3]2
𝐶𝑀𝐻 = ~ 𝜆2
11.87
𝐶𝑀𝐻 = 6.37 ~ 𝜆2
Kesimpulan : Dengan taraf signifikan 5% dapat disimpulkan bahwa nilai 𝜆2 = 6.37 >
𝜆0.05(1) = 3.841 maka 𝐻0 ditolak artinya bahwa Response dengan Treatment
Conditional Dependent untuk center tertentu
4.37 For data from Florida on 𝑌 = whether someone convicted of multiple murders receives
the death penalty (1 = yes, 0 = no), the prediction equation is 𝑙𝑜𝑔𝑖𝑡𝜋̂ = −2.06 +
.87𝑑 − 2.40𝑣, where 𝑑 and 𝑣 are defendant’s race and victims’ race (1 = black, 0 =
white). The following are true–false questions based on the prediction equation.
a. The estimated probability of the death penalty is lowest when the defendant is
white and victims are black.
Answer: Benar
b. Controlling for victims’ race, the estimated odds of the death penalty for white
defendants equal 0.87 times the estimated odds for black defendants. If we
instead let 𝒅 = 𝟏 for white defendants and 0 for black defendants, the estimated
coefficient of 𝒅 would be 𝟏/𝟎. 𝟖𝟕 = 𝟏. 𝟏𝟓 instead of 0.87.
Answer: Salah
c. The lack of an interaction term means that the estimated odds ratio between the
death penalty outcome and defendant’s race is the same for each category of
victims’ race.
Answer: Benar
d. The intercept term −2.06 is the estimated probability of the death penalty when
the defendant and victims were white (i.e., 𝒅 = 𝒗 = 𝟎).
Answer: Salah
e. If there were 500 cases with white victims and defendants, then the model fitted
count (i.e., estimated expected frequency) for the number who receive the death
𝟓𝟎𝟎𝒆−𝟐.𝟎𝟔
penalty equals 𝟏 + 𝒆−𝟐.𝟎𝟔 .
Answer: Benar
Chapter 6
1. Dibawah ini merupakan data tabel 6.1 tentang ukuran panjang 59 aligator Florida (dalam
meter) dan pilihan makanannya.
Data yang dianalisis merupakan data jenis makanan utama yang ditemukan pada 59 perut
buaya alam liar. Terdapat tiga kategori jenis makanan utama, yaitu ikan, invertebrata (siput,
serangga, dan udang), dan lainnya (amfibi, mamalia, tanaman, batu, puing-puing, dan reptil).
Dengan Y = jenis makanan utama dan X = panjangnya ukuran buaya. Pada kasus ini jenis
makanan utama diketahui sebagai respon yang bersifat nominal, dimana kategori lainnya
(other) digunakan sebagai kategori acuan (baseline).
Pada tabel 6.2 terdapat hasil analisis untuk model logit kategori baseline dari data aligator
pada tabel 6.1.
Data yang dianalisis merupakan data jenis makanan utama yang ditemukan pada 59 perut
buaya alam liar. Terdapat tiga kategori jenis makanan utama, yaitu ikan, invertebrata (siput,
serangga, dan udang), dan lainnya (amfibi, mamalia, tanaman, batu, puing-puing, dan reptil).
Dengan Y = jenis makanan utama dan X = panjangnya ukuran buaya. Pada kasus ini jenis
makanan utama diketahui sebagai respon yang bersifat nominal, dimana kategori lainnya
(other) digunakan sebagai kategori acuan (baseline).
𝜋𝑗
𝑙𝑜𝑔𝑖𝑡(𝜋𝑗 ) = 𝑙𝑜𝑔 (𝜋 ) dengan j = 2, …, J.
1
Pada kasus ini berdasarkan output diatas maka didapat model taksiran ML sebagai
berikut:
̂
𝜋 ̂
𝜋
𝑙𝑜𝑔 ( ̂ 𝐹 ) = 1.618 − 0.11𝑥 dan 𝑙𝑜𝑔 (̂ 𝐼 ) = 5.697 − 2.4654𝑥.
𝜋𝑂 𝜋𝑂
Lalu taksiran log odds respon ikan (Fish) dibandingkan invertebrata adalah sebagai
berikut:
̂
𝜋
𝑙𝑜𝑔 ( 𝜋̂𝐹 ) = (1.618 − 6.697) + [−0.11 − (−2.465)]𝑥 = −4.08 + 2.355𝑥.
𝐼
Dari model ini kita bisa melihat bahwa besarnya odds ratio antara ikan dan invertebrata
adalah exp(2.355) = 10.54, artinya setiap buaya (alligator) yang memiliki panjang sebesar x+1
meter, diestimasikan akan memilih makanan ikan (fish) sebesar 10.54 kali dari perkiraan odds
pada alligator sepanjang x meter.
Model taksiran reglog multinom untuk masing-masing kategori pilihan makanan dapat
dinyatakan sebagai berikut:
1
𝜋̂𝑜 = 1+𝑒1.62−0,11𝑥 +𝑒5.7−2.47𝑥 (untuk kategori lainnya (other))
𝑒 1.62−0,11𝑥
𝜋̂𝐹 = 1+𝑒1.62−0,11𝑥 +𝑒5.7−2.47𝑥 (untuk kategori ikan (fish))
𝑒 5.7−2.47𝑥
𝜋̂𝐼 = 1+𝑒1.62−0,11𝑥 +𝑒5.7−2.47𝑥 (untuk kategori invertebrata)
Dari tabel 6.1 dapat dilihat bahwa ukuran maksimal dari panjang aligator pada data
tersebut adalah sebesar 3.89 meter, maka dengan model taksiran diatas, didapat 𝜋̂𝑜 = 0.23, 𝜋̂𝐹
= 0.76, dan 𝜋̂𝐼 = 0.005. Dari ketiga hasil tersebut terlihat bahwa taksiran probabilitas aligator
memilih makanan paling besar adalah untuk kategori ikan (fish), artinya dapat dikatakan bahwa
aligator yang memiliki ukuran lebih panjang akan lebiih memilih untuk memakan ikan
dibanding invertebrata atau lainnya.
Pada bagian Global Null Hypothesis yaitu uji kecocokan model unuk Likelihood-ratio,
score, dan wald.
Dengan hipotesis:
Statistik Uji :
2. Dibawah ini merupakan data tabel 6.7 tentang Ideologi Politik dari Survey Sosial Umum.
Data yang dianalisis merupakan data dari Survey Sosial Umum mengenai kaitan ideologi
politik dengan partai politik. Ideologi politik memiliki lima kategori yang berskala ordinal,
yaitu Very Liberal, Slightly Liberal, Moderate, Slightly Conservative dan Very Conservative.
X merupakan variabel indikator untuk partai politik, x = 1 untuk demokrat dan x = 0 untuk
republik. Regresi logistik multinomial berskala ukur ordinal memiliki beberapa model, yaitu :
Diketahui :
exp(𝛼𝑗 + 𝛽𝑥)
𝑃 (𝑌 ≤ 𝑗 ) =
[1 + exp(𝛼𝑗 + 𝛽𝑥)]
Karena kita memperoleh nilai Standar Errornya pada output di atas, kita juga dapat
mencari taksiran intervalnya sebagai berikut:
CI= ˆ z / 2 SE ˆ
α = 5%
Statistik Uji:
α = 5%
Statistik Uji:
(i) Deviance
Pada output diatas didapat nilai sebesar 3.6877 dan P-value sebesar 0.2972 dan df
sebesar 3.
(ii) Score Test
Pada output diatas didapat nilai sebesar 3.6629 dan P-value sebesar 0.3002 dan df
sebesar 3.
Kesimpulan :
Sehingga dapat disimpulkan bahwa dari kedua pengujian baik statistik devians maupun
pearson didapat P-value lebih besar dari alpha = 0.05 yang berarti H0 diterima, dengan
demikian model yang digunakan sudah cocok.
3. Tabel 6.9 menjelaskan sebuah studi tentang kesehatan mental untuk sampel acak dari
penduduk dewasa di Alachua, Florida. Kelompok respon atau Y adalah gangguan mental yang
bersifat ordinal dengan kategori (baik, pembentukan gejala ringan, pembentukan gejala sedang,
terganggu). Penelitian ini menghubungkan Y = gangguan mental dengan dua variabel penjelas,
yaitu indeks peristiwa kehidupan (X1) adalah ukuran gabungan dari jumlah dan tingkat
keparahan peristiwa kehidupan penting seperti kelahiran anak, pekerjaan baru, perceraian, atau
kematian dalam keluarga yang terjadi pada subjek dalam tiga tahun terakhir. Dalam sampel ini
memiliki rata-rata 4.3 dan standar deviasi 2.7. Status sosial ekonomi/SES (X2) diukur sebagai
biner (1 = tinggi, 0 = rendah). Disajikan tabel penurunan mental disebabkan oleh SES dan
peristiwa kehidupan sebagai berikut:
Pada tabel 6.10 terdapat hasil analisis untuk model logit kumulatif dari data pada tabel
6.9.
Untuk kasus diatas dengan dua buah variabel kovariat X dengan variabel respon
sebanyak J buah yang bersifat ordinal, model kumulatif logit dinyatakan sebagai berikut:
𝑙𝑜𝑔𝑖𝑡[𝑃 (𝑌 ≤ 𝑗)] = 𝛼𝑗 + 𝛽1 𝑋1 + 𝛽2 𝑋2
Estimasi peluang kumulatif pada saat skor peristiwa kehidupan (X1 = 1) dan SES tinggi
(X2 =1) perkiraan peluang gangguan mental adalah exp(1.111) = 3 kali dari estimasi Odds ada
saat SES rendah.
𝒆𝜶𝒋+𝜷𝟏 𝑿𝟏 +𝜷𝟐𝑿𝟐
̂ (𝒀 ≤ 𝒋) =
𝑷
𝟏 + 𝒆𝜶𝒋 +𝜷𝟏𝑿𝟏 +𝜷𝟐 𝑿𝟐
Untuk Y ≤ 1
𝑒 −0.2819−0.3189(1)+1.1112(1)
𝑃̂(𝑌 ≤ 1) = = 0.6249002
1 + 𝑒 −0.2819−0.3189(1)+1.1112(1)
Untuk Y ≤ 2
𝑒 1.2128−0.3189(1)+1.1112(1)
𝑃̂ (𝑌 ≤ 2) = = 0.8813315
1 + 𝑒 1.2128−0.3189(1)+1.1112(1)
Untuk Y ≤ 3
𝑒 2.2094−0.3189(1)+1.1112(1)
𝑃̂ (𝑌 ≤ 3) = = 0.9526509
1 + 𝑒 2.2094−0.3189(1)+1.1112(1)
Dari hasil perhitungan estimasi peluang kumulatif di atas dapat dicari nilai peluangnya
adalah sebagai berikut :
𝜋̂2 = 𝑃̂(𝑌 = 2) = 𝑃̂ (𝑌 ≤ 2) − 𝑃̂ (𝑌 ≤ 1) = 0.2564313
Estimasi peluang untuk seseorang yang mengalami pembentukan gejala ringan dalam
gangguan mental dengan skor peristiwa kehidupan 1 dan SES tinggi adalah sebesar 0.2564.
𝜋̂3 = 𝑃̂(𝑌 = 3) = 𝑃̂ (𝑌 ≤ 3) − 𝑃̂ (𝑌 ≤ 2) = 0.0713194
Estimasi peluang untuk seseorang yang mengalami pembentukan gejala sedang dalam
gangguan mental dengan skor peristiwa kehidupan 1 dan SES tinggi adalah sebesar 0.0713.
Pada bagian Score Test for the Proportional Odds Assumption yaitu uji kecocokan model
dengan Score Test. Dengan hipotesis: