You are on page 1of 4

Design consideration

2.1 introduction

Dalam bab ini kontras longitudinal studi cross-sectional dan kami dari perspektif desain.
Sebagaimana dibahas dalam Bab 1, keuntungan utama dari studi longitudinal adalah
kemampuannya untuk membedakan-sectional dan longitudinal hubungan silang antara variabel
penjelas dan tanggapannya. Harga yang terkait dengan keuntungan ini adalah biaya yang lebih
tinggi potensi dikeluarkan oleh sampling berulang individu. Pada tahap desain, kita bisa
mendapatkan keuntungan dari guestimates dari ukuran potensi bas dari studi cross-sectional
dan peningkatan ketepatan kesimpulan dari studi longitudinal. Informasi ini kemudian dapat
ditimbang baik secara formal maupun informal terhadap biaya tambahan sampling diulang.
Kemudian jika studi longitudinal dipilih, kita harus memilih jumlah orang dan jumlah
pengukuran pada masing-masing.

Dalam bagian 2.2 dan 2.3 kita menghitung potensi bias dari cross-sectional serta efisiensi relatif
sebuah studi longitudinal. Bagian 2.4 menyajikan perhitungan ukuran sampel saat variabel
respon baik kontinyu atau dikotomis.

2.2 bias

Sebagai pembahasan contoh membaca pada bagian 1.4 menunjukkan, itu adalah mungkin
untuk asosiasi antara variabel penjelas, x, dan respon, Y, ditentukan dari studi cross-sectional
menjadi sangat berbeda dengan asosiasi yang diukur dalam studi longitudinal.

Kita mulai pelajaran kita bias oleh meresmikan gagasan ini dengan menggunakan model dari
bagian 2.4. mempertimbangkan variabel respon yang baik perubahan dari waktu ke waktu dan
bervariasi atas subyek. Contohnya termasuk umur, tekanan darah, atau berat. Mengadopsi
notasi diberikan pada bagian 1.3, kita mulai dengan model bentuk

Y ij =β 0 + βx ij + ϵ ij , j=1 , … , n ; i=1 , … ,m .(2.2.1)

Re-mengekspresikan (2.2.1) sebagai

Y ij =β 0 + βx i1 + β ( x ij−x i 1 ) +ϵ ij ,(2.2 .2)

Kami mencatat bahwa model ini secara implisit mengasumsikan bahwa cross-sectional efek
akibat x i1 adalah sama dengan efek longitudinal diwakili oleh x-ij x i1 di tangan sebelah kanan.
Asumsi ini bukan satu yang kuat dan pasti gagal dalam banyak studi. Model ini dapat
dimodifikasi dengan memungkinkan setiap orang untuk memiliki mencegat mereka sendiri, β oi,
yaitu dengan mengganti β 0 + β xi1 dengan β 0i sehingga

Y ij =β 0 + β ( x ij −x i 1 )+ ϵ ij ,(2.2.3)
Kedua (2.2.1) dan (2.2.3) merupakan kasus yang ekstrim untuk memodelkan cross-sectional
variasi dalam variabel respon pada awal. Dalam kasus yang pertama, kita menganggap bahwa
cross-sectional asosiasi dengan x i1 adalah sama dengan efek membujur; dalam kasus surat,
tingkat baseline boleh berbeda untuk setiap orang. An dan sering lebih efektif cara menengah
untuk memodifikasi (2.2.1) adalah dengan mengasumsikan bentuk model

Y ij =β 0 + βx Cxi1 + β L ( x ij −x i 1) + ϵ ij ,(2.2.4)

Seperti yang disarankan dalam bagian 1.4. dimasukkannya x i1 pada model dengan terpisah C
koefisien β memungkinkan baik-sectional dan longitudinal efek silang untuk diperiksa secara
terpisah. Kita juga dapat menggunakan formulir ini untuk menguji apakah-sectional dan
longitudinal efek salib jelas variabel terutama adalah sama, yaitu, apakah β C = β L. Dari sudut
pandang kedua, satu hanya dapat melihat x i1 sebagai variabel pengganggu yang mungkin tidak
bias perkiraan kami dari efek longitudinal benar.

Kita sekarang menguji bias-kuadrat dari perkiraan paling β diturunkan dari model (2.2.1).
perkiraan adalah
m n

∑ ∑ ( xij −x́ )( y ij− ý)


^β= i=1 j=1
,
m n
2
∑ ∑ ( x ij −x́)
i=1 j=1

Dimana x́=∑ x ij /(nm) dan x́=∑ y ij /(nm). Dimana model aslinya pada (2.2.4), mengakibatkan
ij ij

∑ ❑ n ( x i1− x́1 ) ( x́ i−x́ )


E ( ^β )= β L + i=1 m n

∑ ∑❑¿¿¿
i=1 j=1

Where x́ i=∑ x ij /n and x́ 1=∑ x i 1 /m. Thus the cross-sectional estimate ^β , which assumes βC=βL, is a
j i

biased estimated of βL and is unbiased only if either βC=βL, or the variables { x i 1 } and { x́ i } are orthogonal
to each other. The latter result is of no surprise if one re-expresses (2.2.4) as

Y ij =β 0 + β Lxij + x i 1 ( β C −β ¿ ¿ L)+ ϵ ij ,(2.2 .5)¿

In this re-expression, (2.2.1) is seen as a special case of (2.2.4) where the variable x i1 has been omitted
from the model.

The direction of the bias in ^β as a estimate from the longitudinal effect, βL, depends upon the
correlation between xi1 and ^x i, as is clear from the expression for E( β^ ) above. The main message to be
conveyed here is that when dealing with covariates which change over time and vary across subjects at
the baseline, it is good practice to use model (2.2.4) instead of (2.2.1). the former model allows one to
separate the longitudinal effect, which describes individual change, from the cross-sectional effect
where comparison on Y is made between individuals with different x’s.

2.3 efficiency

The previous section addressed the issue of bias in cross-sectional studies of change. Even when βC=βL,
longitudinal studies tend to be more powerful, as we now examine in detail. Assuming the model
specified in (2.2.1), the variance of ^
β C, which uses the data from the first visit only, is
m
Var ( ^β C )=σ 2 / ∑ ¿ ¿ ¿
i=1

Where σ 2=Var (ϵ ij ). On the other hand, the variances of ^β L , which uses all the data, is the lower right
entry of

σ 2¿ ¿

Where Ri is the nixni correlation matrix for Yi=(Yi1,…,Yin) and

X 'i = 1 … 1
( xi 1 … x¿ )
We can address the question of how much more can be learned by taking repeated measurements on
each person by comparing the variances of ^β L and ^β C in (2.2.5) when βC=βL. we use e=Var( ^β L )/Var( ^β C)
as the specific measure of efficiency. The smaller the value of e the greater is the information gained by
taking additional measurements on each person.

As expected, the value of e depends on the true structure of the correlation matrix. We consider two
correlation matrices commonly occurring in longitudinal studies. For simplicity, we continue to assume
ni=n for all i.

In case 1, we assume the uniform correlation matrix, R jk=1 if j=k and Rjk=ρ for any j≠k. The e function
defined above then reduces to

{1+(n−1) ρ } (1− ρ)
e=
n(1+ δ ) {1−p+ nρδ /(1+ δ) }

Where

the averaged within−subject variation∈ x


δ=
the between−subjects variation∈ x at visit 1
∑ (x ij− x́ i)2 / { m(n−1)}
i,j
¿
∑ ( x́ i−x́ )2 /(m−1)
i

Figure 2.1 gives plot of e against δ for some selected values of ρ and n. Except when δ is small and the
common correlation ρ is high, there is much to be gained by conducting longitudinal studies even when
the number of repeated observations is as small as two.
|j−k|
In case 2, we consider the situation when the true correlation matrix has the form R jk =ρ . This is the
correlation structure of a first order autoregressive process discussed in chapter 5. In this case

1−ρ2
e=
( 1−ρ ) { n−( n−2 ) ρ }+ δγ /(n+ 1)

Where γ=n(n+1)-2(n-3)(n+1)ρ+(n-3)(n-2)ρ2. The message regarding efficiency gain is similar as can be


seen in fig. 2.2.

We note that in either case, e is a decreasing function of δ. One implication for design is that we may
obtain a more efficient (less variable) estimate of β by increasing the within-subject variation in x when
possible. Suppose xij is the age of person i at visit j so that β represent the time rate of change of the
response variable. With three observations for each person, it is better, all of other factors being
equal, to arrange the visits at years 0, 1, and 3 rather than 0, 1, and 2. In the former design, the
within-subject variation in x is {(0-4/3)2+(1-4/3)2+(3-4/3)2}/3=1,45 as opposed to {(0-1)2+(1-
1)2+(2-1)2}/3=0,67 in the letter case. The efficiency for the former design depends on the type of
correlation structure, the magnitude of ρ, and the between-subject variation in x at visit 1 (the
denominator of δ). For example, with exchangeable correlation structure with ρ=0,5 and the
between-subject variation at visit one equal to 10, the variance of ^β for the (0,1,3) design I only
78% of that for the 0,1,2) design. In other words, delaying the last visit from year two to year three
is equivalent to increasing the number of persons in the study by a factor of 0,78 -1=1,28.

You might also like