You are on page 1of 29

Introduction to Survival Analysis

Sarini Abdullah

March 11, 2019

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 1 / 29


The expected outcome

By the end of the lecture, it is expected that students are able to:

1 Explain the unique characteristics of data for survival analysis


2 Comprehend the role of each quantities used in survival analysis

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 2 / 29


What is survival analysis?

Focus of study in survival analysis


Survival time, T , also known as death time.

Properties of survival time, T :

T ≥0
The birth (starting) time is well defined.
The death (end) time is well defined.

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 3 / 29


Historically, survival analysis was developed and used by actuaries and
medical researchers to measure the lifetimes of populations.
What is the expected lifetime of a patient given Drug A? Drug B?
What is the expected residual lifetime of a client, given he applied for
the life insurance at the age of 30?

Qs:
Work with your partner, find more example of cases suitable for survival
analysis.

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 4 / 29


why do survival analysis?

Figure 1: Proporsi orang yang melewati usia tertentu untuk kelahiran 1851 - 2031
di England dan Wales.Sumber: http://healthyfoodscience.com
Sarini Abdullah Introduction to Survival Analysis March 11, 2019 5 / 29
library(survival)
data(leukemia)
dim(leukemia)

## [1] 23 3

Data terdiri dari tiga pengukuran terhadap 23 pasien.

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 6 / 29


names(leukemia)

## [1] "time" "status" "x"

Tiga pengukuran tersebut adalah:

1 Time, menyatakan waktu (dalam bulan) untuk pasien leukemia


mengalami kekambuhan sesudah dinyatakan sembuh.
2 Status: indikator yang menyatakan apakah pasien mengalami
kekambuhan, atau tersensor (tidak kambuh hingga akhir masa studi)
3 X: treatment pasien, apakah tetap menerima kemoterapi (maintained)
atau tidak (non-maintained).

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 7 / 29


Adapun ringkasan datanya adalah sebagai berikut:

## time status x
## Min. : 5.00 Min. :0.0000 Maintained :11
## 1st Qu.: 12.50 1st Qu.:1.0000 Nonmaintained:12
## Median : 23.00 Median :1.0000
## Mean : 29.48 Mean :0.7826
## 3rd Qu.: 33.50 3rd Qu.:1.0000
## Max. :161.00 Max. :1.0000

Ada 11 pasien yang tetap menjalani kemoterapi, dan 12 pasien tidak


menjalani kemoterapi.
Waktu paling cepat pasien keluar dari pengamatan adalah 5 bulan, bisa
karena eventnya sudah teramati (mengalami kekambuhan). Hal ini
dikatakan data teramati. Atau, kemungkinan lain adalah pasien keluar
dari studi karena hal lain walaupun eventnya belum teramati. Dalam
hal ini, data dikatakan tersensor kanan. Waktu survivalnya dapat
ditulis 13+.
Sarini Abdullah Introduction to Survival Analysis March 11, 2019 8 / 29
Cuplikan 5 contoh data adalah sebagai berikut:

head(leukemia, n=5)

## time status x
## 1 9 1 Maintained
## 2 13 1 Maintained
## 3 13 0 Maintained
## 4 18 1 Maintained
## 5 23 1 Maintained

Pasien 1, menjalani kemoterapi, kambuh saat 9 bulan dalam masa


studi.
Pasien 3, menjalani kemoterapi, dan tidak teramati mengalami
kekambuhan selama 13 bulan dalam masa studi. Pasien ini disebut
tersensor kanan.
Sarini Abdullah Introduction to Survival Analysis March 11, 2019 9 / 29
Perbandingan waktu survival berdasarkan treatment
150
100
Waktu survival

50
0

Maintained Nonmaintained

Treatment

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 10 / 29


Analisis apa yang dapat dilakukan pada data
leukemia?

Beberapa informasi yang dapat diperoleh adalah:

1 Bagaimana distribusi dari waktu kekambuhan pasien leukemia?


2 Apakah kemoterapi memberikan efek yang lebih baik, dalam konteks
pasien tidak akan rentan mengalami kekambuhan, dibandingkan
dengan non-kemoterapi?
3 Bagaimana mengukur efek dari kemoterapi terhadap survival
experience dari pasien leukemia?

Hal - hal ini akan dipelajari pada pembahasan berikutnya.

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 11 / 29


2. Data Kidney catheter

Data berupa waktu terjadinya infeksi (yang berulang) di lokasi pemasangan


kateter pada pasien gagal ginjal yang menggunakan peralatan dialisis
portabel. Terdapat tepat 2 kali pengamatan untuk tiap pasien. Ada
kemungkinan hingga saat kateter dilepas pasien tidak mengalami infeksi.
Dalam hal ini, data dikatakan tersensor kanan.
Data ini terdiri dari 6 (+1 pengukuran id) pengukuran terhadap 76 pasien
gagal ginjal. Pengukuran tersebut adalah:

1 time: waktu hingga pasien mengalami infeksi


2 status: 1 jika pasien mengalami infeksi, dan 0 jika data tersensor kanan
3 age: usia pasien (tahun)
4 sex: 1=laki - laki, 2=perempuan
5 disease: tipe penyakit (0=GN, 1=AN, 2=PKD, 3=lainnya)
6 frail: estimasi frailty berdasarkan Gilchrist & Aisbett (1991)

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 12 / 29


Cuplikan 6 data pertama adalah berikut:

## id time status age sex disease frail


## 1 1 8 1 28 1 Other 2.3
## 2 1 16 1 28 1 Other 2.3
## 3 2 23 1 48 2 GN 1.9
## 4 2 13 0 48 2 GN 1.9
## 5 3 22 1 32 1 Other 1.2
## 6 3 28 1 32 1 Other 1.2

1 Pasien pertama: laki - laki, usia 28 tahun, mengalami infeksi 8 dan 16


jam setelah pemasangan kateter.
2 Pasien kedua: perempuan, usia 48 tahun, mengalami infeksi 23 jam
setelah pemasangan kateter yang pertama kali. Akan tetapi, pada
pemasangan kateter kedua kali, hingga kateter dilepas 13 jam dari
pemasangan, ia tidak mengalami infeksi. Waktu survival pasien ini
dapat dituliskan sebagai: 23 dan 13+.
Sarini Abdullah Introduction to Survival Analysis March 11, 2019 13 / 29
500
400
Waktu infeksi

300
200
100
0

1 2

Jenis kelamin

Apakah jenis kelamin dapat menjelaskan cepat/lambatnya pasien akan


mengalami infeksi?
Sarini Abdullah Introduction to Survival Analysis March 11, 2019 14 / 29
500
400
Waktu infeksi

300
200
100
0

Other GN AN PKD

Tipe penyakit

Apakah tipe penyakit dapat menjelaskan cepat/lambatnya pasien akan


mengalami infeksi?
Sarini Abdullah Introduction to Survival Analysis March 11, 2019 15 / 29
500
400
Waktu infeksi

300
200
100
0

10 20 30 40 50 60 70

Usia

Apakah usia dapat menjelaskan cepat/lambatnya pasien akan mengalami


infeksi?
Sarini Abdullah Introduction to Survival Analysis March 11, 2019 16 / 29
Analisis apa yang dapat dilakukan pada data
Kidney?

1 Apakah waktu terjadinya infeksi pada pasien kidney dapat dijelaskan


oleh faktor - faktor: jenis kelamin? tipe penyakit? usia?
2 Bagaimana mengukur efek dari faktor - faktor tersebut?
3 Apakah menguji apakah efek dari faktor - faktor tersebut (jika ada),
signifikan secara statistik?

Hal - hal ini akan dipelajari selanjutnya.

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 17 / 29


3. Data Generator fans

Data berupa waktu rusaknya kipas generator diesel.


Tujuan studi untuk menentukan apakah kipas generator perlu diganti
dengan kipas yang lebih bagus, untuk mencegah kerusakan di masa
mendatang.
Pengamatan dilakukan terhadap 70 generator, kemudian dicatat waktu
(hours) hingga kipasnya rusak (status=1) atau masih bekerja dengan
baik hingga akhir pengamatan (status=0, tersensor kanan).

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 18 / 29


Cuplikan 6 data pertama:

## hours status
## 1 4.5 1
## 2 4.6 0
## 3 11.5 1
## 4 11.5 1
## 5 15.6 0
## 6 16.0 1

1 Generator pertama mengalami kerusakan kipas (status=1) sesudah 4.5


jam dalam masa studi.
2 Generator kedua tetap bekerja dengan baik (status=0) selama 4.6 jam
dalam masa studi. Intepretasi untuk yang lain serupa.
3 Data di atas dapat dituliskan sebagai: 4.5, 4.6+, 11.5, 11.5, 15.6+,
16.0, dengan tanda + menyatakan data tersensor kanan.
Sarini Abdullah Introduction to Survival Analysis March 11, 2019 19 / 29
100
80
Waktu survival

60
40
20

0 1

Status: 0=Tersensor, 1=Kipas rusak

Berdasarkan waktu survivalnya, apakah dapat diduga ada beda karakteristik


antara generator dengan kipas yang rusak dengan yang sebaliknya?
Sarini Abdullah Introduction to Survival Analysis March 11, 2019 20 / 29
4. Data lung cancer
Data survival dari 228 pasien penderita kanker paru - paru stadium lanjut
pada the North Central Cancer Treatment Group (Loprinzi et.al., 1994).
Pengukuran berupa:

1 inst: kode institusi


2 time: waktu survival (hari)
3 status: 1=tersensor (masih hidup di akhir pengamatan), 2= meninggal
4 age: usia (tahun)
5 sex: laki - laki =1, perempuan=2
6 ph.ecog: skor ECOG (0=bagus,5= meninggal)
7 ph.karno: skor Karnofsky (buruk= 0–100 = bagus) berdasarkan
penilaian dokter
8 par.karno: skor Karnofsky berdasarkan penilaian pasien
9 meal.cal: kalori yang dikonsumsi
10 wt.loss: susut berat badan dalam 6 bulan terakhir.
Sarini Abdullah Introduction to Survival Analysis March 11, 2019 21 / 29
Cuplikan 6 data pertama dengan 8 pengukuran (8 kolom pertama)

## inst time status age sex ph.ecog ph.karno pat.karno


## 1 3 306 2 74 1 1 90 100
## 2 3 455 2 68 1 0 90 90
## 3 3 1010 1 56 1 0 90 90
## 4 5 210 2 57 1 1 90 60
## 5 1 883 2 60 1 0 100 90
## 6 12 1022 1 74 1 1 50 80

1 Pasien 1, laki-laki, usia 74 tahun, merasa kondisinya bagus


(pat.karno=100) namun meninggal (status=2) 306 hari setelah masuk
klinik 3 (inst=3).
2 Pasien 2, laki - laki, usia 68 tahun, tetap hidup setelah dalam masa
studi 455 hari di klinik 3.
3 Waktu survival 6 pasien tersebut dapat juga dituliskan: 306, 455,
1010+, 210, 883, 1022+, dengan + menyatakan data tersensor
kanan (hingga di akhir waktu pengamatan pasien masih hidup).
Sarini Abdullah Introduction to Survival Analysis March 11, 2019 22 / 29
1000
800
600
Waktu survival

400
200
0

1 2

Jenis kelamin: 1 = Laki − laki, 2= Perempuan

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 23 / 29


1000
800
600
Waktu survival

400
200
0

40 50 60 70 80

Usia

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 24 / 29


1000
800
600
Waktu survival

400
200
0

0 1 2 3

Skor ECOG

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 25 / 29


1000
800
600
Waktu survival

400
200
0

0 500 1000 1500 2000 2500

Kalori yang dikonsumsi

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 26 / 29


1000
800
600
Waktu survival

400
200
0

1 2 3 4 5 6 7 10 11 12 13 15 16 21 22 26 32 33

Kode institusi

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 27 / 29


1000
800
600
Waktu survival

400
200
0

−20 0 20 40 60

Susut berat badan dalam 6 bulan terakhir

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 28 / 29


Analisis apa yang dapat dilakukan pada data cancer?

1 Apakah ada pengaruh faktor - faktor (usia, jenis kelamin, dan lainnya)
terhadap waktu survival (dalam hal ini waktu kematian) penderita
kanker paru - paru?
2 Bagaimana mengetahui pengaruh faktor - faktor tersebut terhadap
waktu survival pasien?
3 Bagaimana mengukur pengaruh faktor - faktor tersebut?
4 Bagaimana menguji signifikansi dari faktor - faktor tersebut?

Hal - hal inilah yang akan dipelajari selanjutnya pada analisis survival.

Sarini Abdullah Introduction to Survival Analysis March 11, 2019 29 / 29

You might also like