Professional Documents
Culture Documents
Tarea 1 Analisis de Sobrevivencia
Tarea 1 Analisis de Sobrevivencia
Mariella Tognarelli
2022-08-23
Pregunta 1
En un estudio se aplicó un veneno a 40 ratones para evaluar su efectividad. El per-
sonal acargo realizó un seguimiento vigilando los animales cada 5 minutos hasta que todos
muerieron, reportando la siguiente tabla
1
Consideraciones: Sabiendo que se observó la administración del veneno y la muerte de todos
los ratones, se sabe que los datos son incesgados, por lo que, para estimar la función de
sobrevivencia, densidad y riesgo, se pueden emplear las siguientes fórmulas
̂
1. Densidad (𝑓𝑥 (𝑡)) : 𝑁𝑥 (𝑡)
#𝐸𝑣𝑒𝑛𝑡𝑜𝑠•Δ𝑥
̂
2. Sobrevivencia (𝑆𝑥 (𝑡)) : 𝑅𝑥 (𝑡)
#𝑇 𝑜𝑡𝑎𝑙𝐼𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑜𝑠
̂
3. Riesgo (𝜆𝑥 (𝑡)) : 𝑅𝑥 (𝑡)
#𝑇 𝑜𝑡𝑎𝑙𝐼𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑜𝑠
Al realizar los respectivos cálculos para cada intervalo de tiempo, se obtienen los siguientes valores:
Donde:
2
Función de Densidad
5 10
10 15
0.03
0 5 20 25
15 20 25 30 35
0.02
fx
45 50
40 45
0.01
35 40
0.00
0 10 20 30 40 50
Tiempo
3
Función de Sobrevivencia
0 5
1.00
5 10
0.75
10 15
15 20
Sx(t)
0.50
20 25
25 30
0.25 30 35
35 40 45
45 50
0 10 20 30 40 50
Tiempo
4
Función de Riesgo
45 50
0.20
0.15
Riesgo
0.10
30 35
40 45
25 30
20 25
0.05 10 15
5 10 15 20
0 5
35 40
0.00
0 10 20 30 40 50
Tiempo
P.D. : Lo siento, no logré poner los 3 gráficos uno al lado del otro con ggplot:(, sólo me resulta con funciones
del R, como plot() xd
5
Pregunta 2
Sean 𝑇1 , . . . , 𝑇𝑛 variables aleatorias i.i.d. con función de riesgo común 𝜆(𝑡). Veri-
fique que la función de hazard de T = min(𝑇1 , . . . , 𝑇𝑛 ), digamos 𝜆𝑇 (𝑡), está dada por 𝑛𝜆(𝑡).
En primer lugar, hay que saber cuáles son las funciones de densidad y acumulada de la función mínima para
variables aleatorias entregadas.
Para ello, por definición de independencia, sabemos que:
𝑛
𝐹𝑇 (𝑡) = 1 − ∏ (1 − 𝐹𝑖 (𝑡))
𝑖=1
De la cual se derivan:
𝑛
1. 1 − 𝐹𝑇 (𝑡) = ∏𝑖=1 (1 − 𝐹𝑖 (𝑡))
𝑛 𝑛
2. 𝑓𝑇 (𝑡) = 𝑓1 (𝑡) ∏𝑖≠1 (1 − 𝐹𝑖 (𝑡)) + ... + 𝑓𝑛 (𝑡) ∏𝑖≠𝑛 (1 − 𝐹𝑖 (𝑡))
Una vez esto entendido, se procede a emplear la definición de la tasa de riesgo. Nota: Recordar que para
obtener la función de densidad en base a la acumulada, se debe derivar
𝑓𝑖 (𝑡) 𝑓𝑖 (𝑡)
Se sabe que: 𝜆𝑖 (𝑡) = 𝑆𝑖 (𝑡) = 1−𝐹𝑖 (𝑡)
Donde se obtiene:
𝑛 𝑛
𝑓𝑇 (𝑡) = 𝜆1 (𝑡)(1 − 𝐹1 (𝑡))(𝑡) ∏ (1 − 𝐹𝑖 (𝑡)) + ... + 𝜆𝑛 (𝑡)(1 − 𝐹𝑛 (𝑡))(𝑡) ∏ (1 − 𝐹𝑖 (𝑡))
𝑖≠1 𝑖≠𝑛
Factorizando se obtiene:
𝑛 𝑛
(∑ 𝜆𝑖 (𝑡)) ∏ (1 − 𝐹𝑖 (𝑡))
𝑖=1 𝑖=1
𝑓𝑖 (𝑡)
Luego, al reemplazar los valores en 𝜆𝑖 (𝑡) = 1−𝐹𝑖 (𝑡) :
𝑛 𝑛
(∑𝑖=1𝜆𝑖 (𝑡)) ∏𝑖=1 (1−𝐹𝑖 (𝑡))
𝜆𝑇 (𝑡) = 𝑛
(∏𝑖=1 (1−𝐹𝑖 (𝑡))
𝑛
𝜆𝑇 (𝑡) = ∑ 𝜆𝑖 (𝑡)
𝑖=1
Consiguiendo la demostración:
𝑛
𝜆𝑇 (𝑡) = ∑ 𝜆(𝑡) = 𝑛𝜆
𝑖=1
6
Pregunta 3
Considere seis individuos de una cohorte para la evaluación de factores de riesgo para
la infección por VIH. El estudio se inició en 01/06/2020, cuando dos de los individuos
entraron en el estudio con resultados negativos para la infección. Uno de ellos, al realizar
el segundo examen, un mes después, presentó un resultado positivo, y el otro, dos meses
después, presentó un resultado positivo. Los otros cuatro individuos entraron en el estudio en
01/07/2020, 01/09/2020, 01/08/2020 y 01/08/2020 y sus respectivas fechas de seroconversión
fueron 2, 3, 2 y 5 meses después de la entrada.
id T Estado
1 1 1
2 2 1
3 2 0
4 3 0
5 2 0
6 5 0
7
Duración de cada individuo en el estudio
3 as.factor(Estado)
Id
0
1
4
0 1 2 3 4 5
Tiempo (Meses)
8
Ingreso y salida de cada individuo en el estudio
3 as.factor(Estado)
Id
0
1
4
0 2 4 6
Tiempo (Meses)
9
a) [5 pts] El estimador no-paramétrico natural de la función de sobrevida en ausencia de censura
𝑛
es: 𝑆𝑒𝑚𝑝 (𝑡) = 𝑛1 ∑𝑖=1 𝐼{𝑇𝑖 > 𝑡}. Muestre que 𝐸(𝑆𝑒𝑚𝑝 (𝑡)) = 𝑆(𝑡) y 𝑉 𝑎𝑟(𝑆𝑒𝑚𝑝 (𝑡)) = 𝑛1 𝑆(𝑡)(1 − 𝑆(𝑡))
Se quiere demostrar que: 𝐸(𝑆𝑒𝑚𝑝 (𝑡)) = 𝑆(𝑡)
Para ello, empezamos asumiendo que hay independencia entre las variables, y aplicamos esperanza a la
definición entregada de 𝑆𝑒𝑚𝑝 (𝑡), quedando:
1 𝑛
= 𝐸( ∑ 𝐼{𝑇𝑖 > 𝑡})
𝑛 𝑖=1
Por propiedad de esperanza:
1 𝑛
= ∑ 𝐸(𝐼{𝑇𝑖 > 𝑡})
𝑛 𝑖=1
Donde 𝐼{𝑇𝑖 > 𝑡} distribuye Bernoulli, puesto que la función indicadora puede entregar sólo valores 0 o 1,
por lo tanto, se asume que la 𝐸(𝐼{𝑇𝑖 > 𝑡}) = 𝐸(𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖) = 𝑝, donde p, en este caso, es 𝑃 (𝑇𝑖 > 𝑡) = 𝑆(𝑡)
Por lo tanto, reemplazando tenemos:
1 𝑛
= ∑ 𝑆(𝑡)
𝑛 𝑖=1
1
= 𝑛𝑆(𝑡)
𝑛
Simplificamos:
𝑆(𝑡)
Esto queda demostrado.
Paralelamente, para la varianza se utiliza la misma lógica anterior. Sólo que, en este caso tomaremos la
varianza de la sumatoria de la función indicadora, pues esta es una binomial, ya que son n ensayos bernoulli.
Es decir,
𝑛
𝑉 𝑎𝑟(∑ 𝐼{𝑇𝑖 > 𝑡}) = 𝑉 𝑎𝑟(𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙) = 𝑛𝑃 (𝑇𝑖 > 𝑡)(1 − 𝑃 (𝑇𝑖 > 𝑡)) = 𝑛𝑆(𝑡)(1 − 𝑆(𝑡))
𝑖=1
1 𝑛
= 𝑉 𝑎𝑟( ∑ 𝐼{𝑇𝑖 > 𝑡})
𝑛 𝑖=1
𝑛
1
= ( )2 𝑉 𝑎𝑟(∑ 𝐼{𝑇𝑖 > 𝑡})
𝑛 𝑖=1
1
= ( )2 𝑛𝑃 (𝑇𝑖 > 𝑡)(1 − 𝑃 (𝑇𝑖 > 𝑡))
𝑛
Simplificamos términos
10
1
= 𝑃 (𝑇𝑖 > 𝑡)(1 − 𝑃 (𝑇𝑖 > 𝑡))
𝑛
1
= 𝑆(𝑡)(1 − 𝑆(𝑡))
𝑛
11
b) [5 pts] Grafique 𝑆𝑒𝑚𝑝 (𝑡) de ambos sexos en una misma figura. Sugerencia: la función
stat_ecdf puede ser de gran ayuda.
0.75
Genero
Semp(t)
0.50 Femenino
Masculino
0.25
0.00
0 25 50 75 100
Tiempo de vida
12
c) [5 pts] Grafique los tiempos de vida de ambos grupos (sepárelos en dos viñetas preferente-
mente).
Masculino Femenino
1
2
3
4 Masculino
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
0 25 50 75 100
Tiempo (Años)
13
d) [5 pts] Basándose en los gráficos anteriores, ¿Qué conclusiones puede obtener?.
Tanto en los gráficos de la sección b) y c) de la presente pregunta se puede apreciar que a partir de los
25 años (aproximadamente), los hombres viven más tiempo que las mujeres. Esto implica que los hombres
obtengan mayor probabilidad de sobrevivencia que el género femenino. Paralelamente, se observa que hay
mayor sobrevivencia de las mujeres (leve) entre el rango [0,25] años de edad.
14