You are on page 1of 21

Análisis de Supervivencia

Aplicación al Cáncer de Pulmón

Angeles Arizaga Itzel Alejandra

Garcia Camacho Salvador Enrique

Murillo Morales Carlos Fernando

Tintor Alonoso Luis Enrique

13 de Abril de 2018
ÍNDICE

1. Introducción
2. Descripción de la base
3. Análisis exploratorio completo sobre el tiempo de supervivencia de los pacientes, sus
características generales y particulares de estos. En particular:
(a) Diga cuál es la mediana.
(b) Dé un intervalo de confianza para el cual ya se presentó la muerte en 10 por
ciento de los pacientes.
(c) Estime la función de supervivencia de forma no paramétrica.
4. Identifique de manera exploratoria (estadísticas descriptivas y gráficas) y de manera
formal (usando pruebas de hipótesis e intervalos de confianza) las variables que
afectan el tiempo de supervivencia.
5. Utilice un modelo paramétrico y ajuste su función de supervivencia
1. Introducción

Generalmente, el cáncer de pulmón comienza en las células que envuelven los bronquios,
bronquiolos y/o los alvéolos.

El cáncer de pulmón se origina cuando las células comienzan a reproducirse de manera


descontrolada, forman un tumor y se trasladan a otras partes del organismo donde
comienzan a crecer y a formar nuevos tumores que remplazan al tejido normal.
Generalmente comienza en las células que envuelven los bronquios, los bronquiolos y/o los
alvéolos.

Existen 2 tipos principales de cáncer de pulmón:

Cáncer de pulmón microcítico o carcinoma microcítico de pulmón: es el cáncer generado por


células pequeñas, Small Cell Lung Cancer (SCLS) por sus siglas en inglés

Cáncer pulmonar de células no pequeñas (CPCNP): es el tipo más común de cáncer


pulmonar, generalmente crece y se desarrolla más lentamente que el de células pequeñas

 Factores de riesgo
 Fumar es el factor de riesgo más importante de cáncer de pulmón
 Antecedentes de haber fumado un promedio de 30 cajetillas al año
 Estar entre los 55 y 74 años de edad y ser fumadores activos
 Exponerse o haberse expuesto a altos niveles de contaminación, radiación y asbesto

Cabe destacar que:

Se cree que aproximadamente el 80% de las muertes por cáncer de pulmón se debe al
hábito de fumar

Fumar cigarrillos con bajo contenido de alquitrán o “light” tiene el mismo riesgo de cáncer de
pulmón tanto como los cigarrillos normales.

Respirar el humo que otros producen (fumador pasivo) puede aumentar el riesgo de cáncer
de pulmón.
Disminución del riesgo

Hasta ahora se desconoce cómo prevenir el cáncer de pulmón, pero existen algunas
maneras de disminuir el riesgo de padecer esta enfermedad, como son:

 No fumar
 Evitar el humo de las personas que fuman
 Una alimentación con muchas frutas y vegetales

En sus primeras etapas, el cáncer de pulmón es asintomático. Para prevenir esta


enfermedad, se recomienda dejar de fumar y/o evitar el humo del tabaco.

El cáncer de pulmón no causa ningún síntoma al principio. En un estado avanzado de la


enfermedad, los síntomas que se pueden presentar son:

 Tos que no desaparece y empeora con el tiempo


 Dolor constante en el pecho
 Tos con expectoración y sangre
 Falta de aire, silbidos al respirar o ronquera
 Problemas repetidos por neumonía o bronquitis
 Inflamación del cuello y la cara
 Pérdida del apetito o pérdida de peso
 Dificultad para respirar
 Fatiga o debilidad

Detección

La detección de cáncer de pulmón no es fácil, ya que en las primeras etapas no presenta


síntomas y se descubre accidentalmente como resultado de exámenes realizados para otras
afecciones médicas.

Tratamiento

El tratamiento dependerá del lugar en el que se encuentre el cáncer y qué tan avanzado
esté. Los tratamientos más comunes son: quimioterapia, radiación y cirugía.
2. Descripción de la base

Supervivencia en pacientes con cáncer de pulmón avanzado del North Central Cancer
Treatment Group. Los puntajes de desempeño evalúan qué tan bien el paciente puede
realizar las actividades diarias habituales.

Las variables incluidas en el modelo son:

 inst: Código institucional


 time: Tiempo de supervivencia en días
 status: estado de censura
 1=censura, 2=muerte
 age: Edad en años
 sex: Masculino=1 Femenino=2
 ph.ecog: puntaje de rendimiento ECOG
 (0=bueno 5=muerto)
 ph.karno: puntaje de rendimiento Karnofsky (malo=0-bueno=100)
 Clasificado por el médico
 pat.karno: puntaje de rendimiento Karnofsky clasificado por el paciente
 meal.cal: Calorías consumidas en las comidas
 wt.loss: Peso perdido en los últimos seis meses
1. Realice un análisis exploratorio completo sobre el tiempo de supervivencia de los
pacientes, sus características generales y particulares de estos. En particular:
La media de la edad de los paacientes es de 62.44737. Mientras que la mediana de la edad
de los pacientes es de 63
1. (a) Diga cuál es la mediana.

Comenzaremos a analizar las variables. Hacemos un histograma para darnos una idea
del comportamiento de la variable time (en días)

Realizaremos un diagrama de caja para revisar en qué valor se encuentra la mediana de


nuestra variable time.
Así, vemos que este valor está un poco por arriba de 200. Luego, obtengamos la mediana de
manera exacta: verificamos que la mediana de los tiempos de supervivencia tiene un valor de
255.5

1. c. Estime la función de supervivencia de forma no paramétrica. Estimaremos la función de


supervivencia mediante Kaplan-Meier (K-M). Los datos censurados aparecen con un signo +.
Ahora, obtenemos los datos para nuestra estimación. Y graficamos nuestra Supervivencia
con K-M

Ahora lo hacemos considerando los intervalos de confianza


b. De un intervalo de confianza para el cual ya se presento la muerte en 10 por ciento de los
pacientes. Entonces, obtendremos el cuantil al 10% de la función de supervivencia que ya
estimamos así como los intervalos de confianza para hacer esto, utilizaremos la función
quantile.

Luego entonces, se estima que al día 79 ya se habrá presentado la muerte del 10% de los
pacientes, con un intervalo de confianza de (54,105).

2. Identifique de manera exploratoria (estadísticas descriptivas y gráficas) y de manera formal


(usando pruebas de hipótesis e intervalos de confianza) las variables que afectan el tiempo
de supervivencia.

Obtendremos la correlación entre las variables (graficando solo las que no son categóricas).

Al no encontrar patrones, podemos decir que no hay correlación entre nuestras variables.
Ahora, vamos a analizar el comportamiento de cada variable.
Luego entonces, podemos ver el por qué de la significancia de esta variable, ya que el
27.63% de los pacientes fueron censurados.

Obtenemos el número de pacientes que hay en cada institución:

Observemos que la mayor concentración de pacientes se encuentra en la institución 1, sin


embargo, de manera intuitiva podemos ver que la institución del paciente no afectará su
tiempo de supervivencia, hecho que comprobaremos más adelante.
Número de pacientes hombres (1) y mujeres (2):
De acuerdo con el médico se clasifican los pacientes con puntaje del 0 al 100 donde 0=Malo
y 100=Bien, identificamos que de acuerdo con el médico la mayoría de los pacientes se
encuentran dentro del intervalo del (80,90), lo cual es bueno, pues no hay nadie menor a
puntaje 50 es decir en muy mal estado.

Podemos notar que de acuerdo con los pacientes la mayoría de estos se encuentran dentro
del intervalo del (70,90), lo cual da resultados muy parecidos con lo clasificado por el médico.
Podemos ver que hay bastantes pacientes que consumen distinto número de calorías,
evidentemente se tiene que hay más pacientes que consumen 1025 calorías y de manera
general se observa que la mayoría de los pacientes consumen más de 825 calorías.

Esta ultima variable nos dice cuanto peso han perdido los pacientes en los últimos meses
debido al cáncer de pulmón, y podemos notar que la mayoría de estos han perdido 1.

Realizamos las respectivas pruebas de hipótesis de cada variable con un nivel de confianza
del 0.05%. Hacemos las pruebas de Log-rank y de Peto&Peto respectivamente es
significativa. Derivado de nuestro análisis anterior, podemos concluir que la variable inst es
una candidata a eliminarse. Mientras que conservaremos las demás variables, al ser
significativas para el modelos, las conservaremos.
3) Utilice un modelo paramétrico y ajuste su función de supervivencia.

De tal forma, de manera visual podemos ver que los modelos paramétricos que mejor se
ajustan son, los modelos exponenciales y el de Weibull. Enfatizando que, pareciera que el
modelo de Weibull es el que se ajusta aun mejor. Por tanto, elegimos el modelo de Weibull

En el summary el parámetro de localización es 6.035 pero esta reparametrizada hay que


usar 1/parámetro de forma y el de escala nos lo dan en escala logaritmica si aplicamos
exponencial tenemos que es 0.759. Asi,la supervivencia en el modelo Weibull es: St = 1-
pweibull(cancer$time,shape=1/6.035,scale=0.759). Graficamos la supervivencia estimada por
el modelo Weibull:

You might also like