Professional Documents
Culture Documents
13 de Abril de 2018
ÍNDICE
1. Introducción
2. Descripción de la base
3. Análisis exploratorio completo sobre el tiempo de supervivencia de los pacientes, sus
características generales y particulares de estos. En particular:
(a) Diga cuál es la mediana.
(b) Dé un intervalo de confianza para el cual ya se presentó la muerte en 10 por
ciento de los pacientes.
(c) Estime la función de supervivencia de forma no paramétrica.
4. Identifique de manera exploratoria (estadísticas descriptivas y gráficas) y de manera
formal (usando pruebas de hipótesis e intervalos de confianza) las variables que
afectan el tiempo de supervivencia.
5. Utilice un modelo paramétrico y ajuste su función de supervivencia
1. Introducción
Generalmente, el cáncer de pulmón comienza en las células que envuelven los bronquios,
bronquiolos y/o los alvéolos.
Factores de riesgo
Fumar es el factor de riesgo más importante de cáncer de pulmón
Antecedentes de haber fumado un promedio de 30 cajetillas al año
Estar entre los 55 y 74 años de edad y ser fumadores activos
Exponerse o haberse expuesto a altos niveles de contaminación, radiación y asbesto
Se cree que aproximadamente el 80% de las muertes por cáncer de pulmón se debe al
hábito de fumar
Fumar cigarrillos con bajo contenido de alquitrán o “light” tiene el mismo riesgo de cáncer de
pulmón tanto como los cigarrillos normales.
Respirar el humo que otros producen (fumador pasivo) puede aumentar el riesgo de cáncer
de pulmón.
Disminución del riesgo
Hasta ahora se desconoce cómo prevenir el cáncer de pulmón, pero existen algunas
maneras de disminuir el riesgo de padecer esta enfermedad, como son:
No fumar
Evitar el humo de las personas que fuman
Una alimentación con muchas frutas y vegetales
Detección
Tratamiento
El tratamiento dependerá del lugar en el que se encuentre el cáncer y qué tan avanzado
esté. Los tratamientos más comunes son: quimioterapia, radiación y cirugía.
2. Descripción de la base
Supervivencia en pacientes con cáncer de pulmón avanzado del North Central Cancer
Treatment Group. Los puntajes de desempeño evalúan qué tan bien el paciente puede
realizar las actividades diarias habituales.
Comenzaremos a analizar las variables. Hacemos un histograma para darnos una idea
del comportamiento de la variable time (en días)
Luego entonces, se estima que al día 79 ya se habrá presentado la muerte del 10% de los
pacientes, con un intervalo de confianza de (54,105).
Obtendremos la correlación entre las variables (graficando solo las que no son categóricas).
Al no encontrar patrones, podemos decir que no hay correlación entre nuestras variables.
Ahora, vamos a analizar el comportamiento de cada variable.
Luego entonces, podemos ver el por qué de la significancia de esta variable, ya que el
27.63% de los pacientes fueron censurados.
Podemos notar que de acuerdo con los pacientes la mayoría de estos se encuentran dentro
del intervalo del (70,90), lo cual da resultados muy parecidos con lo clasificado por el médico.
Podemos ver que hay bastantes pacientes que consumen distinto número de calorías,
evidentemente se tiene que hay más pacientes que consumen 1025 calorías y de manera
general se observa que la mayoría de los pacientes consumen más de 825 calorías.
Esta ultima variable nos dice cuanto peso han perdido los pacientes en los últimos meses
debido al cáncer de pulmón, y podemos notar que la mayoría de estos han perdido 1.
Realizamos las respectivas pruebas de hipótesis de cada variable con un nivel de confianza
del 0.05%. Hacemos las pruebas de Log-rank y de Peto&Peto respectivamente es
significativa. Derivado de nuestro análisis anterior, podemos concluir que la variable inst es
una candidata a eliminarse. Mientras que conservaremos las demás variables, al ser
significativas para el modelos, las conservaremos.
3) Utilice un modelo paramétrico y ajuste su función de supervivencia.
De tal forma, de manera visual podemos ver que los modelos paramétricos que mejor se
ajustan son, los modelos exponenciales y el de Weibull. Enfatizando que, pareciera que el
modelo de Weibull es el que se ajusta aun mejor. Por tanto, elegimos el modelo de Weibull