You are on page 1of 23

TCNICAS NONO-PARAMTRICAS

O passo inicial de qualquer anlise estatstica consiste em uma descrio dos dados atravs de anlise descritiva (tabelas, medidas e grficos). Como a presena de censura invalida esse tipo de tratamento aos dados de sobrevivncia, o principal componente da anlise descritiva a funo de sobrevivncia. Dessa forma, o procedimento inicial encontrar uma estimativa para a funo de sobrevivncia e, a partir dela, estimar as quantidades de interesse. Mtodos no paramtricos para estimao da funo de sobrevivncia so fceis de entender e aplicar. Eles so menos eficientes que os mtodos paramtricos quando os tempos de sobrevivncia seguem uma distribuio terica e mais eficientes quando nenhuma distribuio terica apropriada conhecida. Na abordagem no paramtrica, a estimao realizada sem que se faa nenhuma suposio sobre a distribuio de probabilidade do tempo de sobrevivncia e assim no possui parmetros a serem estimados. Iremos considerar dois estimadores no paramtricos: A tabela de vida e o estimador de Kaplan e Meier

TABELA DE VIDA
As tabelas de vida so usadas pelas companhias de seguros desde o sculo XVII. So procedimentos que mostram a estrutura do tempo de sobrevivncia para grupos homogneos de indivduos quando esses tempos so submetidos a censura. Para construo da tabela de vida necessrio dividir o eixo do tempo em um certo nmero de intervalos. Suponha que o eixo do tempo seja dividido em s intervalos, ou seja, Ij=[tj-1,tj), para j=1,2,...,s em que t0=0 e ts=. Sejam: dj = nmero de falhas no intervalo [tj-1,tj), cj = nmero de censuras em [tj-1,tj) e nj = nmero de observaes sob risco (no falhou e no foi censurado) em tj-1.

TABELA DE VIDA
o
1)

A estimao de S(t) feita da seguinte maneira:


Estimamos para cada um dos intervalos a probabilidade condicional de uma observao falhar no intervalo [tj-1,tj) sabendo que ela no falhou at tj-1, ou seja

q j = P(T [t j 1, t j ) | T t j 1)
importante citar que o nmero de censuras dividido por dois pois observaes para as quais a censura ocorreu no intervalo [tj-1,tj) so tratadas como se estivessem sob risco durante a metade do intervalo considerado.
2) 3)

j Podemos construir estimadores para S(t) a partir de q Suponha que em um grupo tenhamos n pacientes no instante t=t0. Desses, aproximadamente n ( q 0 ) no chegaro a t=t1 sem a ocorrncia do evento de interesse.
0 ) Em consequncia, ao final do primeiro perodo ainda estaro sob risco n (1 q

4) 5)

Assim, temos que

TABELA DE VIDA
6)

0 ) que chegam ao final desse perodo, n(1 q 0 )(1 q 1) Analogamente, dos n(1 q chegaro ao final do terceiro perodo. Assim,

(t ) = (1 q 0 )( 1) S 1q 2
7)

Em geral, para qualquer tempo t teremos

(t ) = (1 q 0 ) (1 q 1 ) ... (1 q j ) = (1 q i 1 ) S j
i =1

0 = 0 com j=1,...,s e q

INTERPRETANDO: A funo de sobrevivncia a probabilidade de uma observao no falhar at o tempo tj. Considere, por exemplo, que a probabilidade de um paciente sobreviver aos primeiros dois anos de um estudo igual a probabilidade dele sobreviver ao primeiro ano e ento sobreviver a mais um ano. A representao grfica da funo de sobrevivncia, chamada curva de sobrevivncia, uma funo escada, com valor constante em cada intervalo de tempo.

EXEMPLO 1: Um estudo clnico aleatorizado foi realizado para


investigar o efeito da terapia com esteride no tratamento de hepatite viral aguda. Vinte e nove pacientes com a doena foram aleatorizados para receber um placebo ou o tratamento com esteride. Cada paciente foi acompanhado por 16 semanas ou at a morte (evento de interesse) ou at a perda de acompanhamento. Os tempos de sobrevivncia observados, em semanas, para os dois grupos foram GRUPO CONTROLE: 1+,2+,3,3,3+, 5+, 5+, 16+, 16+, 16+, 16+, 16+, 16+, 16+, 16+ GRUPO ESTERIDE: 1,1,1,1+,4+,5,7,8,10,10+,12+,16+,16+,16+ Considere o grupo esteride dividido em 4 intervalos: [0,5), [5,10), [10,15), [15,), construa a tabela de vida para os dados.

EXEMPLO 1: Construa a tabela de vida para o grupo controle. Compare o resultado com o do grupo esteride.

ESTIMADOR DE KAPLANKAPLAN-MEIER

O estimador de Kaplan-Meier, tambm chamado estimador produtolimite, foi proposto por Kaplan e Meier em 1958 e sem dvida o mais utilizado em estudos clnicos. A expresso estimador produto refere-se ao fato de que a probabilidade de sobrevida at a data especificada estimada considerando-se que a sobrevivncia at cada tempo independente da sobrevivncia at outros tempos, e, em consequncia, a probabilidade de se chegar at o tempo t o produto da probabilidade de se chegar at cada um dos tempos anteriores. O estimador de Kaplan-Meier considera tantos intervalos de tempo quantos forem o nmero de falhas distintas e os limites dos intervalos so os prprios tempos de falha da amostra. O estimador de Kaplan-Meier apresenta a forma do estimador tabela de vida, mas utiliza um estimador ligeiramente diferente para qj.

ESTIMADOR DE KAPLANKAPLAN-MEIER

Suponha que existam n pacientes no estudo e k(n) falhas distintas nos tempos t1<t2<...<tk. Seja dj o nmero de falhas no tempo tj e nj o nmero de observaes sob risco at o tempo tj (exclusive), ou seja, os indivduos que no falharam e no foram censurados at o instante imediatamente anterior a tj. O estimador de Kaplan-Meier , ento, definido como:

nj d j dj = 1 S (t ) = n j:t <t n j:t j <t j j j


PRINCIPAIS PROPRIEDADES: i. o estimador de mxima verossimilhana de S(t), ii. no-viciado para amostras grandes, iii. fracamente consistente e iv. Converge assintoticamente para um processo Gaussiano.
o

EXEMPLO 1:
GRUPO CONTROLE: 1+,2+,3,3,3+, 5+, 5+, 16+, 16+, 16+, 16+, 16+, 16+, 16+, 16+ GRUPO ESTERIDE: 1,1,1,1+,4+,5,7,8,10,10+,12+,16+,16+,16+

Obtenha as estimativas de Kaplan-Meier para o grupo esteride.

EXEMPLO 1:
o

Todos os indivduos estavam vivos em t=0 e se mantm at a primeira morte que ocorre em t=1 semana. Ento a estimativa de S(t) deve ser 1 neste intervalo compreendido entre 0 e 1 semana. No valor correspondente a 1 semana , a estimativa deve cair devido a trs mortes que ocorrem neste tempo. No segundo intervalo, existem ento 14 indivduos que estavam sob risco antes de t=1 e 3 morrem. Desta forma, a estimativa da probabilidade condicional de morte neste intervalo 3/14 e a probabilidade de sobreviver 1-3/14. ( t ) uma funo escada (6) = S (5) , pois S Observe, por exemplo, que S com saltos somente nos tempos de falha. A curva de sobrevivncia construda mantendo o valor estimado da funo de sobrevivncia constante entre os tempos de falha. Quando o maior tempo observado na amostra corresponder a uma (t ) = 0 . censura, o grfico no atinge o valor S

EXEMPLO 1:

Figura 2.1: Estimativas de Kaplan-Meier para os dados de hepatite.

ESTIMADOR DE KAPLANKAPLAN-MEIER

Este estimador est sujeito variaes que devem ser descritas em termos de estimaes intervalares. Para a construo de intervalos de confiana necessrio uma (t ) . estimativa da varincia de S A expresso para a varincia assinttica do estimador de Kaplan-Meier dada por
(t )) = [ S (t )] 2 ( S var

j :t j < t

dj n j (n j d j )

(t ) , para t fixo, tem distribuio assinttica normal, segue que Como S um intervalo aproximado para S(t) com (1-)% de confiana dado por

ESTIMADOR DE KAPLANKAPLAN-MEIER
o

Obtenha um intervalo de 95% de confiana para S(6) (Exemplo 1).

Quando a funo de sobrevivncia estimada prxima de zero ou um, este tipo de intervalo, simtrico, inapropriado pois pode conduzir os limites de confiana para valores fora do intervalo [0,1]. Uma soluo utilizar uma transformao para S(t) e construir um intervalo assimtrico, como por exemplo

ESTIMADOR DE KAPLANKAPLAN-MEIER
o

Assim, um intervalo aproximado de 100(1-)% de confiana para S(t) dado por

Os estimadores tabela de vida e Kaplan-Meier so em geral similares. A grande diferena est no nmero de intervalos utilizados. A estimativa obtida pelo estimador de Kaplan-Meier baseada, frequentemente, em um nmero maior de intervalos. natural esperar que quanto maior o nmero de intervalos, melhor ser a aproximao para a verdadeira distribuio do tempo de falha. Para o mecanismo de censura do tipo aleatrio, as estimativas por Kaplan-Meier e Tabela de vida sero prximas mas no necessariamente coincidentes. Neste caso, alguns estudos mostram a superioridade do estimador de Kaplan-Meier.

ESTIMAO DE QUANTIDADES BSICAS


o

A partir da curva de Kaplan-Meier possvel obter estimativas de algumas quantidades de interesse, tais como tempo mediano e percentis. Como a curva de sobrevivncia uma funo escada, as estimativas mais adequadas so obtidas por meio de interpolao linear.
(6) : Para obter S

Para obter o tempo mediano:

Esta forma usualmente gera uma melhor representao da distribuio contnua do tempo de falha.

ESTIMAO DE QUANTIDADES BSICAS


o

De forma anloga pode-se obter estimativas de outros percentis da distribuio dos tempos de vida. Outra quantidade que pode ser de interesse o tempo mdio de vida. Uma estimativa pode ser obtida calculando-se a rea (integral) sob a curva de Kaplan-Meier estimada. Como esta curva uma funo escada, esta integral simplesmente a soma de reas de retngulos.

Em que t1<...<tk so os k tempos distintos e ordenados de falha. Tal estimativa deve ser evitada se o maior tempo observado for censurado. Uma alternativa usar a mediana ao invs do tempo mdio de vida.

No R
Kapla-Meir: ekm<-survfit(Surv(tempo, censura)) summary (ekm)

Curva de sobrevivncia: plot(ekm,conf.int=T, xlab="tempo",ylab="S(t) estimada")

Kapla-Meir com estratificao: ekm<-survfit(Surv(tempo, censura) ~varivel) summary (ekm) plot(ekm)

Exemplo 1: Pacientes com aids

tempo <- c(16, 18, 21, 21, 22, 25, 29, 35, 37,39, 40, 50, 52, 54, 60, 80, 80, 81, 83, 84, 85)

censura <- c(1,1,0,1,1,0,1,1,1,1,1,0,1,1,1,0,1,0,1,1,0) y<- Surv(tempo,censura) ekm<-survfit(y~1) ekm summary(ekm) plot(ekm, xlab="tempo",ylab="S(t) estimada")

Exemplo 2: Pacientes com hepatite

tempo<- c(1,2,3,3,3,5,5,16,16,16,16,16,16,16,16,1,1,1,1,4,5,7,8,10,10,12,16,16,16) cens<-c(0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,0,0,1,1,1,1,0,0,0,0,0) grupos<-c(rep(1,15),rep(2,14)) ekm<- survfit(Surv(tempos,cens)~grupos) summary(ekm) plot(ekm, lty=c(2,1), xlab="Tempo (semanas)",ylab="S(t) estimada") legend(1,0.3,lty=c(2,1),c("Controle","Esteroide"),lwd=1, bty="n")

COMPARAO DE CURVAS DE SOBREVIVNCIA


o

O problema de comparao de distribuies de sobrevivncia surge com frequncia em estudos de sobrevivncia. Por exemplo, pode ser de interesse comparar dois tratamentos para uma determinada doena. Um caminho simples a observao do grfico das funes de sobrevivncia estimadas. Contudo esse grfico fornece apenas uma idia aproximada da diferena entre essas distribuies. Ele no revela se as diferenas so significativas. Para comparar as curvas de sobrevivncia mais formalmente, podemos recorrer a TESTES DE HIPTESES.

COMPARAO DE CURVAS DE SOBREVIVNCIA


TESTE LOG-RANK: Compara a distribuio da ocorrncia dos eventos observados em cada estrato com a distribuio que seria esperada se a incidncia fosse igual em todos os estratos. Se a distribuio observada for equivalente distribuio esperada, dizemos que a curva de sobrevivncia dos pacientes pertencentes ao estrato equivalente curva de sobrevivncia dos pacientes em geral (a covarivel no tem efeito na sobrevida. Realizao do teste: Hiptese nula: no h diferena entre estratos. Estima-se o nmero de eventos esperados para cada estrato k, segundo a hiptese nula de incidncia igual em cada estrato.

o 1) 2)

COMPARAO DE CURVAS DE SOBREVIVNCIA


o o o

N(t) o nmero total de eventos observados. Rk(t) o nmero de pessoas em risco no estrato k. R(t) o nmero total de pessoas em risco no estudo no tempo t. Calcula-se a estatstica de teste:

3)

COMPARAO DE CURVAS DE SOBREVIVNCIA


o

OBSERVAO: Quando apenas dois estratos esto sendo comparados, a estatstica log-rank calculada utilizando-se os dados de apenas um dos estratos. O resultado do teste para um estrato se estende ao outro estrato por simetria. A generalizao do teste de log-rank para mais de dois estratos no complicada.

No R

survdiff(Surv(tempos,censura)~grupos,rho=0) EXEMPLO: Dados de Hepatite

tempo<- c(1,2,3,3,3,5,5,16,16,16,16,16,16,16,16,1,1,1,1,4,5,7,8,10,10,12,16,16,16) cens<-c(0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,0,0,1,1,1,1,0,0,0,0,0) grupos<-c(rep(1,15),rep(2,14)) survdiff(Surv(tempo,cens)~grupos,rho=0)

COMPARAO DE CURVAS DE SOBREVIVNCIA


TESTE PETO:

A varincia da estatstica de Peto igual a varincia do log-rank, onde a cada tempo se pondera pelo quadrado da funo de sobrevida. No R
survdiff(Surv(tempos,censura)~grupos,rho=1) EXEMPLO: Dados de Hepatite survdiff(Surv(tempo,cens)~grupos,rho=1)

o o