You are on page 1of 12

Version août 2008

12 – ANALYSER DES DONNEES DE SURVIE

Introduction aux méthodes d’analyse de la survie

Nous allons nous intéresser à la survenue d’un évènement (par exemple le décès) dans un groupe de
sujets (ou collectif) défini par une caractéristique commune (eg diagnostic d’une affection grave)
survenant à une date particulière : la date d’origine (DO).

I Ev †
II Ev †
III †
IV Ev †
V †

VI Pv (A) (B)

0 1 2 3 4 5 6 7 8 9
temps calendaire

Figure 1. Données fictives représentant la survie de 6 patients

Le collectif de sujets (patients) est suivi dans le temps. En fonction de la date à laquelle est effectuée
l’analyse, deux situations sont rencontrées :
-1- situation B : toutes les observations sont complètes : tous les patients sont décédés.
-2- situation A (cas le plus fréquent) : une partie des observation est complète (certains patients sont
décédés), une autre partie incomplète (des patients sont encore vivants).

Le jour J choisi pour faire le bilan de l’étude est appelé la date de point (DP). A cette date, il est
nécessaire de disposer de l’état vivant ou décédé de chaque sujet du collectif. Un suivi actif est nécessaire
pour que cette information soit disponible pour tous les sujets le jour J. La dernière date à laquelle des
nouvelles d’un sujet sont disponibles est la date de dernières nouvelles (DDN). Celle-ci peut être la date
de dernière consultation pour les sujets encore vivants, et la date de décès pour les autres. A cette date de
dernières nouvelles, est associé l’état aux dernières nouvelles (vivant/décédé). Lorsque le suivi du
collectif est bien mené, soit le patient est décédé avant la date de point, soit sa date de dernières nouvelles
est postérieure ou égale à la date de point. Si sa date de dernières nouvelles est antérieure à la date de
point et qu’il est vivant aux dernières nouvelles, le sujet est perdu de vue à sa date de dernières nouvelles
(cas du sujet N° VI). L’idéal est de ne pas avoir de perdus de vue, qui risquent de fausser les résultats de
l’analyse et obligent à faire sur eux des hypothèses fortes.

Premiers pas dans SPSS ; Louis AYZAC 103


Version août 2008

A partir de ces différentes dates, se définissent deux délais importants :

Date d’origine Date des Dernières nouvelles Date de point

(1)

(2)
(1) temps de participation (2) recul

Figure 2. Temps de participation et recul

Recul : délai écoulé entre la date d’origine et la date de point,


Temps de participation :
-si la date des dernières nouvelles est antérieure à la date de point, le temps de participation se
calcule entre la date d’origine de dernières nouvelles (DDN - DO)
-si la date de dernières nouvelles est postérieure à la date de point, le temps de participation se
calcule entre la date d’origine et la date de point (DP - DO).

L’information survenant après la date de point n’est pas prise en compte : le sujet vivant à la date de point
est exclu vivant à la date de point

I Ev
II Ev
III †
IV Ev
V †

VI Pv

0 1 2 3 4 5 6 7 8

temps de participation

Figure 3. Représentation des temps de participation

L’échelle de temps utilisée de la figure est celle des temps de participation. L’origine de cette échelle est
la date d’origine de tous les sujets. Sont représentés les 2 sujets décédés avant la date de point, les 3 sujets
exclus-vivants à la date de point, et le sujet perdu de vue.

Premiers pas dans SPSS ; Louis AYZAC 104


Version août 2008

La figure 4 est la même, mais les temps de participation des 6 sujets sont présentés en ordre croissant. En
cas d’égalité des temps de participation, les † sont représentés avant les ev.

III †
II Ev
V †
IV Ev
VI pv
I ev

0 1 2 3 4 5 6 7 8

temps de participation

Figure 4. Représentation des temps de participation (bis)

Méthode de Kaplan et Meier

La méthode Kaplan et Meier s’appuie sur le calcul des probabilités conditionnelles

P(A / B) = P(A ∩ B) P(B) # 0


P(B)

La méthode de Kaplan et Meier est une méthode non paramétrique d’estimation de la survie, prenant en
compte les différents temps de participation se terminant par les 3 évènements présentés plus haut (†, ev,
pv).

Soit Ti un de ces instants. La probabilité de décès à l'instant Ti sachant que le patient a survécu jusque
là s'écrit :

P(décès au temps Ti / survie jusqu'à Ti-1 au moins)


=
P(décès au temps Ti et survie jusqu'à Ti-1 au moins)
P(survie jusqu'à Ti-1 au moins)

Désignons par Ni le nombre de patients ayant survécu jusqu'à Ti au moins et par Di le nombre de décès à
l'instant Ti. Alors il est possible d'écrire

P(décès au temps Ti / survie jusqu'à Ti-1 au moins) = Di / Ni

La probabilité instantanée si de survivre au delà de Ti sachant que l'on a survécu jusqu'en Ti au moins
s'écrit donc comme le complément de la probabilité calculée ci-dessus

si = 1 - Di / Ni

Premiers pas dans SPSS ; Louis AYZAC 105


Version août 2008

Courbe de survie : La probabilité de survivre au delà de Ti s'écrit

P(survivre au delà de Ti)


=
P(survivre au delà de Ti / survie jusqu'à Ti-1 au moins) . P(survie au delà de Ti-1)

Si = Si-1 . si

Disposition pratique repérer tous les instants ou un événement s'est produit

Ti Ni pv ev Di si Si
0 6 0 0 0 1 1
1 6 0 0 1 5/6 5/6
1 5 0 1 0 1 5/6
3 4 0 0 1 3/4 15/24
4 3 1 1 0 1 15/24
5 1 0 1 0 1 15/24

Le taux de survie doit être complété par son écart-type dont le calcul n'est pas du ressort de cette
introduction. En cas d'ex-aequo, toujours admettre que le pv ou le ev se placent après le décès.
Voici la courbe de survie et le « listing » correspondant fournis par le logiciel SPSS.

Survie globale
Méthode de Kaplan et Meier (N = 6)
1.0

.9

.8

Su .7
rvi .6
e
.5
cu
m .4
ul .3

.2

.1
0.0
0 1 2 3 4 5 6

temps (jours, semaines, mois,

Survival Analysis for TEMPS

Time Status Cumulative Standard Cumulative Number


Survival Error Events Remaining

1.00 1.00 .8333 .1521 1 5


1.00 .00 1 4
3.00 1.00 .6250 .2135 2 3
4.00 .00 2 2
4.00 2.00 2 1
5.00 .00 2 0

Number of Cases: 6 Censored: 4 ( 66.67%) Events: 2

Premiers pas dans SPSS ; Louis AYZAC 106


Version août 2008

Méthode actuarielle

La méthode diffère de celle de Kaplan et Meier : dans la méthode de Kaplan Meier, seuls les temps de
participation des sujets décédés apportent de l'information. Dans la méthode actuarielle, les intervalles de
temps sont définis a priori, la survie étant constante par intervalle. Les ev ne sont pas traités de la même
façon dans les deux méthodes.

Test du logrank

Il est construit sous l'hypothèse nulle Ho suivante : les probabilités instantanées de décès sont les mêmes
entre les deux groupes (pour tout Ti pour lequel un décès est observé, la proportion de décès attendus est
la même dans 2 groupes). Ce test n'est pas adéquat en cas d'interaction du facteur étudié avec le temps.

Références utilisées
Estève J., Benhamou H., Raymond L. Méthodes statistiques en épidémiologie descriptive. Les Editions
INSERM, PARIS, 1993
Laplanche A., Com-Cougué C., Flamant R. Méthodes statistiques appliquées à la recherche clinique.
Collection Statistiques en biologie et en Médecine. Flammarion Médecine-Sciences, 1987, PARIS.

Premiers pas dans SPSS ; Louis AYZAC 107


Version août 2008

APPLICATIONS
Le fichier de travail renferme des informations sur des ampoules électriques pour lesquelles on voudrait
analyser leur durée de vie.
debut ddn etat machine
1 01.03.95 02.03.95 2.00 2.00
2 01.02.95 03-02.95 2.00 3.00
3 01.03.95 15.03.95 2.00 3.00
4 01.02.95 01.03.95 2.00 3.00
5 01.02.95 06.04.95 2.00 2.00
6 01.03.95 12.05.95 2.00 2.00
7 01.01.95 15.03.95 2.00 2.00
8 01.03.95 26.06.95 1.00 1.00
9 01.03.95 26,06.95 1.00 1.00
10 01.03.95 26.06.95 1.00 3.00
11 01.03.95 26.06.95 1.00 4.00
12 01.02.95 15-05,95 1.00 3.00
13 01.02.95 16-05.95 2.00 1.00
14 01.01.95 2l.04.95 2.00 1.00
15 01.02.95 26.06.95 1.00 2.00
16 01.02.95 26.06.95 1.00 4.00
17 01.01.95 26.06.95 1.00 2.00
18 01.01.95 26.06.95 1.00 2.00
19 01.01.95 02.06.95 1.00 1.00
20 01.01.95 30.05.95 2.00 1.00
21 01.01.95 26.06.95 1.00 4.00

1° étape : Fixez une date de point qui permette de perdre le moins d’informations, en sachant que l’état 1
correspond à une ampoule fonctionnant à la date de dernières nouvelles (ddn) et l’etat 2 à une ampoule
mise hors service à la date ddn (à partir du fichier de données "tab7.sav").
Commencez par trier les données
par « ddn ».
On constate que le premier
« vivant » survient le 15/05/95.
Le « vivant » suivant survient le
02/06/95.
Les autres ampoules sont
« vivantes » après cette date.

• Soit on fixe la date de point au 15/05/95 : il n’y a alors aucun perdu de vue ; mais deux ampoules
dont on sait qu’elles sont hors service deviennent vivantes à la date de point et on perd ainsi de
l’information.
• Soit on fixe la date de point au 02/06/95 : on ne perd aucune information ; par contre, il y a alors
un perdu de vue car on ne sait pas si l’ampoule vivante au 15/05/95 n’a pas été mise hors service
depuis.
Cet exercice de réflexion montre combien il est important de prévoir une prise de nouvelles pour tous
les individus statistiques à une date de point fixée au préalable pour ce prémunir de tout biais
d’observation.

Premiers pas dans SPSS ; Louis AYZAC 108


Version août 2008

Calculez les nouvelles variables ddp (date de point), durée (durée de survie), détat (état à la date de
point), pdv (perdu de vue).
Reprenez, si nécessaire, la 1° étape du chapitre 5
(page 19).
Calculer d’abord la date de point. COMPUTE ddp = DATE.MDY(6,2,1995) .
Attention, pour faire afficher correctement le EXECUTE .
résultat il faut modifier le type et la largeur de la
variable ddp dans le tableau de données après
calcul.
Calculer ensuite l’état à la date de point. COMPUTE détat = etat .
EXECUTE .
Calculer encore la durée de survie. COMPUTE durée = CTIME.DAYS(ddp - debut) .
C’est le délai entre la date de début et la date de IF (détat = 2) durée = CTIME.DAYS(ddn - debut) .
EXECUTE .
point ; sauf si l’ampoule est hors service à la date
de point où c’est le délai entre la date de début et la
date de nouvelle qui est la date de décès.
Calculer enfin l’indicateur perdu de vue (0=non ; 1 COMPUTE pdv = (détat = 1) & (ddn < ddp) .
= oui). EXECUTE .
C’est oui si l’ampoule est encore en service à une
date de dernières nouvelles antérieure à la date de
point
2° étape : Déterminez la table de survie de Kaplan-Meier basée sur toutes les observations de notre
fichier par machine.
Comment obtenir une analyse de survie de Kaplan-Meier ?
A partir du menu, choisissez
Analyse
Survie
Kaplan-Meier.

Durée. Sélectionnez une variable numérique indiquant combien de temps chaque individu a survécu
(données non censurées) ou a été observé (données censurées). Cette variable peut être mesurée dans
n'importe quelle unité de temps. SPSS exclut de l'analyse les individus auxquels est associée une durée
négative.

Premiers pas dans SPSS ; Louis AYZAC 109


Version août 2008

Etat. Sélectionnez une variable numérique ou chaîne courte dont une ou plusieurs valeurs indiquent si
l'événement s'est produit. Vous devez alors spécifier les codes qui identifient les données non censurées.
Critère. Par défaut, l'analyse traite tous les individus du fichier courant. Pour sortir des courbes de survie
par sous-groupes, il faut sélectionner une variable numérique ou chaîne courte dont les valeurs définissent
deux ou plusieurs sous-groupes.
Définir l'événement pour la variable d'état
Pour spécifier quelle(s) valeur(s) de la variable d'état identifie(nt) l'événement, cliquez sur :
Définir l'événement...

Une ou plusieurs valeurs peuvent indiquer que l'événement s'est produit. Les individus dont la valeur de
la variable d'état n'est pas manquante sont traités.
Valeur unique. Entrez une seule valeur d'identification.
Intervalle de valeurs. Il faut que la variable soit numérique. Entrez la plus petite et la plus grande
valeur de l'intervalle.
Liste de valeurs. Sélectionnez des valeurs en les ajoutant au fur et à mesure.
3° étape : Enregistrez dans votre fichier de données les probabilités de survie cumulées,les écarts type
associés et donnez une représentation graphique des groupes de survie.
Comment sauver de nouvelles variables?
Pour sauvegarder des variables de survie, cliquez sur Enregistrer...

Vous pouvez sauver une ou plusieurs variables suivantes


Survie. Estimateur de la probabilité de survie cumulée.
Ecart type de survie. Ecart type de l'estimateur cumulé de survie.
Hasard. Estimateur de la fonction cumulée de hasard.
Fréquence cumulée. Fréquence cumulée quand les individus sortent de leur temps de survie.

Premiers pas dans SPSS ; Louis AYZAC 110


Version août 2008

Options
Pour obtenir d'autres statistiques et des graphes, cliquez sur Options...

Statistiques. Les statistiques sont calculées pour chaque combinaison de niveaux de facteur et de strates.
Vous pouvez choisir une ou plusieurs st,-e'.@;tiques.
Graphes.
Si vous avez une variable de stratification, un graphe sera produit pour chaque strate. Pour obtenir les
courbes de survie des différents niveaux de facteur, choisissez Survie.
4° étape : Comparez les fonctions de survie des ampoules des quatre groupes de machines.
Comment comparer des niveaux de facteurs ?
Si vous avez une variable correspondant à un critère, vous pouvez obtenir des tests de comparaison des
fonctions de survie pour différents niveaux du facteur. Cliquez sur:
Comparer les niveaux..

Tests statistiques. Vous pouvez choisir un ou plusieurs tests d'égalité des fonctions de survie pour les
niveaux d'un facteur.
Mantel-Cox. Test de Mantel-Cox (Log rank). Ce test donne un poids égal à toutes les observations.
Breslow. Test de Breslow (Gehan). Ce test donne un poids en ti (temps de décès) correspondant au
nombre total de sujets exposés au risque en ti. Ainsi les décès précoces ont un poids plus élevé que les
décès tardifs dans la comparaison.
Tarone-Ware. Test de Tarone-Ware. Ce test donne un poids en ti correspondant à la racine carrée du
nombre total de sujets exposés au risque en ti.
Pour des tests de comparaisons par niveaux de facteur, vous pouvez choisir de comparer tous les niveaux
simultanément ou par paires. Vous pouvez obtenir des résultats sur l'ensemble des strates ou bien des
tests séparés pour chaque strate.
Sur l'ensemble des strates. Comparaison des niveaux de facteur sur un simple test.
Pour chaque strate. Tests de comparaison des différents niveaux de facteur pour chaque strate.
Appariés sur les strates. Comparaison de chaque paire distincte de niveaux de facteur.

Premiers pas dans SPSS ; Louis AYZAC 111


Version août 2008

Appariés pour chaque strate. Comparaison de chaque paire distincte de niveaux de facteur pour
chaque strate.
Les résultats affichés sont :
• La table de survie pour chaque machine
Survival Analysis for durée

Factor machine = 1,00

Time Status Cumulative Standard Cumulative Number


Survival Error Events Remaining

93,00 1,00 0 5
93,00 1,00 0 4
104,00 2,00 ,7500 ,2165 1 3
110,00 2,00 ,5000 ,2500 2 2
149,00 2,00 ,2500 ,2165 3 1
152,00 1,00 3 0

Number of Cases: 6 Censored: 3 ( 50,00%) Events: 3

Survival Time Standard Error 95% Confidence Interval

Mean: 128,75 10,94 ( 107,31; 150,19 )


(Limited to 152,00 )
Median: 110,00 22,50 ( 65,90; 154,10 )

Intervalle de temps Probabilité de survie Erreur standard de la Nombre d’individus


uniquement en cas de probabilité de survie exposés au début de
Médiane et intervalle survenue de « décès ». pour le calcul de l’intervalle
de confiance à 95% l’intervalle de
(valeur du temps où confiance si on veut.
50% des individus
sont encore vivants)
……
• Un résumé de l’analyse pour toutes les machines.
Survival Analysis for durée

Total Number Number Percent


Events Censored Censored

machine 1,00 6 3 3 50,00


machine 2,00 7 4 3 42,86
machine 3,00 5 3 2 40,00
machine 4,00 3 0 3 100,00

Overall 21 10 11 52,38

• Le résultat des tests d’hypothèse d’égalité de distribution de survie pour les machines.
Attention ce résultat peut ne pas être vu à l’affichage si les tables de survie sont très
longues. Il convient alors d’agrandir la zône d’affichage des résultats en dragant le bord
inférieur de cette zône.
Test Statistics for Equality of Survival Distributions for machine
Statistic df Significance
Log Rank 3,80 3 ,2842

Valeur du Khi 2 du Log Rank Nombre de dégrés de liberté P value

Premiers pas dans SPSS ; Louis AYZAC 112


Version août 2008

• Les courbes de survie pour chaque machine.

Fonctions de survie

1,0 machine
1,00
2,00
0,8 3,00
4,00
Survie cumulée

1,00-
0,6 censuré
2,00-
censuré
0,4 3,00-
censuré
4,00-
censuré
0,2

0,0

0,00 50,00 100,00 150,00


durée
Les croix sur les courbes montre les censurés (exclus vivants).
Les ampoules de la machine 4 survivent plus longtemps que celles de la machine 1 puis que celles de
la machine 2 et enfin que celles de la machine 3 qui survivent le moins bien. Mais ces différences ne
sont pas statistiquement significatives (p du Log Rank = 0.2842).

Premiers pas dans SPSS ; Louis AYZAC 113


Version août 2008

Premiers pas dans SPSS ; Louis AYZAC 114

You might also like