You are on page 1of 30

Qualit des donnes dans la recherche mdicale

Dr Frdric Berthier
Dpartement dinformation et dinformatique mdicale CHU de Nice
Master 1 Module INF1 - Qualit des donnes Lundi 16 octobre 2006

Plan du cours

Trois objectifs diffrents : la gestion des soins, les soins aux patients, la recherche mdicale Le recueil des donnes dans la recherche

Le protocole Vocabulaire unifi, informations standardises Le CRF, le data management Erreur alatoire et erreur systmatique Fiabilit et validit Les chelles de mesures Type dtude Mise plat des donnes

Caractriser les donnes dune tude


Juger de la qualit des donnes


Quelques exemples

Des objectifs diffrents


Manager et grer les prises en charge

Soigner les patients

Mener des recherches

Manager la structure de soins

Efficience conomique, optimiser les moyens mis en uvre


Dvelopper

surcots,

certaines activit, reprer et diminuer les

Systme dinformation
Sans limitation de dure Information synthtique Smantique et rgles de

codage spcifique Information encore peu mdicalise Qualit mdiocre des donnes

Soigner : dossier du patient


Objectif individuel Outil daide la dcision pour un individu

Proposer

des investigations diagnostiques Choisir un traitement Adapter la surveillance

Faible organisation des prises en charge

Soigner : dossier du patient

Systme dinformation
Sans

limitation de dure Nombreux acteurs, pluridisciplinaire Informations dtailles Donnes non formates
Texte, abrviations, synonymie Il faut introduire des rgles de codage : amliorer la standardisation de linformation

Centr

sur le patient

Mener des actions de recherche

Amliorer les connaissances


Pour mieux soigner les patients Pour mieux prvenir les maladies

Systme dinformation

Conu pour une dure donne Quelques acteurs particuliers Smantique spcifique Information dtaille et structure Centr sur ltude

Outils ad hoc valuation spcifique

Le protocole de recherche

tat de la question Hypothses et objectif(s) Mthodologie dtaille


Le

schma dtude Les patients : critres dinclusion, de non inclusion Le recueil des donnes Lanalyse des donnes Laspect rglementaire : information, consentement, assurances

Le recueil des donnes

En fonction des hypothse et des objectifs Caractristiques socio-dmographiques Antcdents mdicaux Donnes cliniques et rsultats des examens

linclusion, suivi Posologies, observance, traitements associs Mortalit pour valuer lefficacit dune chimiothrapie Intensit de la douleur pour valuer un antalgique tous effets indsirables graves => leve de linsu

Les traitements administrs


Les critres de jugements pour mesurer leffet des traitements

Les effets indsirables


Le recueil des donnes

Avoir un vocabulaire clinique unifi


La

rdaction scientifique doit obir 3 rgles : rigueur, clart, concision A viter

Limprcision

Une grosse tumeur : 3 cm ? 10 cm ? 20 cm ? Un amaigrissement rcent : 1, 3, 6 mois? Une consommation alcoolique modre : 2, 3, 4 verres par jour, plus ? Fivre, hyperthermie, dcalage thermique, fbricule

Les synonymes et pseudo-synonymes

Le recueil des donnes

Standardiser linformation
Dfinir

les termes employs

Hypertension artrielle si pression artrielle systolique > 160 mm Hg ou pression artrielle diastolique > 90 mm Hg aprs 15 minutes de repos

Coder

linformation

Choisir le niveau de prcision adquat pour ltude


Diabte (oui / non) ou taux de glucose dans le sang ? Tabagisme (oui / non), nombre de cigarettes par jour, consommation en paquets-annes ?

Le CRF support du recueil

Formulaire de recueil ou cahier dobservation (Case Report Forms) Suit les tapes du protocole dans un ordre logique labor avant le dbut de ltude et pr-test Doit tre simple, comprhensible Accompagn dun guide pour le recueil Pourra tre saisi par une socit externe sil est bien conu

Data management

Aspect peu connu de la recherche clinique Traitement des donnes Permettre la production dun fichier lectronique de donnes valides, destin lanalyse statistique dune tude Contribue assurer la documentation et la qualit de la base de donnes clinique dans laquelle seront reportes les informations recueillies au cours dun essai thrapeutique

Caractriser les donnes

Mesures prcises et valides


Prcision

Imprcision

Erreur alatoire Non reproductibilit


Exactitude

ou Validit Erreur systmatique

Biais

Erreurs alatoires

Elles sont dues au hasard Leur direction (sous-estimation, surestimation) est imprvisible Mais la marge derreur est quantifiable par les lois de probabilit

Lerreur diminue si la taille de lchantillon augmente

La prcision est mesure par lintervalle de confiance


La prcision sera meilleure si la taille de lchantillon augmente donc Lintervalle de confiance sera plus troit si la taille de lchantillon augmente

Intervalle de confiance dune moyenne m (variable quantitative)

IC1 m z / 2

s2 n

Intervalle de confiance dun pourcentage p0 (variable qualitative)

IC1 p 0 z / 2

p0q 0 n

Erreurs systmatiques - biais

Un biais est une varit derreur dite systmatique , dans laquelle les mesures sont toujours errones dans le mme sens et non pas du fait du hasard

Mauvaise calibration dun appareil de mesure Rponses inexactes lors dun recueil par questionnaire

Donc le biais altre la validit des rsultats dune tude, il peut parfois remettre en question les conclusions

Sous-estimation (ou surestimation) de la frquence dune maladie

Frquence estime = 10% alors que la frquence relle est de 15% Traitement dclar efficace alors quil ne lest pas

Surestimation (ou sous-estimation) de lefficacit dun traitement

Il sagit derreurs dans la planification ou dans le droulement dune tude et non pas derreurs lies au hasard Contrairement aux erreurs alatoires, laugmentation des effectifs ne permet pas de rduire les biais

Caractriser les donnes


Fiabilit
Si

on mesure un phnomne plusieurs fois avec le mme instrument, on doit obtenir le mme rsultat Rptabilit, reproductibilit
Validit
Les

instruments de mesure choisis doivent permettre dapprhender le mieux possible le phnomne que lon cherche mesurer

Caractriser les donnes

Si lon dcompose le rsultat dune mesure en 3 lments


M=
Mesure

V
Vraie valeur

Es

Ea
Erreur alatoire

Erreur systmatique

Le problme de fiabilit est concern par lerreur alatoire Le problme de validit est concern par les deux termes derreur

Caractriser les donnes les chelles de mesure

Que mesurer ?

Phnomnes directement observables


Cas des sciences physiques Comportements Processus mentaux : opinions, attitudes

Phnomnes non observables

Les chiffres et la ralit


soit quantits vraies soit points de repre dune chelle (prfrence, attitude) soit fonction dtiquetage pour codifier les rponses

La classification des variables est fonde sur les oprations mathmatiques quil est possible de leur appliquer Les variables o le mme ensemble dopration est applicable sont mesures avec la mme chelle

Caractriser les donnes les chelles de mesure

chelles de proportion, chelle de rapport ou de ratio


Unit de mesure comportant un zro naturel qui correspond labsence du phnomne tudi Poids, vitesse, dosage Mmes proprits, mais pas de zro naturel Distance entre deux points mesures dans une unit constante et le point zro est choisi arbitrairement

chelles dintervalle

chelle de temprature

chelles ordinales

Modalits qualitatives ordonnes (stades de gravit dune maladie) Modalits qualitatives catgorielles (CSP, groupe sanguin)

chelles nominales

chelles de proportion et dintervalle => Variables quantitatives chelles ordinales et nominales => Variables qualitatives

Les diffrents types dtudes

tudes prospectives
Recueil

au fur et mesure Actualisation des informations Exemple : habitudes alimentaires, consommation de tabac, dalcool

tudes rtrospectives
Recueil

dvnements passs parfois trs anciens Biais de rappel Donnes parfois peu prcises

Quelques critres favorables


Cahier dobservation dans un essai thrapeutique Double saisie et / ou contrles de saisie Pr-tester un questionnaire Choix pertinent des informations recueillir

Suffisamment

pour rpondre lhypothse mais pas dinformation inutile

Mise plat des donnes


Non rpondants Valeurs manquantes sur certains items Valeurs aberrantes Valeurs extrmes

vrifier : exactes ou errones ?

Consquences de la non qualit

Ltude ne peut conclure


Hypothse

invrifiable Estimations trop imprcises Une tude pour rien

Les conclusions sont fausses


En

cas de biais Importance de comparer les rsultats aux autres tudes, aux lments apports par dautres disciplines

Quelques exemples

Fiches de recueil
Questions

ouvertes, manque de prparation, important avant analyse (correction, standardisation, codage), exhaustivit difficile valuer Questions fermes, bonne prparation, donnes facilement exploitables, donnes manquantes faciles reprer

A viter
Quelle est ou quelles sont la ou les pathologie(s) du patient Quel est le degr dautonomie du patient

Quel est le pronostic chez ce patient : . Quelles grilles dvaluation formalises utilisez-vous chez ce patient ? .. .. .. .. .. ..

Fiche standardise
La prise en charge palliative concerne principalement une pathologie volutive de fond Score de dpendance de lOMS (1 seule rponse possible) (1 seule rponse possible) Polypathologie du sujet 75 ans 0 - Capable de toute activit normale sans aucune restriction Cancreuse 1 - Capable dactivits lgres excluant toute activit physique pnible Hmopathie maligne 2 - Ambulatoire et capable de se suffire lui-mme mais incapable de toute autre Dmence en phase terminale activit. Hors du lit ou du fauteuil plus de 50% des heures de veille de jour Neurologique autre que dmence 3 - Capable de quelques activits personnelles mais confin au lit ou au Respiratoire fauteuil plus de 50% des heures de veille Cardiaque 4 - Totalement confin au lit ou au fauteuil. Incapable de toute activit, Rnale mme essentielle comme manger SIDA Autre : Le pronostic estim est-il infrieur 1 an ? (1 seule rponse possible) OUI NON Impossible dterminer

Si vous avez utilis une ou plusieurs grille(s) dvaluation chez ce patient, veuillez prciser la ou lesquelles (plusieurs rponses possibles) EVA Edmonton Mini-Mental Test Norton Doloplus2 HAD (Hospital Anxiety Depression) Karnofsky Braden QDSA Echelle de dpression griatrique OMS / Performance status Autres : ..

Quelques exemples

Fichier lectronique des donnes


Nombreux

items, valeurs manquantes frquentes, format texte Items indispensables uniquement, peu de valeurs manquantes, codage pralable des modalits

Exemple (1)
Numero 1 ANNEE NAISSANCE 1955 DATE DIAGNOSTIQUE 1993 SYMPTOMES NON ATCD TV NON ATCD TSV NON DATE ECG1 1993

2
3 4 5 1948 1966 1983

LIPOTHYMIES
LIPOTHYMIES PALPITATIONS

NON
NON NON

NON
NON OUI

2004
1999 1999

6
7 8 9

1976
1968 1963 1971

NON
NON NON NON

NON
NON NON NON

NON
NON OUI NON

1999
2000 1997 2005

10
11 12 13

1957
1947 1956 1929 1991

NON
NON PALPITATIONS

NON
NON NON

NON
NON OUI

2004
1993 1993 1993

14
15 16 17

1962
1961 1956 1951

2002
PALPITATIONS 1994 1982 NON NON NON NON NON OUI OUI NON

2005
1996 1996 1997

18

1970

2005

Exemple (2)
Numero 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 Ets GP GP GP GP GP GP GP GP GP GP GP GP GP GP GP GP GP GP GP GP GP GP GP GP GP GP GP Classe CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 CE2 Sexe M M M F F M M M M F F M F F M M F M M F M F M F M M F Taille 136 131 140 144 134 131 128 134 142 141 132 140 130 139 140 138 140 143 137 148 135 128 136 132 126 141 135 Age 9 8 8 9 9 8 9 8 9 9 9 9 8 9 9 9 8 8 9 8 10 9 9 8 8 10 8 Fum 1 1 0 2 0 2 1 0 1 0 1 1 2 1 0 1 2 0 0 0 1 0 0 1 0 2 2 Asth 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 Sport 0 1 1 1 0 0 1 0 1 0 0 0 0 0 1 1 1 1 1 0 0 1 0 0 1 1 0 CapSouffle 390 370 350 350 350 350 340 340 340 340 340 330 330 320 320 320 310 300 300 300 300 290 290 280 280 270 270