You are on page 1of 16

Qualit des donnes

Master

Version 1

Cration 10.10.2004

Approbation 10.10.2004

Mise jour 10.10.2004

Diffusion 14.03.2005

Auteur(s) P Staccini

Page 1

Une problmatique mal comprise


Qualit donnes Dimensions En pratique

La qualit des donnes des systmes de gestion de base de donnes (SGBD) a dabord t traite selon des approches techniques comme le contrle de concurrence (concurrency), la reprise arrire (recovery), lintgrit rfrentielle (integrity), le contrle de la scurit (security control) Bien que ces techniques soient ncessaires pour assurer de faon correcte les oprations dans un SGBD, elles nont pas t dveloppes pour rgler directement les problmes de qualit des donnes du point de vue de lutilisateur. Par exemple, une prise de dcision optimale repose dabord sur la recherche des donnes utiles et correctement dfinies, puis sur une prsentation adquate et utilisable dun contenu exact.

Master

Version 1

Cration 10.10.2004

Approbation 10.10.2004

Mise jour 10.10.2004

Diffusion 14.03.2005

Auteur(s) P Staccini

Page 2

Une problmatique mal comprise


Qualit donnes Dimensions En pratique

Les besoins que peuvent exprimer les utilisateurs, concernent rarement directement la qualit des donnes,
aspect quils considrent tort comme un problme technique, en dehors de leur champ de prrogative ou de comptence.

Leur dsir le plus courant est dutiliser les donnes sans prter une attention particulire au modle conceptuel sous-jacent, ni se soucier de savoir sils posent des hypothses incorrectes propos de leurs donnes.

Master

Version 1

Cration 10.10.2004

Approbation 10.10.2004

Mise jour 10.10.2004

Diffusion 14.03.2005

Auteur(s) P Staccini

Page 3

Une problmatique mal comprise


Qualit donnes Dimensions En pratique

Pourtant, au sein dun systme dinformation clinique, comme dans tout SI, le rle des utilisateurs finaux dans le traitement des donnes est tour tour un rle de producteur et de consommateur . La production concerne lajout de donnes dans le systme. La consommation des donnes concerne la recherche des donnes. Mme si elle est rpartie des niveaux de responsabilit diffrents, la prise de dcision est une constante des activits cliniques.
Cest une action la fois productrice et consommatrice de donnes qui ncessite donc, de la part du clinicien, une attention particulire la qualit des donnes contenues dans les bases de donnes dun systme dinformation clinique.

Master

Version 1

Cration 10.10.2004

Approbation 10.10.2004

Mise jour 10.10.2004

Diffusion 14.03.2005

Auteur(s) P Staccini

Page 4

Une problmatique mal comprise


Qualit donnes Dimensions En pratique

Lintrt initial sur la qualit des donnes a dabord concern la recherche et les essais cliniques. Puis la rflexion a gagn le domaine pidmiologique. Ensuite, les considrations stratgiques de la qualit des donnes ont concern lvaluation conomique et laudit clinique. Ncessit de professionnaliser la dmarche de gestion de la qualit des donnes Pour satisfaire cette exigence de qualit, certains ont propos doptimiser le recueil des donnes
par des approches techniques bases sur la constitution dun vocabulaire contrl ou lutilisation de nomenclatures, ou des approches organisationnelles bases sur la formation et lentranement la saisie.

Master

Version 1

Cration 10.10.2004

Approbation 10.10.2004

Mise jour 10.10.2004

Diffusion 14.03.2005

Auteur(s) P Staccini

Page 5

Une dmarche continue


Qualit donnes Dimensions En pratique

La qualit des donnes nest pas un tat. Cest une exigence qui sinscrit dans une dmarche continue de progrs, et qui se conoit depuis ltape danalyse conceptuelle lexploitation du systme constitu. Cest ainsi que lassociation amricaine de gestion de linformation mdicale a propos un rfrentiel transversal de mise en oeuvre et dvaluation dune stratgie damlioration de la qualit des donnes dun systme dinformation. Lvaluation de la qualit des donnes sinscrit donc dans un cycle et dpend du type dopration effectue : recueil, transmission, entreposage et analyse. chaque opration, la relation entre donnes et opration peut se faire
dans le sens causal : la qualit des donnes influe sur la qualit des oprations effectues, comme, par exemple, pour la transmission et lanalyse ou dans le sens inverse : la qualit de lopration influe sur le niveau de qualit des donnes, comme, par exemple, pour le recueil et lentreposage

Master

Version 1

Cration 10.10.2004

Approbation 10.10.2004

Mise jour 10.10.2004

Diffusion 14.03.2005

Auteur(s) P Staccini

Page 6

Un questionnement permanent
Qualit donnes Dimensions En pratique

Au moment de la capture des besoins des utilisateurs, de la dfinition des exigences du systme, et de son analyse conceptuelle, prendre en compte le problme de la qualit des donnes, amne se poser les questions suivantes
Quelles sont les donnes utilises selon les types dutilisateurs ? Les donnes recenses sont-elles toutes pertinentes ? Quel est le rapport cot-utilit de saisie dune donne ?

Lors de lexploitation en routine du systme, les principales questions qui se posent sont les suivantes :
Toutes les donnes juges comme obligatoires sont-elles saisies ? Les donnes saisies sont-elles compltes et sincres ? Quelle priodicit de mise jour choisir en fonction du contexte dutilisation ?
Master Version 1 Cration 10.10.2004 Approbation 10.10.2004 Mise jour 10.10.2004 Diffusion 14.03.2005 Auteur(s) P Staccini Page 7

Un questionnement permanent
Qualit donnes Dimensions En pratique

Une donne non reconnue comme pertinente sera considre comme accessoire par lutilisateur et ne sera pas saisie correctement. A linverse une donne juge comme obligatoire mais plus difficilement observable ou consommatrice de temps la saisie sera galement mal renseigne. Questions :
Quelle dfinition prendre pour valuer la pertinence dune donne ? Une donne dclare comme obligatoire saisir, est-elle pour autant pertinente ? Selon le contexte dutilisation (saisie, lecture, traitement), le degr de pertinence dune donne varie-t-il ?

Master

Version 1

Cration 10.10.2004

Approbation 10.10.2004

Mise jour 10.10.2004

Diffusion 14.03.2005

Auteur(s) P Staccini

Page 8

Un questionnement permanent
Qualit donnes Dimensions En pratique

Chez les utilisateurs, la proccupation du niveau de qualit des donnes dpend troitement :
de la plus-value apporte par la donne la documentation et la comprhension de ltat du patient ; de la plus-value apporte par la donne dans laide la prise de dcision ; du bnfice escompt par lutilisateur dans lexploitation ultrieure de la donne.

Dfinir une donne de qualit ncessite donc de considrer non seulement lexactitude de la donne stocke, mais galement dautres aspects comme lusage et lutilit.

Master

Version 1

Cration 10.10.2004

Approbation 10.10.2004

Mise jour 10.10.2004

Diffusion 14.03.2005

Auteur(s) P Staccini

Page 9

Dimensions de la qualit des donnes


Qualit donnes Dimensions En pratique

Selon une logique tablissant un rapport de cause effet entre la qualit du dveloppement logiciel et la qualit des donnes, la norme ISO 9126 recommande de travailler sur les points suivants : dfinition, compltude, comprhension, volatilit, traabilit et consistance. Ce cadre danalyse a t amlior pour servir de rfrentiel au dveloppement des environnements dentrepts de donnes. Cette approche concerne plutt le versant oprationnel du systme dinformation clinique que son versant dcisionnel. Elle ne permet pas davoir une vue densemble des conditions respecter selon le type de traitement.

Master

Version 1

Cration 10.10.2004

Approbation 10.10.2004

Mise jour 10.10.2004

Diffusion 14.03.2005

Auteur(s) P Staccini

Page 10

Dimension conceptuelle
Pertinence des donnes
Qualit donnes Dimensions En pratique Contenu Accessibilit aux valeurs Prcision des dfinitions Compltude Porte Essentialit, primordialit Granularit des attributs Niveau de dtail Prcision des domaines Evidence Identification Composition Homognit Redondance minimale Cohrence smantique Cohrence Cohrence structurelle Flexibilit Raction au changement
Version 1 Cration 10.10.2004 Approbation 10.10.2004 Mise jour 10.10.2004 Diffusion 14.03.2005

Vue conceptuelle

Prennit
Auteur(s) P Staccini Page 11

Master

Dimensions valeurs et reprsentation


Exactitude Qualit donnes Dimensions En pratique Actualit / cycle de temps Valeurs des donnes Compltude (niveau entit et attribut) Cohrence Adquation Prcision des formats Utilisation efficace du stockage Formats Reprsentation des donnes Flexibilit du format Portabilit Aptitude reprsenter valeurs nulles Instances physiques
Master Version 1 Cration 10.10.2004 Approbation 10.10.2004 Mise jour 10.10.2004 Diffusion 14.03.2005

Interprtabilit

Cohrence des reprsentations


Auteur(s) P Staccini Page 12

Approche fonctionnelle
Qualit donnes Dimensions En pratique

Dans le domaine mdical, on adopte une approche similaire, mais qui restitue chaque dimension selon quatre domaines dutilisation :
Application : concerne le but pour lequel les donnes sont recueillies ; Recueil : concerne les processus par lesquels les lments de donnes sont recueillis ; Entrept : concerne les processus et les systmes utiliss pour archiver les donnes et les journaux de donnes ; Analyse : concerne le processus de traduction des donnes en informations utilises par une application.

Cf. rfrentiel de gestion de la qualit des donnes

Master

Version 1

Cration 10.10.2004

Approbation 10.10.2004

Mise jour 10.10.2004

Diffusion 14.03.2005

Auteur(s) P Staccini

Page 13

En pratique
Qualit donnes Dimensions En pratique

Concernant la qualit des donnes, nous retiendrons trois principes de base :


la donne est une entit informatique, un conteneur, qui possde des caractristiques intrinsques ; chaque utilisateur, selon le contexte, fait appel un ou plusieurs conteneurs pour y dposer ou en extraire du contenu ; lusage du contenu par lutilisateur dpend du type de conteneur, du type dusage (recueil, prsentation, analyse) et du contexte de la demande.

Master

Version 1

Cration 10.10.2004

Approbation 10.10.2004

Mise jour 10.10.2004

Diffusion 14.03.2005

Auteur(s) P Staccini

Page 14

En pratique
Qualit donnes Dimensions En pratique
Traiter Recueillir Entreposer Analyser

contenu

Interface
conteneur

Donne
Dfinition Pertinence Cohrence Granularit Exactitude Prcision

Accessibilit
Opportunit Scurit Lgalit Utilisabilit Interprtabilit

Contexte
Opportunit Compltude Actualit Utilit Interprtabilit

Utilisateur
Quoi ? Pourquoi ? Quand ? Pour qui ? Comment ?

Master

Version 1

Cration 10.10.2004

Approbation 10.10.2004

Mise jour 10.10.2004

Diffusion 14.03.2005

Auteur(s) P Staccini

Page 15

En pratique
Qualit donnes Dimensions En pratique

Quel que soit le type de systme de gestion de bases de donnes ou darchitecture informatique qui le supporte, le dictionnaire des donnes dun systme dinformation revt une importance stratgique en matire de communication des donnes et daide la prise de dcision.
O se trouve la donne ? Que contient-elle ? Qui est responsable de sa saisie ? Quelles sont les oprations qui lutilisent et pour quels objectifs ? A qui ou quoi est-elle utile et accessible ? Comment est-elle prsente ?

Master

Version 1

Cration 10.10.2004

Approbation 10.10.2004

Mise jour 10.10.2004

Diffusion 14.03.2005

Auteur(s) P Staccini

Page 16