You are on page 1of 8

Disponible en ligne sur

www.sciencedirect.com

Revue d’Épidémiologie et de Santé Publique 61 (2013) 261–268

Article original
Méthodes biostatistiques et épidémiologiques employées pour
la recherche biomédicale : implications pour la formation
médicale initiale
Statistical and epidemiological methods used in biomedical research:
Implications for initial medical education
M.-Q. Picat a,*, M. Savès b,d, J. Asselineau a,c, M. Dumoulin a, G. Coureau b,d,
L.-R. Salmi b,d, P. Perez a,c, G. Chêne a,c
a
Unité de soutien méthodologique à la recherche clinique et épidémiologique (USMR), université Bordeaux-Segalen,
CHU de Bordeaux, ISPED, 146, rue Léo-Saignat, 33076 Bordeaux cedex, France
b
Université Bordeaux-Segalen, institut de santé publique d’épidémiologie et de développement (ISPED),
146, rue Léo-Saignat, 33076 Bordeaux cedex, France
c
Inserm, centre d’investigation clinique et d’épidémiologie clinique 7 (CIC-EC 7), 33076 Bordeaux cedex, France
d
Pôle de santé publique, service d’information médicale, CHU de Bordeaux, 146, rue Léo-Saignat, 33076 Bordeaux cedex, France
Reçu le 28 juillet 2011 ; accepté le 6 novembre 2012

Abstract
Background. – The main source of key medical information consists in original articles published in peer-reviewed biomedical journals.
Reported studies use increasingly sophisticated statistical and epidemiological approaches that first require a solid understanding of core methods.
However, such understanding is not widely shared among physicians. Our aim was to assess whether the basic statistical and epidemiological
methods used in original articles published in general biomedical journals are taught during the first years of the medical curriculum in France.
Methods. – We selected original articles published in The New England Journal of Medicine, The Lancet, and The Journal of the American
Medical Association, over a period of six months in 2007 and in 2008. A standardized statistical content checklist was used to extract the necessary
information in the ‘‘Abstract’’, ‘‘Methods’’, ‘‘Results’’, footnotes of tables, and legends of figures. The methods used in the selected articles were
compared to the national program and the public health program of biostatistics and epidemiology taught during the first six years of medical school.
Results. – The 237 analyzed original articles all used at least one statistical or epidemiological method. Descriptive statistics, confidence
interval and Chi2 or Fisher tests, methods used in more than 50% of articles, were repeatedly taught throughout the medicine curriculum. Measures
of association, sample size, fit and Kaplan–Meier method, used in 40 to 50% of articles, were specifically taught during training sessions on critical
reading methods. Cox model (41% of articles) and logistic regression (24% of articles) were never taught. The most widely used illustrations,
contingency tables (92%) and flowcharts (48%), were not included in the national program.
Conclusion. – More teaching of the core methods underlying the understanding of sophisticated methods and illustrations should be included
in the early medical curriculum so that physicians can read the scientific literature critically for their medical education.
# 2013 Elsevier Masson SAS. All rights reserved.

Keywords: Biostatistics; Epidemiology; Evidence-Based Medicine; Peer review research; Medical education

Résumé
Position du problème. – Les études originales publiées dans les journaux biomédicaux de référence sont les principales sources de nouvelles
connaissances. Elles utilisent des méthodes biostatistiques et épidémiologiques de plus en plus sophistiquées, qui nécessitent une compréhension
solide des notions fondamentales. Notre objectif était d’évaluer si les notions fondamentales concernant les méthodes biostatistiques et
épidémiologiques employées dans les articles originaux des journaux biomédicaux généralistes étaient enseignées en premier et début du
deuxième cycles de médecine en France.

* Auteur correspondant.
Adresse e-mail : marie-quitterie.picat@isped.u-bordeaux2.fr (M.Q. Picat).

0398-7620/$ – see front matter # 2013 Elsevier Masson SAS. Tous droits réservés.
http://dx.doi.org/10.1016/j.respe.2012.11.002
262 M.-Q. Picat et al. / Revue d’Épidémiologie et de Santé Publique 61 (2013) 261–268

Méthodes. – Nous avons sélectionné les articles originaux publiés dans The New England Journal of Medicine, The Lancet et The Journal of
the American Medical Association sur six mois en 2007 et 2008. Une grille standardisée de lecture a permis d’extraire les informations nécessaires
dans les sections « Résumé », « Méthodes », « Résultats », les notes de bas de tableaux et les légendes des figures. Les méthodes employées dans les
articles de notre étude ont été confrontées aux enseignements de biostatistique et d’épidémiologie prévus par le programme national et celui des
collèges d’enseignants en santé publique des deux premiers cycles de médecine.
Résultats. – Les 237 articles analysés rapportaient tous l’utilisation d’au moins une méthode biostatistique ou épidémiologique. L’ensei-
gnement des statistiques descriptives, de l’intervalle de confiance et des tests de Chi2 ou Fisher (méthodes utilisées dans plus de 50 % des articles)
était programmé de façon répétée au cours des six premières années de médecine. Celui des mesures d’association, du calcul de taille d’étude, de
l’ajustement et de la méthode de Kaplan-Meier (40 à 50 % des articles) était prévu spécifiquement au moment de la formation à la lecture critique
d’articles. L’enseignement du modèle de Cox (41 % des articles) et de la régression logistique (24 % des articles) n’était jamais prévu. Les
principales représentations employées, tableaux de contingence (92 %) et diagrammes de flux (48 %), n’étaient pas prescrites par le programme
national.
Conclusion. – Le cursus médical doit inclure un enseignement élargi des notions fondamentales en biostatistique, épidémiologie et
représentations de données afin que les praticiens puissent pratiquer la lecture critique d’articles et utiliser la littérature scientifique comme
source de formation médicale.
# 2013 Elsevier Masson SAS. Tous droits réservés.

Mots clés : Biostatistique ; Épidémiologie ; Médecine fondée sur les faits ; Revue à comité de lecture ; Formation médicale

1. Introduction domaines : médecine interne, médecine générale, pédiatrie et


médecine préventive. Les compétences variaient selon la
La médecine fondée sur les faits, désignée sous le terme complexité de la méthode biostatistique. Si 82 % des internes
anglais Evidence-Based Medicine, a pris une place croissante savaient interpréter un risque relatif, seulement 37 % savaient
en médecine au cours de la dernière décennie [1,2]. Elle repose interpréter un rapport de cotes et 11 % les résultats d’une
sur l’utilisation pertinente, dans la pratique médicale quoti- analyse de survie de type Kaplan-Meier. Parallèlement, les
dienne, des meilleures données disponibles issues d’études méthodes biostatistiques et épidémiologiques employées dans
cliniques de qualité. Elle nécessite, de la part des praticiens, une les études publiées dans les journaux biomédicaux sont de plus
capacité à lire des articles scientifiques de haut niveau, fondée en plus complexes. Horton et Switzer [10] ont rapporté en
sur une analyse critique des études publiées afin d’en extraire 2005 que seulement 21 % des médecins étaient capables de
(ou pas) les résultats qui pourront améliorer le processus de comprendre et d’interpréter les résultats des articles publiés
prise de décision face au malade. dans le New England Journal of Medicine, en raison de
Pour optimiser les décisions cliniques et garantir leur qualité l’utilisation de méthodes sophistiquées. Ces problèmes
d’exercice, les praticiens doivent mettre à jour leurs constituent donc un défi majeur, pour les praticiens d’une
connaissances régulièrement. Les connaissances les plus part, afin d’évaluer la qualité et la pertinence des résultats des
susceptibles d’influencer les pratiques médicales sont issues études, et pour les enseignants d’autre part, qui doivent intégrer
d’études originales de recherche clinique publiées dans les l’enseignement de la biostatistique et de l’épidémiologie de
journaux biomédicaux à comité de lecture [3]. Ces études manière appropriée dans le cursus médical.
utilisent des méthodes biostatistiques et épidémiologiques pour L’objectif de notre étude était d’évaluer si les notions
l’analyse des données afin de tester l’hypothèse scientifique fondamentales parmi les méthodes biostatistiques et épidémio-
formulée initialement. Ces méthodes doivent être reportées logiques employées dans les articles originaux des journaux
avec exactitude dans les articles afin de s’assurer que les biomédicaux généralistes étaient enseignées au cours des
informations pertinentes, nécessaires pour vérifier ou repro- premier et deuxième cycles de la formation médicale en France,
duire le travail, soient présentes [4,5]. afin de proposer des priorités d’enseignements pour la formation
Pour tout praticien, une compréhension des notions médicale initiale en biostatistique et en épidémiologie
fondamentales est essentielle pour appréhender les hypothèses clinique. L’originalité de ce travail a concerné la réflexion sur
et raisonnements sous-jacents aux méthodes plus complexes. A l’adéquation aux enseignements de biostatistique et d’épidé-
défaut d’une telle acquisition, le futur praticien peut être miologie clinique dans le contexte récent de réforme des études
handicapé pour l’analyse critique de la littérature médicale de santé. Il a nécessité un travail préalable de description des
scientifique, outil incontournable de formation tout au long de méthodes biostatistiques et épidémiologiques employées dans
sa vie professionnelle. les articles originaux des journaux biomédicaux généralistes.
Le niveau de connaissance des notions fondamentales en
biostatistique et épidémiologie des médecins reste néanmoins 2. Méthodes
limité [6–8]. À partir d’une revue des méthodes employées dans
239 articles originaux publiés dans six journaux biomédicaux 2.1. Sélection des articles
de référence, Windish et al. [9] ont évalué les compétences en
biostatistique de près de 300 internes en médecine, exerçant Nous avons sélectionné les articles rapportant une contribu-
dans le Connecticut aux États-Unis, en 2006, dans divers tion originale, publiés dans trois journaux biomédicaux de
M.-Q. Picat et al. / Revue d’Épidémiologie et de Santé Publique 61 (2013) 261–268 263

référence généralistes à comité de lecture et à facteur d’impact Tableau 1


Grille de lecture standardisée des méthodes biostatistiques et épidémiologiques
élevé : The New England Journal of Medicine (NEJM), The
et des représentations de données employées dans les articles originaux. The
Lancet, et The Journal of the American Medical Association NEJM, The Lancet et The JAMA ; janvier, février, novembre, décembre 2007 et
(JAMA). Les articles considérés utilisaient soit un recueil de novembre, décembre 2008.
données ad hoc et rapportaient les résultats d’études originales
Méthodes biostatistiques et/ou épidémiologiques employées
de recherche clinique (essai clinique, cohorte, étude trans- Méthodes prédéfinies dans les études d’Horton
versale, étude cas-témoins), soit une modélisation à partir de et Switzer et de Windish et al.
données déjà publiées, apportant une contribution originale Statistiques descriptives 1& Oui / 0& Non
(méta-analyse, revue systématique de la littérature et analyse de Test du Chi2 et/ou test de Fischer 1& Oui / 0& Non
Test de Student 1& Oui / 0& Non
décision). Ces articles ont été regroupés sous l’appellation
Tests non paramétriques 1& Oui / 0& Non
« articles originaux ». En revanche, les articles non médicaux, Analyse de la variance 1& Oui / 0& Non
recensés sous les sections Original Contributions des journaux Corrélation deux à deux 1& Oui / 0& Non
considérés, ont été exclus car ne relevant pas directement de la Analyse de survie (Kaplan-Meier) 1& Oui / 0& Non
recherche clinique et épidémiologique, ainsi que les rapports de Analyse de survie (modèle de Cox) 1& Oui / 0& Non
Régression logistique 1& Oui / 0& Non
cas cliniques car ne rentrant pas directement dans les objectifs
Régression linéaire 1& Oui / 0& Non
de ce travail. Autres modèles de régression. Si oui, précisez 1& Oui / 0& Non
Ce projet a été élaboré en janvier 2007 à l’unité de soutien Risque relatif et/ou rapport de cotes 1& Oui / 0& Non
méthodologique et de recherche clinique du CHU de Bordeaux, Calcul de taille d’étude 1& Oui / 0& Non
sous la direction d’un enseignant en Santé publique. Deux Incidence et/ou prévalence 1& Oui / 0& Non
Sensibilité et/ou spécificité et/ou valeurs 1& Oui / 0& Non
internes en Santé publique, formées à la recherche clinique dans
prédictives
cette unité et alors diplômées en biostatistique et épidémiologie Ajustement 1& Oui / 0& Non
(niveau Master 1 de Santé publique) ont été impliquées dans Analyses de sensibilité aux données 1& Oui / 0& Non
l’élaboration de ce projet. manquantes
Les années 2007 et 2008 ont été retenues pour la sélection Analyses économiques 1& Oui / 0& Non
Comparaisons multiples 1& Oui / 0& Non
des articles afin de disposer des résultats les plus actuels lorsque
ce travail a été entrepris. Le type de méthodes biostatistiques et Méthodes incorporées par les auteurs
épidémiologiques employées dans la littérature scientifique Intervalle de confiance 1& Oui / 0& Non
Interaction 1& Oui / 0& Non
étant en évolution constante [11], nous avons fait le choix de Log transformation des données 1& Oui / 0& Non
recueillir les méthodes à différents temps suffisamment Aire sous la courbe (c statistics) 1& Oui / 0& Non
éloignés les uns des autres : janvier-février et novembre- Standardisation 1& Oui / 0& Non
décembre pour l’année 2007, et novembre-décembre pour Appariement 1& Oui / 0& Non
l’année 2008. Méthodes de rééchantillonage 1& Oui / 0& Non
Représentations de données employées
2.2. Recueil des données Représentation prédéfinie dans les études
d’Horton et Switzer et de Windish et al.
Tableau de contingence 1& Oui / 0& Non
Pour recueillir les informations pertinentes pour notre étude,
nous avons élaboré une grille standardisée de lecture des Représentations incorporées par les auteurs
Diagramme de flux 1& Oui / 0& Non
articles originaux (Tableau 1). Cette grille de lecture permettait Courbe de survie de type Kaplan-Meier 1& Oui / 0& Non
de recueillir les caractéristiques générales des articles, les Boı̂te à moustaches, diagramme en 1& Oui / 0& Non
méthodes biostatistiques et épidémiologiques ainsi que les entonnoir et/ou graphique en forêt
représentations de données employées. Courbe de mesures répétées dans le temps 1& Oui / 0& Non
Les caractéristiques générales étaient le champ de recher-
che, le pays d’affiliation du premier auteur et le schéma d’étude.
Quand le champ de recherche était pluridisciplinaire, le choix méthodes et représentations décrites dans ces deux études.
du champ de recherche principal a été guidé par le département Parallèlement, elle a été enrichie par des méthodes et
d’affiliation des premiers et derniers auteurs. représentations non anticipées, incorporées par les auteurs au
Le choix des méthodes et des représentations de données à fur et à mesure de leur lecture des articles, si elles étaient
recueillir a été guidé par deux études de la littérature concernant pertinentes dans une confrontation aux notions fondamentales
les notions fondamentales en biostatistique et épidémiologie : enseignées en formation médicale initiale.
l’étude d’Horton et Switzer, qui décrivait les méthodes Les informations ont été extraites dans les sections
employées dans 311 articles publiés dans The NEJM entre « Résumé », « Méthodes » et « Résultats », les notes de bas
janvier 2004 et juin 2005 [10], et l’étude de Windish et al., qui de tableaux et les légendes des figures. Le codage des données
constituait une revue des méthodes employées dans 239 articles était binaire. Il a été réalisé par l’enseignant et les deux internes
originaux publiés dans six journaux biomédicaux (The du projet.
American Journal of Medicine, The Annals of Internal Les 30 premiers articles ont été codés par chacun des trois
Medicine, The British Medical Journal, The NEJM, The lecteurs puis confrontés pour assurer la concordance des
Lancet et The JAMA) [9]. Notre grille de lecture a repris les définitions et de l’interprétation des items. Les données des
264 M.-Q. Picat et al. / Revue d’Épidémiologie et de Santé Publique 61 (2013) 261–268

autres articles ont été extraites indépendamment par un seul Tableau 2


Champs de recherche des études. The NEJM, The Lancet et The JAMA ; janvier,
lecteur. Les articles pour lesquels l’utilisation d’une méthode
février, novembre, décembre 2007 et novembre, décembre 2008.
était douteuse ont fait l’objet d’une discussion pour obtenir un
accord consensuel de codage. Champs de recherche Effectif %
Maladies cardiovasculaires 57 24,1
2.3. Analyse des données Maladies infectieuses 39 16,5
Cancérologie 29 12,2
Médecine internea 17 6,3
2.3.1. Etape préalable de description des méthodes et
Pédiatrie 15 6,3
représentations employées Endocrinologie 12 5,1
La première partie de l’analyse a permis la description des Neurologie 10 4,2
articles originaux éligibles, des modalités de représentation des Génétique 10 4,2
données recueillies dans chaque étude ainsi que des méthodes Gériatrie 10 4,2
Pneumologie 7 3,0
biostatistiques et épidémiologiques utilisées. Les données
Psychiatrie 7 3,0
colligées étant binaires, les variables ont été décrites en termes Santé publique 7 3,0
d’effectifs et de pourcentages. Les analyses ont été réalisées avec Gynécologie – Obstétrique 6 2,5
le logiciel SAS1 (version no 9.1.3, SAS Institute, Carry, Caroline Néphrologie – Urologie 4 1,7
du Nord). Hépato-gastro-entérologie 3 1,3
Anesthésie – Réanimation 2 0,8
Dermatologie 1 0,4
2.3.2. Enseignement des méthodes et représentations au Ophtalmologie 1 0,4
cours des six premières années de médecine
Total 237 100,0
Nous avons ensuite confronté les méthodes et représenta-
a
tions de données employées dans les articles de notre étude à Dont un article de rhumatologie.
l’enseignement de biostatistique et d’épidémiologie clinique
des six premières années de la formation médicale initiale en
France. Les programmes d’enseignement considérés étaient le données a donc porté sur 237 articles originaux publiés
programme national et le programme des collèges d’ensei- dans The NEJM, The Lancet et The JAMA pour les périodes
gnants en santé publique. La réforme actuelle des études de janvier-février 2007, novembre-décembre 2007 et novembre-
santé scinde les six premières années de la formation médicale décembre 2008.
en deux grandes périodes : la Licence santé médecine, pendant
laquelle les notions fondamentales sont acquises, et le Master 3.2. Caractéristiques générales des articles originaux
de sciences médicales ou deuxième cycle, pendant lequel ces
notions sont mises en application pour pratiquer la lecture Les journaux biomédicaux sélectionnés étant généralistes,
critique d’articles. Pour le programme national de Licence, les champs de recherche concernés étaient variés (Tableau 2).
le contenu de l’unité d’enseignement 4 « Évaluation des Néanmoins, plus de la moitié des publications concernait les
méthodes d’analyse appliquées aux sciences de la vie et de la maladies cardiovasculaires, les maladies infectieuses et la
santé » a été considéré pour la biostatistique [12]. Le contenu cancérologie.
du module « Santé publique » de l’unité d’enseignement 7 Les premiers auteurs exerçaient majoritairement en Amé-
« Santé, Société, Humanité » a été considéré pour l’épidé- rique du Nord (52 %) et en Europe (36 %) pour les périodes
miologie. Enfin, le glossaire des épreuves classantes nationa- concernées, plus particulièrement dans trois pays : États-Unis,
les, disponible sur le site Internet du centre national des Canada et Royaume-Uni dans deux tiers des cas.
concours d’Internat, a été considéré comme référentiel des Parmi les 237 articles analysés, 223 utilisaient un recueil de
méthodes biostatistiques et épidémiologiques à enseigner au données ad hoc (essai clinique, cohorte, étude transversale,
cours du Master de sciences médicales [13]. Concernant le étude cas-témoins) et 14 une modélisation à partir de données
programme des collèges d’enseignants en santé publique, le déjà publiées (méta-analyse, revue systématique de la
référentiel d’enseignement que nous avons pu considérer littérature et analyse de décision). Les essais cliniques et les
concernait l’enseignement de la biostatistique [14]. Cet études observationnelles de cohorte étaient retrouvés dans plus
ouvrage s’adresse principalement aux étudiants de la Licence de 75 % des articles.
santé médecine.
3.3. Méthodes biostatistiques et épidémiologiques et
3. Résultats représentations de données employées

3.1. Sélection des articles originaux 3.3.1. Méthodes biostatistiques et épidémiologiques


Les 237 articles mentionnaient tous l’emploi d’au moins une
Au total, 248 articles originaux ont été identifiés pour les méthode biostatistique ou épidémiologique (Tableau 3). Tous
périodes considérées. Parmi ces articles, 11 ne répondaient pas employaient des statistiques descriptives. L’intervalle de
aux critères d’éligibilité de l’étude. Il s’agissait de dix séries de confiance et les tests du Chi2 ou de Fisher étaient utilisés
cas cliniques et d’un article de sociologie. L’analyse des dans plus de la moitié des articles. Plus d’un tiers des articles
M.-Q. Picat et al. / Revue d’Épidémiologie et de Santé Publique 61 (2013) 261–268 265

Tableau 3
Méthodes biostatistiques et épidémiologiques dans 237 articles originaux, présentées par ordre décroissant de fréquence d’utilisation. The NEJM, The Lancet et The
JAMA ; janvier, février, novembre, décembre 2007 et novembre, décembre 2008.
Méthodes Année 2007 Année 2008 Total
(n = 161) (n = 76) (n = 237)
n % n % n %
Plus de 50 % des articles
Statistiques descriptives 161 100,0 76 100,0 237 100,0
Intervalle de confiance 134 83,2 64 84,2 198 83,5
Test du Chi2, test de Fisher 95 59,0 41 53,9 136 57,4
De 30 à 50 % des articles
Risque relatif, rapport de cotes 79 49,1 26 34,2 105 44,3
Calcul de taille d’étude 70 43,5 35 46,1 105 44,3
Ajustement 69 42,9 29 38,2 98 41,4
Analyse de survie (Kaplan-Meier) 71 44,1 25 32,9 96 40,5
Analyse de survie (modèle de Cox) 63 39,1 33 43,4 96 40,5
Incidence, prévalence 53 32,9 30 43,4 83 35,0
Moins de 30 % des articles
Tests non paramétriques 46 28,6 17 22,4 63 26,6
Test de Student 46 28,6 13 17,1 59 24,9
Régression logistique 38 23,6 19 25,0 57 24,1
Interaction 31 19,3 25 32,9 56 23,6
Autres modèles de régressiona 19 11,8 16 21,1 35 14,8
Analyse de la variance 26 16,1 8 10,5 34 14,3
Comparaisons multiples 16 9,9 12 15,8 28 11,8
Régression linéaire 30 18,6 6 7,9 26 11,0
Corrélation 13 8,1 10 13,2 23 9,7
Analyse de sensibilité aux données manquantes 11 6,8 11 14,5 22 9,3
Sensibilité, spécificité, valeurs prédictives 11 6,8 2 2,6 13 5,5
Log transformation des données 6 3,7 6 7,9 12 5,1
Aire sous la courbe (c statistics) 7 4,3 2 2,6 9 3,8
Analyses économiques 7 4,3 1 1,3 8 3,4
Standardisation 3 1,9 4 5,3 7 3,0
Appariement 6 3,7 1 1,3 7 3,0
Méthodes de rééchantillonnage 4 2,5 1 1,3 5 2,1
a
Régression de Poisson, méta-régression, régression d’Egger, régression de Weibull, modèle de régression hiérarchique, régression pour séries temporelles,
régression à effet mixte.

rapportaient des mesures d’association (risque relatif, rapport 3.3.2. Représentation de données
de cotes), un calcul de taille d’étude, un ajustement ou des Les statistiques descriptives étaient présentées dans des
méthodes d’analyse des données de survie, comme la méthode tableaux de contingence dans 92 % des articles (Tableau 4). Le
de Kaplan-Meier ou le modèle de Cox. Concernant les diagramme de flux, préconisé par les recommandations
méthodes de régression, la régression logistique était recensée CONsolidated Standards Of Reporting Trials (CONSORT)
dans environ un quart des articles et la régression linéaire dans [4] et STAndards for the Reporting of Diagnostic accuracy
plus de 10 % d’entre eux. studies (STARD) [5], était employé pour illustrer l’éligibilité de

Tableau 4
Représentations de données dans 237 articles originaux, présentées par ordre décroissant de fréquence d’utilisation. The NEJM, The Lancet et The JAMA ; janvier,
février, novembre, décembre 2007 et novembre, décembre 2008.
Représentations de données Année 2007 Année 2008 TOTAL
(n = 161) (n = 76) (n = 237)
n % n % n %
Tableau de contingence 148 91,9 70 92,1 218 92,0
Diagramme de flux 78 48,4 35 46,1 113 47,7
Courbe de survie de type Kaplan-Meier 60 37,3 22 28,9 82 34,6
Boı̂te à moustaches, diagramme en entonnoir, graphique en forêt 42 26,1 17 22,4 59 24,9
Courbe de mesures répétées dans le temps 25 15,5 17 22,4 42 17,7
266 M.-Q. Picat et al. / Revue d’Épidémiologie et de Santé Publique 61 (2013) 261–268

la population et les déviations au protocole (perdus de vue, des articles de notre étude, au cours des six premières années
abandons) dans 48 % des articles. Les courbes de survie étaient de la formation médicale.
présentes dans 35 % des articles. Les tests de comparaison de deux variables quantitatives,
tests de Student ou tests non paramétriques, employés dans
3.4. Comparaison des méthodes et représentations de moins d’un tiers des articles, sont prévus en Licence santé, à la
données employées dans les articles par rapport aux fois par le programme national et celui des collèges
enseignements en Licence-Master santé d’enseignants en santé publique. Concernant les méthodes de
régression, l’enseignement de la régression logistique,
3.4.1. Méthodes biostatistiques et épidémiologiques employée dans près d’un quart des articles analysés, n’est
Les statistiques descriptives, l’intervalle de confiance et les prévu au cours des six premières années de la formation
tests du Chi2 ou de Fisher, employés dans plus de 50 % des médicale par aucun des programmes considérés. L’enseigne-
articles originaux de notre étude sont mentionnés par ment de la régression linéaire multivariée, employée dans plus
l’ensemble des programmes considérés (Tableau 5). Ces de 10 % des articles, est prévu en Licence santé par les collèges
méthodes correspondent aux notions fondamentales à acquérir d’enseignants en santé publique, et en Master par le programme
dès la Licence santé médecine et sont répétées et appliquées en national.
Master de sciences médicales.
Les mesures d’association (risque relatif, rapport de 3.4.2. Représentations de données
cotes), le calcul de taille d’étude, l’ajustement et la méthode Hormis la courbe de survie de Kaplan-Meier, le programme
de Kaplan-Meier, employés dans plus d’un tiers des articles, national ne mentionne aucune des représentations de données
sont préconisés plus spécifiquement en Master par le que nous avons recueillies dans notre étude. Le programme de
programme national. Le programme des collèges d’ensei- biostatistique prévu par les collèges d’enseignants en santé
gnants en santé publique introduit cependant les mesures publique en Licence santé médecine préconise l’enseignement
d’association et la méthode de Kaplan-Meier dès la Licence du tableau de contingence (92 % des articles), du diagramme de
santé. En revanche, aucun des programmes considérés ne flux (48 % des articles), de la courbe de survie de Kaplan-Meier
prévoit l’enseignement du modèle de Cox, utilisé dans 41 % (35 % des articles) et des boı̂tes à moustaches.

Tableau 5
Enseignements, en Licence et Master santé, des méthodes employées dans les 237 articles de notre étude. Programme national et programme des collèges
d’enseignants en santé publique.
Méthode Licence santé Master santé
% Programme Programme des collèges Programme
national d’enseignants en santé publique national
Statistiques descriptives 100,0 X X X
Intervalle de confiance 83,5 X X X
Test du Chi2, test de Fisher 57,4 X X X
Risque relatif, rapport de cotes 44,3 X X
Calcul de taille d’étude 44,3 X
Ajustement 41,4 X
Analyse de survie (Kaplan-Meier) 40,5 X X
Analyse de survie (modèle de Cox) 40,5
Incidence, prévalence 35,0 X X
Tests non paramétriques 26,6 X X
Test de Student 24,9 X X
Régression logistique 24,1
Interaction 23,6 X
Autres modèles de régression 14,8
Analyse de la variance 14,3 X
Comparaisons multiples 11,8
Régression linéaire 11,0 X X
Corrélation 9,7 X
Analyse de sensibilité aux données manquantes 9,3
Sensibilité, spécificité, valeurs prédictives 5,5 X X X
Log transformation 5,1
Aire sous la courbe (c statistics) 3,8
Analyses économiques 3,4
Standardisation 3,0
Appariement 3,0 X X
Méthodes de rééchantillonnage 2,1
« X » signifie que l’enseignement de la méthode est prévu par le programme considéré.
M.-Q. Picat et al. / Revue d’Épidémiologie et de Santé Publique 61 (2013) 261–268 267

4. Discussion l’interaction, la log transformation des données, l’aire sous


la courbe (c statistics), la standardisation, l’appariement, les
Tous les articles originaux de notre étude rapportaient méthodes de rééchantillonage ainsi que les représentations de
l’utilisation d’au moins une méthode biostatistique ou épidé- données, mais elle ne se prétend pas exhaustive pour l’ensemble
miologique. Les méthodes les plus fréquemment employées des méthodes et représentations employées dans la littérature.
étaient les statistiques descriptives, l’intervalle de confiance et les Elle ne prend pas en compte des notions telles que les
tests du Chi2 ou de Fisher. Il est prévu que ces méthodes soient probabilités ou le raisonnement bayésien, les mesures d’impact
enseignées de manière répétée, en Licence puis en Master, au (différences absolues et relatives de risque, excès de risque,
cours de la formation médicale. Leur compréhension est nombre de sujets à traiter) [16], et en particulier les
indispensable, notamment celle de l’intervalle de confiance, développements méthodologiques actuels liés aux données
particulièrement pertinent pour les utilisateurs de la médecine « omics » [17] dont l’introduction au cours de la formation
fondée sur les faits [15]. L’enseignement des mesures médicale fait l’objet de discussions [18,19]. Dans notre étude,
d’association, du calcul de taille d’étude, de l’ajustement et de 4,2 % des articles étaient concernés par le champ de la
la méthode de Kaplan-Meier est programmé plus spécifiquement génétique. Les méthodes d’analyse de données « omics »
en Master, au moment de la formation à la lecture critique recensées dans ces articles étaient des méthodes adaptées aux
d’articles scientifiques. En revanche, celui du modèle de Cox et données de grandes dimensions : analyse en composantes
de la régression logistique n’est jamais inclus. Concernant les principales, classification hiérarchique ascendante, correction
représentations de données, le tableau de contingence, le pour la multiplicité des tests et analyses discriminantes.
diagramme de flux et la courbe de survie de Kaplan-Meier Néanmoins, l’idée de ce travail n’était pas de collecter toutes
étaient très souvent employées pour illustrer les résultats des les méthodes de manière exhaustive, mais celles qui
études. L’enseignement de ces représentations est prévu par le permettaient de former en premier et début de deuxième
programme des collèges d’enseignants en santé publique, mais cycles (où se situe principalement l’enseignement en santé
seule la courbe de survie de Kaplan-Meier est prescrite par le publique) les jeunes médecins à une compréhension suffisante
programme national. des notions fondamentales incontournables pour la compré-
Concernant la sélection des articles, la fréquence de parution hension de méthodes plus complexes.
des articles originaux étant de trois à quatre par semaine pour La grille de recueil des méthodes a ainsi été élaborée avec
chaque journal, nous avons fait le choix d’un recueil sur six la finalité de cibler les notions fondamentales à enseigner aux
mois, ce qui nous permettait d’analyser un échantillon étudiants et d’identifier les méthodes plus complexes pour
d’articles compris entre 216 et 288 (239 articles dans l’étude que leurs hypothèses et leurs raisonnements sous-jacents
de Windish et al. et 311 dans l’étude de Horton et Switzer). puissent également être appréhendés. Le fait que le nombre
L’évolution constante de la médecine a justifié notre choix de de méthodes complexes utilisées couramment dans les
recueil des méthodes biostatistiques à différents temps. Nous articles ait augmenté au cours des dix à 15 dernières années
reconnaissons que notre échantillon aurait idéalement dû être doit être la base d’un renforcement important de l’ensei-
sélectionné aléatoirement. A posteriori, nous n’avons pas gnement des notions fondamentales en biostatistique et en
d’éléments permettant de penser que la saisonnalité des épidémiologie en premier et début de deuxième cycles. Les
publications pourrait modifier notre conclusion. Nos résultats étudiants sont plus à même de découvrir l’intérêt de ces
s’accordent avec ceux des deux études qui nous ont servi de enseignements en fin de cursus, particulièrement en troisième
référentiel pour le choix de notre effectif d’analyse et pour cycle lorsqu’ils sont beaucoup plus intégrés dans l’organisa-
l’élaboration de notre grille de recueil des méthodes [9,10] sur tion des services cliniques. A ce moment-là, les notions
l’importance des statistiques descriptives et sur l’utilisation des fondamentales en épidémiologie et en statistique leur
méthodes d’analyses multivariées. permettant d’appréhender des méthodes plus sophistiquées
Les items sélectionnés pour élaborer notre grille de lecture et auront déjà été enseignées.
les modalités de regroupement peuvent être discutés. Certains Cette étude fournit des informations actualisées pour mieux
items auraient pu être plus développés, en particulier les aspects cibler les notions fondamentales en biostatistique et épidé-
spécifiques des schémas d’étude conditionnant les niveaux de miologie à enseigner aux étudiants. Il est indispensable qu’ils
preuve (essais cliniques de supériorité, de non-infériorité, en puissent y être suffisamment sensibilisés au cours des quatre
plan factoriel, essais en grappes ou séquentiels par exemple). premières années de leur formation, pour disposer d’un recul
De même, parmi les méthodes étudiées, les autres méthodes de critique suffisant pour interpréter les résultats des études
régression auraient pu être étudiées spécifiquement (modèles à actuellement publiées dans les journaux biomédicaux de
effets fixes, à effets aléatoires, mixtes, modèles structuraux, référence. Le contexte actuel de réforme des études de santé est
modèles linéaires généralisés, modèles à données répétées). propice à cette réflexion. Le Rapport 2008 Licence Master
Dans le domaine des données temporelles et des données de Doctorat des commissions pédagogiques nationales des études
survie, le modèle de Cox étant employé dans 41 % des articles, médicales, odontologiques, pharmaceutiques et du comité de
les notions de covariable dépendante du temps auraient pu être perfectionnement des études de maı̈eutique souligne d’ailleurs
précisées. Notre grille de lecture nous a permis de quantifier des cet aspect : « Une grande liberté mais aussi une responsabilité
méthodes et représentations non prédéfinies dans les études de sont laissées aux universités pour organiser les enseignements
Horton et Switzer et de Windish et al., en particulier correspondant à la réforme » [20]. Il est donc possible, pour les
268 M.-Q. Picat et al. / Revue d’Épidémiologie et de Santé Publique 61 (2013) 261–268

universités françaises, d’adapter les enseignements de biosta- Références


tistique et d’épidémiologie selon ce qu’il est prioritaire
d’acquérir pour les étudiants. Néanmoins, la masse d’appren- [1] Evidence-Based Medicine Working Group. Evidence-based medicine. A
new approach to teaching the practice of medicine. JAMA 1992;268(17):
tissage est considérable au cours des premières années de
2420–5.
médecine [21]. Il est donc indispensable de disposer de [2] Sackett DL, Rosenberg WM, Gray JA, Haynes RB, Richardson WS. Evi-
référentiels pour les notions fondamentales des programmes de dence-based medicine: what it is and what it isn’t. BMJ 1996;312(7023):
biostatistique et d’épidémiologie clinique pour la Licence 71–2.
santé médecine mais également pour le Master de sciences [3] Wyatt J. Use and sources of medical knowledge. Lancet 1991;338(8779):
médicales. Ces référentiels devraient couvrir les notions 1368–73.
[4] Altman DG, Schulz KF, Moher D, Egger M, Davidoff F, Elbourne D, et al.
fondamentales, telles que les statistiques descriptives ou The revised CONSORT statement for reporting randomized trials: expla-
l’intervalle de confiance notamment, et les fondements des nation and elaboration. Ann Intern Med 2001;134(8):663–94.
méthodes plus complexes (modèle de Cox, régression [5] Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP, Irwig LM,
logistique). Au-delà des études en génomique, les articles et al. The STARD statement for reporting studies of diagnostic accuracy:
de synthèse étaient de plus en plus nombreux dans les revues explanation and elaboration. Ann Intern Med 2003;138(1):W1–2.
[6] Berwick DM, Fineberg HV, Weinstein MC. When doctors meet numbers.
sélectionnées, les développements propres aux méta-analyses Am J Med 1981;71(6):991–8.
et leurs limites devraient faire partie des notions à acquérir [7] Estellat C, Faisy C, Colombet I, Chatellier G, Burnand B, Durieux P.
pour lire la littérature médicale. L’implication des collèges French academic physicians had a poor knowledge of terms used in
d’enseignants en santé publique devrait permettre d’établir ces clinical epidemiology. J Clin Epidemiol 2006;59(9):1009–14.
[8] Wulff HR, Andersen B, Brandenhoff P, Guttler F. What do doctors know
référentiels et d’optimiser la manière et le moment propice à
about statistics? Stat Med 1987;6(1):3–10.
l’introduction des différentes méthodes et représentations de [9] Windish DM, Huot SJ, Green ML. Medicine residents’ understanding of the
données au cours des six premières années de médecine. biostatistics and results in the medical literature. JAMA 2007;298(9):
Les articles originaux des journaux biomédicaux de 1010–22.
référence s’appuient fortement sur le raisonnement biostatis- [10] Horton NJ, Switzer SS. Statistical methods in the journal. N Engl J Med
tique et épidémiologique. L’enseignement de la biostatistique 2005;353(18):1977–9.
[11] Altman DG, Goodman SN. Transfer of technology from statistical jour-
et de l’épidémiologie doit donc avoir une place privilégiée au nals to the biomedical literature. Past trends and future predictions. JAMA
sein du cursus médical. Cette culture est indispensable à tous 1994;272(2):129–32.
les praticiens, à l’ère de la médecine fondée sur les faits, pour [12] Ministère de l’Enseignement supérieur et de la Recherche. Études de santé.
lire, comprendre et interpréter la plupart des articles Première année commune aux études de santé. BO du 3 décembre 2009 (45).
scientifiques tout au long de leur exercice professionnel. URL : http://media.enseignementsup-recherche.gouv.fr//file/45/72/9/bulle-
tin_officiel_esr_H45-03-12-09_128729.pdf [Consulté le 27 juin 2011].
L’évolution constante de la médecine et l’émergence de [13] Centre National des Concours d’Internat. Glossaire - ECN : Lecture
thèmes de recherche spécifique s’accompagnent de l’utilisation Critique d’articles médicaux. Paris : CNCI ; 2007. URL : http://
de méthodes de plus en plus sophistiquées. Néanmoins, ces www.cnci.univ-paris5.fr/medecine/Glossaire-ECN-LCAM.pdf [Consulté
méthodes reposent sur des notions fondamentales qu’il est le 27 juin 2011].
[14] Beuscart R, Bénichou J, Roy P, Quantin C, Collège national des enseignants
indispensable de cibler et d’enseigner au cours de la formation
des facultés de médecine. Biostatistique. Montreuil: Omniscience; 2009.
médicale initiale. [15] Chêne G, Salmi LR. Médecine fondée sur les faits [Traduction et adaptation
L’élaboration d’un observatoire des méthodes biostatisti- de l’anglais Evidence-Based Medicine]. Paris: Elsevier Masson; 2007.
ques et épidémiologiques employées dans les journaux de [16] Salmi LR, Suissa S, Chêne G, Salamon R. Clinically informative measures
référence de la littérature pourrait contribuer à identifier les of the effect of drugs or other interventions. Br J Clin Pharmacol
développements méthodologiques généralistes et spécifiques 2008;65(6):935–41.
[17] Valleron AJ. L’épidémiologie humaine, conditions de son développement
afin de faire évoluer les enseignements des notions fonda- en France, et rôle des mathématiques [Rapport sur la science et la
mentales dans les années futures, pour qu’ils répondent au technologie no 23]. Les Ulis : EDP Sciences ; 2006. URL : http://
mieux à l’évolution de la médecine actuelle et aux besoins des www.bibsciences.org/bibsup/acad-sc/common/articles/rapport3.pdf
praticiens dans le but d’utiliser de façon appropriée la littérature [Consulté le 27 juin 2011]
[18] Dhar SU, Alford RL, Nelson EA, Potocki L. Enhancing exposure to
scientifique.
genetics and genomics through an innovative medical school curriculum.
Gen Med 2012;14(1):163–7.
Déclaration d’intérêts [19] Salari K. The dawning area of personalized medicine exposes a gap in
medical education. Plos Med 2009;6(8):138–40.
Les auteurs déclarent ne pas avoir de conflits d’intérêts en [20] Commissions pédagogiques nationales des études médicales, odontolo-
relation avec cet article. giques et pharmaceutiques et du comité de perfectionnement des études de
maı̈eutique. Le LMD santé [Rapport 2008]. URL : http://www.timone.u-
Remerciements niv-mrs.fr/medecine/enseignement/reforme_l1_sante/CPNEM-
LMD_0109.pdf [Consulté le 27 juin 2011].
[21] Smeeton NC. Comments on statistical education for medical students-
Les auteurs remercient les Pr Roger Salamon et Jean-Luc concepts are what remain when the details are forgotten. Stat Med
Pellegrin pour les discussions importantes sur les résultats. 2008;27(12):2267–8.

You might also like