Professional Documents
Culture Documents
www.sciencedirect.com
Article original
Méthodes biostatistiques et épidémiologiques employées pour
la recherche biomédicale : implications pour la formation
médicale initiale
Statistical and epidemiological methods used in biomedical research:
Implications for initial medical education
M.-Q. Picat a,*, M. Savès b,d, J. Asselineau a,c, M. Dumoulin a, G. Coureau b,d,
L.-R. Salmi b,d, P. Perez a,c, G. Chêne a,c
a
Unité de soutien méthodologique à la recherche clinique et épidémiologique (USMR), université Bordeaux-Segalen,
CHU de Bordeaux, ISPED, 146, rue Léo-Saignat, 33076 Bordeaux cedex, France
b
Université Bordeaux-Segalen, institut de santé publique d’épidémiologie et de développement (ISPED),
146, rue Léo-Saignat, 33076 Bordeaux cedex, France
c
Inserm, centre d’investigation clinique et d’épidémiologie clinique 7 (CIC-EC 7), 33076 Bordeaux cedex, France
d
Pôle de santé publique, service d’information médicale, CHU de Bordeaux, 146, rue Léo-Saignat, 33076 Bordeaux cedex, France
Reçu le 28 juillet 2011 ; accepté le 6 novembre 2012
Abstract
Background. – The main source of key medical information consists in original articles published in peer-reviewed biomedical journals.
Reported studies use increasingly sophisticated statistical and epidemiological approaches that first require a solid understanding of core methods.
However, such understanding is not widely shared among physicians. Our aim was to assess whether the basic statistical and epidemiological
methods used in original articles published in general biomedical journals are taught during the first years of the medical curriculum in France.
Methods. – We selected original articles published in The New England Journal of Medicine, The Lancet, and The Journal of the American
Medical Association, over a period of six months in 2007 and in 2008. A standardized statistical content checklist was used to extract the necessary
information in the ‘‘Abstract’’, ‘‘Methods’’, ‘‘Results’’, footnotes of tables, and legends of figures. The methods used in the selected articles were
compared to the national program and the public health program of biostatistics and epidemiology taught during the first six years of medical school.
Results. – The 237 analyzed original articles all used at least one statistical or epidemiological method. Descriptive statistics, confidence
interval and Chi2 or Fisher tests, methods used in more than 50% of articles, were repeatedly taught throughout the medicine curriculum. Measures
of association, sample size, fit and Kaplan–Meier method, used in 40 to 50% of articles, were specifically taught during training sessions on critical
reading methods. Cox model (41% of articles) and logistic regression (24% of articles) were never taught. The most widely used illustrations,
contingency tables (92%) and flowcharts (48%), were not included in the national program.
Conclusion. – More teaching of the core methods underlying the understanding of sophisticated methods and illustrations should be included
in the early medical curriculum so that physicians can read the scientific literature critically for their medical education.
# 2013 Elsevier Masson SAS. All rights reserved.
Keywords: Biostatistics; Epidemiology; Evidence-Based Medicine; Peer review research; Medical education
Résumé
Position du problème. – Les études originales publiées dans les journaux biomédicaux de référence sont les principales sources de nouvelles
connaissances. Elles utilisent des méthodes biostatistiques et épidémiologiques de plus en plus sophistiquées, qui nécessitent une compréhension
solide des notions fondamentales. Notre objectif était d’évaluer si les notions fondamentales concernant les méthodes biostatistiques et
épidémiologiques employées dans les articles originaux des journaux biomédicaux généralistes étaient enseignées en premier et début du
deuxième cycles de médecine en France.
* Auteur correspondant.
Adresse e-mail : marie-quitterie.picat@isped.u-bordeaux2.fr (M.Q. Picat).
0398-7620/$ – see front matter # 2013 Elsevier Masson SAS. Tous droits réservés.
http://dx.doi.org/10.1016/j.respe.2012.11.002
262 M.-Q. Picat et al. / Revue d’Épidémiologie et de Santé Publique 61 (2013) 261–268
Méthodes. – Nous avons sélectionné les articles originaux publiés dans The New England Journal of Medicine, The Lancet et The Journal of
the American Medical Association sur six mois en 2007 et 2008. Une grille standardisée de lecture a permis d’extraire les informations nécessaires
dans les sections « Résumé », « Méthodes », « Résultats », les notes de bas de tableaux et les légendes des figures. Les méthodes employées dans les
articles de notre étude ont été confrontées aux enseignements de biostatistique et d’épidémiologie prévus par le programme national et celui des
collèges d’enseignants en santé publique des deux premiers cycles de médecine.
Résultats. – Les 237 articles analysés rapportaient tous l’utilisation d’au moins une méthode biostatistique ou épidémiologique. L’ensei-
gnement des statistiques descriptives, de l’intervalle de confiance et des tests de Chi2 ou Fisher (méthodes utilisées dans plus de 50 % des articles)
était programmé de façon répétée au cours des six premières années de médecine. Celui des mesures d’association, du calcul de taille d’étude, de
l’ajustement et de la méthode de Kaplan-Meier (40 à 50 % des articles) était prévu spécifiquement au moment de la formation à la lecture critique
d’articles. L’enseignement du modèle de Cox (41 % des articles) et de la régression logistique (24 % des articles) n’était jamais prévu. Les
principales représentations employées, tableaux de contingence (92 %) et diagrammes de flux (48 %), n’étaient pas prescrites par le programme
national.
Conclusion. – Le cursus médical doit inclure un enseignement élargi des notions fondamentales en biostatistique, épidémiologie et
représentations de données afin que les praticiens puissent pratiquer la lecture critique d’articles et utiliser la littérature scientifique comme
source de formation médicale.
# 2013 Elsevier Masson SAS. Tous droits réservés.
Mots clés : Biostatistique ; Épidémiologie ; Médecine fondée sur les faits ; Revue à comité de lecture ; Formation médicale
Tableau 3
Méthodes biostatistiques et épidémiologiques dans 237 articles originaux, présentées par ordre décroissant de fréquence d’utilisation. The NEJM, The Lancet et The
JAMA ; janvier, février, novembre, décembre 2007 et novembre, décembre 2008.
Méthodes Année 2007 Année 2008 Total
(n = 161) (n = 76) (n = 237)
n % n % n %
Plus de 50 % des articles
Statistiques descriptives 161 100,0 76 100,0 237 100,0
Intervalle de confiance 134 83,2 64 84,2 198 83,5
Test du Chi2, test de Fisher 95 59,0 41 53,9 136 57,4
De 30 à 50 % des articles
Risque relatif, rapport de cotes 79 49,1 26 34,2 105 44,3
Calcul de taille d’étude 70 43,5 35 46,1 105 44,3
Ajustement 69 42,9 29 38,2 98 41,4
Analyse de survie (Kaplan-Meier) 71 44,1 25 32,9 96 40,5
Analyse de survie (modèle de Cox) 63 39,1 33 43,4 96 40,5
Incidence, prévalence 53 32,9 30 43,4 83 35,0
Moins de 30 % des articles
Tests non paramétriques 46 28,6 17 22,4 63 26,6
Test de Student 46 28,6 13 17,1 59 24,9
Régression logistique 38 23,6 19 25,0 57 24,1
Interaction 31 19,3 25 32,9 56 23,6
Autres modèles de régressiona 19 11,8 16 21,1 35 14,8
Analyse de la variance 26 16,1 8 10,5 34 14,3
Comparaisons multiples 16 9,9 12 15,8 28 11,8
Régression linéaire 30 18,6 6 7,9 26 11,0
Corrélation 13 8,1 10 13,2 23 9,7
Analyse de sensibilité aux données manquantes 11 6,8 11 14,5 22 9,3
Sensibilité, spécificité, valeurs prédictives 11 6,8 2 2,6 13 5,5
Log transformation des données 6 3,7 6 7,9 12 5,1
Aire sous la courbe (c statistics) 7 4,3 2 2,6 9 3,8
Analyses économiques 7 4,3 1 1,3 8 3,4
Standardisation 3 1,9 4 5,3 7 3,0
Appariement 6 3,7 1 1,3 7 3,0
Méthodes de rééchantillonnage 4 2,5 1 1,3 5 2,1
a
Régression de Poisson, méta-régression, régression d’Egger, régression de Weibull, modèle de régression hiérarchique, régression pour séries temporelles,
régression à effet mixte.
rapportaient des mesures d’association (risque relatif, rapport 3.3.2. Représentation de données
de cotes), un calcul de taille d’étude, un ajustement ou des Les statistiques descriptives étaient présentées dans des
méthodes d’analyse des données de survie, comme la méthode tableaux de contingence dans 92 % des articles (Tableau 4). Le
de Kaplan-Meier ou le modèle de Cox. Concernant les diagramme de flux, préconisé par les recommandations
méthodes de régression, la régression logistique était recensée CONsolidated Standards Of Reporting Trials (CONSORT)
dans environ un quart des articles et la régression linéaire dans [4] et STAndards for the Reporting of Diagnostic accuracy
plus de 10 % d’entre eux. studies (STARD) [5], était employé pour illustrer l’éligibilité de
Tableau 4
Représentations de données dans 237 articles originaux, présentées par ordre décroissant de fréquence d’utilisation. The NEJM, The Lancet et The JAMA ; janvier,
février, novembre, décembre 2007 et novembre, décembre 2008.
Représentations de données Année 2007 Année 2008 TOTAL
(n = 161) (n = 76) (n = 237)
n % n % n %
Tableau de contingence 148 91,9 70 92,1 218 92,0
Diagramme de flux 78 48,4 35 46,1 113 47,7
Courbe de survie de type Kaplan-Meier 60 37,3 22 28,9 82 34,6
Boı̂te à moustaches, diagramme en entonnoir, graphique en forêt 42 26,1 17 22,4 59 24,9
Courbe de mesures répétées dans le temps 25 15,5 17 22,4 42 17,7
266 M.-Q. Picat et al. / Revue d’Épidémiologie et de Santé Publique 61 (2013) 261–268
la population et les déviations au protocole (perdus de vue, des articles de notre étude, au cours des six premières années
abandons) dans 48 % des articles. Les courbes de survie étaient de la formation médicale.
présentes dans 35 % des articles. Les tests de comparaison de deux variables quantitatives,
tests de Student ou tests non paramétriques, employés dans
3.4. Comparaison des méthodes et représentations de moins d’un tiers des articles, sont prévus en Licence santé, à la
données employées dans les articles par rapport aux fois par le programme national et celui des collèges
enseignements en Licence-Master santé d’enseignants en santé publique. Concernant les méthodes de
régression, l’enseignement de la régression logistique,
3.4.1. Méthodes biostatistiques et épidémiologiques employée dans près d’un quart des articles analysés, n’est
Les statistiques descriptives, l’intervalle de confiance et les prévu au cours des six premières années de la formation
tests du Chi2 ou de Fisher, employés dans plus de 50 % des médicale par aucun des programmes considérés. L’enseigne-
articles originaux de notre étude sont mentionnés par ment de la régression linéaire multivariée, employée dans plus
l’ensemble des programmes considérés (Tableau 5). Ces de 10 % des articles, est prévu en Licence santé par les collèges
méthodes correspondent aux notions fondamentales à acquérir d’enseignants en santé publique, et en Master par le programme
dès la Licence santé médecine et sont répétées et appliquées en national.
Master de sciences médicales.
Les mesures d’association (risque relatif, rapport de 3.4.2. Représentations de données
cotes), le calcul de taille d’étude, l’ajustement et la méthode Hormis la courbe de survie de Kaplan-Meier, le programme
de Kaplan-Meier, employés dans plus d’un tiers des articles, national ne mentionne aucune des représentations de données
sont préconisés plus spécifiquement en Master par le que nous avons recueillies dans notre étude. Le programme de
programme national. Le programme des collèges d’ensei- biostatistique prévu par les collèges d’enseignants en santé
gnants en santé publique introduit cependant les mesures publique en Licence santé médecine préconise l’enseignement
d’association et la méthode de Kaplan-Meier dès la Licence du tableau de contingence (92 % des articles), du diagramme de
santé. En revanche, aucun des programmes considérés ne flux (48 % des articles), de la courbe de survie de Kaplan-Meier
prévoit l’enseignement du modèle de Cox, utilisé dans 41 % (35 % des articles) et des boı̂tes à moustaches.
Tableau 5
Enseignements, en Licence et Master santé, des méthodes employées dans les 237 articles de notre étude. Programme national et programme des collèges
d’enseignants en santé publique.
Méthode Licence santé Master santé
% Programme Programme des collèges Programme
national d’enseignants en santé publique national
Statistiques descriptives 100,0 X X X
Intervalle de confiance 83,5 X X X
Test du Chi2, test de Fisher 57,4 X X X
Risque relatif, rapport de cotes 44,3 X X
Calcul de taille d’étude 44,3 X
Ajustement 41,4 X
Analyse de survie (Kaplan-Meier) 40,5 X X
Analyse de survie (modèle de Cox) 40,5
Incidence, prévalence 35,0 X X
Tests non paramétriques 26,6 X X
Test de Student 24,9 X X
Régression logistique 24,1
Interaction 23,6 X
Autres modèles de régression 14,8
Analyse de la variance 14,3 X
Comparaisons multiples 11,8
Régression linéaire 11,0 X X
Corrélation 9,7 X
Analyse de sensibilité aux données manquantes 9,3
Sensibilité, spécificité, valeurs prédictives 5,5 X X X
Log transformation 5,1
Aire sous la courbe (c statistics) 3,8
Analyses économiques 3,4
Standardisation 3,0
Appariement 3,0 X X
Méthodes de rééchantillonnage 2,1
« X » signifie que l’enseignement de la méthode est prévu par le programme considéré.
M.-Q. Picat et al. / Revue d’Épidémiologie et de Santé Publique 61 (2013) 261–268 267