You are on page 1of 57

Biostatistique

Cours 2
Intervalle de fluctuation
7 octobre 2021
Master 1 Santé Publique

julie.boucquemont@universite-paris-saclay.fr
Rappels
→ Pourquoi fait-on de la biostatistique ?

Biostatistique – M1 SP 2
Rappels
→ Pourquoi fait-on de la biostatistique ?

Fluctuations d’échantillonnage
Les observations varient (au hasard)
d’un échantillon à l’autre

Biostatistique – M1 SP 3
Fluctuations d’échantillonnage

Intervalle de fluctuation
Valeur théorique
Observations
(ou vraie)

Population Echantillon

Intervalle de confiance

Biostatistique – M1 SP 4
Intervalle de fluctuation

Valeur théorique
Observations
(ou vraie)

Population Echantillon
Intervalle de fluctuation
µ–σ–π m – s – p0

π = % vrai dans la population p0 = % observé dans l’échantillon

µ = moyenne vraie dans la population m = moyenne observée dans l’échantillon

σ = écart-type vrai dans la population s = écart-type observé dans l’échantillon

σ2 = variance vraie dans la population s2 = variance observée dans l’échantillon

Biostatistique – M1 SP 5
Intervalle de fluctuation
• Dans une proportion fixée de cas, un nouvel échantillon issu de la
population contiendra la valeur observée du paramètre A d’intérêt
(%, moyenne, …)

Dans 95% des cas, le % de malades


dans un nouvel échantillon sera
compris entre 15% et 50%

Nombre de malades observés sur 10000 échantillons de


20 sujets tirés au sort dans une population où π=30%

Biostatistique – M1 SP 6
Intervalle de fluctuation
• Dans une proportion fixée de cas, un nouvel échantillon issu de la
population contiendra la valeur observée du paramètre A d’intérêt
(%, moyenne, …)

Dans 95% des cas, le % de malades


dans un nouvel échantillon sera
compris entre 15% et 50%

[0,15;0,50] = intervalle de fluctuation


à 95% (ou au risque 5%)
Nombre de malades observés sur 10000 échantillons de
20 sujets tirés au sort dans une population où π=30%

Biostatistique – M1 SP 7
Intervalle de fluctuation
• Taille d’échantillon + grande = diminution de la largeur de l’intervalle

Dans 95% des cas, le % de malades


dans un nouvel échantillon sera
compris entre 21% et 39%

Nombre de malades observés sur 10000 échantillons de


100 sujets tirés au sort dans une population où π=30%

Biostatistique – M1 SP 8
Intervalle de fluctuation
• Taille d’échantillon + grande = diminution de la largeur de l’intervalle

Dans 95% des cas, le % de malades


dans un nouvel échantillon sera
compris entre 21% et 39%

[0,21;0,39] = intervalle de fluctuation


à 95% (ou au risque 5%) Nombre de malades observés sur 10000 échantillons de
Rappel échantillon 20 sujets : [0,15;0,50] 100 sujets tirés au sort dans une population où π=30%

Biostatistique – M1 SP 9
Risque d’erreur : pourquoi 5% ?
• Pas de raisons scientifiques

• « Raisons » historiques liées aux tables de Fisher


• Chiffre rond
• 5% = risque d’erreur faible et acceptable

+ le risque d’erreur est petit, + l’intervalle de fluctuation est grand : information


dégradée
Il faut un équilibre

Biostatistique – M1 SP 10
Calcul de l’intervalle de fluctuation
• Cas d’une loi normale centrée réduite Z

Problème : trouver a et b tels que P(a<Z<b)=95%

Biostatistique – M1 SP 11
Calcul de l’intervalle de fluctuation

P(Z>1,960)=0,025 & P(Z>-1,960)=0,975

P(-1,960<Z<1,960)=0,95

[-1,96;1,96]
Intervalle de fluctuation à 95%

Biostatistique – M1 SP 12
Calcul de l’intervalle de fluctuation

P(Z>zα/2)=α/2 & P(Z>- zα/2)=α/2

[-zα/2; zα/2]
Intervalle de fluctuation
à 1-α ou au risque α

Biostatistique – M1 SP 13
Calcul de l’intervalle de fluctuation

• Intervalle de fluctuation à 90% ?

• Intervalle de fluctuation à 99% ?

Biostatistique – M1 SP 14
Calcul de l’intervalle de fluctuation

• Intervalle de fluctuation à 90% ?

[-1,645;1,645]

• Intervalle de fluctuation à 99% ?

[-2,576;2,576]

Biostatistique – M1 SP 15
Calcul de l’intervalle de fluctuation
• Cas d’une loi normale quelconque : A~N(µA,σA)
• 1ère étape ?

Biostatistique – M1 SP 16
Calcul de l’intervalle de fluctuation
• Cas d’une loi normale quelconque : A~N(µA,σA)
• 1ère étape ? Se ramener à une loi normale centrée réduite

𝐴 − 𝜇𝐴
𝑍= ~𝑁(0,1)
𝜎𝐴

• [-zα/2; zα/2] est l’intervalle de fluctuation calculé à partir de Z

𝐴 − 𝜇𝐴
𝑃 −𝑧𝛼/2 < < 𝑧𝛼/2 = 1 − 𝛼
𝜎𝐴

Biostatistique – M1 SP 17
Calcul de l’intervalle de fluctuation
• Cas d’une loi normale quelconque : A~N(µA,σA)

𝐴 − 𝜇𝐴
𝑃 −𝑧𝛼/2 < < 𝑧𝛼/2 = 1 − 𝛼
𝜎𝐴

𝐴 − 𝜇𝐴
−𝑧𝛼/2 < ֞ 𝜇𝐴 − 𝑧𝛼/2 𝜎𝐴 < 𝐴
𝜎𝐴
𝐴 − 𝜇𝐴
< 𝑧𝛼/2 ֞ 𝐴 < 𝜇𝐴 + 𝑧𝛼/2 𝜎𝐴
𝜎𝐴

Donc : 𝑃 𝜇𝐴 − 𝑧𝛼/2 𝜎𝐴 < 𝐴 < 𝜇𝐴 + 𝑧𝛼/2 𝜎𝐴 = 1 − 𝛼

Biostatistique – M1 SP 18
Calcul de l’intervalle de fluctuation
• Cas d’une loi normale quelconque : A~N(µA,σA)

𝐴 − 𝜇𝐴
𝑃 −𝑧𝛼/2 < < 𝑧𝛼/2 = 1 − 𝛼
𝜎𝐴

Donc : 𝑃 𝜇𝐴 − 𝑧𝛼/2 𝜎𝐴 < 𝐴 < 𝜇𝐴 + 𝑧𝛼/2 𝜎𝐴 = 1 − 𝛼

L’intervalle de fluctuation à 1-α est :


𝜇𝐴 − 𝑧𝛼/2 𝜎𝐴 ; 𝜇𝐴 + 𝑧𝛼/2 𝜎𝐴

Biostatistique – M1 SP 19
Calcul de l’intervalle de fluctuation
• Cas d’une loi normale quelconque : A~N(µA,σA)

L’intervalle de fluctuation à 1-α est :


𝜇𝐴 − 𝑧𝛼/2 𝜎𝐴 ; 𝜇𝐴 + 𝑧𝛼/2 𝜎𝐴

𝜇𝐴 ± 𝑧𝛼/2 𝜎𝐴

• Exemples : intervalle de fluctuation d’un pourcentage, d’une


moyenne ou d’une variance

Biostatistique – M1 SP 20
Intervalle de fluctuation d’un pourcentage
Valeur théorique
Observations
(ou vraie)

Echantillon
Population
Intervalle de fluctuation n
π
p0

𝜋(1−𝜋)
• Si n grand : 𝑃0 ~𝑁 𝜋,
𝑛

Biostatistique – M1 SP 21
Intervalle de fluctuation d’un pourcentage
Valeur théorique
Observations
(ou vraie)

Echantillon
Population
Intervalle de fluctuation n
π
p0

𝜋(1−𝜋)
• Si n grand : 𝑃0 ~𝑁 𝜋,
𝑛

𝜋(1−𝜋)
Intervalle de fluctuation = 𝜋 ± 𝑧𝛼/2 si nπ et n(1-π) ≥ 5
𝑛

Si petits échantillons : pas de solution en dehors du recours à la loi binomiale


Biostatistique – M1 SP 22
Intervalle de fluctuation d’un pourcentage
• Exemple : % de vrais malades dans la population = 0,15
• Echantillon de n = 100 sujets
• Intervalle de fluctuation à 95% ?

Biostatistique – M1 SP 23
Intervalle de fluctuation d’un pourcentage
• Exemple : % de vrais malades dans la population = 0,15
• Echantillon de n = 100 sujets
• Intervalle de fluctuation à 95% ? 0,15*100=15 et 0,85*100=85 ≥ 5
0,15∗0,85
𝐼95% = 0,15 ± 1,96 = 0,15 ± 0,07 = [0,08; 0,22]
100

• Dans 95% cas, le % observé de malades dans un nouvel échantillon de


100 sujets sera compris entre 8% et 22%

Biostatistique – M1 SP 24
Intervalle de fluctuation d’un pourcentage
• Exemple : % de vrais malades dans la population = 0,05
• Echantillon de n = 100 sujets

• Intervalle de fluctuation à 95% ?


• Intervalle de fluctuation à 99% ?

Biostatistique – M1 SP 25
Intervalle de fluctuation d’un pourcentage
• Exemple : % de vrais malades dans la population = 0,05
• Echantillon de n = 100 sujets (n*0,05=5 et n*0,95=95 ≥ 5)

• Intervalle de fluctuation à 95% ?


0,05∗0,95
𝐼95% = 0,05 ± 1,960 = [0,01; 0,09]
100

• Intervalle de fluctuation à 99% ?


0,05∗0,95
𝐼99% = 0,05 ± 2,576 = [−0,01; 0,11]
100

Biostatistique – M1 SP 26
Intervalle de fluctuation d’une moyenne
Valeur théorique
Observations
(ou vraie)

Echantillon
Population
Intervalle de fluctuation n
µ–σ
m–s

• Grands échantillons (n≥30)

• Petits échantillons

Biostatistique – M1 SP 27
Intervalle de fluctuation d’une moyenne
Valeur théorique
Observations
(ou vraie)

Echantillon
Population
Intervalle de fluctuation n
µ–σ
m–s

• Grands échantillons (n≥30)


M ~ loi normale de moyenne µ et de variance σ2/n

Intervalle de fluctuation = 𝜇 ± 𝑧𝛼/2 𝜎 2 /𝑛

Biostatistique – M1 SP 28
Intervalle de fluctuation d’une moyenne
Valeur théorique
Observations
(ou vraie)

Echantillon
Population
Intervalle de fluctuation n
µ–σ
m–s

• Grands échantillons (n≥30)


• Petits échantillons : même formule si distribution de X normale

Intervalle de fluctuation = 𝜇 ± 𝑧𝛼/2 𝜎 2 /𝑛

Biostatistique – M1 SP 29
Intervalle de fluctuation d’une moyenne
• Exemple → taille à la naissance : μA = 49cm et 𝜎𝐴2 = 7,8 cm2
• Intervalle de fluctuation à 95% de la moyenne des tailles de naissance
observées sur un échantillon de taille 400 ?

Biostatistique – M1 SP 30
Intervalle de fluctuation d’une moyenne
• Exemple → taille à la naissance : μA = 49cm et 𝜎𝐴2 = 7,8 cm2
• Intervalle de fluctuation à 95% de la moyenne des tailles de naissance
observées sur un échantillon de taille 400 ?

𝜎𝐴2 7,8
𝜇𝐴 ± 𝑧𝛼/2 = 49 ± 1,960 = 49 ± 0,27
𝑛 400
[48,73;49,27]
Dans 95% des cas, la moyenne observée des tailles dans un nouvel
échantillon de 400 nouveau-nés sera comprise entre 48,73 et
49,27 cm
Biostatistique – M1 SP 31
Intervalle de fluctuation d’une moyenne
• Exemple → taille à la naissance : μA = 49cm et 𝜎𝐴2 = 7,8 cm2
• Intervalle de fluctuation à 95% de la moyenne des tailles de naissance
observées sur un échantillon de taille 10 ?

Biostatistique – M1 SP 32
Intervalle de fluctuation d’une moyenne
• Exemple → taille à la naissance : μA = 49cm et 𝜎𝐴2 = 7,8 cm2
• Intervalle de fluctuation à 95% de la moyenne des tailles de naissance
observées sur un échantillon de taille 10 ?

𝜎𝐴2 7,8
𝜇𝐴 ± 𝑧𝛼/2 = 49 ± 1,960 = 49 ± 1,73
𝑛 10

[47,27;50,73]
Hypothèse de la distribution normale des tailles de naissance

Biostatistique – M1 SP 33
Intervalle de fluctuation d’une moyenne
• Exemple → taille à la naissance : μA = 49cm et 𝜎𝐴2 = 7,8 cm2
• Intervalle de fluctuation à 95% de la moyenne des tailles de naissance
observées sur un échantillon de taille 1 ?

Biostatistique – M1 SP 34
Intervalle de fluctuation d’une moyenne
• Exemple → taille à la naissance : μA = 49cm et 𝜎𝐴2 = 7,8 cm2
• Intervalle de fluctuation à 95% de la moyenne des tailles de naissance
observées sur un échantillon de taille 1 ?
𝜎𝐴2 7,8
𝜇𝐴 ± 𝑧𝛼/2 = 49 ± 1,960 = 49 ± 5,47
𝑛 1

[43,53;54,47]
Revient à dire que 95% des nouveau-nés auront une taille
comprise entre 43,53 et 54,47 cm
Hypothèse de la distribution normale des tailles de naissance
Biostatistique – M1 SP 35
Intervalle de fluctuation d’une variance
Valeur théorique
Observations
(ou vraie)

Echantillon
Population
Intervalle de fluctuation n
µ – σ2
m – s2

𝑛−1 2 2
• Si X ~ loi normale : 𝑠 ~χ ddl
𝜎2 𝑛−1

Biostatistique – M1 SP 36
Intervalle de fluctuation d’une variance
𝑛−1 2 2
• Si X ~ loi normale : 𝑠 ~χ ddl
𝜎2 𝑛−1

• [a;b] l’intervalle de fluctuation à 95%


𝑃 𝑎 < χ2𝑛−1 < 𝑏 = 0,95
𝑛−1 2
𝑃 𝑎< 2
𝑠 < 𝑏 = 0,95
𝜎
𝜎2 𝜎 2
𝑃 𝑎 < 𝑠2 < 𝑏 = 0,95
𝑛−1 𝑛−1

Biostatistique – M1 SP 37
Intervalle de fluctuation d’une variance
𝑛−1 2 2
• Si X ~ loi normale : 𝑠 ~χ ddl
𝜎2 𝑛−1

• Intervalle de fluctuation à 95% de s2


𝜎2 𝜎2
𝑎 ;𝑏
𝑛−1 𝑛−1
si la distribution de X est normale

Biostatistique – M1 SP 38
Loi du Chi-2
• Z1, Z2, …, Zk k lois normales centrées réduites indépendantes
• χ2𝑘 = 𝑍12 + 𝑍22 + ⋯ + 𝑍𝑘2 ~ loi du χ2 à k degrés de liberté (ddl)

Biostatistique – M1 SP 39
Loi du Chi-2
• Z1, Z2, …, Zk k lois normales centrées réduites indépendantes
• χ2𝑘 = 𝑍12 + 𝑍22 + ⋯ + 𝑍𝑘2 ~ loi du χ2 à k degrés de liberté (ddl)

Biostatistique – M1 SP 40
Loi du Chi-2

𝑃 χ12 > 3,84 = 0,05

2
𝑃 χ100 > 118,5 = 0,10

Biostatistique – M1 SP 41
Loi du Chi-2
• Nombre de ddl élevé (k ≥ 30) → approximation par une loi normale
μ = k et σ2 = 2k

Biostatistique – M1 SP 42
Loi du Chi-2
• Nombre de ddl élevé (k ≥ 30) → approximation par une loi normale
μ = k et σ2 = 2k
• 𝑃 χ2300 > 329 = ?
2
• 𝑃 χ100 > 118,5 = ?

Biostatistique – M1 SP 43
Loi du Chi-2
• Nombre de ddl élevé (k ≥ 30) → approximation par une loi normale
μ = k et σ2 = 2k
329−300
•𝑃 χ2300 > 329 = 𝑃 𝑍 > = P Z > 1,184 = 0,12
600

2 118,5−100
•𝑃 χ100 > 118,5 = 𝑃 𝑍 > = P Z > 1,308 = 0,095
200

Biostatistique – M1 SP 44
Intervalle de fluctuation d’une variance
𝑛−1 2 2
• Si X ~ loi normale : 𝑠 ~χ ddl
𝜎2 𝑛−1

• Intervalle de fluctuation à 95% de s2


𝜎2 𝜎2
𝑎 ;𝑏
𝑛−1 𝑛−1
si la distribution de X est normale

Biostatistique – M1 SP 45
Intervalle de fluctuation d’une variance
𝑛−1 2 2 𝜎2 𝜎2
• Si X ~ loi normale : 𝑠 ~χ ddl
𝑎 ;𝑏
𝑛−1 𝑛−1
𝜎2 𝑛−1

• Taille à la naissance σ2 = 7,8 cm2


• Echantillon de 20 nouveau-nés : n-1=19
• Intervalle de fluctuation à 95% de χ219 : [a;b] ?

Biostatistique – M1 SP 46
Intervalle de fluctuation d’une variance

𝑃(χ219 > a) = 0,975 et 𝑃(χ219 > b) = 0,025


a = 8,91 et b = 32,85
Biostatistique – M1 SP 47
Intervalle de fluctuation d’une variance
𝑛−1 2 2
• Si X ~ loi normale : 𝑠 ~χ ddl
𝜎2 𝑛−1

• Taille à la naissance σ2 = 7,8 cm2


• Echantillon de 20 nouveau-nés : n-1=19
• Intervalle de fluctuation à 95% pour χ219 : [8,91;32,85] ?

𝜎2 𝜎2 7,8 7,8
𝐼 𝑠2 = 𝑎 ;𝑏 = 8,91 ; 32,85 = [3,66; 13,49]
𝑛−1 𝑛−1 19 19

Biostatistique – M1 SP 48
Intervalle de fluctuation d’une variance
• Si n grand (≥ 30) → χ2𝑛−1 ~ approximativement une loi normale
μ = n-1 et σ2 = 2(n-1)
• Intervalle de fluctuation à 95% pour χ2𝑛−1 devient :
(𝑛 − 1) ± 𝑧𝛼/2 2(𝑛 − 1)
2 𝜎2 2 2 𝜎2 𝜎2
•𝑠 = χ ֜ 𝐼95% 𝑠 = (n − 1) ± 𝑧𝛼/2 2(𝑛 − 1)
𝑛−1 𝑛−1 𝑛−1 𝑛−1

Biostatistique – M1 SP 49
Intervalle de fluctuation d’une variance
• Si n grand (≥ 30) et distribution de X normale

2𝜎 4
𝐼 𝑠 2 = 𝜎 2 ± 𝑧𝛼/2
𝑛−1

/!\ Coquille page 66 du livre

Biostatistique – M1 SP 50
Intervalle de fluctuation d’une variance
• Exemple : échantillon de 101 nouveau-nés (μ=49cm, σ2=7,8cm2)
𝜎2 𝜎2
• a = 74,22 et b = 129,56 → 𝐼 𝑠2 = 𝑎 ;𝑏 = [5,79; 10,11]
𝑛−1 𝑛−1

Distribution des tailles de naissance normale


• Approximation par la loi normale
2𝜎 4
𝐼 𝑠 2 = 𝜎 2 ± 𝑧𝛼/2 = 7,8 ± 2,16 = [5,63; 9,96]
𝑛−1

Distribution des tailles de naissance normale + n ≥ 30

Biostatistique – M1 SP 51
Résumé
Formules Conditions

𝜋(1 − 𝜋)
Pourcentage 𝜋 ± 𝑧𝛼/2 nπ et n(1-π) ≥ 5
𝑛

Moyenne 𝜇 ± 𝑧𝛼/2 𝜎 2 /𝑛 n ≥ 30 ou X = loi normale

2𝜎 4 n ≥ 30 et X = loi normale
𝜎 2 ± 𝑧𝛼/2
𝑛−1
Variance /!\ Coquille page 66 du livre
𝜎2 𝜎2
𝑎 ;𝑏 X = loi normale
𝑛−1 𝑛−1

Biostatistique – M1 SP 52
Intervalle de fluctuation d’une différence
• 2 populations : mesure de la même variable X (X1 et X2)
D = X1-X2
Distribution X1 et X2 normales : distribution de D normale

• Moyennes et variances
• X1 : μ1 et 𝜎12
• X2 : μ2 et 𝜎22
• D : μD= μX1 – μX2 et 𝜎𝐷2 = 𝜎𝑋1
2 2
+ 𝜎𝑋2 (car X1 et X2 indépendantes)

Biostatistique – M1 SP 53
Intervalle de fluctuation d’une différence
• 2 populations : mesure de la même variable X (X1 et X2)
D = X1-X2
Distribution X1 et X2 normales : distribution de D normale

• Echantillon représentatif dans chaque population


→ différence moyenne observée = md

𝐼 𝑚𝑑 = 𝜇𝐷 ± 𝑧𝛼/2 𝜎𝐷2 = (𝜇𝑋1 − 𝜇𝑋2 ) ± 𝑧𝛼/2 𝜎𝑋21 + 𝜎𝑋22

Biostatistique – M1 SP 54
Intervalle de fluctuation d’une différence
• Intervalle de fluctuation de la différence d=m1-m2 de 2 moyennes
observées sur 2 grands échantillons indépendants (n1 et n2 ≥ 30)
𝜎12 𝜎22
𝐼 𝑑 = (𝜇1 − 𝜇2 ) ± 𝑧𝛼/2 +
𝑛1 𝑛2

• Intervalle de fluctuation de la différence d=p1-p2 de 2 %


observés sur 2 échantillons indépendants
𝑛1 𝜋1
𝜋1 (1 − 𝜋1 ) 𝜋2 (1 − 𝜋2 ) 𝑛2 𝜋2
𝐼 𝑑 = (𝜋1 − 𝜋2 ) ± 𝑧𝛼/2 + 𝑛1 (1 − 𝜋1 )ൢ ≥ 5
𝑛1 𝑛2 𝑛2 (1 − 𝜋2 )

Biostatistique – M1 SP 55
Intervalle de fluctuation d’une différence
• Cas particulier : 𝜋1 − 𝜋2 = 0
• Deux traitements avec un taux de guérison vrai = 0,60
• Intervalle de fluctuation à 95% de la différence des % de
guérison observés dans deux échantillons de 50 sujets
recevant chacun un traitement

0,6 ∗ 0,4 0,6 ∗ 0,4


𝐼 𝑑 = (0) ± 1,96 + = [−0,19; 0,19]
50 50

Biostatistique – M1 SP 56
Intervalle de fluctuation d’une différence
• Intervalle de fluctuation à 95% de la différence des % de guérison
observés dans 2 échantillons de 50 sujets recevant chacun un
traitement
𝐼 𝑑 = [−0,19; 0,19]

Même si deux traitements sont équivalents, la différence de


taux de guérison lorsqu’ils sont administrés à 2 groupes de
50 patients peut « raisonnablement » atteindre 19%
Une différence par exemple de 15% ne doit pas être
considérée comme la preuve de l’efficacité d’un des 2
traitements
Tests statistiques !
Biostatistique – M1 SP 57

You might also like