You are on page 1of 65

UN EXEMPLE

Pour estimer la qualité du tri sélectif des déchets,


la mairie décide de mener une étude statistique.
Un sondage est réalisé auprès de 800
personnes, en leur demandant combien de
déchets en verre ils ont déposés dans le bac
prévu à cet effet.
LA STATISTIQUE DESCRIPTIVE

La statistique descriptive a pour objet la collecte, la


caractérisation, l'analyse et l'interprétation d'observations
relatives à des phénomènes concernant des ensembles plus
ou moins importants d'objets, d'événements ou
d'individus. L’objectif est de faire « parler » les chiffre
afin de prendre une décision.
VOCABULAIRES DE LA STATISTIQUE
☑Population
☑Échantillon
☑Individu ou unité statistique
☑Caractère ou variable statistique
☑Modalité
☑Effectif
☑Fréquence
☑Série statistique
☑Distribution statistique
POPULATION STATISTIQUE

Ensemble des éléments sur lesquels porte


une étude statistique. Les éléments de la
population sont appelés unités statistiques (ou
individus). Une unité
statistique peut être un être humain (étudiant, salarié,
femme, …), un être vivant quelconque (animal, plante,
microbe,…), ou un objet (ville, produit, industrie, table,
machine,…)
ÉCHANTILLON
Il est souvent impossible, pour des raisons
pratiques ou pour des raisons de coût,
d'observer la population de façon exhaustive et
l'étude est alors faite sur un échantillon
prélevé d’une population
C’est un sous-ensemble (une partie) prélevé
d’une population.
les résultats obtenus sont extrapolés à la
population mère.
INDIVIDU OU UNITÉ STATISTIQUE

⚫ Éléments de la population ou de l’échantillon


CARACTÈRE OU VARIABLE STATISTIQUE (X)

⚫Chaque individu de la population peut être étudié par


rapport à un ou plusieurs traits ou caractéristiques ou
critères appelés caractères ou variables statistiques.
⚫Une variable statistique peut être qualitative ou
quantitative.
🗸Si la variable étudiée est mesurable numériquement,
on dit qu’il est quantitative (âge, poids, taille,
salaire,…).
🗸Par contre, si le caractère étudié est non mesurable
numériquement, on dit qu’il est qualitatif (sexe, niveau
d’étude, état matrimonial, nationalité, …).
MODALITÉ (XI)
 Valeur que peut prendre une variable statistique.
Par exemple, la variable « sexe » comporte deux
modalités (masculin, féminin);
la variable « état matrimonial » comporte quatre
modalités (célibataire, marié, divorcé et veuf );
la variable âge comporte plusieurs valeurs (1,2,3,
… , 99, …).
VARIABLES STATISTIQUES DISCRÈTES
/VARIABLES STATISTIQUES CONTINUES
On distingue deux sortes de variables quantitatives : les
Variables Statistiques Discrètes et les Variables Statistiques
Continues .
⚫ Variable statistique est discrète si de ses
modalités
l’ensembleest fini ou dénombrable (le plus souvent contient des
valeurs entières). Exemple : nombre d’enfant par ménage,
nombre de pièces par appartement, nombre de véhicules par
ménage,...
⚫ Une variable statistique est continue si elle peut prendre
n’importe quelle valeur dans un intervalle donné. Autrement
dit, si l’ensemble de ses modalités n’est pas dénombrable.
Exemples: L’âge, la taille, le poids d’un individu, le salaire, les
dépenses publicitaires,…
CARACTÈRE QUALITATIF NOMINAL/
CARACTÈRE QUALITATIF ORDINAL
Un caractère qualitatif peut être:
⚫Ordinal : si ses modalités peuvent être naturellement
ordonnées exemple : satisfaction plus ou moins grande
après l’achat d’un produit;
⚫Nominal : si ses modalités ne peuvent être
naturellement ordonnées exemple : état matrimoniale,
couleur des yeux,...
VARIABLE STATISTIQUE

Qualitative Quantitative
si ses valeurs ne sont pas numériques (par si ses valeurs sont numériques ou bien
exemple le sexe, les catégories socio- peuvent être ordonnées de manière
professionnelles, etc.). logique. :

Discrète Continue
Nominale ordinale
VSD VSC
EFFECTIF D’UNE MODALITÉ (NI)

Nombre d’individus ayant la même modalité.


Effectif d’une population (n)
Nombre d’individus formant une population.

n = ∑ ni
FRÉQUENCE D’UNE MODALITÉ (FI)

Proportion d’individus ayant la même modalité.

fi = ni
n
Remarque :
la fréquence d’une population est toujours égale à 1.
∑fi=1
SÉRIE STATISTIQUE
⚫Une série statistique est la suite des modalités
d’une population donnée.
⚫Une population peut être étudiée selon une
seule variable : on parle alors de série simple .
⚫Lorsqu’on s’intéresse à étudier deux variables
en même temps sur une même population : on
parle dans ce cas de série double.
La moyenne statistique

C’est le quotient de la somme des produits ni × xi


par leur nombre (effectif total N )
n x  n x  n x  ...  n x
x 1 1 2 2 3 3 p p

N
xi : valeurs du caractère ou centres de classe,
ni : effectif de xi,
N : effectif total.
Exemple 1 : Caractère discret
   Compléter la dernière colonne du tableau suivant
Nombre
Nombre de
d’enfants par Produits(ni xi)
familles(ni)
famille(xi)
1 8 1×8 = 8
2 9 2×9 = 18
3 6 3×6 = 18
4 3 4×3 = 12
5 2 5×2 = 10
6 1 6×1 = 6
Total 29 72
b.    Quelle est la réponse la plus fréquente ?
La réponse la plus fréquente est 2

c.    Quel est le mode de cette série ?


le mode de la série est donc 2.
l’effectif correspondant est 9.
d.    Calcul de la moyenne
72
x  2,5
29
Exemple 2 : Caractère quantitatif continu
1. Tableau
Classe Nombre Fréquences en Centre de
Amplitudes
d'âge d'employés n i % classe x i n i xi
[18; 20[ 5850
[ 20; 25[ 13050
[25; 30[ 16125
[30; 35[ 12450
[35; 40[ 9125
[40; 45[ 7800
[45; 50[ 6525
[50; 60[ 3825
Total 74750
2. Pourcentage d’employés ayant moins de 30 ans
7,83 + 17,46 + 21,57 = 46,86
Pourcentage d’employés ayant plus de 40 ans
10,43 + 8,73 + 5,12 = 24,28

Pourcentage d’employés ayant entre 25 et 45 ans


21,57 + 16,65 + 12,21 + 10,43 = 60,86
3. Calcul de l’âge moyen
n x  n x  n x  ...  n x
x 1 1 2 2 3 3 p p

N
2 446 838
x 74 750
= 32,73 ans
la médiane
La médiane est la valeur du caractère étudié
qui partage en deux parties égales l’effectif total.

50 % de l’effectif total 50 % de l’effectif total

Effectif correspondant
à la médiane de la série
Détermination de la médiane:

Dans le cas d’un caractère discret


•Si l’effectif total est impair, la médiane est la

valeur du caractère situé au milieu de la série.


Exemple : Série de prix de vente

PV en
12 17 21 25 32 40 13

Le prix médian est 25 €.
•Si l’effectif total est pair, la médiane est la
demi-somme des deux valeurs centrales du caractère.

Exemples : Nombre d’achats journaliers


Nombr
42 56 68 76 84 92
e

68  76
M   72
2
e

Le nombre d’achats médian est de 72


VARIANCES
Comme pour les séries simples,
il est possible de calculer la variance pour
chacune des coordonnées de la série
Population Échantillon
N n
 (X i  X) 2
 i
( x  x ) 2

 i 1
s i 1
N n 1
APPLICATION
APPLICATION
QUALITATIVES: DIAGRAMME EN
TUYAUX D’ORGUE (EN BANDES)
GRAPHIQUES POUR VARIABLES

⚫ Il s’agit d’un certain nombre de rectangles ou de


bandes verticales égal au nombre de modalités. La
base (ou la largeur) de chaque rectangle est la même
et la hauteur (ou la longueur) est proportionnelle à
l’effectif (ou à la hauteur). Ce type de représentation
facilite les comparaisons.
B) LE GRAPHIQUE EN TUYAUX
D'ORGUE (À BANDES)
Exemple : Les dépenses culturelles et de loisirs en 2013 et en 2014

2013 2014
Télévision, Hi-Fi, vidéo, photo 7,2 6,8
Informatique 9,4 9,1
Disques, cassettes, pellicules photo 2,7 2,3
Presse, livres et papeterie 13.9 13,6
Services culturels (1) 17.0 17,5
Jeux, jouets, articles de sport 12.0 12,1
Jardinage, animaux de compagnie 12.5 12,8
Services récréatifs et sportifs(2) 10,4 10,6
Jeux de hasard 9,9 10,1
Autres biens culturels et de loisir 4,9 4,9
Total 100,0 100,0
1) Cinéma, spectacles vivants, musées, abonnements
audiovisuels (y compris redevance TV), développements
de tirage de photos, etc.
(2) Sport, location de matériel sportif, fêtes foraines,
parcs d'attractions,
⚫Représenter graphiquement les dépenses culturelles et
de loisirs en 2013 et en 2014.

Corrigé
⚫Le diagramme en tuyaux d'orgue représentant les dépenses
par catégorie pour chaque année est le suivant :
⚫Application: à partir de l’application 1, établir
le diagramme en tuyaux d’orgue.
DIAGRAMME EN TUYAUX D’ORGUE
(EN BARRES)

Répartition des 20 personnes selon l'état


matrimonial
0,6

0,5

0,4

0,3

0,2

0,1

0
2.2. GRAPHIQUES POUR VARIABLES
DISCRÈTES: DIAGRAMME EN
BÂTONS

Il est formé d’un certain nombre de segments


(ou bâtons) dont les hauteurs sont
proportionnelles aux effectifs (ou fréquences)
des modalités associées.
Application: à partir de l’application 2, établir
le diagramme en bâtons.
DIAGRAMME EN BÂTONS

Répartition des ménages selon le nombre


d'enfants
ni

7
6
5
4
3
2
1
0
GRAPHIQUES POUR VARIABLES
DISCRÈTES: DIAGRAMME EN BÂTONS
COURBE CUMULATIVE (OU
DIAGRAMME EN ESCALIERS)
 Si le diagramme en bâtons est une représentation des
fréquences ou des effectifs simples, la courbe cumulative
est une représentation des fréquences ou des effectifs
cumulés.
 La courbe cumulative est construit comme suit:
 On trace un axe vertical (axe des ordonnées) qui représente Fi
(ou Ni) et un axe horizontal (axe des abscisses) qui représente
xi;
 À chaque modalité xi on associe, par un point, la fréquence
cumulée Fi; à chaque intervalle on trace une ligne droite.
 Application: à partir de l’application 3, établir le
diagramme en escaliers.
COURBE CUMULATIVE
100 Répartition des ménages selon 100
Fi

90 le nombre d’enfants 90
80
75
70
60
50
45
40
30
20 20
10
5
0
0 1 2 3 4 5 6
Nombre d’enfants
xi
COURBE CUMULATIVE
 Une fois le diagramme est construit, sa lecture peut être
faite de la manière suivante: la fréquence cumulée d’une
modalité xi correspond à la proportion d’individus dont le
caractère est inférieur à xi. Autrement
dit: F(xi) = f (X < xi).
 Dans notre application, la lecture du diagramme donne:
⚫ 5% correspond à la proportion des ménages ayant moins de
1 enfant (OU 5% des ménages n’ayant pas d’enfant) .
⚫ 75% correspond à la proportion des ménages ayant moins
de 4 enfants (OU 75% des ménages ayant 0, 1, 2, 3
enfants)
2.3. GRAPHIQUES POUR VARIABLES
CONTINUES: HISTOGRAMME (CAS
DES AMPLITUDES ÉGALES)

Dans le cas où les amplitudes sont égales,


l’histogramme est un diagramme composé de
rectangles verticales dont les hauteurs sont
proportionnels aux fréquences (ou aux
effectifs) et dont les bases sont égales à
l’amplitude de la classe associée.
Application: à partir de l’application 3, établir
l’histogramme adéquat.
HISTOGRAMME: CAS DES
AMPLITUDES ÉGALES

Répartition des salariés selon le salaire


fi

0,5

0,4

0,3

0,2

0,1

0
35 70
70 105 140
xi
HISTOGRAMME: CAS DES
AMPLITUDES INÉGALES
Dans le cas où les amplitudes sontdifférentes, l’histogramme
est un diagrammecomposé de rectangles verticales dont
les hauteurs sont proportionnels aux fréquences corrigées fi’(ou
aux effectifs corrigés) et dont les bases sont égales à l’amplitude
de la classe associée.
hi= fi’= fi x ar
ai
⚫ Application: établir l’histogramme convenable à
l’application 3 (en regroupant les 2 dernières classes).
HISTOGRAMME: CAS DES
AMPLITUDES INÉGALES
Le tableau statistique correspondant est le
suivant:
Classes fi ai li fi'
[0; 35[ 0,30 35 1 0,30
[35; 70[ 0,45 35 1 0,45
[70; 140[ 0,25 70 2 0,13
Total 1 ar= 35 -- %
HISTOGRAMME: CAS DES
AMPLITUDES INÉGALES
 Répartition des salariés selon le salaire
0,5
fi

0,4

0,3

0,2 0,45
0,3
0,1
0,13
0
35 70 140
xi
COURBE CUMULATIVE
 Comme dans le cas d’une «V.S.D.», la courbe cumulative est
une représentation des fréquences ou des effectifs cumulés.
 La courbe cumulative est construit comme suit:
 On trace un axe vertical (axe des ordonnées) qui représente
Fi (ou Ni) et un axe horizontal (axe des abscisses) qui
représente xi;
 À chaque borne supérieure d’une classe « ei » on associe, par
un point, la fréquence cumulée Fi; puis on joigne les points
ainsi obtenus.
 Application: à partir de l’application 3, établir la
courbe cumulative.
COURBE CUMULATIVE
Répartition des salariés selon le salaire
fi

100%
100%
90%
80% 75%
70%
60%
50%
40%
30%
30%
20%

10% 0%
0% 0 35 70 140
xi
INDICATEURS DE TENDANCES
Indicateurs de dispersion
1. Étendue d’une série statistique
L’étendue (E) d’une série statistique est la différence entre la
plus grande valeur du caractère (Maximum) et la plus petite
(Minimum).
E = Max - Min
Exemple: L’étendue des notes, 2; 15; 8; 16; 8; 11; 18 est:

E = 18 – 2 = 16

Retour
Indicateurs de dispersion
2. Quartiles
Le premier quartile Q1:
plus petite valeur du caractère correspondant au moins au
quart de l’effectif total
Exemple:
Notes obtenues par 18 élèves d’une classe, rangées par ordre
croissant:
2;2; 3; 4; 7; 8; 8; 9; 10; 10; 12; 13; 14; 15; 15; 16; 17; 20.
N = 18; N/4 = 4,5 arrondi à l’entier supérieur 5
La 5e note est 7
Le premier quartile Q1 = 7:
Il y a au moins 25% des notes inférieures ou égales à 7

Retour
Indicateurs de dispersion

Le deuxième quartile Q2:


plus petite valeur du caractère correspondant au moins à la
moitié de l’effectif total
Exemple:
Notes obtenues par 18 élèves d’une classe, rangées par ordre
croissant:
2;2; 3; 4; 7; 8; 8; 9; 10; 10; 12; 13; 14; 15; 15; 16; 17; 20.
N = 18; N/2 = 9
La 9e note est 10
Le deuxième quartile Q2 = 10:
Il y a au moins 50% des notes inférieures ou égales à 10

Retour
Indicateurs de dispersion
La médiane Me:
valeur du caractère correspondant au moins à la moitié de
l’effectif total
Exemple:
Notes obtenues par 18 élèves d’une classe, rangées par ordre
croissant:
2;2; 3; 4; 7; 8; 8; 9; 10; 10; 12; 13; 14; 15; 15; 16; 17; 20.
N = 18; est pair donc 10  10
Me   10
2
Ici, la médiane Me = Q2 = 10
Il y a autant de notes inférieures à 10 que supérieures à 10

Retour
Indicateurs de dispersion

Le troisième quartile Q3:


plus petite valeur du caractère correspondant au moins au
trois quarts de l’effectif total
Exemple:
Notes obtenues par 18 élèves d’une classe, rangées par ordre
croissant:
2;2; 3; 4; 7; 8; 8; 9; 10; 10; 12; 13; 14; 15; 15; 16; 17; 20.
N = 18; N×0,75 = 13,5 arrondie à l’unité supérieure 14
La 14e note est 15
Le troisième quartile Q3 = 15.
Il y a au moins 75% des notes inférieures ou égales à 15

Retour
Indicateurs de dispersion

Le quatrième quartile Q4:


plus petite valeur du caractère correspondant au moins à
l’effectif total; c’est le Max
Exemple:
Notes obtenues par 18 élèves d’une classe, rangées par ordre
croissant:
2;2; 3; 4; 7; 8; 8; 9; 10; 10; 12; 13; 14; 15; 15; 16; 17; 20.
N = 18;
La 18e note est 20
Le quatrième quartile Q4 = 20.
100% des notes sont inférieures ou égales à 20

Retour
Autres exemples de calculs d’indicateurs
 Série quantitative discrète avec peu
de valeurs

Exemple 1:
Notes d’un élève, rangées par ordre croissant:
2; 2; 3; 9;10;12
 ;13;14; 15;16;17; 20
             
Me 12,5
12 notes

12×0,25 = 3 donc Q1 = 3 qui est la 3e valeur;


12×0,50 = 6 donc Q2 = 12 qui est la 6e valeur;
12×0,75 = 9 donc Q3 = 15 qui est la 9e valeur;
Autres exemples de calculs d’indicateurs

2; 2; 3; 9;10;12
 ;13;14;15;16;17; 20
     Me
 12,5
      
12 notes

12  13
N = 12: Me   12, 5
2
Le quatrième quartile Q4 = 20.
100% des notes sont inférieures ou égales à 20
 Série quantitative discrète avec de nombreuses de valeurs

Temps d'écoute en nombre de jeunes Effectif cumulé


Produits ni×xi
heure (xi) (ni) total
1 45  
45×1 = 45   45
1,5 120  
120×1,5 = 180   165
2 60 60×2  = 120   225
2,5 134 134×2,5
  = 335   359
3 165   = 495
165×3   524
3,5 122  
122×3,5 = 427   646
4 78 78×4  = 312   724
4,5 65   = 292,5
65×4,5   789
5 71 71×5  = 355   860
Total N = 860 2  564,5  

La moyenne: 2564, 5


x  2, 98
860
Le temps moyen est de 2,98 heures soit ( 2h58min48s)
 Série quantitative discrète avec de nombreuses de valeurs

Temps d'écoute en nombre de jeunes Effectif cumulé


Produits ni×xi
heure (xi) (ni) total
1 45 45×1  = 45   45
1,5 120   = 180
120×1,5   165
2 60 60×2 =  120   225
2,5 134 134×2,5
  = 335   359
3 165 165×3  = 495  524
3,5 122   = 427
122×3,5   646
4 78 78×4 =  312   724
4,5 65 65×4,5  = 292,5   789
5 71  
71×5 = 355   860
Total N = 860  
2 564,5  

L’effectif total est 860 (nombre pair), donc la médiane Me


est la moyenne des valeurs des 430e et 431e rangs. Cette
médiane, ici, est égale à 3 heures
 Série quantitative discrète avec de nombreuses de valeurs

Temps d'écoute en nombre de jeunes Effectif cumulé


Produits ni×xi
heure (xi) (ni) total
1 45   = 45
45×1   45
1,5 120  
120×1,5 = 180   165
2 60 60×2  = 120   225
2,5 134 134×2,5
  = 335   359
3 165   = 495
165×3   524
3,5 122  
122×3,5 = 427   646
4 78 78×4  = 312   724
4,5 65   = 292,5
65×4,5   789
5 71 71×5 =  355   860
Total N = 860 2  564,5  

L’étendue de cette série est: Retour


E = Max – Min = 5 – 1 = 4 heures
 Premier quartile Q1
Retour
Temps d'écoute en Effectif cumulé
heure (xi) total
1 45 
1,5 165   860  0,25  215  225
2  
225
2,5  
359
3  
524 On prend comme rang
3,5  
646 du premier quartile Q1
4 724
 
l’effectif cumulé qui suit
4,5 789
 
immédiatement 215; soit
5 860  225; donc Q1 = 2 h
Total  
 Deuxième quartile Q2
Retour
Temps d'écoute en Effectif cumulé
heure (xi) total
1 45 
1,5 165   860  0,50  430  524
2  
225
2,5  
359
3  
524 On prend comme rang
3,5  
646 du deuxième quartile Q2
4 724
 
l’effectif cumulé qui suit
4,5 789
 
immédiatement 430; soit
5 860  524; donc Q2 = 3 h
Total  
 Troisième quartile Q3
Retour
Temps d'écoute en Effectif cumulé
heure (xi) total
1 45 
1,5 165   860  0,75  645  646
2  
225
2,5  
359
3  
524 On prend comme rang
3,5  
646 du troisième quartile Q3
4 724
 
l’effectif cumulé qui suit
4,5 789
 
immédiatement 430; soit
5 860  646; donc Q3 = 3,5 h = 3h
Total  
30 min
 Calcul des quartiles d’une série quantitative à valeurs
continues
 Exemple: Calculons les quartiles de la série suivante

Caractère Effectif Effectifs cumulés

[10; 20[ 11  11


[20; 30[ 15  26
[30; 40[ 10   36
[40; 50[ 14   50
Total 50  

On commence par compléter la colonne des effectifs cumulés


et la cellule de l’effectif total N.

Retour
Calcul du premier quartile Q1

Caractère Effectif Effectifs cumulés

[10; 20[ 11   11
[20; 30[ 15   26
[30; 40[ 10   36
[40; 50[ 14   50
Total 50  

 50  0, 25  12, 5  26
Donc Q1 est compris dans l’intervalle [20; 30[

Retour
Calcul du premier quartile Q1

Caractère Effectif Effectifs cumulés

[10; 20[ 11   11
[20; 30[ 15   26
[30; 40[ 10   36
[40; 50[ 14   50
Total 50  

30  20
Q1  20   (12,5  11)  21
15
Retour
Calcul du deuxième quartile Q2

Caractère Effectif Effectifs cumulés

[10; 20[ 11   11
[20; 30[ 15   26
[30; 40[ 10   36
[40; 50[ 14   50
Total 50  

 50  0,50  25  26
Donc Q2 est compris dans l’intervalle [20; 30[

Retour
Calcul du deuxième quartile Q2

Caractère Effectif Effectifs cumulés

[10; 20[ 11   11
[20; 30[ 15   26
[30; 40[ 10   36
[40; 50[ 14   50
Total 50  

30  20
Q2  20   (25  11)  29,33
15
Retour
Calcul du troisième quartile Q3

Caractère Effectif Effectifs cumulés

[10; 20[ 11   11
[20; 30[ 15   26
[30; 40[ 10   36
[40; 50[ 14   50
Total 50  

 50  0,75  37, 5  50
Donc Q3 est compris dans l’intervalle [40; 50[

Retour
Calcul du troisième quartile Q3

Caractère Effectif Effectifs cumulés

[10; 20[ 11   11
[20; 30[ 15   26
[30; 40[ 10   36
[40; 50[ 14   50
Total 50  

50  40
Q3  40   (37,5  36)  41,1
14
Retour

You might also like