You are on page 1of 77
Introduction et Généralités sur les statistiques Département de Mathématiques Faculté des Sciences et Techniques Mohammedia R.

Introduction et Généralités sur les statistiques

Introduction et Généralités sur les statistiques Département de Mathématiques Faculté des Sciences et Techniques Mohammedia R.
Introduction et Généralités sur les statistiques Département de Mathématiques Faculté des Sciences et Techniques Mohammedia R.

Département de Mathématiques

Faculté des Sciences et Techniques Mohammedia

R. MORCHADI morchadi@hotmail.com

A vos maths !

Prêts ?

Partez !

A vos maths ! Prêts ? Partez !
Introduction et Généralités sur les statistiques Objectifs de ce module  Apprendre les principales techniques de

Introduction et Généralités sur les statistiques

Objectifs de ce module

  • Apprendre les principales techniques de la statistique descriptive à une dimension et à deux dimensions.

  • Etre capable de mettre en œuvre ces techniques de manière appropriée dans un contexte donné.

Introduction et Généralités sur les statistiques Objectifs de ce module  Apprendre les principales techniques de
  • Manipuler les techniques de statistiques descriptives sur Excel ou

au moyen d’un langage informatique

(langage R).

Introduction et Généralités sur les statistiques Plan du module Voici les parties que nous allons aborder

Introduction et Généralités sur les statistiques

Plan du module

Voici les parties que nous allons aborder :

  • I. Définitions, historique et applications.

II. Les deux aspects de la statistique.

III. Concepts de base.

Introduction et Généralités sur les statistiques Plan du module Voici les parties que nous allons aborder

Introduction et Généralités sur les statistiques

Introduction et Généralités sur les statistiques Ⅰ . Définitions, historique et applications
Introduction et Généralités sur les statistiques Ⅰ . Définitions, historique et applications

. Définitions, historique et applications

Ce cours se présente davantage comme

une initiation à la rigueur que

nécessite la manipulation d’ensembles

de données afin d’utiliser à bon

escient les méthodes appropriées pour éviter de faire parler faussement les chiffres.

Ce cours se présente davantage comme une initiation à la rigueur que nécessite la manipulation d’ensembles

Les concepts et méthodes statistiques seront abordées au travers de nombreux exemples que viendront ponctués le déroulement du cours.

Ⅰ . Définitions, historique et applications 1. Définitions heuristiques Qu’est -ce-que la statistique? La tâche la

. Définitions, historique et applications

1. Définitions heuristiques

Qu’est-ce-que la statistique?

La tâche la plus difficile de ce cours est de définir le mot

« statistique »…

Ⅰ . Définitions, historique et applications 1. Définitions heuristiques Qu’est -ce-que la statistique? La tâche la
Ⅰ . Définitions, historique et applications 1. Définitions heuristiques Définition de la statistique Pour nous, la

. Définitions, historique et applications

1. Définitions heuristiques

Définition de la statistique

Pour

nous,

la

statistique

sera

un

ensemble

de

techniques

mathématiques

permettant

de

recueillir, décrire et interpréter des

données,

avant

létablissement

de

prévisions.

Ⅰ . Définitions, historique et applications 1. Définitions heuristiques Définition de la statistique Pour nous, la

Ces

données

ont

une

variabilité

« hasard. On perçoit dans cette définition:

due

au

Le recueil qui sous entend la collecte, qui à son tour suppose généralement la réalisation

d’une enquête ou d’un sondage.

Ces derniers imposent un

échantillonnage d’une certaine population en vue d’une étude

Le recueil qui sous entend la collecte, qui à son tour suppose généralement la réalisation d’une

plus poussée

« une

inférence mathématique»

Les

phases

d’interprétation

et

de

prévisions nécessitent le

plus

de

rigueur

possible,

afin

de

ne

pas

affirmer de contrevérités

Une maîtrise de l’incertitude dans le but de réaliser des prévisions.

On

les

accompagne

en

général

d’un

« degré de confiance », mesurant le

crédit que l’on peut leur apporter.

Les phases d’interprétation et de prévisions nécessitent le plus de rigueur possible, afin de ne pas
Ⅰ . Définitions, historique et applications 2. Mises en garde… À noter que ce dernier point,

. Définitions, historique et applications

2. Mises en garde…

À noter que ce dernier point, précision des résultats, est souvent (toujours !) oublié des médias lorsquils tentent de nous informer

Par exemple, si lon interroge 1000 personnes avant une élection à deux candidats, Mick et Keith, et que Keith obtient 51% dintentions de vote, cela signifie en fait que sur la population entière, Keith à 95 chances sur 100 davoir entre 48% et 54% des voix

Ⅰ . Définitions, historique et applications 2. Mises en garde… À noter que ce dernier point,

Quel sens allons nous donner à ses chiffres? C’est l’ « estimation paramétrique ».

Ⅰ . Définitions, historique et applications 2. Mises en garde… Autre point capital, pour pouvoir effectuer

. Définitions, historique et applications

2. Mises en garde…

Autre point capital, pour pouvoir effectuer des prévisions il convient davoir un échantillon « représentatif ».

Très Important

Aux élections américaines de 1936, le journal Literary Digest prédit la victoire du républicain Landon en interrogeant par téléphone plus de 2 millions délecteurs.

Ⅰ . Définitions, historique et applications 2. Mises en garde… Autre point capital, pour pouvoir effectuer

Un sondeur, George Gallup, annonce

lui

la

victoire

du

démocrate

Roosevelt

en

ne

sondant

que

3000

personnes,

mais

judicieusement choisies.

Ⅰ . Définitions, historique et applications 2. Mises en garde… C ’ est ce dernier qui

. Définitions, historique et applications

2. Mises en garde…

Cest ce dernier qui avait raison, léchantillon du Literary Digest était certes plus important

mais «

biaisé

»,

car

à cette époque

seule

la

bourgeoisie

téléphone

possédait

le

Ces exemples

sont

pour vous mettre

en

garde !!! Et on peut les multiplier

Ⅰ . Définitions, historique et applications 2. Mises en garde… C ’ est ce dernier qui

Soyez donc critique si on vous donne

des

résultats statistiques et

. soyez rigoureux si vous avez à en établir !!!

Ⅰ . Définitions, historique et applications 3. Bref historique Le mot « statistique » est récent,

. Définitions, historique et applications

3. Bref historique

Le mot « statistique » est récent, on le trouve dans un ouvrage administratif français de la fin du 17 e siècle.

Le terme dérive du latin « statisticum » : qui a trait à létat.

Lactivité

correspondante,

le

recueil

de

données, est elle beaucoup plus ancienne.

Ⅰ . Définitions, historique et applications 3. Bref historique Le mot « statistique » est récent,

À lorigine, ce sont des chefs détat, qui via des recensements, souhaitaient connaître l’étendue de leur puissance. On dénombrait ainsi population, richesses, capacité militaire

Ⅰ . Définitions, historique et applications 3. Bref historique On trouve trace de tels recensements :

. Définitions, historique et applications

3. Bref historique

On trouve trace de tels recensements :

  • Dans la civilisation sumérienne, entre 5000 et 3000

ans avant

J.C.

:

tablettes dargile.

liste

dhommes et de biens

sur des

  • En Mésopotamie, 3000 ans avant J.C.

Ⅰ . Définitions, historique et applications 3. Bref historique On trouve trace de tels recensements :
  • En Egypte,

2500 ans avant J.C. : recensements à

finalité fiscale.

En

Chine,

2000

ans

productions agricoles.

avant

J.C.

:

évaluations

de

Ⅰ . Définitions, historique et applications 4. Champs d ’ applications Les statistiques ne se limitent

. Définitions, historique et applications

4. Champs dapplications

Les statistiques ne se limitent plus comme à lorigine aux seules données démographiques, économiques ou sociologiques.

On y a recourt maintenant dans de nombreux domaines :

  • En

sciences

physiques

mécanique, astronomie.

: thermodynamique,

  • Démographie, économie, biologie, chimie, sociologie, médecine, pharmacie, agronomie

  • En géophysique : météorologie et climatologie.

  • En biologie : hérédité, génétique, médecine.

  • En psychologie : sondages dopinions.

Ⅰ . Définitions, historique et applications 4. Champs d ’ applications Les statistiques ne se limitent
  • En industrie : contrôle de qualité des productions.

  • Dans le domaine tertiaire : banques et assurances

Ⅰ . Définitions, historique et applications Pause-réflexion sur la partie Ⅰ

. Définitions, historique et applications

Pause-réflexion sur la partie

Ⅰ . Définitions, historique et applications Pause-réflexion sur la partie Ⅰ
Ⅰ . Définitions, historique et applications Pause-réflexion sur la partie Ⅰ

Introduction et Généralités sur les statistiques

Introduction et Généralités sur les statistiques Ⅱ . Les deux aspects de la statistique
Introduction et Généralités sur les statistiques Ⅱ . Les deux aspects de la statistique

. Les deux aspects de la statistique

Ⅱ . Les deux aspects de la statistique Plan de la partie Voici les chapitres que

. Les deux aspects de la statistique

Plan de la partie

Voici les chapitres que nous allons aborder

1. La statistique descriptive.

  • 2. La statistique inférentielle.

  • 3. La démarche statistique.

Ⅱ . Les deux aspects de la statistique Plan de la partie Voici les chapitres que

A partir de la définition on voit que:

la statistique est un ensemble de méthodes permettant de prendre une bonne

décision face à l’incertitude

C’est aussi un ensemble d’outils et de

méthodes qui permettent de synthétiser

et de résumer des grands volumes de données, des grandes matrices

A partir de la définition on voit que: la statistique est un ensemble de méthodes permettant

d’informations.

On voit se dessiner ici les

deux principales branches de

la statistique :

La statistique descriptive

  • La statistique mathématique

ou inférentielle

On voit se dessiner ici les deux principales branches de la statistique :  La statistique
Ⅱ . Les deux aspects de la statistique 1. La statistique descriptive On désigne par statistique

. Les deux aspects de la statistique

1. La statistique descriptive

On désigne par statistique

descriptive lensemble des méthodes de collecte et

traitement des données. Elle

consiste à résumer, ordonner, présenter et analyser de façon claire des données statistiques relatives à une population

Ⅱ . Les deux aspects de la statistique 1. La statistique descriptive On désigne par statistique

donnée

La description des données passe par :

  • Une présentation synthétique (tableaux…).

  • Une représentation graphique adaptée (histogramme…).

  • Un résumé numérique par le calcul de

certaines grandeurs typiques (moyenne…).

  • Une étude des éventuelles corrélations entre variables.

La description des données passe par :  Une présentation synthétique ( tableaux …).  Une
Ⅱ . Les deux aspects de la statistique 1. La statistique descriptive Exemple : notes des

. Les deux aspects de la statistique

1. La statistique descriptive

Exemple : notes

des étudiants de FSTM à

lexamen de probabilités et statistiques.

On

collecte

section.

les

résultats dans chaque

  • On représente la répartition des notes par un histogramme.

  • On « résume » la série par sa moyenne, médiane

Ⅱ . Les deux aspects de la statistique 1. La statistique descriptive Exemple : notes des

On

mesure

type

la

dispersion

avec

lécart-

Exemple : Les températures moyennes mensuelles à Ifrane sur la période 1971-2000.

Exemple : Les températures moyennes mensuelles à Ifrane sur la période 1971-2000.
Exemple : Les températures moyennes mensuelles à Ifrane sur la période 1971-2000.

Le « simple » passage d'un tableau de données plus ou moins important à un graphique et/ou à quelques indicateurs

pertinents telle que la moyenne constituent

Le « simple » passage d'un tableau de données plus ou moins important à un graphique

une opération relevant de la statistique descriptive.

Ⅱ . Les deux aspects de la statistique 2. La statistique inférentielle La statistique inférentielle ou

. Les deux aspects de la statistique

2. La statistique inférentielle

La statistique inférentielle ou mathématique est pour sa part lensemble des méthodes qui

permettent à partir de létude dun échantillon dinduire des informations sur une population, de

faire des prévisions de comportements basées sur le calcul

de probabilités.

Ⅱ . Les deux aspects de la statistique 2. La statistique inférentielle La statistique inférentielle ou

Elle

nécessite

un

choix

judicieux

de

l’échantillon, i.e. il doit être représentatif de la population (cf. exemple des élections américaines de 1936)

Elle

utilise

des

modèles

théoriques

de

référence, les lois de probabilités .

Elle nécessite un choix judicieux de l’échantillon , i.e. il doit être représentatif de la population

En effet, on constate en général que la répartition statistique d’une variable sur un échantillon est voisine d’une loi de probabilité.

Ⅱ . Les deux aspects de la statistique 2. La statistique inférentielle La statistique inférentielle permet

. Les deux aspects de la statistique

2. La statistique inférentielle

La statistique inférentielle permet alors :

Destimer

les

paramètres

de

la

loi de

probabilité à partir de léchantillon.

De mesurer la validité de cette estimation par un intervalle de confiance.

Ⅱ . Les deux aspects de la statistique 2. La statistique inférentielle La statistique inférentielle permet

De

mesurer

ladéquation

de

la

loi

de

probabilité choisie à léchantillon par des tests statistiques.

Exemple :

En période électorale, on interroge 1 000 personnes sur leur intention de vote. A

partir des résultats obtenus sur cet échantillon, on prévoit, avec une certaine précision, le comportement de l’ensemble des électeurs (population mère) et par là même, le résultat des élections. C’est ce

qu’on appel l’inférence statistique et c’est le principe même du sondage d’opinion par exemple.

Exemple : En période électorale, on interroge 1 000 personnes sur leur intention de vote. A

Démarche statistique

Etapes d’une étude statistique :

1- Collecte des données (les statistiques) :

Recueillir les informations adéquates sur un

échantillon qui serviront de base à l’ étude.

2- Traitement des données (la statistique) :

A- Statistique descriptive : techniques permettant de traiter les données recueillies, de

les mettre sous forme de tableaux, de graphiques et de dégager les caractéristiques essentielles

Démarche statistique Etapes d’une étude statistique : 1- Collecte des données (les statistiques) : Recueillir les

(moyenne, médiane,

variance,. . .

)

B- Statistique mathématique : techniques permettant de tirer des conclusions sur toute la population à partir de données partielles recueillis

sur un échantillon.

Démarche statistique

Démarche statistique

Le lien de complémentarité entre

statistique inférentielle et

statistique descriptive est évident :

Le lien de complémentarité entre statistique inférentielle et statistique descriptive est évident : la première collecte

la première collecte et fournit à la seconde la matière première à décrire à et analyser et à faire des prévisions

Ⅱ . Les deux aspects de la statistique Pause-réflexion sur la partie Ⅱ

. Les deux aspects de la statistique

Pause-réflexion sur la partie

Ⅱ . Les deux aspects de la statistique Pause-réflexion sur la partie Ⅱ
Ⅱ . Les deux aspects de la statistique Pause-réflexion sur la partie Ⅱ

Introduction et Généralités sur les statistiques

Introduction et Généralités sur les statistiques Ⅲ . Concepts de base
Introduction et Généralités sur les statistiques Ⅲ . Concepts de base

. Concepts de base

Ⅲ . Concepts de base Plan de la partie Voici les chapitres que nous allons aborder

. Concepts de base

Plan de la partie

Voici les chapitres que nous allons aborder

1. Terminologie de base.

  • 2. Les différents types de

caractères.

  • 3. Effectifs et fréquences.

Ⅲ . Concepts de base Plan de la partie Voici les chapitres que nous allons aborder
Ⅲ . Concepts de base 1. Terminologie de base A la base de toute étude statistique,

. Concepts de base

1. Terminologie de base

A la base de toute étude

statistique, il y a une

population, formée d'

individus sur lesquels on observe des caractères.

Ⅲ . Concepts de base 1. Terminologie de base A la base de toute étude statistique,

Population : ensemble dindividus présentant un caractère commun. Pour

une thématique donnée sur lesquels on effectue une étude statistique.

  • La population européenne : ensemble des individus résidant sur le territoire européen a un moment donné.

Population : ensemble d ’ individus présentant un caractère commun. Pour une thématique donnée sur lesquels
  • Le parc automobile Marocain: ensemble des automobiles immatriculées sur le territoire Marocain.

  • La population est en général notée P

  • L'effectif total d'une population est note N ou n

Unité statistique (ou individu) : élément de

base constitutif de la population a laquelle il appartient. Il est indivisible et peut être un animal, un végétal, un humain ou un objet.

 La population est en général notée P  L'effectif total d'une population est note N

Exemples : une automobile, un logement, une vache, une ampoule, une ville, etc. note i

  • Échantillon : sous-ensemble de la population, dite population mère.

 Échantillon : sous-ensemble de la population, dite population mère.  Recensement : enquête dans laquelle
  • Recensement : enquête dans laquelle les observations (mesures, questions…) portent sur

 Échantillon : sous-ensemble de la population, dite population mère.  Recensement : enquête dans laquelle

la population entière.

  • Sondage : enquête dans laquelle les observations portent sur un échantillon de la population.

Série statistique : C’est une correspondance qui à chaque individu de la population

étudiée fait associer une valeur du

caractère étudié.

Les valeurs d’une série statistique pour un

caractère X sont notées :

Série statistique : C’est une correspondance qui à chaque individu de la population étudiée fait associer

x(1), x(2),

. . .

,

x(N)

Exemple

Exemple
Exemple

Modalités : Ce sont les différentes valeurs distinctes prises par le caractère. Les modalités d’un caractère X sont notées :

Modalités : Ce sont les différentes valeurs distinctes prises par le caractère. Les modalités d’un caractère

k désigne le nombre de modalités du caractère.

Exemple

le caractère ”X =couleur” peut avoir comme modalités : noir, rouge, bleu, blanc, gris, autres.

Modalités : Ce sont les différentes valeurs distinctes prises par le caractère. Les modalités d’un caractère

Si ”X =groupe sanguin” , il a comme modalités : A, B, O, AB.

Remarque

Les modalités d’un caractère doivent

être :

Incompatibles : (chaque individu a une seule modalité).

Exhaustives (tous les cas sont prévus).

Remarque Les modalités d’un caractère doivent être :  Incompatibles : (chaque individu a une seule
Ⅲ . Concepts de base 1. Terminologie de base Pour fixer les idées, il est plus

. Concepts de base

1. Terminologie de base

Pour fixer les idées, il est plus facile

de penser en termes de population humaine. Les individus sont des

personnes, et les caractères

observes peuvent être morphologiques (taille, poids,

couleur des yeux), physiologiques

(groupe sanguin, numération

globulaire, taux de cholestérol) ou

psychologiques (réactions a des

Ⅲ . Concepts de base 1. Terminologie de base Pour fixer les idées, il est plus

tests ou réponses a une enquête d'opinion)

Remarques: Ce vocabulaire provient bien

sûr des origines démographiques des

études statistiques.

On

étudie

un

échantillon

lorsque

la

population est impossible (ou très difficile) à étudier dans son intégralité.

Exemple

:

lensemble

des étudiants

inscrits à la FSTM est une population dont

la section BCG est un échantillon.

Remarques : Ce vocabulaire provient bien sûr des origines démographiques des études statistiques.  On étudie

Exemple pratique

Sous quelle forme se présentent les données statistiques ?

Exemple pratique Sous quelle forme se présentent les données statistiques ?

Pour étudier la répartition des terres

agricoles d'une région, on peut faire l'inventaire des exploitations agricoles (soit n leur nombre), et noter pour

chacune d'elles sa taille (en hectares).

Pour étudier la répartition des terres agricoles d'une région, on peut faire l'inventaire des exploitations agricoles

L'ensemble des n exploitations s'appelle la population statistique étudiée ; chacune des exploitations est un individu, ou une unité statistique. La taille (en ha) est la variable statistique (ou caractère) étudiée.

Les valeurs que peut prendre un caractère

s'appellent les modalités.

Ⅲ . Concepts de base 2. Les différents types de caractères Un caractère (ou variable )

. Concepts de base

2. Les différents types de caractères

Un caractère (ou variable ) est une propriété

(caractéristique) relative à chacun des individus de la population et sur laquelle on veut faire porter l’ étude (c.à.d que l’on décide d’observer et analyser). Il est soit observé soit mesuré.

Les caractères (ou variables) seront désignés par une lettre X, Y,

. .

.

Exemple : la couleur, le sexe, le poids, la taille, la marque, le modèle, l'espèce, le prix, la surface,

Ⅲ . Concepts de base 2. Les différents types de caractères Un caractère (ou variable )

etc.

Dans une même étude statistique, on pourra considérer plusieurs caractères simultanément

sur une même population.

On distingue deux types de

caractères :

Les caractères qualitatifs.

(Qualité)

Les caractères quantitatifs

On distingue deux types de caractères :  Les caractères quali tatifs . (Qualité)  Les

(Quantité)

Ⅲ . Concepts de base 2. Les différents types de caractères Caractères qualitatifs Un caractère est

. Concepts de base

2. Les différents types de caractères

Caractères qualitatifs

Un

caractère

est

dit

qualitatif

lorsquil prend des modalités non numériques.

On dit qu’un caractère qualitatif est nominal, si les valeurs ne peuvent être ni ordonnées ni ajoutées

Ⅲ . Concepts de base 2. Les différents types de caractères Caractères qualitatifs Un caractère est

Les opérations arithmétiques que l'on

peut réaliser sur ce type de

variable sont relativement réduites et se limitent au comptage des

effectifs par modalité (fréquences

absolues) et au calcul de pourcentage (fréquences relatives) et le mode.

Les opérations arithmétiques que l'on peut réaliser sur ce type de variable sont relativement réduites et

Exemple 1

Nationalité : marocaine, allemande, française. Groupe sanguin : A, B, O, AB.

Exemple 1  Nationalité : marocaine, allemande, française.  Groupe sanguin : A, B, O, AB.

Exemple 2:

Classement d’un groupe de 25 étudiants selon leur

ville de naissance) Les quatre modalités du caractère « ville de naissance» sont

Exemple 2 : Classement d’un groupe de 25 étudiants selon leur ville de naissance) Les quatre
Exemple 2 : Classement d’un groupe de 25 étudiants selon leur ville de naissance) Les quatre

nominales, en plus, ils ne font objet d’aucun

classement hiérarchique.

  • Si les modalités peuvent être ordonnées dans une graduation logique, selon une hiérarchie naturelle, mais ne peuvent être ajoutées, les individus de la population étudiée pour le caractère retenu. (niveau hiérarchique, intensité d’une douleur) on parle de caractère qualitatif ordinal.

Les opérations autorisées pour l'échelle

 Si les modalités peuvent être ordonnées dans une graduation logique, selon une hiérarchie naturelle, mais

qualitative ordinale

sont,

en

plus

du

comptage par modalité (fréquences relatives , mode, médiane..).

Exemples :

  • le stade d’une maladie, les tailles pour

habits, ..

  • les réponses lors d’un sondage Les modalités :«pas du tout», «un peu», «assez»,«beaucoup», «à la folie»

  • Enquête réalisée par une entreprise sur le degré de satisfaction des consommateurs concernant un produit. Le caractère : « Degré

de satisfaction » . Les modalités du caractère

Exemples :  le stade d’une maladie, les tailles pour habits, ..  les réponses lors

«satisfait», «Peu satisfait»,

«Assez satisfait», «Pas satisfait»

Exemple

Niveau d’ étude : primaire, secondaire, supérieur.

Etat mécanique d’une Voiture :

mauvais, moyen, bon, excellent.

Exemple  Niveau d’ étude : primaire, secondaire, supérieur.  Etat mécanique d’une Voiture : mauvais,

Caractères quantitatifs

Un caractère est dit quantitatif sil est mesurable.

La

variable

"surface" est

continue, alors

que

la

variable "nombre de chats"

est discrète.

Caractères quantitatifs Un caractère est dit quantitatif s ’ il est mesurable. La variable " surface

Si le caractère quantitatif ne prend quun nombre fini de valeurs, on dira de plus quil est discret ou dénombrable.

En général il résulte d’un comptage et les

modalités sont des valeurs numériques isolées.

Exemples : le nombre d’accidents pour une période donnée, le nombre d’enfants par foyer, le nombre d’étudiants inscrits en bac, nombre denfants par famille, nombre de jours de retard dun étudiant, ….

Si le caractère quantitatif ne prend qu ’ un nombre fini de valeurs, on dira de

Exemple : Une enquête auprès des habitants d’un quartier composé de 50 foyers révèle le nombre de personne par foyer. Ces résultats sont regroupés dans le tableaux suivant:

Exemple : Une enquête auprès des habitants d’un quartier composé de 50 foyers révèle le nombre
Exemple : Une enquête auprès des habitants d’un quartier composé de 50 foyers révèle le nombre

Si le caractère quantitatif peut prendre toute les valeurs dans un intervalle donné ( l’ensemble de ses modalités n’est pas dénombrable), il sera dit continu.

En général, elle résulte d’une mesure. Exemples : le poids, la taille, la durée, le

taux de glycémie, le rendement, la

surface, la durée, le salaire, l’âge,….

Si le caractère quantitatif peut prendre toute les valeurs dans un intervalle donné ( l’ensemble de
Ⅲ . Concepts de base 2. Les différents types de caractères Dans le cas d ’

. Concepts de base

2. Les différents types de caractères

Dans le cas dun caractère quantitatif, lorsque le nombre des modalités d’un caractère quantitatif est élevé (supérieur à 15), pour faciliter létude et linterprétation, on est amené à regrouper les valeurs

en « classes », rassemblant chacune des individus présentant des caractères similaires. Ce qui revient a les rendre discrètes, les nouvelles modalités étant les

différentes classes.

Ce sont des intervalles du type

.
.

Par exemple, si le caractère ”Notes obtenues par un groupe d’ étudiants” peut avoir comme modalités :

[0; 5[, [5; 7[, [7; 10[, [10; 14[, [14; 20].

Ⅲ . Concepts de base 2. Les différents types de caractères Dans le cas d ’

Caractéristiques d’une classe

  • Une classe est un intervalle de la forme [a inf ; a sup [ ou

  • a inf est la borne inférieure de la classe

  • a sup est la borne supérieure de la classe

  • On appelle le centre de la classe ]a inf ; a sup ] le milieu de l’intervalle, qui est donné par:

    • c = (a inf + a sup )/2

  • On appelle amplitude de la ]a inf ; a sup ] la différence entre la borne supérieure de la classe et la borne inférieure de la classe,

Caractéristiques d’une classe  Une classe est un intervalle de la forme [ a ; a

donnée par:

a

= a sup - a inf

Récapitulatif

Pour les variables du questionnaire médical ci-dessous, on

va donner la nature (Quantitative, Discrète, Continue) des variables de 1 à 8:

Récapitulatif Pour les variables du questionnaire médical ci-dessous, on va donner la nature (Quantitative, Discrète, Continue)
Ⅲ . Concepts de base 3. Effectifs et fréquences Effectifs  N ou n : effectif

. Concepts de base

3. Effectifs et fréquences

Effectifs

  • N ou n : effectif total, i.e. le nombre dindividus de léchantillon (ou de la population).

  • n i : effectif de la modalité i (resp. de la i ème valeur, resp. de la i ème classe), i.e. le nombre dindividus présentant la modalité i (resp. prenant la i ème valeur, resp. appartenant à la i ème classe).

Ⅲ . Concepts de base 3. Effectifs et fréquences Effectifs  N ou n : effectif
Ⅲ . Concepts de base 3. Effectifs et fréquences Fréquences  f : fréquence de la

. Concepts de base

3. Effectifs et fréquences

Fréquences

f i : fréquence

de

la

modalité i (resp. de la i ème

valeur, resp. de la i ème classe), i.e. la proportion

des

individus

présentant

la

modalité

i

(resp.

prenant la i ème valeur, resp. appartenant à la i ème classe).

On a bien sûr :

Ⅲ . Concepts de base 3. Effectifs et fréquences Fréquences  f : fréquence de la

f i = n i n

Ⅲ . Concepts de base 3. Effectifs et fréquences Fréquences  f : fréquence de la
Ⅲ . Concepts de base 3. Effectifs et fréquences Fréquences cumulées  Si les valeurs du

. Concepts de base

3. Effectifs et fréquences

Fréquences cumulées

  • Si les valeurs du caractère sont ordonnables, i.e. le caractère est qualitatif ordinal ou quantitatif, il sera intéressant de considérer les fréquences cumulées.

  • On commence par classer les valeurs par ordre croissant x 1 <x 2 <<x p (dans le cas continu on ordonne les classes).

Ⅲ . Concepts de base 3. Effectifs et fréquences Fréquences cumulées  Si les valeurs du
  • On pose alors :

F

i

i

j 1

f F f

j

i

1

i

Effectifs cumulés,

Résultat de l'addition, de proche en proche, des effectifs d'une distribution

Effectifs cumulés , Résultat de l'addition, de proche en proche, des effectifs d'une distribution observée, Effectifs

observée,

Effectifs cumulés croissants, En commençant par le 1er :

N 1 = n 1 , N 2 = n 1 + n 2 ,

, N i = n 1 + n 2 +

... Effectifs cumulés décroissants,

...

+ n i

En commençant par le dernier :

N' K = n K , N' K-1 = n K + n K-1 ,

...

, N i ' = n K + n K-1 +

...

+ n i

Fréquences cumulées :

Résultat de l'addition, de proche en proche, des fréquences d'une

distribution observée,

Fréquences cumulées croissantes

En commençant par le 1er :

F 1 = f 1 , F 2 = f 1 + f 2 ,

...

, F i = f 1 + f 2 +

...

+ f i

Fréquences cumulées décroissantes

Fréquences cumulées : Résultat de l'addition, de proche en proche, des fréquences d'une distribution observée, Fréquences

En commençant par le dernier :

F' K = f K , F' K-1 = f K + f K-1 ,

...

, F' i = f K + f K-1 +

...

+ f i

Interprétation

Dans le cas discret, F i sinterprète comme étant la proportion des individus pour laquelle la valeur du caractère est inférieure ou égale à x i .

Dans

le

cas

continu, F i s interprète

comme étant la proportion des individus

Interprétation  Dans le cas discret , F s ’ interprète comme étant la proportion des

pour laquelle la valeur du caractère est

dans les i premières classes.

Ⅲ . Concepts de base Pause-réflexion sur la partie Ⅲ

. Concepts de base

Pause-réflexion sur la partie

Ⅲ . Concepts de base Pause-réflexion sur la partie Ⅲ
Ⅲ . Concepts de base Pause-réflexion sur la partie Ⅲ
Félicitations Vous avez suivi avec succès ce module introductif : Introduction et Généralités sur les statistiques
Félicitations
Vous avez suivi avec succès ce
module introductif :
Introduction et Généralités
sur les statistiques

Introduction et Généralités sur les statistiques

Fin

Introduction et Généralités sur les statistiques Fin
Introduction et Généralités sur les statistiques Fin