Professional Documents
Culture Documents
INTRODUCTION 1
LES T.P
T.P N°2 - LES RAPPORTS PRÉLIMINAIRES SUR LES OBSERVATIONS ET SUR LES
VARIABLES ET LES TRIS À PLAT 12
INTRODUCTION
Ce cours est donc destiné aux étudiants qui désirent mettre à jour leurs connaissances
de base en statistiques et s’initier à l’utilisation de SPSS pour l’analyse des données. Les
concepts de variabilité et de distribution d’une variable statistique, les techniques de mesure
de la tendance centrale et de la dispersion sont expliqués ; les relations entre les variables
sont aussi présentées.
Page 1/36
Applications informatiques en marketing M M E HAMROUNI W A F A
A cet égard, nous pouvons parler par exemple de Business mapping ou géomarketing
qui constitue un domaine qui aide à mieux appréhender et gérer les réalités et les
opportunités des marchés économiques en mettant en relation les données et leur
positionnement géographique. Cette approche propose d’analyser des territoires ou des
espaces économiques avec des outils d’analyse spatiale.
Le champ d’application du business mapping est très étendu, aussi bien par la diversité
des secteurs d’activité qui y ont recours que par la variété des problématiques abordées.
Le passage à l’étape de l’analyse des données se fait évidemment après avoir posé la
problématique, l’objectif de la recherche, après la revue de la littérature, après avoir formulé
les hypothèses (et pour fixer les concepts, les variables, les mesures, identifier la source des
informations, choisir la méthode de collecte d’information…).
Cette place assez retardée dans le processus de la recherche ne signifie pas que nous
n’y songeons qu’à la fin, le chercheur gagne beaucoup de temps en fixant toute sa
méthodologie avant de se lancer effectivement dans la recherche et dans les enquêtes
(surtout la fixation des méthodes de traitement des informations qui est une étape cruciale
de la méthodologie).
Page 2/36
Applications informatiques en marketing M M E HAMROUNI W A F A
9 Les objectifs
A partir de la problématique de recherche, nous fournissons un ou plusieurs objectifs
de recherche qui traduisent la mission du chercheur c'est-à-dire l’action qu’il est censé
mener pour apporter les éléments de réponse à la problématique.
Qui dit action ou mission dit forcément la présence d’un verbe dans la formulation ;
par exemple, à la problématique suivante traduite sous forme de questions : existe-t-il des
groupes homogènes d’une population donnée par rapport à un comportement d’achat ? Quel
est le profil des groupes dominants ? La formulation des objectifs peut se faire comme suit :
vérifier l’existence de segments au sein de cette population ;
identifier une ou plusieurs caractéristiques pertinentes des groupes retenus.
Ces deux objectifs ont un caractère descriptif, la méthode d’analyse à utiliser est donc
de même nature, à savoir la méthode descriptive ; dans ces objectifs il n’y pas de
phénomènes à expliquer.
9 Les hypothèses :
L’objectif étant complexe, le passage par des hypothèses est la meilleure voie pour le
simplifier. Une hypothèse est composée généralement de 3 éléments : 2 variables et une
relation.
Page 3/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Par rapport au nombre de variables présentes dans un objectif ou dans une hypothèse,
le choix de la méthode peut être dans le cadre univarié (une seule variable), bivarié (deux
variables) ou multivarié (trois variables et plus).
Nous pouvons classer les variables en plusieurs catégories : les variables à expliquer
qui concernent le ou les phénomènes à étudier et à expliquer par des facteurs appelés
variables explicatives.
Les variables endogènes apparaissent comme une variable dépendante dans au moins
une relation. Par contre, une variable est dite exogène quand elle n’apparaît jamais comme
une variable dépendante.
Une variable est dite observable ou manifeste quand elle est directement observable et
mesurable (par exemple le temps passé dans un point de vente). Une variable est dite latente
(par exemple job autonomy) quand elle n’est pas directement mesurable et pour laquelle
nous avons besoin d’un ensemble d’indicateurs ou de propositions ou d’items qui sont
observables.
Page 4/36
Applications informatiques en marketing M M E HAMROUNI W A F A
LES TRAVAUX
PRATIQUES
Page 5/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Le logiciel SPSS (Statistical Package for Social Sciences) sous Windows est un outil
d'analyse statistique particulièrement conçu pour les étudiants en méthodologie d’enquêtes
ou ceux des disciplines reliées aux sciences humaines, ainsi que toute personne travaillant
en tant que : analyste de marché, économiste et professionnel du domaine social. Il permet
principalement de réaliser la codification, la saisie, la manipulation et l'utilisation des
données à l'aide des fonctions informatiques et statistiques de base disponibles dans ce
programme.
9 Fichier : permet d’ouvrir des fichiers de données existants en format SPSS ; d’ouvrir
une feuille de données vierge ; d’importer des données en format texte, Excel, Access
notamment ; permet de sauvegarder les fichiers créés ou modifiés ; permet d’obtenir
des informations sur des données, d’appliquer les paramètres d’un fichier externe au
fichier actif (Apply Data Directory) ; permet de quitter l’application.
9 Édition : copier – coller – couper – effacer les données d’une colonne et d’autres
options.
9 Affichage : permet de déterminer l’affichage des données.
9 Données : édition des données, permet notamment d’insérer des lignes ou des
colonnes, de créer des gabarits pour le format des variables, de transposer les lignes
en colonnes et inversement, d’agréger des données, de diviser un échantillon en
plusieurs groupes, de sélectionner des objets dans l’échantillon.
9 Transformer : permet de transformer les scores des variables, ceci par différentes
formules, permet de compter des valeurs, de re-coder des variables (changer de
Page 6/36
Applications informatiques en marketing M M E HAMROUNI W A F A
9 Fichier : mêmes fonctions que celles de la feuille des données, avec quelques
spécificités.
9 Édition : idem que la feuille des données, avec en plus le choix pour l’éditeur de texte
ou de graphique (selon l’élément sélectionné sur la feuille des résultats).
9 Affichage : mêmes finalités que celles de la feuille des données.
9 Insérer : permet l’insertion de nouveaux graphiques, de titres, d’objets créés à partir
d’autres logiciels dans le but de compléter les résultats obtenus.
9 Format : permet d’aligner les éléments de la feuille, de modifier la fonte du texte,
ainsi que la mise en page des résultats.
9 Analyse : idem que pour la feuille des données ; ainsi il n’est pas nécessaire de
revenir à la feuille des données pour compléter une analyse ou en commencer une
nouvelle.
9 Graphes : idem que pour la feuille des données.
9 Outils : idem que pour la feuille des données.
9 Fenêtre : idem que pour la feuille des données.
9 Aide : idem que pour la feuille des données.
Page 7/36
Applications informatiques en marketing M M E HAMROUNI W A F A
n donner un nom à la variable : 8 caractères maximum, sans accent ni "-", seul les "_"
sont acceptés.
o définir le type de la variable - en général, nous pouvons laisser ce qui est sélectionné
par défaut,
sauf si nous avons une question ouverte dont les réponses ne sont pas précodées.
Dans ce cas de figure, nous cocherons "Chaîne de caractères" et nous augmenterons
la "largeur" (par exemple en mettant 50, de façon à pouvoir saisir quelques mots).
p Nous pouvons laisser la largeur 8 par défaut (exception, cf. supra)
q Définir le nombre de décimales possibles.
r L’étiquette permet de taper un texte plus explicite que les 8 caractères du nom de la
variable
s les étiquettes de valeur permettent de rendre les tableaux de résultats plus lisibles et
plus explicites
t les valeurs manquantes permettent de traiter le cas où un répondant n’a pas répondu
à une question ; par convention, nous utilisons la valeur 9 pour définir les valeurs
manquantes ; lorsque 9 appartient à l’espace des réponses possibles nous retiendrons
la valeur 99 (ou 999…).
Page 9/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Ordinale ; nous choisirons Ordinale lorsque les données sont rangées par ordre sans
que l’intervalle entre chaque niveau de la variable soit constant. C'est très souvent le
cas d’échelle à 3 points. La décision entre Échelle ou Ordinale dépend grandement
du choix de données qui seront ultérieurement effectuées.
Nominale ; nous choisirons Nominale lorsque les données permettent des
classification sans relation d’ordre. Par exemple, le sexe (Homme, Femme), le lieu
d’habitat (Tunis, Sousse, Sfax, etc.). Les modalités peuvent être binaires ou
multiples.
Page 10/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Pour ajouter des variables, il faut sélectionner : Données Æ fusionner des fichiers Æ
ajouter des variables
Page 11/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Lorsque vous avez vous-même saisi le fichier, cette fonction vous permet de vérifier
votre travail et d’obtenir une synthèse facile à lire.
Lorsque vous travaillez sur un fichier qui vous a été donné, cette fonction vous permet
de vous familiariser avec des variables et de voir comment le fichier a été constitué.
Pour avoir un rapport préliminaire sur les variables, il faut sélectionner : Outils Æ
informations sur le fichier (nous obtenons le File information).
Page 12/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Cette fonction permet de repérer les éventuelles erreurs de saisie des questionnaires.
Pour avoir un rapport préliminaire sur les observations, il faut sélectionner : Analyse
Æ rapports Æ récapitulatif des observations (il faut sélectionner les variables sur
lesquelles nous souhaitons des informations ; en général, il est souhaitable de sélectionner
l’ensemble des observations. Dans "statistiques" nous pouvons sélectionner la moyenne, la
médiane, la variance, l’écart type, la somme, les déciles…
Page 13/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Page 14/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Page 15/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Si nous désirons calculer certaines statistiques, nous cliquons sur statistiques et nous
sélectionnons les éléments désirés :
Pour une variable nominale : mode, distribution de fréquences, minimum, maximum …
Pour une variable ordinale : mode, distribution de fréquences, minimum, maximum,
médiane …
Pour une variable métrique : écart-type, moyenne, minimum, maximum …
Puis, après avoir cliquer sur poursuivre, nous faisons OK et nous aurons le résultat suivant :
Page 16/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Page 17/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Nous allons donc recoder cette variable. Deux possibilités s'offrent à nous. Soit nous
remplaçons les valeurs erronées au sein de la même variable, soit nous en créant une
nouvelle. Cette dernière solution est plus prudente. Pour ce faire nous devons
sélectionner Transformer Æ recoder Æ création des variables.
Page 18/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Enfin il faut aller dans l’onglet Affichage des variables de façon à taper les étiquettes
de valeur et à vérifier les caractéristiques de la variable ainsi créée.
Il est parfois nécessaire de faire des calculs sur des variables par exemple si nous
voulons faire un recodage d'une variable à partir d'une variable existante.
Nous pouvons souhaiter ne travailler que sur une partie du fichier (de l’échantillon).
Par exemple, nous voulons dissocier les analyses du sous-échantillon des hommes par
rapport à celui des femmes.
Dans ce cas, nous allons utiliser une condition logique du type "ne retenir que les
observations pour lesquelles la valeur de la variable la valeur sexe est égale à 1".
Page 20/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Page 21/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Page 22/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Page 23/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Ce test permet de vérifier si une relation entre deux variables (non métriques) existe
dans la population.
Le test permet donc d’accepter ou de rejeter l’hypothèse H0 "il n’y pas de relation
entre les deux variables dans la population dont est issu l’échantillon".
Page 24/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Plus le coefficient est proche de 1 en valeur absolue, plus les valeurs sont dites
corrélées : (le fichier utilisé est "voiture.sav" disponible dans SPSS)
si r est proche de +1, ceci signifie que les deux variables varient dans le même
sens (exemple : dépenses de loisirs et revenu)
si r est proche de -1, ceci signifie que les deux variables varient en sens inverse
l’une de l’autre (exemple : plus nous nous éloignons du centre de Paris, moins les
loyers sont élevés)
plus r est proche de 0, moins les variables sont corrélées. 0 signifie l’absence de
corrélation entre les deux variables
Dans la mesure où nous travaillons sur un échantillon (et non sur la population totale),
SPSS teste si le coefficient obtenu est significativement différent de 0 (autrement dit, si le
coefficient obtenu est différent de 0 dans la population). Il indique le risque d’erreur de
première espèce (sig.), à savoir, le risque de rejeter à tort l’hypothèse de non corrélation (ou
l’hypothèse H0 suivante : r=0). Si H0 est rejetée alors nous concluons que les variables sont
corrélées. SPSS permet de représenter sur un tableau croisé les mesures de corrélation deux
à deux d’un nombre illimité de variables.
Page 25/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Æ OK.
Nous aurons les résultats suivants qui peuvent être interprétés comme suit ;
Page 26/36
Applications informatiques en marketing M M E HAMROUNI W A F A
SPSS permet de calculer des estimations de ces coefficients pour l’échantillon. Par
ailleurs, la régression simple est un cas particulier de la régression multiple avec une seule
variable X au lieu de plusieurs variables Xi (régression multiple).
Il faut insister sur deux notions différent (un peu comme les corrélations) :
9 avoir des coefficients significatifs, c'est-à-dire qui ne sont pas dus au hasard (ceci
invite à rechercher le seuil de signification sig. pour chaque coefficient) ;
9 avoir une part de variance expliquée, ceci est lié à la distance entre les points et la
droite des moindres carrés
1. LA RÉGRESSION SIMPLE
La variable dépendante est "miles per gallonn" (Y) et la variable indépendante est
"cylindrée" (X). Cliquer ensuite sur OK.
Page 28/36
Applications informatiques en marketing M M E HAMROUNI W A F A
2. LA RÉGRESSION MILTIPLE
Page 30/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Page 31/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Page 32/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Page 33/36
Applications informatiques en marketing M M E HAMROUNI W A F A
Nous recherchons donc les corrélations qui existent entre les différentes variables,
pour rapprocher au sein des "composantes" les variables les plus proches entre elles. Nous
regroupons donc les variables pour qu’elles composent des dimensions dans le but de
réduire le nombre de caractéristiques décrivant les individus afin de mieux interpréter les
données ; les composantes sont en quelque sorte des "méta-variables".
En pratique, chaque dimension est définie par la meilleure combinaison linéaire des
variables expliquant la variance non expliquée par la dimension précédente.
PROCÉDURE SPSS
Page 35/36
Applications informatiques en marketing M M E HAMROUNI W A F A
4- La représentation graphique : elle peut être réalisée pour la matrice des composantes
et surtout des scores factoriels en créant un graphique de dispersion, et ce suivant les
étapes suivantes :
Sélectionner dans le menu graphes diagramme de dispersion, pour obtenir la
boite de dialogue sur la droite, cliquer sur définir ;
Faire glisser la variable REGR factor score 1 vers l’axe X et REGR factor 2
vers l’axe Y ; afin d’afficher sur le graphique les noms des régions, faire glisser
Région vers "étiqueter les observations par" ; ensuite cliquer sur options ;
Cliquer sur "afficher le diagramme avec les étiquettes" pour les faire
apparaître ;
Le graphique ainsi obtenu nécessite quelques modifications pour en améliorer
la lisibilité. Il faut double cliquer sur le graphique pour ouvrir la fenêtre d’édition
des graphiques (sélectionner ensuite la commande graphique Æ lignes de
références, cliquer sur Ok pour Echelle X, cliquer ensuite Ajouter et enfin Ok ;
répéter la même opération pour échelle Y.
Page 36/36