SPSS

MINISTRE DE L’ENSEIGNEMENT SUPÉRIEUR
INSTITUT SUPÉRIEUR DES ÉTUDES TECHNOLOGIQUES DE KSAR-HELLEL
DEPARTEMENT : TECHNIQUES DE COMMERCIALISATION
APPLICATIONS INFORMATIQUES EN MARKETING
TESCHNIQUES DE VENTE NIVEAU 3
ÉLABORÉ PAR : MME HAMROUNI WAFA

SOMMAIRE
INTRODUCTION 1
1. Importance de l’analyse des données 1
2. Quelques concepts de base en analyse des données 2
LES T.P
T.P N°0 - LA PRÉSENTATION GÉNÉRALE DU LOGICIEL SPSS 6
T.P N°1 - LA CRÉATION DE MASQUE DE SAISIE ET LA FUSION DES FICHIERS 8
T.P N°2 - LES RAPPORTS PRÉLIMINAIRES SUR LES OBSERVATIONS ET SUR LES
VARIABLES ET LES TRIS À PLAT 12
T.P N°3 - LE RECODAGE DES DONNÉES, LE CALCUL DES VARIABLES ET LA

SÉLECTION DES OBSERVATIONS 18
T.P N°4 - LES TRIS CROISÉS ET LES TESTS D’INDÉPENDANCE 22
T.P N°5 - LES CORRÉLATIONS 25
T.P N°6 - LES RÉGRESSIONS (SIMPLE ET MULTIPLE) 27
T.P N°7 - L’ACP (L’ANALYSE EN COMPOSANTES PRINCIPALES) 34

Applications informatiques en marketing M M E HAMROUNI W A F A
INTRODUCTION
1. IMPORTANCE DE L’ANALYSE DES DONNÉES
L’analyse des données est davantage un ensemble de techniques qu’un champ de

connaissance distinct en marketing ; les individus ou les étudiants doivent apprendre à
solutionner les problèmes au moyen des technologies de l’information, des calculs et de
l’analyse quantitative. Ils doivent développer une expérience pratique de manipulation des
outils et des logiciels spécialisés en analyse des données.
Tout l’aspect technique concernant la recherche (marketing par exemple) repose en

bonne partie sur la compréhension et l’interprétation des données : les résultats d’analyse
statistique éclairent la réflexion et aident les gestionnaires à appuyer leurs
recommandations.
Ce cours est donc destiné aux étudiants qui désirent mettre à jour leurs connaissances
de base en statistiques et s’initier à l’utilisation de SPSS pour l’analyse des données. Les
concepts de variabilité et de distribution d’une variable statistique, les techniques de mesure
de la tendance centrale et de la dispersion sont expliqués ; les relations entre les variables
sont aussi présentées.
Les notions de base vues dans ce cours aideront à :

9 développer un sens critique face aux résultats d’enquête ;
9 lire et interpréter les tableaux présentant des résultats d’analyse des données ;
9 faire des analyses statistiques de base avec SPSS.
Par ailleurs, les institutions, les services gouvernementaux et les établissements

d’enseignement ont de plus en plus besoin d’un accès continu à l’information commerciale
et à des données fiables sur le marché. Les sociétés doivent examiner l’ensemble des
Page 1/36
marchés, globaux et régionaux, pour repérer les occasions de diversification de produits et

de marchés et identifier les clients potentiels.
A cet égard, nous pouvons parler par exemple de Business mapping ou géomarketing
qui constitue un domaine qui aide à mieux appréhender et gérer les réalités et les
opportunités des marchés économiques en mettant en relation les données et leur
positionnement géographique. Cette approche propose d’analyser des territoires ou des
espaces économiques avec des outils d’analyse spatiale.
Le géomarketing est donc une branche du marketing qui consiste à modéliser et

analyser l’ensemble des facteurs de corrélation entre le lieu de vie et de travail du
consommateur ainsi que son mode de consommation. Le géomarketing favorise les critères
géographiques pour l’optimisation des actions commerciales en alliant analyses statistiques
et cartographie.
Le champ d’application du business mapping est très étendu, aussi bien par la diversité
des secteurs d’activité qui y ont recours que par la variété des problématiques abordées.
2. QUELQUES CONCEPTS DE BASE EN ANALYSE DE DONNÉES
Le passage à l’étape de l’analyse des données se fait évidemment après avoir posé la
problématique, l’objectif de la recherche, après la revue de la littérature, après avoir formulé
les hypothèses (et pour fixer les concepts, les variables, les mesures, identifier la source des
informations, choisir la méthode de collecte d’information…).
Cette place assez retardée dans le processus de la recherche ne signifie pas que nous
n’y songeons qu’à la fin, le chercheur gagne beaucoup de temps en fixant toute sa
méthodologie avant de se lancer effectivement dans la recherche et dans les enquêtes
(surtout la fixation des méthodes de traitement des informations qui est une étape cruciale
de la méthodologie).
Le choix de l’analyse des données permettra au chercheur d’abord de répondre à son

objectif de recherche et de vérifier ses hypothèses en traduisant les informations collectées
de leur état brut et superficiel à un état plus utile, plus pertinent et plus précis. L’application
Page 2/36
de la méthode d’analyse consiste à choisir une méthode statistique, simple ou complexe,

pour convertir les informations collectées à un état plus précis. Le choix des méthodes
dépend des objectifs poursuivis, des hypothèses à vérifier et de la nature des variables
utilisées.
9 Les objectifs
A partir de la problématique de recherche, nous fournissons un ou plusieurs objectifs
de recherche qui traduisent la mission du chercheur c'est-à-dire l’action qu’il est censé
mener pour apporter les éléments de réponse à la problématique.
Qui dit action ou mission dit forcément la présence d’un verbe dans la formulation ;
par exemple, à la problématique suivante traduite sous forme de questions : existe-t-il des
groupes homogènes d’une population donnée par rapport à un comportement d’achat ? Quel
est le profil des groupes dominants ? La formulation des objectifs peut se faire comme suit :
vérifier l’existence de segments au sein de cette population ;
identifier une ou plusieurs caractéristiques pertinentes des groupes retenus.
Ces deux objectifs ont un caractère descriptif, la méthode d’analyse à utiliser est donc
de même nature, à savoir la méthode descriptive ; dans ces objectifs il n’y pas de
phénomènes à expliquer.
Par contre, d’autres recherches peuvent être explicatives :

par exemple, si nous supposons qu’une chaîne de magasins constate
l’irrégularité de fréquentation de ses points de vente, cette irrégularité dénote un
comportement d’infidélité ou un transfert d’enseigne
la problématique est ainsi la suivante : quels sont les raisons qui expliquent ce
transfert d’enseignes ?
l’objectif à atteindre est le suivant : expliquer le transfert d’enseignes par des
facteurs propres aux consommateurs ou par des facteurs liés à l’enseigne.
9 Les hypothèses :
L’objectif étant complexe, le passage par des hypothèses est la meilleure voie pour le
simplifier. Une hypothèse est composée généralement de 3 éléments : 2 variables et une
relation.
Page 3/36
Exemple : Selon Pearson : Job autonomy positivly affects learning effort.
9 Les variables et le choix des méthodes :

Plusieurs éléments interviennent pour choisir la méthode d’analyse, notamment la
nature de la variable, son échelle de mesure et aussi le nombre de variables.
Par rapport au nombre de variables présentes dans un objectif ou dans une hypothèse,
le choix de la méthode peut être dans le cadre univarié (une seule variable), bivarié (deux
variables) ou multivarié (trois variables et plus).
Nous pouvons classer les variables en plusieurs catégories : les variables à expliquer
qui concernent le ou les phénomènes à étudier et à expliquer par des facteurs appelés
variables explicatives.
Les variables endogènes apparaissent comme une variable dépendante dans au moins
une relation. Par contre, une variable est dite exogène quand elle n’apparaît jamais comme
une variable dépendante.
Une variable est dite observable ou manifeste quand elle est directement observable et
mesurable (par exemple le temps passé dans un point de vente). Une variable est dite latente
(par exemple job autonomy) quand elle n’est pas directement mesurable et pour laquelle
nous avons besoin d’un ensemble d’indicateurs ou de propositions ou d’items qui sont
observables.
Page 4/36
LES TRAVAUX
PRATIQUES
Page 5/36
T.P N°0 - PRÉSENTATION GÉNÉRALE DU LOGICIEL SPSS
Le logiciel SPSS (Statistical Package for Social Sciences) sous Windows est un outil
d'analyse statistique particulièrement conçu pour les étudiants en méthodologie d’enquêtes
ou ceux des disciplines reliées aux sciences humaines, ainsi que toute personne travaillant
en tant que : analyste de marché, économiste et professionnel du domaine social. Il permet
principalement de réaliser la codification, la saisie, la manipulation et l'utilisation des
données à l'aide des fonctions informatiques et statistiques de base disponibles dans ce
programme.
Son utilisation exige une certaine familiarité avec l'environnement Windows et la

connaissance de logiciels tels que Word, Excel etc. Le logiciel SPSS a un fonctionnement
quelque peu différent d’Excel.
1. MENU DE LA FEUILLE DE DONNÉES
9 Fichier : permet d’ouvrir des fichiers de données existants en format SPSS ; d’ouvrir
une feuille de données vierge ; d’importer des données en format texte, Excel, Access
notamment ; permet de sauvegarder les fichiers créés ou modifiés ; permet d’obtenir
des informations sur des données, d’appliquer les paramètres d’un fichier externe au
fichier actif (Apply Data Directory) ; permet de quitter l’application.
9 Édition : copier – coller – couper – effacer les données d’une colonne et d’autres
options.
9 Affichage : permet de déterminer l’affichage des données.
9 Données : édition des données, permet notamment d’insérer des lignes ou des
colonnes, de créer des gabarits pour le format des variables, de transposer les lignes
en colonnes et inversement, d’agréger des données, de diviser un échantillon en
plusieurs groupes, de sélectionner des objets dans l’échantillon.
9 Transformer : permet de transformer les scores des variables, ceci par différentes
formules, permet de compter des valeurs, de re-coder des variables (changer de
Page 6/36
niveau de mesure), d’attribuer le rang de chaque score, de créer des séries de

nombres, de remplacer les valeurs manquantes.
9 Analyse : dans ce menu vous trouvez tous les outils d’analyse statistique que ce
logiciel propose ; description, analyse de dépendance et inférence.
9 Graphes : les fonctions réunies sous ce menu permettent de créer les graphiques issus
de l’analyse statistique ; différents types de graphiques sont proposés : ligne – barres
– points – en secteurs – histogrammes – etc.
9 Outils : permet d’obtenir des informations sur les données, les fichiers, de créer et
d’utiliser des groupes de variables (afin d’éviter de manipuler à chaque fois
l’ensemble des données), d’exécuter des scripts, de personnaliser le menu de SPSS.
9 Fenêtre : permet de minimiser la taille de la fenêtre et d’activer celles disponibles.
9 Aide : procure l’aide en ligne, ainsi que différentes sources d’information relatives à
SPSS.
2. MENU DE LA FEUILLE DES RÉSULTATS (OUTPUTS)
9 Fichier : mêmes fonctions que celles de la feuille des données, avec quelques
spécificités.
9 Édition : idem que la feuille des données, avec en plus le choix pour l’éditeur de texte
ou de graphique (selon l’élément sélectionné sur la feuille des résultats).
9 Affichage : mêmes finalités que celles de la feuille des données.
9 Insérer : permet l’insertion de nouveaux graphiques, de titres, d’objets créés à partir
d’autres logiciels dans le but de compléter les résultats obtenus.
9 Format : permet d’aligner les éléments de la feuille, de modifier la fonte du texte,
ainsi que la mise en page des résultats.
9 Analyse : idem que pour la feuille des données ; ainsi il n’est pas nécessaire de
revenir à la feuille des données pour compléter une analyse ou en commencer une
nouvelle.
9 Graphes : idem que pour la feuille des données.
9 Outils : idem que pour la feuille des données.
9 Fenêtre : idem que pour la feuille des données.
9 Aide : idem que pour la feuille des données.
Page 7/36
T.P N°1 - CRÉATION DE MASQUE DE SAISIE ET FUSION DES FICHIERS
1. CRÉATION DE MASQUE DE SAISIE
Pour créer un masque de saisie, il faut suivre les opérations suivantes :
n donner un nom à la variable : 8 caractères maximum, sans accent ni "-", seul les "_"
sont acceptés.
o définir le type de la variable - en général, nous pouvons laisser ce qui est sélectionné
par défaut,
sauf si nous avons une question ouverte dont les réponses ne sont pas précodées.
Dans ce cas de figure, nous cocherons "Chaîne de caractères" et nous augmenterons
la "largeur" (par exemple en mettant 50, de façon à pouvoir saisir quelques mots).
p Nous pouvons laisser la largeur 8 par défaut (exception, cf. supra)
q Définir le nombre de décimales possibles.
r L’étiquette permet de taper un texte plus explicite que les 8 caractères du nom de la
variable
Il est recommandé de rentrer le libellé de la question correspondant à la variable codée,

afin de pouvoir s’y retrouver facilement, par exemple : la satisfaction par rapport au
choix des produits.
Page 8/36
s les étiquettes de valeur permettent de rendre les tableaux de résultats plus lisibles et
plus explicites
t les valeurs manquantes permettent de traiter le cas où un répondant n’a pas répondu
à une question ; par convention, nous utilisons la valeur 9 pour définir les valeurs
manquantes ; lorsque 9 appartient à l’espace des réponses possibles nous retiendrons
la valeur 99 (ou 999…).
Par défaut, SPSS ne définit

aucune valeur manquante.
Conseil : toujours utiliser le
même type de valeur manquante
de façon à simplifier la saisie du
questionnaire.
Si les questionnaires présentent la modalité « ne sais pas » ou « pas concerné », cette

modalité est traitée de façon similaire à une valeur manquante en adoptant le même
principe mais avec des 8.
u La largeur d’affichage de la colonne. Permet d’élargir une colonne de données de façon à

voir l’ensemble des données saisies.
Cette fonction est utile lorsque les valeurs numériques entrées sont très grandes lorsque nous
faisons entrer des données de nature qualitative (chaîne de caractères).
v Aligner à droite, au centre ou à gauche les valeurs dans le fichier de données.

w la mesure permet de sélectionner le type de mesure correspondant à la nature de la
variable :
Échelle ; nous choisirons Échelle lorsque les données sont de nature métrique, ratio
ou intervalle (c'est-à-dire la plupart des outils de mesures psychométriques : échelle
d’attitude, d’intention d’achat, d’implication, etc. …).
Page 9/36
Ordinale ; nous choisirons Ordinale lorsque les données sont rangées par ordre sans
que l’intervalle entre chaque niveau de la variable soit constant. C'est très souvent le
cas d’échelle à 3 points. La décision entre Échelle ou Ordinale dépend grandement
du choix de données qui seront ultérieurement effectuées.
Nominale ; nous choisirons Nominale lorsque les données permettent des
classification sans relation d’ordre. Par exemple, le sexe (Homme, Femme), le lieu
d’habitat (Tunis, Sousse, Sfax, etc.). Les modalités peuvent être binaires ou
multiples.
2. LA FUSION DES FICHIERS
Il existe deux sortes de fusion de fichiers :

ajouter des observations, par exemple lorsque deux personnes ont saisi chacune une
partie des données d’une même enquête ;
ajouter des variables, par exemple lorsqu’une enquête est réalisée en plusieurs fois
auprès des mêmes individus.
Pour ajouter des observations, il faut sélectionner : Données Æ fusionner des

fichiersÆajouter des observations
Page 10/36
Pour ajouter des variables, il faut sélectionner : Données Æ fusionner des fichiers Æ
ajouter des variables
Page 11/36
T.P N°2 - LES RAPPORTS PRÉLIMINAIRES SUR LES OBSERVATIONS ET

SUR LES VARIABLES ET LES TRIS À PLAT
1. RAPPORT PRÉLIMINAIRE SUR LES VARIABLES
Lorsque vous avez vous-même saisi le fichier, cette fonction vous permet de vérifier
votre travail et d’obtenir une synthèse facile à lire.
Lorsque vous travaillez sur un fichier qui vous a été donné, cette fonction vous permet
de vous familiariser avec des variables et de voir comment le fichier a été constitué.
Pour avoir un rapport préliminaire sur les variables, il faut sélectionner : Outils Æ
informations sur le fichier (nous obtenons le File information).
Page 12/36
2. RAPPORT PRÉLIMINAIRE SUR LES OBSERVATIONS
Cette fonction permet de repérer les éventuelles erreurs de saisie des questionnaires.
Pour avoir un rapport préliminaire sur les observations, il faut sélectionner : Analyse
Æ rapports Æ récapitulatif des observations (il faut sélectionner les variables sur
lesquelles nous souhaitons des informations ; en général, il est souhaitable de sélectionner
l’ensemble des observations. Dans "statistiques" nous pouvons sélectionner la moyenne, la
médiane, la variance, l’écart type, la somme, les déciles…
Page 13/36
RÉSULTATS & INTERPRÉTATION
Page 14/36
3. LES ANALYSES UNIVARIÉES ET LES TRIS À PLAT
L’analyse univariée permet de décrire et de synthétiser les résultats de l’étude en

analysant les variables une par une.
Pour ce faire, il faut sélectionner : Analyse Æ statistiques descriptives Æ

fréquences ; puis nous sélectionnons les variables pour lesquelles nous souhaitons connaître
les fréquences et les fait passer dans le cadre "variable(s)" en cliquant sur la flèche.
Pour avoir la distribution des fréquences, nous cliquons sur OK.
Page 15/36
Si nous désirons calculer certaines statistiques, nous cliquons sur statistiques et nous
sélectionnons les éléments désirés :
Pour une variable nominale : mode, distribution de fréquences, minimum, maximum …
Pour une variable ordinale : mode, distribution de fréquences, minimum, maximum,
médiane …
Pour une variable métrique : écart-type, moyenne, minimum, maximum …
Puis, après avoir cliquer sur poursuivre, nous faisons OK et nous aurons le résultat suivant :
Page 16/36
Page 17/36
T.P N° 3 : LE RECODAGE DES DONNÉES, LE CALCUL DES VARIABLES ET

LA SÉLECTION DES OBSERVATIONS
1. LE RECODAGE DES DONNÉES
Il est parfois nécessaire de recoder les variables pour de nombreuses raisons :

9 Le codage initial n’est pas satisfaisant : par exemple, dans le fichier ‘‘voitures’’
(fourni avec SPSS), il existe une variable qui indique le nombre de cylindres des
véhicules.
Nous allons donc recoder cette variable. Deux possibilités s'offrent à nous. Soit nous
remplaçons les valeurs erronées au sein de la même variable, soit nous en créant une
nouvelle. Cette dernière solution est plus prudente. Pour ce faire nous devons
sélectionner Transformer Æ recoder Æ création des variables.
Page 18/36
Le recodage s'effectue comme suit :
Enfin il faut aller dans l’onglet Affichage des variables de façon à taper les étiquettes
de valeur et à vérifier les caractéristiques de la variable ainsi créée.
Et nous obtiendrons ainsi une nouvelle variable convenablement codée.
9 Le codage initial ne facilite pas l’interprétation : le codage peut être contre-

intuitif (par exemple la valeur 7 pour la réponse pas du tout d’accord et la valeur 1
pour tout à fait d’accord), le recodage de la variable est fait selon la même procédure
citée ci-dessus.
Page 19/36
2. LE CALCUL DES VARIABLES
Il est parfois nécessaire de faire des calculs sur des variables par exemple si nous
voulons faire un recodage d'une variable à partir d'une variable existante.
A titre d’exemple, si nous avons une note de 1 à 5 et souhaitons la ramener sur 20 de

façon à faire référence à un système de notation auquel nous sommes habitués ; dans ce cas,
il faut multiplier les valeurs initiales par 4.
Pour ce faire, il faut sélectionner : Transformer Æ Calculer
3. LA SÉLECTION DES OBSERVATIONS
Nous pouvons souhaiter ne travailler que sur une partie du fichier (de l’échantillon).
Par exemple, nous voulons dissocier les analyses du sous-échantillon des hommes par
rapport à celui des femmes.
Dans ce cas, nous allons utiliser une condition logique du type "ne retenir que les
observations pour lesquelles la valeur de la variable la valeur sexe est égale à 1".
Page 20/36
Pour cela, il faut sélectionner : Données Æ sélectionner des observations, cocher

selon une condition logique et cliquer sur Si. Ensuite sélectionner la variable filtre et
indiquer la valeur que nous souhaitons retenir, puis poursuivre et finalement Ok.
Lorsque nous souhaitons de nouveau travailler sur l’ensemble du fichier, il faut de

nouveau sélectionner : Données Æ sélectionner des observations puis cocher toutes les
observations.
Page 21/36
T.P N° 4 - LES TRIS CROISÉS ET LES TESTS D’INDÉPENDANCE DU Χ 2
Il est nécessaire de recourir au test d’indépendance du Χ 2 lorsque l’analyse porte sur

une relation bivariée comprenant deux variables non métriques (nominales ou/et ordinales).
L’analyse de deux variables non métriques s’effectue à l’aide de fréquences conjointes
(tableau de contingence).
Le tableau croisé contient les fréquences correspondant au croisement des
caractéristiques qui définissent les deux variables.
Pour obtenir un tableau croisé et faire le test d’indépendance du Χ 2 , il faut

sélectionner : Analyse Æ statistiques descriptives Æ Tableaux croisés (il faut
sélectionner les deux variables à croiser puis cliquer sur cellules pour obtenir la boite de
dialogue : cocher ligne, colonne et total dans les pourcentages puis poursuivre ; dans
statistiques il faut sélectionner Khi-deux puis poursuivre).
Page 22/36
1. LE RÉSULTAT ET LA LECTURE D’UN TABLEAU CROISÉ
Page 23/36
2. L’INTERPRÉTATION DES RÉSULTATS DU TEST DU Χ 2
Ce test permet de vérifier si une relation entre deux variables (non métriques) existe
dans la population.
Le test permet donc d’accepter ou de rejeter l’hypothèse H0 "il n’y pas de relation
entre les deux variables dans la population dont est issu l’échantillon".
Dans la lecture du tableau Khi-deux, il est préférable de se référer au seuil de

signification statistique qui est toujours le même (0,05) plutôt qu'à la valeur du Χ 2 qui
varie selon le nombre de degrés de liberté.
Page 24/36
T.P N° 5 - LES CORRÉLATIONS
Un coefficient de corrélation r est une mesure d’interdépendance ou d’association

entre deux variables métriques. Elle mesure l’intensité de la co-variation entre les deux
variables. Cette mesure est standardisée (elle ne dépend pas de l’unité utilisée pour chaque
variable) et est compris entre deux valeurs extrêmes -1 et 1.
Plus le coefficient est proche de 1 en valeur absolue, plus les valeurs sont dites
corrélées : (le fichier utilisé est "voiture.sav" disponible dans SPSS)
si r est proche de +1, ceci signifie que les deux variables varient dans le même
sens (exemple : dépenses de loisirs et revenu)
si r est proche de -1, ceci signifie que les deux variables varient en sens inverse
l’une de l’autre (exemple : plus nous nous éloignons du centre de Paris, moins les
loyers sont élevés)
plus r est proche de 0, moins les variables sont corrélées. 0 signifie l’absence de
corrélation entre les deux variables
Dans la mesure où nous travaillons sur un échantillon (et non sur la population totale),
SPSS teste si le coefficient obtenu est significativement différent de 0 (autrement dit, si le
coefficient obtenu est différent de 0 dans la population). Il indique le risque d’erreur de
première espèce (sig.), à savoir, le risque de rejeter à tort l’hypothèse de non corrélation (ou
l’hypothèse H0 suivante : r=0). Si H0 est rejetée alors nous concluons que les variables sont
corrélées. SPSS permet de représenter sur un tableau croisé les mesures de corrélation deux
à deux d’un nombre illimité de variables.
Page 25/36
La procédure SPSS est la suivante : Analyse Æ corrélation Æ bivariée
Æ OK.
Nous aurons les résultats suivants qui peuvent être interprétés comme suit ;
Page 26/36
T.P N° 6 -LES RÉGRESSIONS (SIMPLE ET MULTIPLE)
L’ajustement linéaire ou la régression consiste à rechercher la "droite des moindres

carrés" de type Y = α1X1 + … + αiXi + β, qui passe "le plus prés possible" de toutes les
observations dans la population, avec :
Y : la variable dépendante ou la variable à expliquer
Xi : la ou les variables indépendantes ou explicatives
β : la constante
αi : les coefficients de la droite de régression
SPSS permet de calculer des estimations de ces coefficients pour l’échantillon. Par
ailleurs, la régression simple est un cas particulier de la régression multiple avec une seule
variable X au lieu de plusieurs variables Xi (régression multiple).
L’examen doit porter sur deux points :

9 d’une part que la relation testée est significative (c'est-à-dire que les coefficients
de la droite sont significativement différents de 0) ;
9 d’autre part que la droite de régression Y = α1X1+ …+ αiXi+ β ‘‘résume’’ bien
l’ensemble des observations, c'est-à-dire que la part de variance à expliquer Y résumé
dans la droite est élevée ; autrement dit, nous vérifions que les observations sont
"proches" de la droite des moindres carrés.
Il faut insister sur deux notions différent (un peu comme les corrélations) :
9 avoir des coefficients significatifs, c'est-à-dire qui ne sont pas dus au hasard (ceci
invite à rechercher le seuil de signification sig. pour chaque coefficient) ;
9 avoir une part de variance expliquée, ceci est lié à la distance entre les points et la
droite des moindres carrés
L’intérêt de la méthode par rapport à une matrice de corrélation (test de corrélation)

concerne le fait qu’il ne s’agit non seulement d’un test de l’existence d’une relation mais
nous testons la nature précise de cette relation.
Page 27/36
Si la relation trouvée est significative et que le pourcentage de la variance expliquée

est élevé, il devient possible de faire des estimations de la variable expliquée à partir des
variables explicatives. Enfin, le dernier avantage par rapport à un simple test de corrélation
c’est qu’il est possible de faire rentrer plus que deux variables dans cette procédure, alors
que nous ne pouvons calculer de coefficients de corrélation que pour des couples de
variables.
1. LA RÉGRESSION SIMPLE
1.1. PROCÉDURE SPSS POUR UNE RÉGRESSION SIMPLE
Sélectionner : Analyse Æ Régression Æ linéaire
La variable dépendante est "miles per gallonn" (Y) et la variable indépendante est
"cylindrée" (X). Cliquer ensuite sur OK.
1.2. RÉSULTATS & INTERPRÉTATION
Page 28/36
2. LA RÉGRESSION MILTIPLE
Contrairement à la régression simple, il y a plus qu’une variable explicative, afin de

capter un pourcentage plus élevé de la variance de la variable expliquée. L’enjeu est, parmi
toutes les variables envisagées, de ne sélectionner que celles qui contribuent de façon
importante à la variance de la variable expliquée en évitant de multiplier les problèmes de
colinéarité (variables explicatives corrélées entre elles). A la demande, SPSS teste
automatiquement plusieurs modèles de régression, en procédant par itérations :
9 soit selon une procédure ascendante (recherche de la variable explicative avec la
corrélation partielle la plus forte puis de la seconde la plus forte…)
Page 29/36
9 soit selon une procédure descendante (introduction de l’ensemble des variables

explicatives, puis élimination de la corrélation la plus faible puis de la seconde la plus
faible…)
9 soit selon une procédure pas à pas (combinaison des deux méthodes précédentes)
Nous recommandons souvent la procédure ascendante (la plus économique en nombre

d’itérations) et qui minimise les risques de colinéarité.
2.1. PROCÉDURE SPSS POUR UNE RÉGRESSION MULTIPLE
Sélectionner : Analyse Æ Régression Æ linéaire
Puis cliquer sur OK.
Page 30/36
2.2. RÉSULTATS & INTERPRÉTATION
Page 31/36
Page 32/36
Page 33/36
TP N° 7 : L’ACP (L’ANALYSE EN COMPOSANTES PRINCIPALES)
L’analyse en composantes principales est une méthode d’analyse des données

multivariées ; elle permet de décrire et d’explorer les relations qui existent entre plusieurs
variables simultanément à la différence des méthodes bivariées qui étudient les relations
supposées entre deux variables.
La procédure s’appuie sur un tableau caractéristique (c'est-à-dire variables) croisé à

des individus. Nous cherchons un nombre plus réduit de variables pour décrire efficacement
les phénomènes structurant d’un groupe de données.
Nous recherchons donc les corrélations qui existent entre les différentes variables,
pour rapprocher au sein des "composantes" les variables les plus proches entre elles. Nous
regroupons donc les variables pour qu’elles composent des dimensions dans le but de
réduire le nombre de caractéristiques décrivant les individus afin de mieux interpréter les
données ; les composantes sont en quelque sorte des "méta-variables".
En pratique, chaque dimension est définie par la meilleure combinaison linéaire des
variables expliquant la variance non expliquée par la dimension précédente.
PROCÉDURE SPSS
Pour réaliser l’ACP, il faut sélectionner : Analyse Æ factorisation Æ analyse

factorielle (nous employons le terme de factorise car il s’agit bien de réduire en une
combinaison linéaire plusieurs variables ensemble) ; ces étapes consistent en :
9 la boite dialogue permet de sélectionner les variables à factoriser (nous pouvons
sélectionner toutes les variables et cliquer sur la flèche vers la droite) ;
9 ensuite il faut sélectionner le type de méthode de facturation ; par défaut,
conserver : analyse en composantes principales ;
9 la boite options permet de sélectionner des options de présentation pour classer les
variables les plus importantes et cacher celles qui n’expliquent pas les dimensions ;
Page 34/36
9 nous pouvons sélectionner dans facteur l’affichage des scores factoriels.
La procédure SPSS propose trois tableaux et un graphique à analyser :

1- La variance expliquée : Ce tableau présente les dimensions qui permettent de résumer
l’information. Par exemple, si la première dimension extraite permet d’expliquer 45%
de la variance du phénomène, cela veut dire que les variables qui composent la
première dimension synthétise 45% du phénomène. La variance cumulée permet
d’évaluer si la réduction des différentes variables à quelques composantes permet de
conserver l’essentiel du phénomène mesuré par les variables de départ.
2- La qualité de représentation : Elle permet de répondre à la question suivante : dans
quelle mesure mes variables de départ sont elles prises en compte par les variables ou
les composantes extraites ? Ainsi, si la qualité de représentation d’une variable X est
de 0.930 cela veut dire que 93% de la variance de la variable est prise en compte par
l’une des dimensions extraites. Par contre, si la qualité de représentation d’une variable
Y est de 0.510 cela veut dire que 51% seulement de la variance de la variable est prise
en compte par l’une des dimensions extraites ce qui signifie que cette variable sera mal
représentée par les composantes retenues.
3- La matrice des composantes : nous pouvons trouver plusieurs manières d’étudier les
coefficients qui sont présentés dans la matrice des composantes. D’une part, les
colonnes correspondent à chacune des dimensions extraites, elles contiennent des
coefficients de saturation qui s’interprètent comme des coefficients de corrélation (si
ce coefficient est élevé, nous pouvons dire que la dimension et la variable en question
suivent la même pente). D’autre part, tous les coefficients forment des coefficients a,
b, c… d’une droite de régression qui est la composition linéaire de la composante. Par
exemple, si nous prenons une composante 1, elle peut être définie par l’équation
suivante : a* X + b*Y + c*Z…Enfin, la matrice des composantes nous permet de
nommer les dimensions extraites en étudiant les coefficients de saturation de chacune
des variables par rapport aux dimensions ; par exemple nous pouvons nommer une
composante « potentiel de développement » car les variables fortement corrélées avec
elle sont des indicateurs du niveau de développement…
Page 35/36
4- La représentation graphique : elle peut être réalisée pour la matrice des composantes
et surtout des scores factoriels en créant un graphique de dispersion, et ce suivant les
étapes suivantes :
Sélectionner dans le menu graphes diagramme de dispersion, pour obtenir la
boite de dialogue sur la droite, cliquer sur définir ;
Faire glisser la variable REGR factor score 1 vers l’axe X et REGR factor 2
vers l’axe Y ; afin d’afficher sur le graphique les noms des régions, faire glisser
Région vers "étiqueter les observations par" ; ensuite cliquer sur options ;
Cliquer sur "afficher le diagramme avec les étiquettes" pour les faire
apparaître ;
Le graphique ainsi obtenu nécessite quelques modifications pour en améliorer
la lisibilité. Il faut double cliquer sur le graphique pour ouvrir la fenêtre d’édition
des graphiques (sélectionner ensuite la commande graphique Æ lignes de
références, cliquer sur Ok pour Echelle X, cliquer ensuite Ajouter et enfin Ok ;
répéter la même opération pour échelle Y.
Page 36/36

SPSS

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

SPSS

Uploaded by

Copyright:

Available Formats

MINISTRE DE L’ENSEIGNEMENT SUPÉRIEUR

INSTITUT SUPÉRIEUR DES ÉTUDES TECHNOLOGIQUES DE KSAR-HELLEL

DEPARTEMENT : TECHNIQUES DE COMMERCIALISATION

APPLICATIONS INFORMATIQUES EN MARKETING

TESCHNIQUES DE VENTE NIVEAU 3

ÉLABORÉ PAR : MME HAMROUNI WAFA

1. Importance de l’analyse des données 1

2. Quelques concepts de base en analyse des données 2

T.P N°0 - LA PRÉSENTATION GÉNÉRALE DU LOGICIEL SPSS 6

T.P N°1 - LA CRÉATION DE MASQUE DE SAISIE ET LA FUSION DES FICHIERS 8

T.P N°3 - LE RECODAGE DES DONNÉES, LE CALCUL DES VARIABLES ET LA

T.P N°4 - LES TRIS CROISÉS ET LES TESTS D’INDÉPENDANCE 22

T.P N°5 - LES CORRÉLATIONS 25

T.P N°6 - LES RÉGRESSIONS (SIMPLE ET MULTIPLE) 27

T.P N°7 - L’ACP (L’ANALYSE EN COMPOSANTES PRINCIPALES) 34

1. IMPORTANCE DE L’ANALYSE DES DONNÉES

L’analyse des données est davantage un ensemble de techniques qu’un champ de

Tout l’aspect technique concernant la recherche (marketing par exemple) repose en

Les notions de base vues dans ce cours aideront à :

Par ailleurs, les institutions, les services gouvernementaux et les établissements

marchés, globaux et régionaux, pour repérer les occasions de diversification de produits et

Le géomarketing est donc une branche du marketing qui consiste à modéliser et

2. QUELQUES CONCEPTS DE BASE EN ANALYSE DE DONNÉES

Le choix de l’analyse des données permettra au chercheur d’abord de répondre à son

de la méthode d’analyse consiste à choisir une méthode statistique, simple ou complexe,

Par contre, d’autres recherches peuvent être explicatives :

Exemple : Selon Pearson : Job autonomy positivly affects learning effort.

9 Les variables et le choix des méthodes :

T.P N°0 - PRÉSENTATION GÉNÉRALE DU LOGICIEL SPSS

Son utilisation exige une certaine familiarité avec l'environnement Windows et la

1. MENU DE LA FEUILLE DE DONNÉES

niveau de mesure), d’attribuer le rang de chaque score, de créer des séries de

2. MENU DE LA FEUILLE DES RÉSULTATS (OUTPUTS)

T.P N°1 - CRÉATION DE MASQUE DE SAISIE ET FUSION DES FICHIERS

1. CRÉATION DE MASQUE DE SAISIE

Pour créer un masque de saisie, il faut suivre les opérations suivantes :

Il est recommandé de rentrer le libellé de la question correspondant à la variable codée,

Par défaut, SPSS ne définit

Si les questionnaires présentent la modalité « ne sais pas » ou « pas concerné », cette

u La largeur d’affichage de la colonne. Permet d’élargir une colonne de données de façon à

v Aligner à droite, au centre ou à gauche les valeurs dans le fichier de données.

2. LA FUSION DES FICHIERS

Il existe deux sortes de fusion de fichiers :

Pour ajouter des observations, il faut sélectionner : Données Æ fusionner des

T.P N°2 - LES RAPPORTS PRÉLIMINAIRES SUR LES OBSERVATIONS ET

1. RAPPORT PRÉLIMINAIRE SUR LES VARIABLES

2. RAPPORT PRÉLIMINAIRE SUR LES OBSERVATIONS

RÉSULTATS & INTERPRÉTATION

3. LES ANALYSES UNIVARIÉES ET LES TRIS À PLAT

L’analyse univariée permet de décrire et de synthétiser les résultats de l’étude en

Pour ce faire, il faut sélectionner : Analyse Æ statistiques descriptives Æ

Pour avoir la distribution des fréquences, nous cliquons sur OK.

T.P N° 3 : LE RECODAGE DES DONNÉES, LE CALCUL DES VARIABLES ET

1. LE RECODAGE DES DONNÉES

Il est parfois nécessaire de recoder les variables pour de nombreuses raisons :

Le recodage s'effectue comme suit :

Et nous obtiendrons ainsi une nouvelle variable convenablement codée.

9 Le codage initial ne facilite pas l’interprétation : le codage peut être contre-

2. LE CALCUL DES VARIABLES

A titre d’exemple, si nous avons une note de 1 à 5 et souhaitons la ramener sur 20 de

Pour ce faire, il faut sélectionner : Transformer Æ Calculer

3. LA SÉLECTION DES OBSERVATIONS

Pour cela, il faut sélectionner : Données Æ sélectionner des observations, cocher

Lorsque nous souhaitons de nouveau travailler sur l’ensemble du fichier, il faut de