You are on page 1of 8

PSY 1004

Techniques danalyses en psychologie

Annexe 7 : Utilisation avance de SPSS


La faon la plus performante d'utiliser SPSS est de lui communiquer les commandes
sous formes de syntaxe. De cette faon: (i) on peut utiliser toutes les possibilits de SPSS, (ii)
avec seulement quelques lignes de texte, au lieu d'une centaine de clic de souris, et (iii)
enregistrer les commandes pour les rutiliser plus tard sur des donnes similaires.
Les commandes de SPSS se regroupent en cinq catgories: 1) les commandes de
manipulation de fichiers, 2) les commandes de formatage, 3) les commandes de manipulation
de donnes, 4) la commande pour faire des graphiques, et 5) les commandes d'analyses
statistiques proprement dites. Nous examinons quelques commandes dans chacune de ces
cinq catgories.
1.

Manipulation de fichiers

Souvent, les outils de mesures en psychologie produisent des fichiers de rsultats (EPrime, Instep, etc.). Pour viter les erreurs de transcription, il est toujours prfrable d'ouvrir
ce fichier directement avec SPSS. Ce fichier doit tre en format texte, c'est dire qu'il doit
pouvoir tre lu par n'importe quel diteur de texte (tel Bloc-note). Les commandes qui suivent
permettent d'importer des fichiers de donnes pr existant dans SPSS, o encore (dans le cas
de la commande Aggregate) de produire un nouveau fichier contenant des donnes rsumes.
a.
Data List
Data List permet d'ouvrir un fichier de donnes qui a t cr par une autre application.
Les options de cette commande sont les suivantes:
o Data list file="localisation\nom.ext" list
o

/nomcol1 nomcol2 nomcol3 {}.

dans laquelle localisation\nom.ext est le nom complet du fichier. Les nomcolX sont les noms qui
vont identifier les diffrentes colonnes de votre fichier de donnes. Il peut y avoir autant de
colonnes que dsires. Cependant, chaque nom de colonne ne peut avoir plus que 8
caractres, sans espaces ni caractres spciaux (voir Section 3, la commande variable labels).
Si le fichier n'est pas organis en colonnes (il y a des changements de lignes des
endroits variables), on peut remplacer l'option list par l'option free. Ce n'est cependant pas
recommand, car on ne peut pas savoir s'il manque des donnes.
Si les donnes utilisent plus d'une ligne, il est possible d'utiliser cette syntaxe:
o Data list file="localisation\nom.ext" list records=x
o

/1 nomcol nomcol nomcol {}

/2 nomcol nomcol nomcol {}.

Utilisation avance de SPSS

PSY 1004

Techniques danalyses en psychologie

o x indique combien de lignes sont utilises dans le fichier texte pour coder une observation.
Pour chaque ligne, il faut donner le nom l'information qu'elle contient. Si par exemple, x
vaut 5, il faut cinq lignes (/1 /2 /3 /4 /5 ).
Si une des colonnes contient des caractres plutt qu'un nombre, vous devez le
spcifiez SPSS en ajoutant la suite de nomcol la mention (Ax) avec les parenthses, o x est
le nombre de caractres maximum contenu dans cette colonne.
b.
Save
La commande Save permet d'enregistrer les donnes actuellement dans SPSS dans un
format propre SPSS. Ce format ne peut plus par la suite tre lu par d'autres logiciels (tel
Bloc-notes). Pour cette raison, on utilise rarement cette commande. Cependant, si vous devez
jumeler ou concatner plusieurs fichiers (voir les deux commandes qui suivent), il faut au
pralable transformer chaque fichier en format SPSS avec la commande Save. La syntaxe est
trs simple:
o Save outfile="localisation\nom.sav".
Si localisation\ n'est pas prsent, le fichier sera enregistr l o se trouve le programme SPSS.
De plus, la convention veut que l'on rajoute l'extension .sav la fin des noms de fichier de
format SPSS.
c.
Add files
La commande Add files permet de concatner plusieurs fichiers. Cette commande est
utile par exemple si les donnes ont t collectes sur plus d'un ordinateur. Chaque fichier est
copi sur un mme ordinateur, puis ajouter bout bout avec la commande Add files. Pour que
cette commande puisse fonctionner, il faut au pralable que chaque fichier soit transform en
format SPSS auparavant (ils doivent tre ouvert avec Data list, puis enregistrs en format SPSS
avec Save). La syntaxe est:
o Add files file="localisation\nom1.sav"
o

/file="localisation\nom2.sav"

{}

/file="localisation\nomx.sav".

o chaque fichier abouter est indiqu sur une ligne diffrente. Il n'y a pas de limite sur le
nombre total de fichiers.
d.
Match files
Cette commande a une fonction un peu similaire Add files, sauf qu'au lieu d'ajouter
des lignes supplmentaires, elle ajoute des colonnes supplmentaires. Par exemple, un fichier
pourrait contenir les numros de participants, leur ge, statut socio-conomique, etc. alors
qu'un second fichier pourrait contenir les rponses un questionnaire. Pour que les deux
fichiers puissent tre lis correctement, il faut qu'une information soit commune au deux. Par
Utilisation avance de SPSS

PSY 1004

Techniques danalyses en psychologie

exemple, le numro de participant pourrait se retrouver dans les deux fichiers et donc, servir
de "cl" pour savoir quelles lignes du premier jumeler avec quelles lignes du second. La
syntaxe est:
o Match files file="localisation\nom.sav"
o

/file="localisation\nom.sav"

{}

/by nomcolcommun1 {}.

o les diffrentes options file indique les fichiers qui contiennent des colonnes
supplmentaires. Chaque colonne rajouter doit avoir des noms diffrents, sauf pour les
colonnes communes aux fichiers (les cls). Pour indiquer quelles sont les cls, il faut
obligatoirement prciser l'option by. De plus, il peut y avoir plus d'un champ cl. Par
exemple, si au lieu d'avoir not le numro de participant, vous aviez not le nom et le prnom
dans deux colonnes distinctes, il faut prciser que la cl est compose de nom et de prnom.
Attention: pour que cette commande fonctionne correctement, il faut absolument trier
le fichier au pralable sur les noms de colonne indiqus dans l'option by (voir la commande
sort by, Section 3).
e.
Split file by
Cette commande permet de segmenter le fichier en plusieurs sous-fichiers. Cette
commande ne sauvegarde rien. Par contre, si vous excutez une commande d'analyse
statistique (Section 5), la commande statistique sera ralise sur chaque sous-fichier
sparment.
Pour que SPSS sache quel endroit segmenter le fichier, il faut prciser un nom de
colonne. Par exemple, si vous avez une colonne "groupe" et que vous demandez de sparer le
fichier par groupe, chaque fois que le numro de groupe change, SPSS segmente le fichier.
La syntaxe est:
o Split file by nomcol1 {}.
o nomcol1 indique la colonne qui indique comment segmenter le fichier. De plus, on peut
utiliser plusieurs colonnes comme critre pour segmenter le fichier.
Attention: pour que cette commande fonctionne correctement, il faut absolument trier
le fichier au pralable sur les mme noms de colonne (voir la commande sort by, Section 3).
f.
Aggregate
La commande Aggregate a pour but de crer un nouveau fichier contenant un
sommaire du fichier actuellement ouvert. Par exemple, partir d'un fichier de donnes brutes
contenant tous les essais de tous les sujets, on peut crer un fichier ne contenant que la
moyenne de chaque sujet. Si le but est de faire un graphique des moyennes, il n'est pas
ncessaire de rsumer le fichier de donnes brutes, la commande de graphique fait cette
Utilisation avance de SPSS

PSY 1004

Techniques danalyses en psychologie

opration automatiquement (voir Section 4). Les sommaires peuvent tre les moyennes par
condition, les carts types, la plus petite rponse, la plus grande, etc. La syntaxe est:
o Aggregate outfile="localisation\nom.sav"
o

/break=nomcol1 {}

/colrsum=fonction(nomcol)

o outfile permet de spcifier le nouveau fichier qui sera cr. L'option break permet de
spcifier les conditions, i.e. les cas qui doivent tre rsums ensemble. Par exemple, si le
fichier contient la colonne numro de participant, on veut regrouper ensemble toutes les
observations d'un mme sujet.
Les lignes qui suivent indiquent quel rsum on souhaite sur les donnes. Chaque
option va crer une nouvelle colonne du nom de colrsum indiqu dans la commande. La
fonction indique si on veut la moyenne (mean), le plus petit ou le plus grand (min, max), la
somme ou l'cart type (sum, sd). On indique entre parenthse sur quelle colonne la fonction
doit tre applique.
2.

Formatage

Les commandes qui suivent ne sont pas des commandes trs importantes. Elles ont
pour but d'amliorer l'affichage des rsultats.
a.
Comment
Cette commande permet d'ajouter un commentaire. Trs utile pour dcrire les
diffrentes tapes d'un long fichier de syntaxe que l'on prvoit utiliser plus tard. La syntaxe
est:
o Comment taper votre commentaire ici.
b.
Sort cases by
Cette commande permet de trier les donnes actuellement dans SPSS. Cette commande
n'est pas ncessaire, puisque les commandes statistiques traitent les donnes, peu importe
leur ordre. Les seules exceptions sont les commandes split file by et match files qui demandent
obligatoirement que le fichier soit tri. La syntaxe est:
o Sort cases by nomcol1 {}.
o nomcol1 indique sur quel critre raliser le tri, qui sera croissant. Plus d'un nom de colonne
peut tre indiqu. Par exemple, si le fichier contient une colonne pour le nom et une colonne
pour le prnom, il faut trier par nom et si les noms sont les mme, utiliser le prnom comme
second critre de tri.

Utilisation avance de SPSS

PSY 1004

Techniques danalyses en psychologie

c.
Variable labels
Cette commande permet de donner un nom alternatif aux colonnes. Les noms de
colonnes ne peuvent avoir que 8 caractres. Or, pour un non initi, les noms peuvent tre peu
clairs. Si un nom alternatif est donn, il sera automatiquement utilis dans toutes les
commandes qui suivent et dans les graphiques, rendant les rsultats plus faciles
comprendre. La syntaxe est:
o Variable labels nomcol 'nom de colonne alternatif'
o

/nomcol 'nom alternatif d une autre colonne'

videmment, puisque l'apostrophe dlimite le nom alternatif, ce caractre ne peut pas tre
utilis, ce qui est embtant en franais qui utilise souvent ce caractre.
d.
Value labels
Le but de cette commande est similaire celui de la commande prcdente, mais pour
des valeurs particulires. Par exemple, supposons que nous avons une colonne sexe, et que
dans cette colonne, la valeur 1 est utilise pour les hommes, et 2 pour les femmes. Si on
spcifie ces tiquettes SPSS, il va par la suite remplacer les 1 par une tiquette "hommes", ce
qui rend les rsultats et graphiques plus faciles lire.
o Value labels nomcol valeur 'tiquette de cette valeur'
o

valeur 'tiquette de cette autre valeur'

Il faut prciser dans quelle colonne ces tiquettes sont valables avec nomcol. Si on veut donner
des tiquettes pour les valeurs d'une autre colonne, il faut une autre commande Value labels.
e.
Missing values
loccasion, une donne peut tre manquante. Soit que le participant na pas rpondu,
il ne sest pas reprsent pour la suite dune exprience ou alors il ntait pas possible de faire
la mesure dans cette condition particulire. Dans ces cas, il est nanmoins prfrable dcrire
quelque chose dans le fichier, de faon ce que toutes les colonnes restent dans le bon ordre,
quil ny ai pas de trou. Par exemple, on peut dcider que -1 signifie une absence de rponse,
un code qui est choisi au moment de rentrer les informations dans un fichier.
Par la suite, il est possible dindiquer SPSS que tous les -1 (ou le code choisi) signifie
en ralit une absence de donne et quil ne faut pas en tenir compte dans une analyse
statistique. Pour ce faire, on indique SPSS le code choisi avec la commande :
o Missing value nomcol (code).
Dans laquelle code est la valeur choisie (par exemple -1). Le code est totalement arbitraire,
mais assurez-vous quaucune donne correcte ne peut prendre cette valeur. Par exemple, si
vous mesurez des QI, nutilisez pas 100 pour coder une absence dinformation sur le QI!
Utilisation avance de SPSS

PSY 1004
3.

Techniques danalyses en psychologie


Manipulation de donnes

Les commandes qui suivent ont pour but de modifier les donnes contenues dans le
fichier actuellement actif. Toutes ces commandes ont la particularit de ne pas tre excuts
immdiatement, mais d'tre places dans une liste d'attente. Elle seront excut ds qu'une
commande d'analyse statistiques ou de graphique sera rencontre. Voir la commande Execute
la Section 5.
a.
Compute
Cette commande permet d'ajouter des nouvelles colonnes dont la valeur sera gnre
par un calcul. Par exemple, tant donn l'ge du participant, on peut calculer la colonne
anne de naissance, qui s'obtient par la formule 2002 ge. On peut aussi transformer une
variable dpendante avant de faire une ANOVA si les donnes n'ont pas une variance
homogne. La syntaxe est:
o Compute nouveaunomcol = calcul.
o recette est un calcul qui peut impliquer d'autres colonnes, ainsi que ces oprations: +, -, *
(multiplication), / (division), SQRT(nomcol) pour la racine carre, SIN(nomcol) pour le sinus,
ARSIN(nomcol) pour l'arc-sinus, TRUNC(nomcol) pour arrondir vers le bas, etc.
b.
If
Le but de la commande If est assez semblable celui de Compute, mais permet de faire
le calcul uniquement si la condition portant sur la valeur d'une colonne est remplie. Par
exemple, si le numro de participant est plus grand ou gal 10 et plus petit que 20, donner
au numro de groupe la valeur 2. La syntaxe est:
o If condition nouveaunomcol = calcul.
dans laquelle la condition peut vrifier l'galit (gale: = ou n'gale pas: <>) et l'ordre (<, <=,
> ou >=). Une condition impliquant plusieurs sous-condition peut tre construite avec des
AND, des OU, qui peuvent tre prcd de la ngation NOT. Le calcul peut comporter les
mmes lments que pour la commande Compute.
c.
Select if
Alors que les commandes Compute et If permettent de manipuler les colonnes, la
commande Select if s'appliquent aux lignes. Cette commande permet de slectionner un sousensemble de lignes. Les autres lignes sont exclues et ne peuvent pas tre rcupres moins
de n'ouvrir nouveau le fichier d'origine. La syntaxe est
o Select if condition.
o la condition peut comporter les mmes lments que dans la commande If.
4.

Cration de graphiques

La cration de graphiques est une part importante de l'activit d'analyse des rsultats.
Les graphiques de moyennes surtout permettent de se faire une image des donnes. SPSS
Utilisation avance de SPSS
6

PSY 1004

Techniques danalyses en psychologie

permet de faire d'excellent graphiques. Ils ne sont pas les plus beaux qui soient, quoique
encore trs acceptable, mais surtout, ces graphiques peuvent tre fait en quelques secondes.
Pour viter tout risque d'erreur, faites toujours votre graphique partir du fichier de
donnes brutes. N'utilisez pas de fichiers intermdiaires, rsultant d'une aggregation ou
provenant d'une source intermdiaire: une cause frquente d'erreur est l'oublie de donnes
dans les fichiers intermdiaires, ce qui fausse souvent le portrait. La commande Igraph de
SPSS ralise automatiquement toute agrgation ncessaire. De plus, SPSS peut rajouter les
barres d'erreurs, et un bon graphique devrait toujours les avoir.
Lorsque vous n'avez qu'une variable dpendante, cette variable se trouve sur l'axe
horizontal. Si vous avez deux variables dpendantes, on place l'une sur l'axe horizontal et on
utilise une ligne distincte pour chaque niveau de l'autre variable dpendante (appel de faon
peu clair un style dans SPSS). Si vous avez trois variables dpendantes ou plus, il est coutume
de faire des "panneaux", c'est dire des graphiques distincts pour chaque niveau de ces
variables.
SPSS permet de spcifier quelle variable va sur l'axe horizontal, quelle variable dfinit
des styles diffrents, et quelle(s) variable(s) dfinie des panneaux diffrents. Par ailleurs, pour
la variable dpendante, qui apparatra sur l'axe vertical, vous pouvez choisir comment
rsumer les donnes (gnralement, on regarde la moyenne obtenue dans les diffrentes
conditions, mais SPSS nous offre d'autres choix). On peut aussi demander les barres d'erreurs
autour de ce rsum.
La commande Igraph permet de raliser ces diffrentes oprations. Cependant, la
syntaxe est complique, surtout trs longue, et difficile retenir. Pour faire un graphique, il
est donc prfrable (une fois n'est pas coutume) d'utiliser les menus et ses millions de clics.
Allez dans le menu Graphe: Interactif, puis slectionner le type de graphique dsir ( barre,
point, avec ligne, en tarte, etc.). Par ailleurs, SPSS possde quelques graphes plus
spcialiss, par exemple, le graphe "histogramme" qui ralise automatique le graphique de la
distribution de vos donnes, et "dispersion" (scatterplot) qui met un point par donne brute
(aucune agrgation), trs utile pour les rgressions.
5.

Analyses statistiques

Il existe dans SPSS un trs grand nombre de commandes d'analyses statistiques. Aprs
tout, l'objectif final de ce logiciel est de faire de la statistique Plusieurs ont t prsents
dans le document gnral. Ici, nous indiquons seulement quelques noms sans les prsenter
dans le dtail.
a.
Examine
Cette commande permet d'obtenir les statistiques de base des donnes, tel la moyenne,
l'cart type, etc. Le graphique, mon avis, est une meilleure faon d'avoir un aperu gnral
des rsultats, mais si vous voulez avoir les moyennes prcises, utiliser cette commande.

Utilisation avance de SPSS

PSY 1004

Techniques danalyses en psychologie

b.
Execute
Cette commande est bidon puisqu'elle ne fait absolument rien. Cependant, puisque
SPSS la considre comme une commande d'analyse statistique, toutes les commandes de
manipulation de donnes dans la liste d'attente sont excutes. Il s'agit donc d'une faon
dtourne de vider la file d'attente.
c.
Cluster / Quick Cluster / Discriminant / Factor
Ces commandes excutent des analyses de facteurs, de cluster, ou encore des analyses
discriminantes. Ces trois familles d'analyses sont assez proche quant leurs fondements.
d.
Alscal / Proximities
Ces commandes excutent des analyses multidimensionnelles, par exemple, pour
reconstruire une carte routire si on lui donne uniquement les distances entre les villes.
e.
Manova / t-test
Des tests de moyennes. Des commandes d'ANOVA plus anciennes existent encore
(Anova, Oneway) et une nouvelle commande vient remplacer MANOVA: GLM.
f.
Npar tests
Excute un certain nombre de tests non paramtrique, tel le test de la mdiane, le test
binomial, le test de kolmogorov-Smirov, etc.
g.

Regression / LogLinear / Logistic regression / HiLogLinear / NLR / CNLR /


Partial Corr / NonPar Corr
Diffrentes familles de rgression, linaire pour Regression (ou une commande plus
ancienne, correlations) et non linaire (logarithmique, logistique) dans les premiers cas, non
paramtrique dans le dernier cas. Comme on le voit, les rgressions ont t tudies et
utilises d'un grand nombre de faon
Et cetera. Cette liste est loin d'puiser toutes les commandes disponibles dans SPSS, ce
qui explique le succs de ce logiciel. Sa trs grande versatilit en statistique compense pour
son langage de manipulation de fichiers et de donnes (Sections 1 et 3 ci-haut) qui est trs
archaque. Des langages plus rcents (tel SQL) dpassent nettement les capacits de SPSS sur
ce point.

Utilisation avance de SPSS