You are on page 1of 6

Chapitre 5 : LE DEPOUILLIEMENT

BENSGHIR AFAF

L’administration des questionnaires a permis certainement de collecter les


informations recherchées. Il va s’agir maintenant de dépouiller les
questionnaires, et traiter les données enregistrées

Le traitement transforme les réponses du questionnaire obtenues pendant la


collecte pour qu’elles conviennent à la totalisation et à l’analyse des données. Il
comprend toutes les activités de traitement des données, automatisé et manuel,
après la collecte et avant l’estimation. Le traitement demande beaucoup de
temps et de ressources, et il a des répercussions sur la qualité et le coût des
données définitives. Il est donc important de bien le planifier, de surveiller la
qualité de sa mise en œuvre et d’apporter des mesures correctives au besoin.

Chaque questionnaire doit d’abord être vérifié scrupuleusement et être éliminé


s’il est incomplet ou suspect (réponses aberrantes à des questions pièges de
vérification). Une fois ce travail est achevé, il va falloir procéder à la préparation
du plan de dépouillement (ou codification).

Une fois le plan de dépouillement prévu initialement mis en place, il faut coder
chaque questionnaire. Il est donc souhaitable de prévoir, lors de sa conception,
une zone de codage pour chaque question. La saisie informatique suit la phase
de codage. Elle doit impérativement faire l’objet d’un contrôle rigoureux.

1. Le codage.

Le codage est le processus d’attribution d’une valeur numérique aux réponses


pour faciliter la saisie des données et le traitement en général.

Déterminer un ensemble de catégories de réponse à une question pose des


difficultés. Les catégories de réponse sont déterminées avant la collecte pour les
questions fermées et le code numérique est habituellement affiché sur le
questionnaire à côté de chaque catégorie de réponse. Le codage des réponses
aux questions ouvertes est fait après la collecte, et il peut être manuel ou
automatisé. Le codeur doit interpréter et faire preuve de jugement pour le
codage manuel et les résultats peuvent varier d’un codeur à l’autre.

Lorsque vous choisissez la méthode de codage, l’objectif devrait être de classer


les réponses en un ensemble significatif de catégories exhaustives et
mutuellement exclusives qui font ressortir les caractéristiques essentielles des
réponses. Le codage de certaines questions peut être direct (p. ex., état
matrimonial). Autrement, un autre système de codage standard peut exister, par
exemple pour la géographie, la branche d’activité et la profession. Il n’y a
cependant pas de système de codage standard appliqué à de nombreuses autres
questions et le choix d’une bonne méthode de codage n’est pas une tâche
triviale. La méthode de codage devrait être uniforme et logique. Il faut
déterminer à quel point les codes doivent être détaillés, compte tenu de l’objectif
de l’enquête, des totalisations et des analyses de données à faire. Il vaut mieux
commencer avec une liste assez large parce qu’un nombre insuffisant de
catégories peut être trompeur et une grande catégorie autre peut être démunie
d’information. Idéalement, toutes les questions d’un questionnaire seraient
fermées et il y aurait une brève liste de catégories de réponse pour simplifier le
codage. Ce n’est pas toujours possible en pratique et les questions ouvertes sont
parfois nécessaires.

1.1. Codage préalable des questions fermées

Les catégories de réponse aux questions fermées peuvent être codées d’avance
dans le questionnaire. Des cases pour les codes peuvent être disposées à côté de
la réponse à coder ou dans la marge pour les questionnaires sur support papier.
Voilà qui améliore énormément l’efficacité de la saisie des données après la
collecte : au lieu de dactylographier la catégorie de réponse sélectionnée, un
code numérique est entré (il est aussi plus facile d’analyser des codes
numériques qu’une suite de mots). Les codes des méthodes de collecte assistée
par ordinateur sont automatiquement saisis lorsque l’intervieweur ou le
répondant choisit une réponse.

Exemple de codification :

Question : êtes-vous favorable à la mise en place d’un service de livraison


à domicile ?

Oui non

• Pour cette question, la codification retenue pourra être : livr.

• Pour les réponses, la codification retenue pourra être : Oui = 1, non = 2.

• pour la saisie informatique, ou aura le choix entre livr1 ou livr2.


Les questions fermées ont beaucoup d’avantages, elles sont un fardeau moindre
pour les répondants, et la collecte, la saisie et l’analyse des données coûtent
moins cher, elles sont plus rapides et faciles que les questions ouvertes.

1.2. Codage manuel des questions ouvertes

Lors du codage manuel des questions ouvertes, le codeur (habituellement après


la collecte) doit lire, interpréter et convertir à la main une réponse par écrit à une
question ouverte en un code numérique. Ce code numérique est ensuite inscrit
dans le questionnaire ou entré à l’ordinateur. Le codeur devra peut-être
simplement remarquer si la réponse contient un mot clé ou une référence à un
élément en particulier pour attribuer un code. Parfois le codage est déterminé à
partir de la réponse à une question seulement, parfois à partir des réponses à
plusieurs questions connexes. La clarté et l’exhaustivité de la réponse écrite, la
qualité de la vérification initiale, la logique de la méthode de codage et
l’aptitude du codeur influencent énormément la qualité du codage dans ce cas.

Pour faire ce codage, il faut tenir compte donc des points suivants :

- le nombre de réponses possibles,

- la complexité (jugement),

- l’ambiguïté possible de la réponse.

On peut ensuite faire des vérifications périodiques de la qualité du codage et


apporter des mesures correctives au besoin.

1.3. Codage automatisé des questions ouvertes

Le codage des questions ouvertes est habituellement une opération manuelle.


Compte tenu de l’évolution technologique, des ressources restreintes et, plus
encore, des exigences de rapidité et de qualité, le processus de codage est
cependant de plus en plus automatisé.

Deux fichiers sont habituellement entrés dans un système de codage automatisé.


Un fichier contient les réponses de l’enquête qu’il faut coder, intitulé fichier de
réponse en lettres. Le deuxième fichier est intitulé fichier de référence et
contient les réponses (ou phrases) écrites typiques et leurs codes numériques
correspondants.
2. Saisie des données.

La saisie des données consiste à transformer les réponses pour les rendre
lisibles à la machine. La saisie est faite après la collecte (habituellement après le
prétraitement et certaines vérifications préliminaires du questionnaire) pour les
méthodes de collecte sur support papier. Dans ce cas par exemple, un commis
(un opérateur de saisie des données) entre au clavier de l’ordinateur les valeurs
déclarées dans le questionnaire. La saisie se fait au moment de la collecte pour
les méthodes de collecte par ordinateur.

Il y a plusieurs moyens d’améliorer l’efficacité de la saisie des données. Les


méthodes de collecte des données assistées par ordinateur sont un moyen. La
collecte et la saisie étant simultanées, le processus de collecte et de saisie des
données est donc plus rapide et efficace que celui des méthodes sur support
papier. Cependant, les programmes des logiciels demandent beaucoup de
développement et de mises à l’essai.

Le codage préalable des questions fermées peut améliorer énormément


l’efficacité de la saisie des données manuelle pour les méthodes de collecte sur
support papier.

3. Traitement et analyse des données.

L’analyse des données comprend le résumé des données et l’interprétation de


leur signification pour donner des réponses claires aux questions qui ont motivé
l’enquête. Il faut souvent interpréter des tableaux et diverses mesures de
récapitulation, par exemple, des distributions de fréquences, des moyennes et
des étendues de valeurs, ou des analyses plus approfondies peuvent être faites.
L’analyste voudra peut-être décrire seulement les unités observées et, dans ce
cas, tous les outils de la statistique élémentaire et intermédiaire sont disponibles
(tableaux, diagrammes et graphiques, mesures élémentaires de la position et de
dispersion, modélisation de base, modèles de classification, etc.). L’analyste
voudra plus souvent décrire la population et vérifier les hypothèses formulées à
ce sujet, et il faudra correctement tenir compte du plan d’échantillonnage
pendant l’analyse.

Il faut faire une analyse des statistiques (distributions des fréquences, mesures
de la tendance centrale et mesures de l’étalement), de présenter aussi des
méthodes analytiques
Une enquête permet la collecte d’un éventail de caractéristiques ou variables :
variables qualitatives et quantitatives. Les variables qualitatives sont codées
(nominales) et les variables quantitatives indiquent un nombre. D’autres
décompositions sont possibles : les variables qualitatives peuvent être nominales
ou ordinales et les variables quantitatives peuvent être discrètes ou continues.

Variables nominales : Une variable nominale est une série de catégories qui
sont simplement des étiquettes ou des noms sans lien mathématique entre eux.

Variables ordinales :Une variable ordinale est une série de catégories


ordonnées ou classées selon une échelle ou un continuum déterminé, et une
catégorie en particulier peut précéder ou suivre une autre.

Voici un exemple de données ordinales : vraiment d’accord, d’accord, ni pour ni


contre, pas d’accord, vraiment pas d’accord. D’autres exemples : la collecte de
l’âge à l’aide d’une question fermée, par exemple, moins de 15 ans, de 15 ans à
34 ans, …, 75 ans ou plus,

Variables discrètes : Une variable discrète est une variable quantitative ayant
des valeurs dénombrables. Voici un exemple de ce genre de variables : une
variable dont les valeurs possibles sont entières et il ne peut y avoir de valeur
intermédiaire entre deux valeurs entières. La taille d’un ménage peut être, par
exemple, 1, 2, 3, et des valeurs comme 1,5 ou 4,75 sont impossibles. Il n’est
cependant pas nécessaire que les variables discrètes soient entières : un autre
exemple de variable discrète est la taille des souliers qui peut être 6, 61/2, 7,
71/2, etc., mais 63/4 est impossible. iv. Variables continues

Une variable continue est une variable quantitative dont toute valeur dans une
certaine étendue est possible (contrairement à une variable discrète dont
certaines valeurs en particulier seulement sont possibles). La taille et le poids
sont donc des variables continues, mais le nombre de buts d’une équipe de
hockey est une variable discrète. Il est possible pour une personne d’avoir
n’importe quelle taille, jusqu’à un certain point, par exemple, 1,68 mètre, mais
une équipe de hockey ne peut compter 2,3 buts parce que le nombre de but est
discret et entier. Remarquez que les variables continues peuvent être
transformées en variables nominales, par exemple, les mesures de la tension
artérielle peuvent être qualifiées de basse, normale ou élevée.

Le type de données détermine le genre de procédures analytiques qui peuvent


être appliquées
L’analyse des variables statistiques doivent suivre une analyse statistique
approfondie, je serais à votre disposition pour tout questionnement

You might also like