You are on page 1of 33

               Quentin TAILLEFER

P1044490

 Travail de recherche   :
 Sujet   : «le vote pour les extrêmes »

METHODES QUANTITATIVES D’ANALYSE
POL 2809

 Remettre à   : Eric Guntermann
14 décembre 2015

1

Remerciement à Marie Vachelard
Le Travail de recherche suivant est en corrélation avec le cours de méthodes quantitatives
d’analyse suivie à l’hiver 2015. L’objectif de ce travail est de réaliser une recherche sur un sujet
politique, en utilisant les méthodes quantitatives étudier tout au long de la session, telle que la
régression logistique ou linéaire (en utilisant le logiciel R studio). La méthode de l’étude devra
suivre la démarche de recherche empirique, développée par Pétry et Gélineau dans le chapitre 1 de
leur ouvrage «Guide pratique : d’introduction à la régression en sciences sociales ». C’est-à-dire
qu’il nous faut suivre les six étapes suivantes, formuler un problème, construire un cadre
opératoire, structurer la preuve et par la suite cueillir des données (ici nous avons choisi la base
donnée proposer par le professeur) pour finalement analyser les données est interpréter les
résultats. Dans un souci d’efficacité, le sujet devras suivre un modèle dans lequel l'espérance
conditionnelle de Y sachant X est une transformation affine de X ou bien un model où un vecteur
de variables aléatoires fait effet sur une variable aléatoire binomiale :
« Depuis une trentaine d’années, un peu partout en Europe, les extrêmes droites ont le vent
en poupe », Les droites extrêmes Europe, seuil, paris. Cette constatation faite par Jean Yves Camus
politologue reconnue est à l’origine de notre étude. Effectivement ce constat, est observable depuis
les trois dernières décennies avec une croissance de la représentativité pour l’extrême droite de 90
sièges sur 750 au parlement européen ainsi que l’apparition de partie tel que l’Aube dorée en
Grèce ou bien le NPD en Allemagne. Au vu de l’avancer de ces parties d’extrêmes droites qui
véhicule des idéaux d’euroscepticisme, de nationalisme et de souverainisme en Europe. Nous
avons voulu développer notre étude sur ce sujet très présent sur la scène médiatique et politique,
puisqu’il inquiète la sphère politique qui fait face à une radicalisation des parties. La recherche
que nous allons effectuer se concentrera sur le vote pour les partis extrêmes en France. Notre
choix a été véritablement influencé par la situation en France, puisque à la suite du Premier tous
des élections régionales Française le dimanche 6 décembre 2015, le parti d’extrême droite (FN)
c’est retrouvé en tête de six régions. La base de données, que nous utiliserons pour le projet est
basée sur la seconde partie d’un sondage sur les élections et la démocratie en France, à la veille
des élections législatives de 2012 (base de données : France2012.dta). La recherche que nous
allons faire sur le sujet a pour but d’observer l’influence du niveau de revenu et d’éducation des
répondants quant à leurs choix de vote. Ici la variable dépendante (qualitative) de notre recherche
est le vote et nos variables indépendantes sont le revenu annuel brut des ménages avant impôts

2

ainsi que le niveau d’éducation le plus haut, compléter par le répondant. Le fondement scientifique
de notre recherche se base sur la revue d’ouvrage scientifique telle que « revue française de
sciences politiques : les hauts et les bas du vote Le Pen, Nonna Mayer, 2002/5 » au sain du quelle
est théoriser des idées comme « Le Pen réussit toujours mieux chez les moins diplômés » p 4 ainsi
qu’« Il s’élève en raison inverse du revenu et du nombre d’éléments de patrimoine mobilier ou
immobiliers possédés, ainsi que chez les chômeurs et les salariés sous CDD (20 et 22 %) » p 4
mai nous observerons cela dans la partie concernant la revue de la littérature. Les éléments que
nous venons d’exposer concernant la vision de notre recherche nous amènent à poser la
problématique suivante pour guider notre recherche. Dans l’étude politique suivante, nous
chercherons à l’aide de méthodes quantitatives à savoir, si les répondants de notre base de données
ayant un niveau d’éducation « faible » et/ou niveau de revenus faible votent plus ou moins pour
les partis d’extrême droite ? Pour procéder à l’analyse suivante qui a pour unité d’Analyse les
citoyens Francais, nous partirons de l’hypothèse de base suivante. Les répondants ayant un niveau
d’éducation plus faible Tende à voter pour des parties d’extrêmes droites, la recherche nous
amènera à valider ou réfuter le modèle. Dans un premier temps il nous faudra faire une brève
revue de la littérature scientifique soutenant notre modèle. Par la suite nous allons présenter les
différentes méthodes de l’analyse quantitative que nous avons utilisée ainsi que les données
employées. Les deux sections concernant l’étude, servirons as présenter les résultats pour ensuite
interprétez et expliqué la signification de ces derniers. Pour finir, nous mentionnerons les limites
de l’étude.

L’un des fondements scientifiques nous permet de soutenir notre hypothèse de départs,
selon laquelle les répondants ayant un niveau d’éducation plus faible tendent à voter pour des
partis d’extrême droite. Est issu du journal l’express. En effet, l’article de l’express datant du trois
avril 2012 est rédigé par Yann Duvert, celui-ci est une explication du sociologue Sylvain Crépon
au sondage de l’IFOP (institut français d’opinion publique) qui affirme que l’intention de vote
pour Marine Le Pen au premier tour des élections présidentielles est de 23% chez les jeunes de 1822 ans. La réponse donnée par ce sociologue, concernant les motifs de cette population de jeune
votant FN, qu’il qualifie comme ayant le moins d’instruction « ce sont les jeunes ayant le moins
d'instruction qui se tournent vers le Front national. ». S’expliquent par « la figure moderne » que
représente Marine Le Pen, ainsi que le vote transgressif et le rejet de la politique chez ces jeunes.
Il va même jusqu'à dire « Moins on est instruit, plus on vote FN ». Le deuxième article qui vient
soutenir notre questionnement est l’ouvrage de Nonna Mayer selon lequel, les sympathisants du
3

Front national qui est un parti d’extrême droite fondé en 1972 sont moins diplômés et que suivant
leurs situations financières (emploi) influence leurs votes. Ces fondements nous ont amenés à faire
une recherche utilisant des méthodes quantitatives, pour réfuter ou non les auteurs suivants.
1- Méthode et données employées :

Cette section concerne les méthodes et les données employées au cours de notre étude,
nous débuterons celle-ci par faire une courte introduction au logiciel Rstudio. Par la suite nous
définirons l’ensemble de notre base de données, de nos variables (dépendante, indépendante,
qualitative, quantitative) et pour finir la méthode utilisée. Par la suite nous verrons la construction
de notre projet et son évolution qui est ici divisé en 4 modèles. Effectivement, ici nous avons
développé quatre modèles, car nous avons fait face des problèmes de représentativité dans notre
variable dépendante (Y) choisie. Nous expliquerons par la suite ces problèmes et l’évolution vers
laquelle nous avons mené notre recherche.
A-

Logiciel Rstudio :

Rstudio, est un programme utilisé pour le traitement de données et
d’analyse

statistique.

Celui-ci

a

été

écrit

grâce

à

un

langage

de

programmation C++ et évolue sur un environnement de développement
multiplateforme qui est libre. Le fait qu’il soit libre désigne l’idée que les
personnes utilisant ce dernier ont la possibilité de créer eux même une
formule pouvant être effectuée sur le logiciel. Nous utilisons le langage de
programmation R, qui nous a été donné au cours de POL 2809 à L’Université
de Montréal.
B- La base de données :
La base de données suivante est issue d’un projet de recherche sur les
élections et la démocratie, elle est issue d’un sondage sous forme de
questionnaire. Les seules informations précises que nous avons au sujet de la
population est le faite que les citoyens étudier ont plus de 18 ans, sont tous
de nationalité française et sont tous résidents en France. La méthode utilisée

4

pour l’échantillonnage semble être de formes aléatoires simples c’est-à-dire le
choix au hasard des individus d’une population. Cette méthode est
représentative, mais peut être très longue suivant la taille de la population. Ici
la base de données, se présente sous la forme de tableaux avec les unités
dans les rangées et les variables dans les colonnes. Elle est composée de 339
variables est de 1949 observations :
n = 1949
q = 339
À présent, nous allons observer les différentes manipulations qu’il faut apporter à
la base de données pour pouvoir étudier, celle-ci est faire notre régression linéaire
multiple par la suite :
La première des choses que nous devons faire lorsque nous étudions une
base de données de la sorte avec un nombre de variables q très élevé, est de
garder seulement les variables au quelle notre étude porte de l’intérêt. Ici
nous avons gardé environ une quinzaine de variables (présenter dans la
suite). Pour enlever les variables au quelle on porte un faible intérêt nous
avons effectué la syntaxe suivante.
Syntaxe :
# take the variables of interest

newdata <- select(data, AGE, female, townsize, income, education,
turnout_1, turnout_2, partychoice_1, partychoice_2, SD4, Q2, Q3B,
Q6A1, Q6B1, Q8A)

newdata<-data.frame(newdata)

La deuxième des actions que nous allons effectuer au sain de la base de
données, est de renommer les variables qui ont une forme qui ne convient pas
a développé une étude compréhensive et soignée :
Syntaxe :
5

-

Pour les variables indépendante :
names(newdata)[names(newdata)=="AGE"] <- "age"
names(newdata)[names(newdata)=="female"] <- "sexe"
names(newdata)[names(newdata)=="SD4"] <- "educ_level"
names(newdata)[names(newdata)=="Q2"] <- "pol_int"
names(newdata)[names(newdata)=="Q3B"] <- "partie_pol"
names(newdata)[names(newdata)=="Q6A1"] <- "vote_pres_1"
names(newdata)[names(newdata)=="Q6B1"] <- "vote_pres_2"
names(newdata)[names(newdata)=="Q8A"] <- "partie_vote_next"

-

Pour les variables dépendantes (pour les 4 modèle, une variable
dépendante par modèle) :
names(newdata)[names(newdata)=="vote_pres_1"] <- "Y_1"
names(newdata)[names(newdata)=="partie_vote_next"] <- "Y_2"
names(newdata)[names(newdata)=="Y"] <- "Y_3"
names(newdata)[names(newdata)=="Y_bis"] <- "Y_4"
Pour

faire

que

notre

régression

linéaire

multiple

soit

effectuée

correctement il nous faut à présent, convertir nos vecteurs numériques de la
forme facteur à la forme caractère pour cela nous effectuons la syntaxe
suivante :
Syntaxe :
#factor to character
newdata$educ_level<-as.character(newdata$educ_level)
newdata$pol_int<-as.character(newdata$pol_int)
newdata$partie_pol<-as.character(newdata$partie_pol)
newdata$vote_pres_1<-as.character(newdata$vote_pres_1)
newdata$vote_pres_2<-as.character(newdata$vote_pres_2)
newdata$partie_vote_next<-as.character(newdata$partie_vote_next)
Nous verrons dans la section concernant les variables, la méthode de dummy que nous
avons appliquées à certaines variables dans un souci de facilité l’étude et de ce concentrer sur
l’intérêt de notre recherche. Ici, la seule critique que nous pouvons faire à la base de données
récupérer sur studium est la syntaxe des valeurs concernant les variables quantitatives. En effet, la
syntaxe adoptée dans ces valeurs comporte des caractères spéciaux (le chômage). L’accent
circonflexe est un caractère spécial qui va être à l’origine d’un message d’erreur. Notre résolution
a été d’exporter la base de donnée dans un fichier Excel pour pouvoir modifier les erreurs de

6

syntaxe et importer de nouveau le fichier en forme CSV et non DTA.
La dernière des actions que nous avons effectuées pour améliorer notre base de données est de
supprimer les valeurs manquantes (NA) :
Syntaxe :
newdata[is.na(newdata)]<-0

c- Les variables :
Pour notre recherche nous avons défini au préalable trois variables, 2
variables

indépendantes

Education

et

revenus

ainsi

que

1

variables

dépendantes qui est le vote. Ici nous verrons, les différentes statistiques
descriptives simples de celle-ci et nous distinguerons les variables qualitatives
dès variables quantitatives. Il faut bien noté que nous avons ajouté de
nombreuse variables contrôle, car la représentativité de notre modèle est
incertaine et le fait d’ajouter celle-ci nous permet de contrôler les variables du
modèle. Après avoir observé les différentes statistiques descriptives, nous
expliquerons la fonction dummy ainsi que sa pertinence dans notre étude.
1- les différentes statistiques simples en distinguant les variables
quantitatives et les variables qualitatives :
-

variables indépendantes :

Quantitative :
-

age : en années

-

incom : annuel brut du ménage avant impôts (in_1 = faible,

in_10= élevé, 0 étant la référence).
Qualitative :
-

sexe : 0 pour homme/1 pour femme

7

-

Education : avec 1 pour référence, ed_2 = faible, ed_9 = élevé

-

Townsize : Big =4 , small =1

Les variables suivantes sont des variables indépendantes qualitatives
concernant l’importance de certaines politiques intérieures :
-

Imm : importance de l’immigration (1 if rest )

-

Sec : importance de la sécurité (1 if rest)

-

Chom : importance du chomage (1 if rest)

Tableau 1 : variables quantitatives :
Nous avons utilisé une procédure de S.A.S afin d’avoir une statistique descriptive (moyenne,
variance, écart-type etc...), des variables quantitatives.
Variable
Age

N
1949

Moyenne
46,03

médiane
47

Minimum
18

Maximum
82

1758

3,91

4

1

11

in
com

Graphique : en boite à moustache

Age :

8

80
20

30

40

50

60

70

Ici nous pouvons observer la dispersion de la variable
âge, avec en abscisse l’âge en année. Les valeurs représentées
sont la valeur maximale (82) ainsi que la valeur minimale
(18). L’observation générale qui peut être faite est que le
corps de la boite a moustache est grand donc ont est face a des
valeurs du milieu qui sont hétérogène. L’étendue de la
moustache étant grand nous sommes face à une population très
dispersée.

2

4

6

8

10

Income :

Ici, nous pouvons observer le revenu, avec en
abscisse le revenu annuel brut du ménage avant
impôt. À premier vu l’on peut observer que le centre
de l’échantillon est vers la partie inférieure de la
moustache. En effet nous observons une moyenne de
3,91 avec une valeur maximale de 9 et une valeur
minimale de 1. Les trois ronds en haut de notre boite
représentent des valeurs exogènes non prises en
compte dans notre système. Le corps de la boite a
moustache étant petit nous pouvons en conclure que
les valeurs du milieu sont homogène et la grandeur
de la moustache montre que les valeurs sont
moyennement dispersées.

Tableau 2 : variables qualitatives :

9

Nous avons utilisé une procédure de S.A.S afin d’avoir une statistique descriptive, des la variables
qualitatives.

variables
sexe
0 = femme
1= homme
Education
2= faible
9= élevé
townsize
1= small
4= big
Imm
Sec
chom

Fréquence

pourcentage

917
1032

47,05
52,95

33
33

1,69
1,69

661
62
211
139
412

34.00
10.24
10,83
7,13
21,14

* la remarque que l’on peut faire ici est que la fréquence de la variable
éducation choisi est faible, ce qui peut entrainer un problème de
représentativité dans notre modèle.
-

variables dépendantes :
Pour notre étude nous avons observé des modèles avec plusieurs
variables dépendantes. En effet au cours de notre recherche nous avons
rencontré un problème de représentativité par rapport à la variable
dépendante choisie pour le modèle 1, modèle 2, modèle 3 ce qui nous a
amené a développer 4 modèles pour trouver une certaine significativité
dans nos variables indépendantes. Nous développerons cela lorsque
nous verrons chaque modèle, pour le moment observons les différentes
statistiques simples de nos variables Y.

P -

Qualitative :

Modèle 1
Y_1 = correspond à la question Q6A1 : pour quel candidat avez-vous

10

voté au premier tour des élections présidentielles.
-

Marine Le Pen prend la valeur 1 et le reste 0 (1= 290 /0= 1659)

Modèle2
Y_2 = correspond à la question Q8A : si vous votez pour le candidat de
quel parti allez-vous voter. (Législative)
-

Front national prend la valeur 1 et le reste 0 (1= 300, 0=1649)

Modèle3
Y_3= correspond à la question Q8B : pour le candidat de quel parti avezvous le plus de chance de voter (législative)
-

Front national prend la valeur 1 et le reste 0 (1= 9, 0= 1940)

Modèle4
Y_4= correspond à la question 30A : où vous situeriez vous sur une
échelle de 0 à 10, 0 étant l’extrême gauche et 10 étant l’extrême droite.
-

[10 ; 7[prend la valeur 1 et le reste 0 (1 = 348, 0= 1601)

Tableau 3 : variables qualitatives dépendante :
Variable
Y_1
1
0
Y_2
1
0
Y_3
1
0
Y_4
1
0

Fréquence

Pourcentage (%)

290
1659

14,8 %
85,12 %

300
1649

15,39 %
84,60 %

9
1940

0,46 %
99,53 %

348
1601

17,8 %
82,14 %

Commentaire :
Le tableau suivant montrant les statistiques descriptives de nos différentes
variables dépendantes (qualitatives) peut expliquer les résultats avec des

11

significativité faibles dans le modèle 1, 2 et 3. En effet, l’on observe que ces
trois modèles ont une représentativité faible, car la variable choisie à une
fréquence faible respectivement 14,8 %/15,39 %/ 0,46 %. Tant dit que dans
notre modèle final la variable étudiée est représentative à 17,8 %.
Pour simplifier et permettre d’appliquer notre modèle sur des variables
spécifiques, nous avons adopté des variables dummy, c’est-à-dire que les
variables prennent à présent seulement deux valeurs possibles : 1 ou 0.
Contrairement à un modèle, généralisez ou l’on peut appliquer n’importe
quelle valeur à notre variable.
Syntaxe dummy appliquée sur toutes les variables dépendantes, ainsi que les
variables : income, townsize, éducation et pol_int. :
imm<ifelse(newdata$pol_int=="L'immigration",1,0)
newdata["imm"]<-imm

2- Application de l’étude :
P
P L’étude de notre projet de recherche est de montrer une relation entre le niveau d’éducation
ainsi que le revenue, avec le vote. Donc ont étudie, le modèle : vote = +
P D’après notre hypothèse de départ, l’on s’attend as une forte significativité du modèle
suivant est que et est une valeur élevée et donc montre que l’évènement vote pour
l’extrême droite est plus probable d’arriver dans ce cas. Nous observerons donc la
significativité de nos variables indépendante ainsi que les variables contrôlent pour en
venir a réfuté ou non ces dernières.

P A-

Modèle de régression (méthodologie) :

P Pour effectuer notre application des méthodes quantitatives, nous appliquons dans l’étude,
une régression logistique de modèle Probit. Commençons par comprendre la régression
logistique et son modèle ainsi que les raisons qui nous ont poussés vers ce choix.
P La régression logistique :

12

P Le choix de la régression étant dépendant de la variable dépendante étudié, nous avons ici
choisi la régression logistique, car nous étudions une variable qualitative. La régression
logistique est un des modèles multivariables couramment utilisées en économétrie avec la
régression linéaire multiple. Elle s’utilise lorsque la variable à expliquer (variable
dépendante Y) est qualitative, le plus souvent binaire. Les variables explicatives (variables
indépendantes Xi ) peuvent être par contre soit qualitatives, soit quantitatives. La variable
dépendante est habituellement la survenue ou non d’un événement et les variables
indépendantes sont celles susceptibles d’influencer la survenue de cet événement.
P
P Modèle Probit :
Le choix du modèle probit c’est fait dû au fait que la variable
dépendante est binaire. En effet, les variables dépendantes des
différents modèles prennent des valeurs 1 ou 0 (extrême droite où soit
autres). Le modèle probit étant un modèle binomial issu d’un cas
particulier de régression linéaire généralisé. Il est introduit en 1934 par
Chester Bliss.

Modèle 1 :
Y_1 =

β 0 + β 1 age + β 2 sexe +

β 3 big+ β 4 smal + β 5 I n1 + β 6 I n10+ β 7 e d2 + β 8 e d 9 + β 9 chom+ β10 sec+ β 11 imm
Y_1 = la variable dépendante binomial qui prend les valeurs 1 si Marine Le Pen ou 0 si autre, Le
Nombre d'observations lues est de n=1949 qui est égal au Nombre d'observations utilisées : 1949.
Il n’y a donc pas d’observations manquantes.
Syntaxe de la régression logistique de modèle probit 1 :
summary(newdata$Y_1)
unique(newdata$Y_1)
MLP<-ifelse(newdata$Y_1=="Marine Le Pen",1,0)  dummy
newdata["MLP"]<-MLP
probit1<-glm(MLP ~ age + sexe + big + smal + in_1 + in_10 + ed_2 + ed_9 + chom + sec + imm,
data = newdata, family = binomial(link="probit"))  modèle probit
summary(probit1)  affiche les résultats de la régression

13

Tableau 4 : Résultats de la régression du modèle 1
variables
(Intercept)
Age
Sexe
Big
Smal
in_1
in_10
ed_2
ed_9
Chom
Sec
imm

Estimate
-1.411605
0.002509
0.029771
0.063084
- 0.076984
0.205268
-0.434220
-0.063248
-0.264742
-0.087535
0.671844
1.233811

Std.error
0.139060
0.002553
0.074016
0.121423
0.081679
0.134653
0.439388
0.280215
0.334781
0.101883
0.125559
0.100343

Z value
-10.151
0.983
0.402
0.520
- 0.943
1.524
-0.988
-0.226
-0.791
-0.859
5.351
12.296

Pr(>|z|)
< 2e-16 ***
0.326
0.688
0,603
0.346
0.127
0.323
0.821
0.429
0.390
8.76e-08 ***
< 2e-16 ***

Inférence dans le modèle 1 :
Nous allons Tester avec un risque de 10% l’hypothèse 0 : 1 = 2 = 3 = 4 = 5 ….= 0 (Aucune
des variables explicatives n’a d’effet. Tous les coefficients sont nuls, sauf la constante) contre �
: 1 ≠0
2 ≠0
3 ≠0
4 ≠0
5 ≠0 (Il y a au moins une variable explicative qui a un effet
non nul).


Nombre de ?=12(nombre de paramètres estimés = 11 bêtas (nombre de
variables explicatives) + 1 constante = 12)
n=1949
q=11(nombre de contraintes)

Tester avec un risque de α=10% la signification de chaque coefficient.
: �
�:

: �
�:

=0

variable

P­value

≠0
significativit
é

14

Intercep
t

< 2e-16
***

< 0,1

Significatif

On ne rejette pas
niveau α=10%

Age 

0.326

> 0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

Sexe

0.688

> 0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

Big

0,603

> 0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

Smal

0.346

> 0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

In_1

0.127

> 0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

In_10

0.323

> 0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

Ed_2

0.821

> 0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

Ed_9

0.429

> 0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

chom

0.390

> 0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

Sec

8.76e-08
***

< 0,1

Significatif

On ne rejette pas
niveau α=10%

0

au

imm

< 2e-16
***

< 0,1

Significatif

On ne rejette pas
niveau α=10%

0

au

0

au

P -•
Si les variables ont un p-value supérieure à notre risque de première espèce, elles ne
sont pas statistiquement significatives. C'est-à-dire que la variable indépendante à laquelle
ils correspondent n'a pas d'impact sur la variable dépendante dans ce modèle. Après avoir
fixé la probabilité de rejeter H0 quand H0 vrai à 10%, nous avons pu trouver les variables
significatives et non significatives. A l’aide des précédentes estimations, nous pouvons
alors présenter les deux causalités suivantes :
(i) En moyenne, lorsque le répondant choisi la politique intérieure
immigration comme étant la plus importante, l’évènement vote extrême
droite est plus probable.

15

(ii) En moyenne, lorsque le répondant choisi la politique intérieure
sécurité comme étant la plus importante, l’évènement vote extrême
droite est plus probable.
L’on peut alors remarquer dans se premier modèle que l’hypothèse de base de la
recherche selon laquelle l’éducation et le revenue aurais une influence sur la probabilité de
l’événement vote extrême droite est rejeté au niveau α=10%. En effet l’indicateur Pvalue qui représente la significativité est supérieur à 0,1.

P Face à ce résultat, l’on cherche à savoir d’où proviennent de tels résultats, ainsi
qu’une faible significativité sur les nombreuses variables indépendantes de contrôle. Quels
éléments faut-il changer pour améliorer notre modèle ?
P Nous savons que la représentativité de la variable dépendante Y_1 est très faible (voir
annexe, schémas1). En effet, dans la section sur les statistiques descriptives nous avons pu
observer que les répondants à la question Q6A1 ayant répondu Marine Le Pen ont une
fréquence de 290 sur une population totale n= 1949. Cette représentativité peut avoir un
effet sur notre modèle.
P Pour améliorer le modèle, nous décidons de changer la variable Y_1, pour la variable Y_2 :
Correspondant à la question Q8A : si vous votez pour le candidat
de quel parti allez-vous voter. (Législative)
P
P Suite changement de variable dépendante nous espérons avoir une plus grande cohérence
dans les résultats ainsi que de voir apparaître une significativité dans notre hypothèse de
base.

Modèle 2 :
Y_2 =

β 0 + β 1 age + β 2 sexe +

β 3 big+ β 4 smal + β 5 I n1 + β 6 I n10+ β 7 e d2 + β 8 e d 9 + β 9 chom+ β10 sec+ β 11 imm
Y_2 = la variable dépendante binomial qui prend les valeurs 1 si Front national et 0 autre,
Le Nombre d'observations lues est de n=1949 qui est égal au Nombre d'observations utilisées :
1949. Il n’y a donc pas d’observations manquantes.
Syntaxe de la régression logistique de modèle probit 2 :
summary(newdata$Y_2)
unique(newdata$Y_2)
16

dep_FN2<-ifelse(newdata$Y_2=="Rassemblement Bleu Marine (Front National)",1,0)  dummy
newdata["dep_FN2"]<-dep_FN2
probit2<-glm(dep_FN2 ~ age + sexe + big + smal + in_1 + in_10 + ed_2 + ed_9 + chom + sec +
imm, data = newdata, family = binomial(link="probit"))  modèle probit
summary(probit2)affiche les résultats de la régression

Tableau 5 : Résultats de la régression du modèle 2

variables
(Intercept)
Age
Sexe
Big
Smal
in_1
in_10
ed_2
ed_9
Chom
Sec
imm

Estimate
-1.2251944
-0.0003495
0.0031724
0.0825592
-0.1323294
-0.0357946
-0.1172214
0.1073637
-0.2615144
0.1607364
0.8094910
1.2769076

Std.error
0.1371699
0.0025495
0.0738825
0.1203650
0.0822063
0.1446524
0.3794605
0.2681877
0.3302422
0.1046276
0.1223224
0.1000207

Z value
-8.932
-0.137
0.043
0.686
-1.610
-0.247
-0.309
0.400
-0.792
-1.536
6.618
12.766

Pr(>|z|)
< 2e-16 ***
0.891
0.966
0.493
0.107
0.805
0.757
0.689
0.428
0.124
3.65e-11 ***
< 2e-16 **

Inférence dans le modèle 2 :
Nous allons Tester avec un risque de 10% l’hypothèse 0 : 1 = 2 = 3 = 4 = 5 ….= 0 (Aucune
des variables explicatives n’a d’effet. Tous les coefficients sont nuls, sauf la constante) contre �
: 1 ≠0
2 ≠0
3 ≠0
4 ≠0
5 ≠0 (Il y a au moins une variable explicative qui a un effet
non nul).


Nombre de ?=12(nombre de paramètres estimés = 11 bêtas (nombre de
variables explicatives) + 1 constante = 12)
n=1949
q=11(nombre de contraintes)

Tester avec un risque de α=10% la signification de chaque coefficient.

17

: �
�:

: �
�:

=0

≠0

variable

P­value

Intercep
t

< 2e-16
***

<

Age 

0.891

Sexe

0.966

Big

0.493

significativit
é
0,1

Significatif

On ne rejette pas
niveau α=10%

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

0

au

Smal

0.107

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

In_1

0.805

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

In_10

0.757

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

Ed_2

0.689

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

Ed_9

0.428

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

chom

0.124

>

0,1

Pas >
Significatif

On rejette
α=10%

0

au niveau

Sec

3.65e-11
***

Significatif

On ne rejette pas
niveau α=10%

0

au

<

0,1

imm

< 2e-16
**

0,1

Significatif

On ne rejette pas
niveau α=10%

0

au

<

P - Si les variables ont une p-value supérieure à notre risque de première espèce, elles ne sont
pas statistiquement significatives. C'est-à-dire que la variable indépendante à laquelle ils
correspondent n'a pas d'impact sur la variable dépendante dans ce modèle. Après avoir fixé
la probabilité de rejeter H0 quand H0 vrai à 10%, nous avons pu trouver les variables
significatives et non significatives. À l’aide des précédentes estimations, nous pouvons
alors présenter les deux causalités suivantes :
(i) En moyenne, lorsque le répondant choisi la politique intérieure
18

immigration comme étant la plus importante, l’évènement vote extrême
droite est plus probable.
(ii) En moyenne, lorsque le répondant choisi la politique intérieure
sécurité comme étant la plus importante, l’évènement vote extrême
droite est plus probable.
P
-

L’on peut alors remarquer dans se second modèle que l’hypothèse de base de la

recherche selon laquelle l’éducation et le revenue aurais une influence sur la probabilité de
l’événement vote extrême droite est rejeté à nouveau au niveau α=10%. En effet
l’indicateur P-value qui représente la significativité est supérieur à 0,1.

P -

Face à ce résultat, l’on cherche à savoir d’où proviennent de tels résultats, ainsi

qu’une faible significativité sur les nombreuses variables indépendantes de contrôle. Quels
éléments faut-il changer pour améliorer notre modèle ?
P Nous savons que la représentativité de la variable dépendante Y_2 est faible (voir annexe,
schémas 2). En effet, dans la section sur les statistiques descriptives nous avons pu
observer que les répondants à la question Q8A ayant répondu Front National ont une
fréquence de 300 sur une population totale n= 1949. Cette représentativité peut avoir un
effet sur notre modèle. Mais aussi, le faite que la question soit une intention de vote
pourrait jouer sur l’interprétation finale de notre recherche
P Pour améliorer le modèle, nous décidons de changer la variable Y_2, pour la variable Y_3 :
P

Correspondant à la question Q8B : Pour le candidat de quel parti avezvous le plus de chance de voter (législative)
Suite changement de variable dépendante nous espérons avoir une plus grande
cohérence dans les résultats ainsi que de voir apparaître une significativité dans notre
hypothèse de base.

19

Modèle 3 :
Y_3 =

β 0 + β 1 age + β 2 sexe +

β 3 big+ β 4 smal + β 5 I n1 + β 6 I n10+ β 7 e d2 + β 8 e d 9 + β 9 chom+ β10 sec+ β 11 imm
Y_3 = la variable dépendante binomial qui prend les valeurs 1 si Front national et 0 autre,
Le Nombre d'observations lues est de n=1949 qui est égal au Nombre d'observations utilisées :
1949. Il n’y a donc pas d’observations manquantes.
Syntaxe de la régression logistique de modèle probit 3 :
summary(newdata$Y_3)
unique(newdata$Y_3)
dep_FN3<-ifelse(newdata$Y_3=="Rassemblement Bleu Marine (Front National)",1,0)  dummy
newdata["dep_FN3"]<-dep_FN3
probit3<-glm(dep_FN3 ~ age + sexe + big + smal + in_1 + in_10 + ed_2 + ed_9 + chom + sec +
imm, data = newdata, family = binomial(link="probit"))  modèle probit
summary(probit3) )affiche les résultats de la régression

Tableau 6 : Résultats de la régression du modèle 3
variables
(Intercept)
Age
Sexe
Big
Smal
in_1
in_10
ed_2
ed_9
Chom
Sec
imm

Estimate
-2.862211
-0.000146
0.047858
0.463590
-0.079946
0.160120
-3.408716
-3.522438
-3.341413
-0.021833
0.739148
0.417738

Std.error
0.467013
0.008466
0.244463
0.304266
0.295272
0.419982
519.168842
413.593324
415.482680
0.369252
0.315430
0.329697

Z value
-6.129
-0.017
0.196
1.524
-0.271
0.381
-0.007
-0.009
-0.008
-0.059
2.343
1.267

Pr(>|z|)
8.86e-10 ***0.9862
0.8448
0.1276
0.7866
0.7030
0.9948
0.9932
0.9936
0.9529
0.0191 *
0.2051

20

Inférence dans le modèle 3 :
Nous allons Tester avec un risque de 10% l’hypothèse 0 : 1 = 2 = 3 = 4 = 5 ….= 0 (Aucune
des variables explicatives n’a d’effet. Tous les coefficients sont nuls, sauf la constante) contre �
: 1 ≠0
2 ≠0
3 ≠0
4 ≠0
5 ≠0 (Il y a au moins une variable explicative qui a un effet
non nul).

Nombre de ?=12(nombre de paramètres estimés = 11 bêtas (nombre de
variables explicatives) + 1 constante = 12)
n=1949
q=11 (nombre de contraintes)


Tester avec un risque de α=10% la signification de chaque coefficient.
: �
�:

: �
�:

=0

≠0

variable

P­value

significativit
é

Intercep
t

8.86e-10
***-

<

Age 

0.9862

Sexe

0,1

Significatif

On ne rejette pas
niveau α=10%

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

0.8448

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

Big

0.1276

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

Smal

0.7866

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

In_1

0.7030

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

In_10

0.9948

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

Ed_2

0.9932

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

Ed_9

0.9936

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

0

au

21

chom

0.9529

Sec

0.0191 *

imm

0.2051

>

<
>

0,1

Pas
Significatif

On rejette
α=10%

0,1

Significatif

On ne rejette pas
niveau α=10%

0,1

Pas
Significatif

On rejette
α=10%

0

0

au niveau

0

au

au niveau

P - Si les variables ont une p-value supérieure à notre risque de première espèce, elles ne sont
pas statistiquement significatives. C'est-à-dire que la variable indépendante à laquelle ils
correspondent n'a pas d'impact sur la variable dépendante dans ce modèle. Après avoir fixé
la probabilité de rejeter H0 quand H0 vrai à 10%, nous avons pu trouver les variables
significatives et non significatives. A l’aide des précédentes estimations, nous pouvons
alors présenter la causalité suivante :
P
(i) En moyenne, lorsque le répondant choisi la politique intérieure
immigration comme étant la plus importante, l’évènement vote extrême
droite est plus probable.
P l’on peut alors remarquer dans se troisième modèle que l’hypothèse de base de la
recherche selon laquelle l’éducation et le revenue aurais une influence sur la probabilité de
l’événement vote extrême droite est rejeté pour la troisième fois au niveau α=10%. En effet
l’indicateur P-value qui représente la significativité est supérieur à 0,1.

-

Face à ce résultat, l’on cherche à savoir d’où proviennent de tels résultats, ainsi qu’une
faible significativité sur les nombreuses variables indépendantes de contrôle. Quels
éléments faut-il changer pour améliorer notre modèle ?

P Nous savons que la représentativité de la variable dépendante Y_3 est extrêmement faible
(voir annexe, schémas 3). En effet, dans la section sur les statistiques descriptives nous
avons pu observer que les répondants à la question Q8B ayant répondu Marine Le Pen ont
une fréquence de 9 sur une population totale n= 1949. Cette représentativité peut avoir un
effet sur notre modèle. Mais aussi, le faite que la question soit une intention de vote
pourrait jouer sur l’interprétation finale de notre recherche
P Pour améliorer le modèle, nous décidons de changer la variable Y_3, pour la variable Y_4 :
Correspondant à la question 30A : où vous situeriez vous sur une
échelle de 0 à 10, 0 étant l’extrême gauche et 10 étant l’extrême droite.
P
P Suite changement de variable dépendante nous espérons avoir une plus grande cohérence
dans les résultats ainsi que de voir apparaître une significativité dans notre hypothèse de
base.

22

Modèle 4 :
Y_4 =

β 0 + β 1 age + β 2 sexe +

β 3 big+ β 4 smal + β 5 I n1 + β 6 I n10+ β 7 e d2 + β 8 e d 9 + β 9 chom+ β10 sec+ β 11 imm
Y_4 = la variable dépendante binomial qui prend les valeurs 1 si d’extrême droite 0 si
autre, Le Nombre d'observations lues est de n=1949 qui est égal au Nombre d'observations
utilisées : 1949. Il n’y a donc pas d’observations manquantes.
Syntaxe de la régression logistique de modèle probit 4 :
summary(newdata$Y_4)
unique(newdata$Y_4)
dep_FN4<-ifelse(newdata$Y_4=="10",1,0)  dummy
newdata["dep_FN4"]<-dep_FN4
probit4<-glm(dep_FN4 ~ age + sexe + big + smal + in_1 + in_10 + ed_2 + ed_9 + chom + sec +
imm, data = newdata, family = binomial(link="probit")) modèle probit
summary(probit4) )affiche les résultats de la régression

Tableau 7 : Résultats de la régression du modèle 4
variables
(Intercept)
Age
Sexe
Big
Smal
in_1
in_10
ed_2
ed_9
Chom
Sec
imm

Estimate
-1.218171
0.003562
-0.131276
0.041432
0.045798
-0.077491
0.016916
-0.119149
-0.002763
-0.202747
0.631652
1.108581

Std.error
0.130940
0.002413
0.069765
0.116897
0.076081
0.140166
0.336897
0.270387
0.268202
0.097431
0.120804
0.098218

Z value
-9.303
1.476
-1.882
0.354
0.602
-0.553
0.050
-0.441
-0.010
-2.081
5.229
11.287

Pr(>|z|)
< 2e-16 ***
0.1399
0.0599 .
0.7230
0.5472
0.5804
0.9600
0.6595
0.9918
0.0374 *
1.71e-07 ***
< 2e-16 ***

23

Inférence dans le modèle 4 :
Nous allons Tester avec un risque de 10% l’hypothèse 0 : 1 = 2 = 3 = 4 = 5 ….= 0 (Aucune
des variables explicatives n’a d’effet. Tous les coefficients sont nuls, sauf la constante) contre �
: 1 ≠0
2 ≠0
3 ≠0
4 ≠0
5 ≠0 (Il y a au moins une variable explicative qui a un effet
non nul).

Nombre de ?=12(nombre de paramètres estimés = 11bêtas (nombre de
variables explicatives) + 1 constante = 12)
n=1949
q=11 (nombre de contraintes)


Tester avec un risque de α=10% la signification de chaque coefficient.
: �
�:

: �
�:

=0

≠0

variable

P­value

significativit
é

Intercep
t

< 2e-16
***

Significatif

<

0,1

On ne rejette pas
niveau α=10%

Age 

0.1399

>

0,1

Pas
Significatif

On rejette
α=10%

Sexe

0.0599 .

0,1

Significatif

On ne rejette pas
niveau α=10%

Big

0.7230

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

Smal

0.5472

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

In_1

0.5804

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

In_10

0.9600

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

Ed_2

0.6595

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

Ed_9

0.9918

>

0,1

Pas
Significatif

On rejette
α=10%

0

au niveau

<

0

0

au

au niveau

0

au

24

chom

0.0374 *

Sec

1.71e-07
***

<

imm

< 2e-16
***

<

<

0,1

Significatif

On ne rejette pas
niveau α=10%

0,1

Significatif

On ne rejette pas
niveau α=10%

0,1

Significatif

On ne rejette pas
niveau α=10%

0

au

0

0

au

au

P - Si les variables ont une p-value supérieure à notre risque de première espèce, elles ne sont
pas statistiquement significatives. C'est-à-dire que la variable indépendante à laquelle ils
correspondent n'a pas d'impact sur la variable dépendante dans ce modèle. Après avoir fixé
la probabilité de rejeter H0 quand H0 vrai à 10%, nous avons pu trouver les variables
significatives et non significatives. À l’aide des précédentes estimations, nous pouvons
alors présenter les quatre causalités suivantes :
(i) En moyenne, lorsque le répondant choisi la politique intérieure
immigration comme étant la plus importante, l’évènement vote extrême
droite est plus probable. Ici P-value < 0 ***, cette causalité est donc
l’une des plus significatives de notre recherche.
(ii) En moyenne, lorsque le répondant choisi la politique intérieure
sécurité comme étant la plus importante, l’évènement vote extrême
droite est plus probable. Ici P-value < 0 ***, cette causalité est donc
l’une des plus significatives de notre recherche.
(iii) En moyenne, lorsque le répondant choisi la politique intérieure
chômage comme étant la plus importante, l’évènement vote extrême
droite est moins probable. Ici P-value < 0,01 *, cette causalité est donc
significative dans notre recherche.
(iiii) En moyenne, lorsque le répondant est une femme, l’évènement
vote extrême droite est, plus probable. Ici P-value < 0,001 ., cette
causalité est donc très peux significative dans notre recherche.
L’on peut alors remarquer dans se quatrième modèle que l’hypothèse de base de la
recherche selon laquelle l’éducation et le revenue aurais une influence sur la probabilité de
l’événement vote extrême droite est rejeté pour la énième fois au niveau α=10%. En effet
l’indicateur P-value qui représente la significativité est supérieur à 0,1.

Nous arrêterons notre recherche sur le modèle suivant, car il est pour le
moment celui où nous avons observé le plus de causalités entre la variable

25

dépendante et les variables indépendantes. Le modèle créer, n’est
effectivement pas parfait, car la représentativité de la variable Y n’est pas
suffisamment élevé (annexe : graph 4) dans le contexte de notre
problématique. D’autre part la base de donnée utilisée pourrait être améliorée
pour arriver à un modèle scientifique plus élaborer.

Observations graphiques de la significativité du model :
Variable éducation faible (ed_2) :
Le graphique, permet de dire que l’on ne peut observer dans le modèle
suivant de significativité dans la relation de l’éducation et du vote pour
l’extrême droite (pente de la courbe faible ou inexistante)

0.6
0.4
0.0

0.2

vote extreme droite

0.8

1.0

Graphique :

0.0

0.2

0.4

0.6

0.8

1.0

education

Variable revenu faible (in_1) :
Le graphique, permet de dire que l’on ne peut observer dans le modèle
suivant de significativité dans la relation du revenu et du vote pour l’extrême
droite (pente de la courbe faible ou inexistante)
Graphique :

26

1.0
0.8
0.6

vote extreme droite

0.4
0.2
0.0

0.0

0.2

0.4

0.6

0.8

1.0

revenufaible

Variable immigration (imm) :
Le graphique, permet de dire que l’on observe dans le modèle suivant une
significativité lorsque le répondant choisi la politique intérieur immigration
comme étant la plus importante et que cela entraine une hausse de la
probabilité de l’événement vote pour l’extrême droite (pente de la courbe,
lorsque Y augmente, X augmente)

0.6
0.4
0.0

0.2

vote extreme droite

0.8

1.0

Graphique :

0.0

0.2

0.4

0.6

0.8

1.0

immigration

Variable sécurité (sec) :
Le graphique, permet de dire que l’on observe dans le modèle suivant une
significativité lorsque le répondant choisi la politique intérieur sécurité comme
étant la plus importante et que cela entraine une hausse de la probabilité de
l’événement vote pour l’extrême droite (pente de la courbe, lorsque Y
augmente, X augmente)
Graphique :

27

1.0
0.8
0.6

vote extreme droite

0.4
0.2
0.0

0.0

0.2

0.4

0.6

0.8

1.0

sec

Variable chômage (chom) :
Le graphique, permet de dire que l’on observe dans le modèle suivant une
significativité lorsque le répondant choisi la politique intérieur chômage
comme étant la plus importante et que cela entraine une baisse de la
probabilité de l’événement vote pour l’extrême droite (pente de la courbe,
lorsque Y baisse, X augmente)
Graphique :

28

1.0
0.8
0.6

vote extreme droite

0.4
0.2
0.0

0.0

0.2

0.4

0.6

0.8

1.0

chomage

Conclusion :
Pour clôturer l’étude suivante qui avait pour but d’observer l’influence du niveau de revenu
et d’éducation des répondants sur leurs choix de vote, nous développerons de façon très brève les
éléments pertinents à retenir. Le premier des faits qu’il faut retenir est que dans notre recherche
nous avons fait un choix risqué quant à notre choix de modèle de méthodes quantitatives,
puisqu’au lieu de choisir un modèle OLS classique, l’on a pris un modèle PROBIT. Ce choix nous
a permis d’étudier notre problématique de façon binaire, c’est-à-dire que notre variable
dépendante à pour valeur 0 ou 1. D’autre part le fait d’avoir appliqué le modèle suivant ne nous a
pas permis d’appliquer le test de significativité globale du modèle en appliquant le test de Fisher.
Le deuxième élément que l’on pourrait mettre en avant est que, dans cette recherche a été
développé quatre modèles diffèrent dans le but d’arriver à des résultats étant les plus représentatifs
29

possible et le plus de significatifs possible. Le modèle n’est donc pas parfait d’un point de vue
scientifique puisqu’il pourrait être largement amélioré et que la base de données utilisée n’est pas
très représentative, pour cela il faudrait avoir une population plus grande où utilisé une méthode
d’échantillonnage différente comme un échantillonnage aléatoire par grappe. Les conclusions que
l’on peut faire suite au modèle sont que l’hypothèse de base de la recherche selon laquelle
l’éducation et le revenue aurais une influence sur la probabilité de l’événement vote extrême
droite est rejeté au niveau α=10%. En effet l’indicateur P-value qui représente la significativité
est supérieur à 0,1, la thèse soulevée par Nonna Mayer est donc réfutée par le modèle. D’autre part
nous sommes arrivés, à observer les quatre causalités suivantes. La première

étant que en

moyenne, lorsque le répondant choisi la politique intérieure immigration comme étant la plus
importante, l’évènement vote extrême droite est plus probable. Ici P-value < 0 ***, cette causalité
est l’une des plus significatives de notre recherche. La seconde est que en moyenne, lorsque le
répondant choisi la politique intérieure sécurité comme étant la plus importante, l’évènement vote
extrême droite est plus probable. Ici P-value < 0 ***, cette causalité est aussi l’une des plus
significatives de notre recherche. La troisième est, en moyenne, lorsque le répondant choisi la
politique intérieure chômage comme étant la plus importante, l’évènement vote extrême droite est
moins probable. Ici P-value < 0,01 *, cette causalité est donc significative dans notre recherche. La
dernière montre qu’en moyenne lorsque le répondant est une femme, l’évènement vote extrême
droite est, plus probable. Ici P-value < 0,001 ., cette causalité est donc très peux significative dans
notre recherche. Ses conclusions sont à vérifier de façon plus scientifique, ici nous n’affirmons
rien, ce sont seulement des suppositions tirées de notre modèle. Pour pouvoir affirmer des
conclusions sur le sujet il nous faudrait améliorer le modèle et le rendre plus scientifique. La
recherche pourrait se préciser sur la variable immigration qui est aussi une thèse que l’on retrouve
dans la littérature scientifique « 96 % des électeurs qui ont choisi Le Pen au premier tour
estiment qu’il y a « trop d’immigrés » » Nonna Mayer.

BIBLIOGRAPHIE :
Liens internet :

http://www.lexpress.fr/actualite/politique/moins-on-est-eduque-plus-onvote-fn_1100733.html

http://www.cairn.info/revue-francaise-de-science-politique-2002-5-page505.htm
30

http://ifmt.auf.org/IMG/pdf/Qu_est-ce_qu_une_regression_logistisque__Rev_Mal_Respir_2005_22_159-162.pdf

http://r.789695.n4.nabble.com/GLM-problems-td819635.html

http://www.columbia.edu/~so33/SusDev/Lecture_9.pdf

http://stats.stackexchange.com/questions/86351/interpretation-of-rsoutput-for-binomial-regression

ANNEXE :
Graph 1 :

31

400
300
200
100
0

0

Fran.ois Bayrou

Marine Le Pen

Nicolas Sarkozy

0

100

200

300

400

Graph 2 :

0

Front de Gauche

Ne sait pas

Parti Socialiste

Graph 3 :

32

1500
1000
500
0

0

Front de Gauche

Ne sait pas

Parti Socialiste

0

50

100

150

200

250

300

350

Graph 4

0

1

10

2

3

4

5

6

7

33