You are on page 1of 8

JADT 2000 : 5es Journes Internationales dAnalyse Statistique des Donnes Textuelles

Les facteurs de choix et dutilisation de logiciels dAnalyse


de Donnes Textuelles1
Mathieu BRUGIDOU*, Caroline ESCOFFIER*, Helka FOLCH*,
Saadi LAHLOU*, Dominique LE ROUX*, Patricia MORIN-ANDREANI*,
Grald PIAT*
*EDF- Ple Industrie - Division Recherche et Dveloppement,1 avenue du Gnral de Gaulle,92141
CLAMART Cdex, Fax : 01.47.65.57.00, Contact : dominique. Le-roux@edf.fr

Summary
Several programs are at present available on the French market for assisting the qualitative tasks of the analyst.
The purpose of this paper is not to compare their different theoretical characteristics and facilities nor to
identify their strengths and limitations. This has been already been recently well done [JEN97]. Here, we intend
to present the point of view of the user making his choice between all these programs according to his own
ability, the caracteristics of the study he is undertaking, the research hypothesis, the type of corpus, and so on.
First, we propose a schedule representing the users choice factors from our own experience of computerized
textual analysis. Secondly, we will illustrate this schedule by rapidly presenting studies carried out on different
types of textual material with the help of various programs such as ALCESTE, TROPES, DISCURSUS, ATLASTi... Finally, we will present the developments which are planned for a better management of methods and
programs.

Rsum
Plusieurs logiciels danalyse textuelle sont actuellement disponibles sur le march franais. Le but de cet article
n' est pas de comparer leurs diffrentes caractristiques et quipements thoriques ni d' identifier leurs forces et
leurs limites. Nous prsenterons plutt le point de vue de l' utilisateur essayant de choisir entre les diffrents
logiciels, en fonction de ses connaissances, des caractristiques de l' tude, de ses hypothses de recherches, etc.
Aprs avoir caractris les diffrents types dtudes menes au GRETS, nous essaierons de mettre en vidence
les diffrentes stratgies en matire de choix instrumental et nous prsenterons rapidement les perspectives.

Mots-cls : Analyse automatise des donnes textuelles, Analyse du discours, Atelier logiciel

1. Introduction
Quels sont les facteurs de choix de logiciels danalyse textuelle ? Lanalyste se contente-t-il de
prendre loutil quil a sous la main, celui dont il a une pratique peu prs correcte ? Nous
avons fait le pari de dpasser cette hypothse minimaliste, et pourtant parfois vrifie, pour
poser la question suivante : existe-t-il, au-del dun empirisme apparent, des stratgies
implicites mises en oeuvre par les utilisateurs pour faire concider, propos dune tude, les
quatre dimensions complmentaires constitutives dune tude que sont : la reprsentation de la
langue, la reprsentation du discours, la dimension statistique, la dimension instrumentale et
exprimentale ? Sans vouloir donner, bien entendu, des rponses dfinitives, on se propose
ici dexposer le tmoignage dune quipe pluridisciplinaire de recherche en sciences sociales
dans une entreprise. Le contexte de lanalyse textuelle en entreprise est tel que de nombreuses
contraintes psent sur sa pratique comme les dlais qui peuvent rendre difficiles le recul
1

Les auteurs tiennent associer ce travail Isabelle Blot, Jean Vidal et Gro Waeraas de St Martin qui ont activement
particip la diffusion de lanalyse textuelle au GRETS.

JADT 2000 : 5es Journes Internationales dAnalyse Statistique des Donnes Textuelles

thorique et le test de diffrents outils et, en ce qui nous concerne, la ncessit de sadapter
des problmatiques trs varies. Conscients des limites de notre pratique, nous ne prtendrons
donc pas ni rendre compte dune utilisation exhaustive des outils existants sur le march, ni
recenser les diffrents points de vue thoriques ayant prsid llaboration des logiciels
dassistance lanalyse de contenu et de discours disponibles pour le chercheur2. En revanche,
il nous a paru utile parce que peu frquent, deffectuer une prsentation du point de vue dun
collectif de praticiens travaillant dans un domaine de connaissance htrogne et dont les
expriences diversifies permettent dapprhender la complexit des paramtres qui
interviennent dans le choix dun logiciel.

2. Contexte dune pratique de lanalyse textuelle


2.1. Une cellule de sciences humaines au sein de lentreprise
Les auteurs de ce papier appartiennent tous une cellule sciences humaines de la Division
Recherches et Dveloppement (le GRETS), qui traite principalement la demande de clients
internes, des sujets aussi varis que la veille sociale au sein de lentreprise, les volutions
organisationnelles et lvolution des mtiers, limpact dEDF sur lenvironnement, les
produits et services lis llectricit... Cette pluralit des thmes traits induit une pluralit
des approches disciplinaires : sociologues, psychosociologues, politologues, ethnoanthropologues, linguistes, smiologues, statisticiens... forment lquipe de travail.
Lintroduction doutils logiciels sest effectue, dabord dans le domaine des tudes
quantitatives, puis dans le champ des tudes qualitatives en commenant par le traitement des
rponses des questions ouvertes. Nous ne bnficions pas proprement parler dun atelier
logiciel intgr et disponible tous les chercheurs et analystes du GRETS. La ralit de
notre travail est beaucoup plus artisanale et nous oblige mettre bout bout des outils
dans un chane de traitement dont certains maillons ne sont pas relis. Dans une logique
essentiellement opratoire, le GRETS a procd, dans un pass plus ou moins rcent, des
tests valuatifs de logiciels de nature diffrente parmi lesquels : SPAD-T, Moda Lisa,
Termino, Prospero. Actuellement, les principaux outils utiliss dans le cadre de nos tudes
sont, pour des usages diversifis, Alceste, Tropes, Atlas-ti dans la famille des CAQDAS3 et
deux outils ad hoc, dvelopps dans le cadre dun partenariat avec IBM, Discursus et ATAL).
2.2 Caractrisation des tudes effectues (cf. tableau en annexe)
La grille qui suit est le fruit dun effort de mise plat des diffrents critres intervenant dans
la caractrisation dune tude et qui vont orienter un choix instrumental :
Dfinition de la problmatique : Type dtude : prestation pour un client interne ou travail de
prospective ou de recherche applique ; Objectifs de lanalyse : dfinition des objectifs de ltude, des
prsupposs, des hypothses, des moyens mettre en oeuvre, de la mthodologie de travail .
Profil de lanalyste : un / multiple (en fonction des modes de partage du travail : dfinition du
questionnaire, recueil des donnes, analyse des donnes...) ; discipline dorigine et rfrentiel thorique ;
limites de lanalyste : facteurs de contraintes quant au choix et la pratique dun outil ; manque dinformation sur
les outils existants, enfermement dans un type dapproche unique.
Mode de constitution dun corpus : Type danalyse : analyse primaire partir de matriaux ad hoc;
analyse secondaire partir de matriaux produits indpendamment du cadre de ltude ; Type de corpus :
2

Une excellente prsentation a dj t effectue, de manire rcente [JEN97], des points de vue thoriques ayant prsid
llaboration des logiciels dassistance lanalyse de contenu et de discours disponibles pour le chercheur.
3
Computer Aided Qualitative Data Analysis Systems.

JADT 2000 : 5es Journes Internationales dAnalyse Statistique des Donnes Textuelles

taille (nombre de textes), degr dhomognit du corpus ; Type de texte : entretiens, questions ouvertes, articles
de presse, publicits, courrier...

Type de traitement en fonction des rsultats attendus : Classer des textes ou de fragments de
textes ; Extraire des informations ; Effectuer une synthse ; Effectuer linventaire des thmes traits ; Enrichir
un corpus de commentaires et de codes.

Lexprience montre que ces diffrents facteurs ne se situent pas au mme niveau et sont en
perptuelle interaction. Nous avons remarqu, de manire empirique, limportance de la
formation initiale et de la famille thorique de lanalyste sur le choix dun outil. Nous
avons recens de nombreuses pratiques de dtournement par rapport aux objectifs initiaux de
loutil (dfinis en terme de spcifications la fois techniques et thoriques). Plus
classiquement, on notera des niveaux dusage la plupart du temps en de de lusage idal
prvu par le concepteur.

3. Existe-t-il des stratgies implicites en matire de choix instrumental ?


Au cours de notre effort, parfois laborieux, en raison de la complexit des critres en prsence,
de mises plat de stratgies des analystes en matire de choix instrumental, nous avons
retenu deux points importants :
de quelle manire lanalyste essaie-t-il de faire concider la reprsentation de la langue,
celle du discours, la dimension statistique, avec la dimension exprimentale lie au choix dun
instrument ?
quels garde-fous peut-on faire appel pour parer aux drapages interprtatifs en
puissance quel que soit le type dapproche retenu ?
3.1. Quel niveau danalyse appliquer quel type de texte ?
Notre quipe a eu traiter des types de corpus varis dont il serait naf de chercher tablir la
typologie tant est grande la complexit des paramtres en prsence, profondment imbriqus.
Etablir une typologie de textes relve toujours, comme le note Habert [HAB98] dun
bricolage. Il nous parat nanmoins important de lister quelques-uns de ces paramtres dans
la mesure o ils ont ncessairement une forte influence sur le type danalyse quon peut leur
appliquer :
le canal de communication : crit ou retranscription dun discours oral plus ou moins
respectueuse de lmission initiale. A ce propos, on peut faire trois types de remarques :
Les corpus disponibles sont pour des raisons pratiques le plus souvent des corpus crits.
Lanalyse des discours des acteurs internes privilgie ainsi des prises de positions plus ou
moins institutionnelles (presse interne, tracts, communiqus etc.). Les paroles dagents, par
exemple, sont le plus souvent issus de dispositifs de recueils ad hoc (entretiens lors denqute
sociologique, runions internes etc.).
On sait par ailleurs que la communication orale est en gnrale moins structure
(notamment dun point de vue thmatique) quune intervention crite. Lanalyse thmatique
des entretiens montre une trs forte redondance et une structure en boucle qui est
caractristique des rcits oraux. La rptition, sous la forme dune rptition littrale ou bien
anaphorique, agit comme un moyen de pallier les insuffisances de la mmoire, et constitue un
outil privilgi de la production de la cohrence interne et squentielle du rcit. Par ailleurs, la
structure syntaxique de loral nest pas la mme que celle de lcrit.
Enfin, le mode de retranscription de loral peut impliquer la rcriture de certains mots ou
certaines phrases (style prise de notes, erreurs manifestes de retranscription...). Une de nos
premires proccupations est de dcider partir de quel moment et jusquo simpose le

JADT 2000 : 5es Journes Internationales dAnalyse Statistique des Donnes Textuelles

nettoyage dun corpus. La solution la plus rigoureuse qui consiste ne rien modifier est trs
rarement satisfaisante.
la sphre de communication : communication prive (entretiens, lettres de rclamation),
interne lentreprise (discours syndicaux et directoriaux), sociale, culturelle et
politique (coupures de presse). Par exemple, dans le cas de prises de paroles retranscrites dans
le cadre de compte-rendu de runions internes plusieurs facteurs font que le corpus ne peut en
aucun cas tre confondu avec des paroles dagents pris individuellement. Il fait tat dans le
meilleur des cas dune parole collective, organise.
la longueur du texte : du niveau du syntagme parfois, (rponses des questions ouvertes)
jusquau texte de plusieurs pages.
le niveau de complexit de lencodage linguistique en ce qui concerne lorganisation
syntaxique, linventaire lexical, la prsence dventuels procds rhtoriques ;
le niveau de complexit des thmatiques abordes et de leur articulation. La plupart des
outils ont notamment pour objet didentifier les thmatiques Par exemple, lanalyse avec
Alceste dun corpus de presse ou dentretiens fait apparatre des thmes ; il est videmment
intressant didentifier les articulations, et les schmes (notamment idologiques) qui sont au
principe de ces articulations (par exemple, dans les discours syndicaux, lopposition entre les
riches et les pauvres etc.). Or ni lunit retenue (forme graphique, lemme etc.), ni la
qualification de la relation (base sur la distance : cooccurrence, opposition etc.) ne sont tout
fait adaptes ce type danalyse. Par ailleurs, certains logiciels de type CAQDAS (ou des
logiciels comme Prospero) permettent de manipuler des units non-linguistiques ou du moins
des units qui sont htrognes de ce point de vue : ce ne sont en effet ni des lemmes, ni
phrases mais des paragraphes, des propositions ou des mots dfinis sur des critres
smantiques (bref des notions). Ces mmes logiciels permettent de qualifier la relation
identifie autrement que dun point de vue statistique (corrlation) ou mme grammatical.
Toutefois, on entre ici dans un processus dinterprtation qui est assez peu formalis : les
indicateurs linguistiques notamment sont peu sollicits.
le mode de structuration du texte : dialogue orient par un meneur de jeu (le sociologue,
muni dune grille dentretien), dbat de groupe, texte argumentatif... Le statut des acteurs est
dterminant en ce qui regarde linterprtation et la constitution du corpus : par exemple, pour
ltude dun corpus de retranscriptions de runions internes, les remarques du rapporteur sur
lambiance de la runion nont videmment pas le mme sens que les propos des participants
quil est cens rapporter : mme si le clivage nest pas toujours si net.
la fonction de communication dominante : fonction motive dans les rcits de vie des
agents ou des utilisateurs interviews, fonction rfrentielle dans les textes de presse interne
ou externe, fonction conative dans les tracts et discours syndicaux...
le statut des acteurs de la communication dterminant quant au choix des actes de parole :
locuteur parlant au nom dune structure ou sexprimant en son nom propre, metteur et
rcepteur clairement identifis ou dissimuls derrire une structure anonymisante. On sait par
exemple que les rponses sont conditionnes par la nature des commanditaires dune enqute
(interne / externe) et la relation de subordination entre commanditaire et enquts : absence
suppose danonymat, questionnaire utilis des fins revendicatives ou modulations des
rponses en fonction des consquences directes envisageables sur la situation du rpondant
(salaires, charge de travail, etc.).

JADT 2000 : 5es Journes Internationales dAnalyse Statistique des Donnes Textuelles

Face ces matriaux, constitus en corpus en fonction de la dfinition dun objectif de


recherche (dans la plupart des cas labore avec le commanditaire de ltude), il est du ressort
de lanalyste de dterminer le niveau danalyse auquel il prtend oprer et quel type de
questionnement il entend soumettre les textes :
niveau lexico-smantique : inventaire lexical et terminologique du corpus trait,
laboration dun rseau de notions ;
niveau de construction syntaxique et textuelle : tude des connecteurs et des marques de
progression thmatique, des marqueurs nonciatifs, notamment les dictiques comme
rfrence aux interlocuteurs, au temps et lespace du discours, des marqueurs dactes de
discours (forme assertive, interrogative, imprative, reprise dans un dialogue..), processus
vise rhtorique de focalisation et de thmatisation...
niveau extra-linguistique : prise en compte du smantisme propre la structuration
physique du texte, couplage avec des donnes sur le contexte de communication (notes du
sociologue sur le droulement dun entretien), ou des donnes socio-dmographiques sur
lmetteur du discours.
Les diffrents outils notre disposition noprent pas tous sur les mmes types dobjets et
noffrent pas tous, quelle que soit la nature des outils utiliss (approche statistique,
linguistique ou mixte) et dans ltat actuel de leur dveloppement, les mmes possibilits
danalyse, laissant lutilisateur le soin de dpasser les rsultats fournis en approfondissant
la main certains niveaux danalyse :
certains outils, relevant dune approche de type lexicomtrique, proposent lanalyste le
calcul des frquences doccurrence des mots dun corpus et llaboration de classes fondes
sur ces dernires comme support de linterprtation. Dans ce cas, ce sont les traitements de
donnes qui guident linterprtation. Certains logiciels appartenant cette famille oprent au
niveau de la forme graphique, dautres tentent dapprocher la notion de lemme au travers
dune simplification de la rduction morphologique.
un autre type dapproche est celui offert par les outils proposant un inventaire
terminologique du texte analys ; dans ce cas, il y a une prise en compte de ce qui est
approch dans lanalyse lexicomtrique au travers des segments rpts mais seulement
partir dune frquence dapparition suffisante. Des outils tels que ATAL (prototype IBM) ou
Termino (actuellement Nomino) permettent, partir de constructions syntagmatiques figes
ou en voie de figement terminologique de dcrire le paysage notionnel ou ses volutions dans
le temps dun domaine dtude.

dautres outils, comme Tropes, effectuent une analyse smantique (de classification, de
visualisation et de surlignage des composants smantiques de diverses natures.
3.2 A quels garde-fous faire appel pour parer aux drapages interprtatifs ?
Le risque de drapages se pose en analyse textuelle comme dans dautres types dtudes mais
les donnes textuelles se prtent sans doute davantage aux projections interprtatives.
Dans tous les cas de figure, lanalyse produite est insparable des conditions de production
des donnes, cest--dire lensemble des choix oprs par lanalyste chaque tape de ltude
(constitution du corpus, choix du logiciel et de ses paramtres). A ce titre, les points voqus
dans le paragraphe prcdent nous semblent constituer autant de garde-fous considrer tout
au long du travail. De faon plus prcise, les possibilits de contrle quoffrent les diffrents
logiciels que nous utilisons sont diverses. Alceste laisse la possibilit de procder des

JADT 2000 : 5es Journes Internationales dAnalyse Statistique des Donnes Textuelles

analyses multiples pour lesquelles ne varient que peu de paramtres : la robustesse des
rsultats est donc vrifiable. En revanche, si elles rendent ce logiciel particulirement
transparent, la multiplicit des rsultats quil produit et laccessibilit de ses dictionnaires ne
constituent pas pour autant des garde-fous automatiques. Tropes, bien que plus opaque, offre
par exemple la possibilit de contrler et de modifier partiellement les univers de rfrence
quil propose. Atlas-Ti, selon le principe des CAQDAS noffre pas le type de mise distance
et dobjectivation propos par exemple par Alceste : le codage, laiss aux soins de lanalyste
et faiblement assist par quelques outils simples de recherche de chanes de caractre, est
demble forcment interprtatif , ce qui confre au processus danalyse un caractre
hyperprojectif . On peut craindre quune telle analyse top-down ne permette aucune
rsistance des matriaux et ne conduise qu retrouver la confirmation naturelle des
hypothses poses par le chercheur. Or, lexprience montre que ces outils offrent bien, une
possibilit de dcouverte et de surgissement ( serendipity ) de notions nouvelles capables
dorienter la construction progressive de la thorie. La possibilit de tenir un journal de bord
de lanalyse ainsi que de partager le codage des donnes plusieurs sont galement autant de
garde-fous des interprtations trop projectives. Par ailleurs, sil nexiste pas de rgles
standardisant la dfinition des catgories dans un outil tel quAtlas-ti, ce qui fait la puissance
dAlceste, en revanche, la libert laisse lutilisateur et la souplesse de loutil, lui permet
daugmenter la finesse de lanalyse.

4. Les perspectives
Lexprience du GRETS montre que deux moments importants de lanalyse des donnes
textuelles ne peuvent tre dissocis : dune part, nous considrons que les textes constituent
bien des donnes et quils sont donc de ce fait justiciables de processus dobjectivation et
de formalisation, dautre part, que ces mmes textes sont le fruit dintention signifiante de la
part des acteurs et lobjet de parcours interprtatif de la part de lanalyste. La double
attention porte au texte comme donne (i.e des units textuelles fruit dun processus de
rduction et de formalisation qui peuvent tre comptes) et comme interprtation rpond
deux traditions de la sociologie mais aussi de la linguistique reprsente au GRETS. Cette
position rend compte des choix du GRETS en terme de logiciels et de capitalisation.
Lexprience du GRETS montre en effet la ncessit pratique de recourir diffrents logiciels
en fonction des problmatiques trs diversifies (types de donnes, objectifs etc.) traits par le
dpartement et du profil des utilisateurs (et de leurs horizons thoriques en particulier) et
surtout davoir recours des logiciels de la famille de lAnalyse de Donnes textuelles
(standardisation de la construction de la donnes, formalisation des traitements pour
assurer notamment le caractre cumulatif des rsultats) comme aux CAQDAS (prise en
compte des processus interprtatifs dans la construction de la donne).
La politique de capitalisation qui a t mise en uvre sappuie sur deux projets :
- Le projet Verbatim est spcifiquement consacr la capitalisation des entretiens qualitatifs
en vue de pratiquer des analyses secondaires. Ici, on sintresse particulirement la
standardisation de larchivage des entretiens [LER00]. Cette base de donnes nous permet de
runir le descriptif signaltique de ltude, les entretiens effectus au cours des tudes
qualitatives, les rsultats obtenus lissue de leur dpouillement.
- le projet Scriptorium , ddi des donnes textuelles htrognes, vise construire des
collections de corpus textuels en accroissement permanent. Ces documents sont dcrits par
une DTD4 permettant dassocier chaque fragment de texte une tiquette contenant le
4

Description of textual data, drive de la text Encoding Initiative.

JADT 2000 : 5es Journes Internationales dAnalyse Statistique des Donnes Textuelles

signaltique du texte. Lobjectif de Scriptorium tant deffectuer du profilage de corpus, il


sagit de procder des extractions homognes en fonction de certains critres qui sont
galement modliss par une DTD permettant de renseigner sur le contexte de lextraction.
Enfin, un troisime niveau de codage correspond aux rsultats de lanalyse, permettant ainsi
denrichir le corpus. Cest en effet parce que les points de vue (et donc les interprtations)
sur le texte sont multiples mais toujours susceptibles dune objectivation, quil est ncessaire
dassurer la traabilit et la rtro-projection des rsultats des analyses vers les documents
dorigine.

Rfrences
1.Rfrences externes
[BLO94] BLOT, I.; HAMMER, B.; LE ROUX, D. (1994) Traitement des questions d' opinion
Revue
"ouvertes" : utilisation d' Alceste, outil d' assistance l' analyse
- ICO Qubec ; 6. (1 & 2)
[BRU99] BRUGIDOU, M. ; LE QUEAU P. Les rafales , une mthode pour identifier les diffrents
pisodes dun rcit - BMS - Bulletin de Mthodologie Sociologique, n64, octobre 1999, p 49 81.
[FIE91] FIELDING, N.G. & LEE, R.M. (ds); (1991) Using Computers in Qualitative Research ;
Londres : Sage Publ.
[GUI98] GUIGLIONE, R. ; LANDRE, A. ; BROMBERG, M. ; MOLETTE, P. ; Lanalyse
automatique des contenus, 1998, Paris Dunod, 156 p.
[HAB98]; HABERT, B., FABRE, C. , ISSAC, F. (1998) De lcrit au numrique : constituer,
normaliser et exploiter les corpus lectroniques; Paris Masson ; 320 p..
[JEN97] JENNY, J. (1997) Mthodes et pratiques formalises danalyse de contenu et de discours
dans la recherche sociologique franaise contemporaine : tat des lieux et essai de classification ;
Bulletin de mthodologie sociologique (BMS) ; 54; pp.64-112.
[LEG95] LEGRIS-DESPORTES, C. (1995) Semiotic analysis concerning the communication about
the electric vehicle, in 12th international electric vehicle symposium ; Los Angeles
[LER00] LE ROUX, D. (2000) Verbatim : une exprience de capitalisation dentretiens qualitatifs BMS - Bulletin de Mthodologie Sociologique, n65, paratre.
[LAH95] LAHLOU, S. (1995) Vers une thorie de linterprtation en analyse statistique des donnes
textuelles, in JADT 1995 ; vol II pp. 221-227
[REI95] REINERT, M. (1995) Quelques aspects de choix des units danalyse et de leur contrle
dans la mthode Alceste, in JADT 1995 ; vol I p.27-34
2. Choix de notes internes EDF
AMAR, M. - Assistance automatise lexploration textuelle : prsentation du progiciel Termino,
systme de dpouillement terminologique assist par ordinateur - 1992 - -Note interne EDF-DER
HN-52/5/92/040
BRUGIDOU M. - LABBE D. .- Le discours syndical CGT - CFDT - FO en 1996 et 1998- 1999 Note
interne EDF-DER HN-51/99/013
BRUGIDOU, M.; ESCOFFIER, C. - L' avenir des mtiers clientle : runions prparatoires la
vidotransmission du 21 janvier 1999: analyse de discours - Note interne EDF-DER HN-51/99/015
HAMMER, B.; LE ROUX, D. - Enqute interne "Vous et votre Entreprise" 1992 : analyse des
rponses aux questions ouvertes - 1993 - Note interne EDF-DER HN-52/93/032
LAHLOU, S. - La construction du sens dans l' analyse statistique de donnes textuelles : thorie et
mthodologie illustres par deux analyses - 1995 - Note interne EDF-DER HN-51/95/012
LEMOINE, J-C. - VVE 1995 Analyse des rponses la question ouverte Q45 : "Pour vous, qu' est-ce
que la mission de service public ?" - 1997 - - Note interne EDF-DER HN-51/97/012
PIAT, G. - Spcifications et fonctionnement de l' application d' aide l' analyse de discours
DISCURSUS - 1996 - Note interne EDF-DER HN-52/96/025

thmes rcurrents

primaire

de 10 10000 lettres

lettres

socio linguiste /
smiologue

expression affective
et lments objectifs

connaissances des enjeux


sociaux et politiques, des
stratgies des
connaissance du domaine
organisations syndicales
commercial

oui

oui

oui

oui

Discursus

objectifs

type danalyse

type de corpus

type de texte

analyste

limites de lanalyse

classification de
textes

inventaire thmes

structures
thmatiques

croisement
extralinguistique

logiciel

discours dvelopps

interne

Comptes-rendus de runion

Alceste

oui

oui

oui

connaissance de lentreprise

statisticien

rponses de 3 50 mots

7000 rponses

primaire

Alceste Tropes

oui

oui

oui

connaissance des mtiers

conditions de constitution du
corpus inconnues

statisticien / politologue

oral et crit

86 comptes-rendus

secondaire

caractrisation de sousenjeux des dbats


population dans lentreprises
caractrisation gographique

reprsentations

interne

Questions ouvertes de
lenqute Vous et Votre
Entreprise

Atlas Ti

oui

oui

qualit de la capitalisation
connaissance du domaine

analyse secondaire

linguiste

vari

45 rapports et entretiens

secondaire

test des analyses secondaires

pr tude

lien entre dsaffection pour


la climatisation et sant

interne

Climatisation et sant

Tropes

oui

oui = relation entre les


thmes/ analyse
synchronique (*)

oui

non

Difficult de comparer
diffrents entretiens.

sociologue/politologue

entretiens

Une quinzaine dentretiens

primaire

Mthodologie danalyse des


entretiens. Identification des
diffrents pisodes dun rcit
de vie et de leur articulation
dans une intrigue

externe/ recherche interne

Entretiens de fumeurs avec le


CREDOC

*Analyse synchronique : dans un texte homogne comme un entretien non-directif ou un discours lidentification dune srie de termes rpts en mme temps de manire importante dans une
courte squence de texte (i.e des rafales ) permet de mettre en vidence les paquets de sens qui constituent des pisodes. En suivant ces rafales de termes, on peut esprer reprer les
ruptures thmatiques (fin dune srie de rafales), les passages o les fils du rcit se dnouent cependant quun nouveau thme (ou pisode ici) est dvelopp (nouvelle srie de rafales).
Lalgorithme des rafales a t intgr dans le logiciel danalyse smantique TROPES. [BRU99].

Alceste, Tropes

oui

oui

oui

sociologue, politologue

ditoriaux

200 articles

primaire

identification de
thmatiques et de
rhtoriques syndicales

interne

interne

commanditaire

Les ditoriaux de la presse


syndicale

Lettres de rclamation

Etudes

Annexe : tableau illustratif des diffrents types dtudes traits par le GRETS.