You are on page 1of 6

Pratiquer la veille multilingue en 4 étapes et 15 outils linguistiques

Christophe Deschamps
www.outilsfroids.net

Dire que Google Reader permet de faire de la veille multilingue grâce à ses fonctions de
traduction automatique c'est une chose, le démontrer c'est mieux. Il ne s'agit en effet
pas seulement de récupérer un flux rss dans une langue étrangère et de cliquer sur le
bon bouton. Ca c'est la dernière étape :-)
Je vous invite donc à un petit exercice pratique et j'ai choisi à cet effet un thème de
veille volontairement complexe et d'actualité : Que dit la presse russe des positions
françaises durant et après le sommet UE - Russie?

Sujet compliqué car :

1 : j'ai fait un peu de russe mais c'est tellement loin que je décrypte à peine 50% de
l'alphabet cyrillique (et que je comprends à peu près 1% de ces 50% ...)
2 : c'est une langue à déclinaison qui pourrait poser pas mal de problèmes lorsqu'il
s'agira de surveiller un mot-clé puisqu'on le retrouvera avec un nombre incalculable de
terminaisons. Enfin si calculable mais bon... je n'ai pas vraiment le temps de me
replonger dans la grammaire russe actuellement. Ceci nous apprend toutefois une
première chose essentielle : lorsque l'on veut faire de la veille dans un langue
précise il faut s'intéresser un minimum à sa construction grammaticale : si vous
choisissez un mot dans une forme qui n'est jamais utilisée, sinon par les dictionnaires,
vous pourriez ne pas avoir de résultat. Heureusement Google News, grâce lui soit rendu,
a pensé à tout et propose dans ses résultats les variantes d'un même mot (pluriel/
singulier, masculin/féminin, et donc les déclinaisons. Cette possibilité relativement
récente et très gênante lorsque l'on recherche un mot précis s'avère ici d'une grande
utilité.

Précision : il est évident que cet article ne prétend pas faire le tour de la question. Dans
un processus de veille réel, pour une entreprise par exemple, il s'agirait d'une simple
phase de démarrage. Sachant que les mots-clés choisis ici seront ensuite optimisés en
fonction des résultats obtenus. La veille c'est forcément itératif et personne ne peut
prétendre arriver d'emblée avec un système parfait.

1 - Première étape : choisir ses mots-clés.

Il s'agit ici de choisir les mots-clés que vous allez lancer dans les moteurs. Je ne
détaillerai toutefois pas cette étape puisqu'elle n'est pas spécifique à la veille multilingue.
En deux mots il s'agira par exemple de trouver les synonymes d'un mot-clé ou encore de
le préciser par un second mot (ex : intelligence + économique), ou au contraire d'en
étendre la portée par des concepts associés (ex : les termes "veille" ou "lobbying" sont
très souvent associés à l'expression "intelligence économique").

Notre exemple : dans notre cas nous nous contenterons du mots-clé "français". Nous
partons en effet du principe qu'on pourra le retrouver dans des expressions telles que "le
président français" ou "les français pensent que". Le conseil le plus important lorsqu'on
fait de la veille sur internet c'est de toujours chercher à se mettre dans la peau de la
personne susceptible d'avoir écrit l'article qui nous intéresse afin d'imaginer les
mots-clé qu'elle aurait pu utiliser. C'est pas très scientifique ça me direz-vous? Non. La
veille c'est 80% d'instinct (je vous renvoie à ma thèse préférée sur le sujet :
Explorateurs-chasseurs-cueilleurs du web) et 20% de savoirs-faire.

2 - Deuxième étape : traduire ses mots-clés

Traduire les mots-clés choisis est à première vue facile. Les services de traduction
automatique sont en effet légion sur le web. Toutefois le fait qu'ils ne proposent souvent
qu'une seule traduction pour un mot est un piège qu'il nous faudra contourner. Nous
savons tous en effet qu'un même mot peut avoir de nombreux sens dans une langue :
un mousse, une mousse (bière), de la mousse (végétale ou autre). Comment faire le
bon choix?
Simple, il va falloir, en plus du traducteur automatique, trouver un dictionnaire de cette
langue proposant des définitions traduites dans une autre que vous comprenez, ceci
afin de valider le sens de votre traduction.
Euh non, pas si simple en fait mais bon j'ai un peu farfouillé :-)

Services de traduction automatique (pratiques mais insuffisants) :

• Google Translate
• Babylon translator
• Promt/ Reverso traduction
• Systran box
• Fagan translation wizard (agrégateur de services de traduction automatique) :
excellent sur le principe mais pas toujours à jour.
• Foreignword (agrégateur de services de traduction automatique) : même
remarque avec une interface moins bien pensée.

Dictionnaires de définitions bilingues (très bien mais on y trouve pas toujours


les langues dont on a besoin), à privilégier toutefois quand c'est possible :
• Freelang : série de dictionnaires français - étranger (et inversement) en ligne
mais que l'on peut aussi télécharger.
• Logosdictionary : le meilleur selon moi.
• PanImages : service de recherche qui traduit directement vos mots-clés après
désambiguïsation. Lance votre requête traduite dans Google Images et Flickr.
Excellent aussi.
• Reference translate : uniquement pour l'anglais.

Plugins Firefox :
• Foxlingo : indispensable barre d'outils, le couteau suisse de la traduction en
ligne.
• Quick translation : indispensable barre d'outils, le couteau suisse de la traduction
en ligne (ah tiens je l'ai déjà dit)

Sites de ressources sur la traduction :


• Foreignword
• Page de l'Université d'Austin, régulièrement mise à jour

Autre solution pour valider le sens d'un mot étranger : ce que j'appelle la validation
visuelle, vous allez voir c'est simple : mettons que vous vouliez mener une veille sur le
mot "éléphant" dans la presse chinoise (quoi y a pas d'éléphants en Chine et alors?
M'étonnerait bien qu'il y en ait pas quelques-uns qui traversent la frontière avec l'Inde
de temps à autres), donc je disais :
1. Vous traduisez le mot "éléphant" dans Google translate et obtenez ceci : 大象
2. Afin d'être sûr que cet idéogramme ne désigne pas les éléphants de mer ou ceux
du parti communiste chinois, vous aller le copier-coller dans Google Images
version chinoise. Vous tatonnez un peu pour trouver le bouton "Rechercher"et
finissez par obtenir une page de résultats pleine de beaux éléphants (cf. ci-
dessous), pas de mer et pas communiste (quoique j'avoue ne pas bien connaître
le système politique des éléphants). Voilà, vous êtes maintenant sûr que votre
mot est le bon. Evidemment cette méthode fonctionne bien pour les animaux,
objets et personnes célèbres, mais beaucoup moins pour les concepts, essayez
avec "phénoménologie" pour voir (le pire c'est qu'il y a quand même 12400
résultats, ou comment la philosophie par l'image :-).
Notre exemple : le mot français a été traduit et désambiguïsé avec Logos Dictionnary.
Le résultat : "французский" qui doit se lire à peu près "françuski".
Mais ce n'est pas tout. Il va nous falloir préciser un contexte si l'on ne veut pas obtenir
tous les articles en russe qui citent le mot "français" (ex: "ce grand écrivain français",
"cet incroyable footballeur français", "ce goût typiquement français pour les bonnes
choses", "ce fabuleux esprit français que tous les peuples du monde leur envient" ou
même "les ravages causés par les éléphants français dans les plaines beauceronnes",
etc).
J'ai choisi tout simplement le mot "Nice", ville où se tient ce sommet.
Logos Dictionnary ne proposant pas de traduction je me suis retourné vers Google
Translate qui m'a donné "Ницца", c'est-à-dire "Nissa". Je suis ensuite allé taper ce mot
dans PanImages. Pas de problème, les milliardaires russes sont bien sur les photos.

3 - Troisième étape : lancer sa requête et la mettre sous


surveillance

Nous voici maintenant armés de deux mots-clés validés. Il ne reste plus qu'à aller
interroger les moteurs qui agrègent la presse russe. Encore faut-il en trouver!

Faisons simple pour l'instant :


• Google News en russe (forcément) : a priori 400 sources de presse indexées
• Il est bien sûr possible d'interroger directement des titres de la presse russe en
ligne mais les choses se compliquent puisqu'ils faut qu'ils proposent un fil Rss
correspondant à votre requête. S'il n'y en a pas on peut toujours utiliser un
service de type FeedBeater, qui va alors créer un fil rss, pas parfait mais
plusieurs tests que j'ai effectué ont donné des résultats corrects.
• Voici tout de même deux services qui vous permettront d'identifier des titres de
presse ligne classés par pays.
◦ The World press
◦ Giga Presse
◦ Newsdirectory

Après avoir lancé votre requête Французский Ницца dans Google News en russe vous
obtenez évidemment les articles dans lesquels se trouvent ces deux mots et vous pouvez
utiliser les fonctionnalités avancées pour affiner encore les résultats.
Il va falloir maintenant intégrer le flux RSS de cette requête dans votre Google Reader
mais avant cela une dernière chose : par défaut les résultats sont classée par
pertinence. Afin de toujours voir apparaître les derniers publiés dans votre agrégateur il
est indispensable de les classer par date.
Maintenant seulement vous pouvez intégrer le flux RSS dans Google Reader.

4 - Quatrième étape : traduction des flux RSS

En fait c'est la partie la plus simple puisqu'il ne reste plus qu'une chose à faire : cocher
la fonctionnalité "Traduire dans ma langue" pour passer de çà :

à çà :
Résultats de l'expérience :

Evidemment la traduction est loin d'être parfaite mais j'ai lu 3 articles en entier et
franchement je pense pouvoir dire que j'en ai saisi la teneur, surtout après avoir lu
quelques articles en français sur le sujet afin de mieux comprendre le contexte, et puis
entre ça et rien le choix est vite fait.

Un exemple d'article traduit :

Pas mal non?

Est-ce que les articles découverts traitent bien du sujet qui m'intéresse? Oui plutôt,
même s'il faut encore faire le tri. Il sera nécessaire d'ajouter des mots-clés pour cerner
plus précisément le sujet et également retirer le mot-clé "Nice" rapidement si l'on veut
continuer à suivre cette thématique, car le sommet n'a duré en fin de compte qu'une
journée et le mot n'apparaîtra bientôt qu'épisodiquement. Si toutefois on souhaite le
conserver pour une raison particulière il suffit de garder cette requète telle quelle et d'en
créer une seconde l'excluant. Itératif vous disais-je.
Christophe Deschamps est consultant - formateur en veille et intelligence économique.
Contact : christophe.de@gmail.com

You might also like