Veille multilingue : les outils de traduction automatique peuvent-ils suffire ?

Carole Tisserand-Barthole
Netsources no
131
publié en
2017.11
826
Acheter ce no
Tags
outils de traduction
Veille multilingue : les outils de traduction automatique ... Image 1
Veille multilingue : les outils de traduction automatique ... Image 1

Comme nous avons eu l’occasion de le mentionner à maintes reprises, la veille et la recherche d’information ne peuvent bien souvent pas être appréhendées à l’échelle d’une seule langue ou tout du moins uniquement en français.

Cela s’applique aussi bien à la veille concurrentielle, stratégique, marketing, réglementaire, scientifique, technique ou encore brevet.

Prenez par exemple une veille concurrentielle dans le secteur de l’industrie : il y a tout de même de bonnes chances que certains concurrents soient basés ou disposent d’une présence à l’étranger, notamment pour leurs sites de production.

De l’intérêt d’une veille multilingue

Un lancement de produit ou un événement peut avoir une résonance en de­hors des frontières. Dès lors, suivre les retombées à l’international est également inévitable.

Et du côté de la veille scientifique et technique, on n’oubliera pas non plus qu’une grande partie des revues scienti­fiques sont en langue anglaise et non en français.

Veille stratégique et concurrentielle : la maîtrise de l’anglais est-elle suffisante ?

On serait tenté de penser qu’une bonne maîtrise de la langue anglaise pourrait suffire pour réaliser des veilles et des recherches d’informations à l’échelle planétaire. Malheureusement il n’en est rien...

Lorsque l’on s’intéresse à des problématiques économiques ou politiques, on arrive toujours à obtenir quelques informations en langue anglaise. Chaque pays ou presque dispose de quelques titres de presse en anglais, les sites institutionnels disposent généralement d’une version anglaise, les grands organismes internationaux susceptibles de couvrir l’actualité et les questions économiques de tous les pays du monde sont également en anglais, etc.

Mais dès que l’on aborde des questions sociétales, culturelles ou des événements avec un ancrage uniquement local, c’est une toute autre histoire...

D’ailleurs, il n’est pas rare que la version anglaise d’un site ne soit qu’une version très réduite de la version en langue locale !

Par expérience, nous avons pu constater que l’information la plus stratégique et la plus confidentielle se trouve bien souvent dans des sources en langues locales.

Comment effectuer une veille multilingue sans maîtriser les langues?

Même si certains de vos collaborateurs disposent de quelques notions en allemand ou espagnol, il est fort probable que vous ne trouviez aucun interlocuteur en interne pour le japonais, le polonais ou encore le finlandais.

Dans un contexte de veille, la question de la traduction se pose aussi bien à l’étape du sourcing qui consiste à identifier les sources pertinentes à mettre sous surveillance que dans la phase de collecte et d’analyse.

Au moment du sourcing, il va falloir être en mesure de construire une requête intégrant les termes ou expressions en langue locale et être capable d’identifier des sources d’informations pertinentes et fiables dans ces mêmes langues. Tout un challenge !

Dans la phase de collecte et d’analyse, c’est la compréhension des articles, pages Web, documents en langue locale dont il va être question.

C’est sur cette phase que nous avons choisi ici de nous focaliser.

Et avant même d’envisager la sous-traitance à des traducteurs maîtrisant les langues en question, il est intéressant de se pencher sur la question des outils de traduction automatiques.

Google Translate, Bing Translator et les autres...

Il y a encore quelques années, la qualité des traductions fournies par Google ou Bing était tellement médiocre qu’on avait même du mal à comprendre le sens général d’un texte et qu’on risquait à coup sûr le contresens... Mais avec le développement de l’intelligence artificielle, ces outils ont fait d’énormes progrès et permettent sans nul doute d’avoir une compréhension générale d’un texte.

Attention cependant, on n’est jamais à l’abri d’un contresens et copier-coller une traduction issue de ces outils directement dans un document de travail risque de vous faire passer pour un professionnel peu consciencieux...

DeepL : un outil de traduction prometteur

A l’été dernier, un petit nouveau a fait son apparition : DeepL. Derrière cette initiative, on retrouve les fondateurs de l’excellent dictionnaire en ligne Linguee. Un gage de qualité !

Les nombreux articles de presse et de blogs parus à son sujet sont élogieux. Nous avons eu l’occasion de l’utiliser à maintes reprises et avons pu apprécier la qualité de la rédaction : des contresens moins nombreux que chez ses concurrents et une traduction beaucoup plus proche d’une traduction « professionnelle ».

Mais alors, quel outil de traduction choisir ?

DeepL est sans nul doute l’outil à privilégier mais il ne peut malheureusement pas être utilisé en toutes circonstances :

  • seules 7 langues sont aujourd’hui proposées(anglais, français, allemand, espagnol, italien, néerlandais et polonais). Toutes les combinaisons entre ces 7 langues sont aujourd’hui possibles.
  • il existe une limite dans la taille du texte que l’on peut entrer (5000 caractères espaces compris) mais c’est fi­nalement la même limite que celle introduite par Google Translate en 2016 ;
  • il n’est pas possible d’entrer l’url d’une page Web pour la traduire à la volée ;
  • il n’existe pas de plugin/add-on permettant de traduire directement une page Web.

Dans les cas où DeepL n’est pas adapté, on recommandera alors de se tourner vers Google Translate.

Les outils de traductions intégrés aux outils de veille et agrégateurs de presse et bases de données

On n’y pense peu mais un certain nom­bre d’outils de veille et d’agrégateurs de presse ont intégré des outils de traductions automatiques au sein même de leurs plateformes, permettant ainsi à leurs utilisateurs de traduire d’un seul clic les articles récupérés dans d’autres langues.

Du côté des agrégateurs de presse, qui permettent d’interroger au sein d’une seule interface des dizaines de milliers de titres en France et aux quatre coins du monde :

  • Factiva a intégré depuis plusieurs années maintenant Google Translate. Néanmoins la traduction n’est pas disponible sur une liste de résultats mais nécessite d’ouvrir chaque article séparément et de cliquer sur la fonctionnalité de traduction.
  • Chez LexisNexis, Nexis et Newsdesk ont aussi recours à Google Translate mais permettent de traduire aussi bien des listes de résultats que des articles individuels.

On citera également des bases de données business comme EMIS (spécialisée sur les pays émergents) qui proposent le même service.

Et c’est sans compter tous les outils de traduction disponibles dans les bases de données brevets. Tous les agrégateurs de brevets en effet, qu’ils soient institutionnels comme l’Office Européen des Brevets ou l’OMPI avec PatentScope, de même que les services commerciaux tels que Questel avec Orbit Intelligence, Minesoft avec Patbase offrent dans de très nombreux cas le texte du brevet dans la langue originale et le texte traduit en langage machine.

L’OEB a établi il y a quelques années un partenariat avec Google en lui fournissant un corpus important de brevets déjà traduits afin de créer une version spécifique de Google Translate adaptée au langage brevet. Les autres acteurs ont quant à eux recours à d’autres prestataires spécialisés pour leurs solutions de traduction.

Du côté des outils de veille, certains acteurs ont aussi intégré des solutions de traduction automatiques comme :

  • Digimind Social
  • Sindup
  • Synthesio
  • Talkwalker
  • etc.

Même si la plupart des plateformes n’indiquent pas à quelle solution ils ont recours, ils s’agit rarement d’une solution interne et ils ont bien souvent recours à Google Translate ou Bing Translator.

On signalera également que le lecteur de flux RSS Inoreader a intégré une solution de traduction automatique des articles dans sa version «Professional».

Pour la traduction appliquée au RSS, on ajoutera cette fonctionnalité intéressante proposée par Zapier qui permet de traduire automatiquement le contenu d’un flux RSS.

Ne pas négliger la piste des traducteurs et des professionnels de l’information locaux

Ces outils de traduction apportent incontestablement une aide précieuse pour la veille et la recherche d’information. Néanmoins, il peut être utile d’aller plus loin surtout quand on souhaite aller au-delà de la compréhension générale vers une analyse plus fine et plus stratégique.

On ne saurait alors négliger le recours à des traducteurs professionnels mais aussi à des professionnels de l’information indépendants basés dans les pays que l’on souhaite surveiller.

Les professionnels de l’information de chaque pays disposent en effet d’une connaissance du marché, des sources, outils de recherche locaux et des contacts qu’aucun outil de traduction automatique ne pourra jamais remplacer...