Trois enseignements majeurs, suite au MT Summit 2019

    Retour sur la conférence MT Summit 2019 : l'avenir des technologies de contenus et de la traduction automatique.

    Abonnez-vous à notre blog

    La conférence MT Summit est terminée. Il est tout simplement impossible d'avoir participé à ces trois jours sans être impatient(e) de voir les évolutions qui nous attendent. Qu'il s'agisse des dernières avancées de la traduction automatique neuronale (TAN), de la classification automatique des erreurs et la qualité prédictive, en passant par la recherche permanente de l'intelligence des contenus, nous avons eu droit à un aperçu de l'avenir de l'automatisation de la traduction.

    1. Estimation prédictive de la qualité : de la théorie à la pratique

    La méthode « BLEU » (BiLingual Evaluation Understudy) reste considérée comme un moyen rapide et peu coûteux pour évaluer les progrès de la traduction automatique (TA).  Développée par des ingénieurs, cette méthode ne demande aucune intervention des traducteurs, mais part du principe qu'il n'y a qu'une traduction correcte pour un même texte donné, ce qui, dans les faits, n'est évidemment pas le cas. La traduction « approuvée » est alors considérée comme référence, pour la langue source comme pour la langue cible. Plus la traduction est proche du texte de référence, plus la note est élevée.

    Ainsi, bien que la méthode BLEU parte généralement d'une appréciation par un humain, elle ne répond pas à la question fondamentale : quelle est la qualité de la traduction faite par la machine ?

    Les discussions sur les mesures de qualité de la TA vont bon train, mais l'objectif reste de parvenir à ce qu'à chaque résultat de traduction automatique soit associé un indice de qualité. Pendant ces trois jours, tous les intervenants finisssaient par admettre admettre que la qualité ne pouvait malheureusement pas être « véritablement » évaluée sans intervention humaine (du moins pour l'instant).

    2. TA neuronale : « APE » ou pas « APE », telle est la question

    Si je ne devais retenir qu'un seul mot au MT Summit, ce serait la post-édition automatique (ou APE, pour « Automatic Post Editing » ) des résultats d'une traduction automatique neuronale. Si ce processus n'est pas nouveau, il prend de l'ampleur. Alors qu'elle commence à être utilisée par des acteurs majeurs de l'e-commerce, elle s'impose petit à petit comme une option envisageable. Il reste à déterminer si cette post-édition est une perte de temps ou un gain appréciable.

     

    L'APE a suivi une évolution similaire à celle de la traduction automatique. Le but d'un système APE est de corriger les erreurs de traduction automatique et de générer une traduction automatique post-éditée (PEMT pour « post- edited machine translation, ou TA-PE) aussi bonne que si elle avait été faite par un humain. L'APE peut améliorer la prose traduite par la machine ou l'adapter à un domaine spécifique. Par exemple, dans les systèmes propriétaires, cette méthode peut s'avérer utile pour l'apprentissage de la machine : les corrections humaines et la prévention des erreurs récurrentes indiquant au système ce qu'il ne doit pas faire. Même avec un moteur de TA de haute qualité, la post-édition automatique peut contribuer à réduire le temps d'intervention humaine en post-édition.

    L'APE peut également être intégré dans des outils de traduction assistée par ordinateur (TAO) pour aider les correcteurs lors de la post-édition. Cependant, les résultats des tests sont contre-productifs, car les correcteurs ont tendance à consacrer moins d'efforts pour les segments évalués à 90 % (ou plus) par l'outil d'APE. Or, les résultats notés à « 90 % » peuvent être fautifs. Si cette étape permet de réduire le travail des correcteurs, elle présente aussi le risque de compromettre la qualité de la traduction finale. En résumé, bien les progrès soient continuels pour les mesures prédictives et les mesures de qualité réelle, il reste encore beaucoup à faire.

    Traduction participative : des attentes à la réalité

    La traduction participative (« crowd translation ») a vu le jour dans des start-up ou organisations à but non lucratif, pour répondre à un besoin de traduire avec un budget très limité. De nos jours, le « crowdsourcing » est plus souvent utilisé dans le contexte de la post-édition de traduction automatique. Cela peut considérablement améliorer la qualité des traductions par la machine, mais non sans générer des difficultés pour le contrôle de la qualité.

    Une multitude de personnes, un petit groupe de collègues ou de clients, voire l'ensemble d'une communauté en ligne, est invitée à traduire des chaînes de texte, dont la qualité sera contrôlée par des pairs - tout le monde pouvant laisser un commentaire ou faire une correction.

    La qualité finale dépendra de l'intérêt et de la disponibilité des participants, mais sans garantie de qualité, du fait d'une incertitude sur leur niveau de compétences. Verdict : même si la traduction participative est sur la bonne voie, elle doit encore faire ses preuves.

    Une question reste en suspens : vers quoi la technologie nous entraîne-t-elle ?

    Les technologies de contenus continuent d'évoluer à la vitesse de la lumière et la traduction automatique n'est pas en reste.

    Les entreprises d'aujourd'hui veulent pouvoir communiquer en temps réel, partout dans le monde. Pour suivre ce rythme, l'automatisation est inévitable. Partout dans le monde, des entreprises se tournent vers la traduction automatique pour faire face à l'augmentation constante des volumes de contenus et à l'expansion du « village global ».

    Comme pour tout nouveau processus, cette évolution technologique soulève des questions et des dilemmes intéressants. Où la technologie de contenu nous entraîne-t-elle ? Pouvons-nous convenir d'indicateurs standard pour mesurer la qualité et la performance de la traduction automatique ? Pouvons-nous garantir à tous le même accès aux données ? Comment gérer l'intégrité des contenus ? La qualité d'une traduction automatique peut-elle vraiment être évaluée sans vérification humaine ? Les applications de reconnaissance vocale suivent-elles le rythme ?

    En tant que partenaire international pour les solutions de contenus, nous sommes ravis de participer à cette révolution et de pouvoir aider nos clients à trouver la combinaison d'outils idéale et le niveau de qualité adapté pour qu'ils communiquent clairement avec leurs différents publics partout dans le monde. Une chose est sûre : les attentes sont grandes pour connaître les contributions de l'European Association for Machine Translation (EAMT) au MT Summit 2020 !

    Pour continuer à alimenter le débat, rejoignez-nous ce 30 septembre pour le salon TAUS à Dublin. Avec les leaders de l'industrie, j'y explorerai les tendances actuelles de la traduction automatique, la post-édition, l'évaluation de la qualité et les évolutions technologiques, ainsi que leurs applications dans des scénarios réels.

     

     

    Publié sur 13/09/19    Dernière mise à jour le 13/09/19

    #Traduction Automatique, #Globalisation, #Traduction et Localisation

    A propos de l'auteur

    Gráinne Maycock is VP Sales at Amplexor, based in Dublin, Ireland. With over 17 years of executive-level experience in the localization industry, she has worked with many of the world’s largest organizations across the IT, life sciences, consumer products, telecommunications, manufacturing and marketing verticals. With a passion for delivering measurable results, Gráinne helps customers worldwide to create and implement content programs that increase their global market share and revenue. Gráinne was a member of the LocWorld committee and is involved in helping with Brand2Global, a global marketing event. She is also a regular speaker on globalization and localization topics at industry events.

    ABONNEZ-VOUS À NOTRE BLOG

    Participez à cette discussion