MT Summit 2019: Eine Standortbestimmung in 3 Schwerpunktbereichen

    Zukunft der Content-Technologie und automatisiertes Übersetzen – wohin geht die Reise? Erkenntnisse vom Machine Translation Summit 2019.

    Abonnieren Sie unseren Blog

    Drei Tage MT Summit – eine Veranstaltung, die eine unbändige Neugier auf die Zukunft geweckt hat! Allein dafür hat die Teilnahme sich bereits gelohnt. Es mangelte zudem nicht an Einblicken in die verschiedenen Bereiche der automatisierten Übersetzung: Fortschritte in den Bereichen neuronale maschinelle Übersetzung (NMT), automatische Fehlerklassifizierung und prädiktive Aussagen zur Qualität, laufende Forschung auf dem Gebiet der Content Intelligence ... kurz, der Summit war Standortbestimmung und Ausblick zugleich!

    1. Prädiktive Qualitätseinschätzung: von der Theorie in die Praxis

    Das Scoring-Verfahren „Bilingual Evaluation Understudy“ (BLEU) gilt nach wie vor als schnelle, kostengünstige Option, um Fortschritte beim Output von MT zu bewerten.  Diese von MT-Spezialisten entwickelte Methode kommt ganz ohne Übersetzer aus. Allerdings basieren die Ergebnisse auf der Annahme, dass es für einen Quelltext jeweils nur eine richtige Übersetzung gibt. Eine zweifelhafte Prämisse. Als Referenz wird jeweils die „bestätigte“ Übersetzung festgelegt, sowohl für die Quell- als auch die Zielsprache. Der in der Bewertung erzielte Score richtet sich anschließend danach, inwieweit sich der Output mit der Referenz-Übersetzung deckt.

    BLEU korreliert in der Regel tatsächlich mit dem Urteil menschlicher Bearbeiter. Allerdings bleibt die wesentliche Frage unbeantwortet: Wie hochwertig ist der maschinell übersetzte Inhalt wirklich?

    Über eine Matrix aus Kriterien zur Bewertung der Qualität maschineller Übersetzung wird weiterhin heiß diskutiert. Auch wenn das Ziel klar ist: Jeder maschinell übersetzte Inhalt soll eine Qualitätseinschätzung – in Form eines Kommentars zum MT-Output und einer Qualitätspunktzahl – erhalten. Alle Vorträge zum Thema endeten jedoch im Grunde damit, dass zugegeben wurde, dass zu einer „echten“ Einschätzung der Qualität (bisher wenigstens) nur ein menschlicher Reviewer in der Lage ist.

    2. Neuronale MT: APE oder besser nicht?

    Wenn ich ein Schlagwort nennen sollte, das mir auf dem MT Summit an jeder Ecke begegnet ist, es wäre ganz ohne Zweifel „Automatic Post-Editing“ (APE) im Zusammenhang mit neuronaler MT – kein neues Thema, aber eins, das derzeit an Fahrt gewinnt. Im E-Commerce-Sektor laufen bei großen Firmen erste Feldversuche. APE zeigt somit konkretes Potenzial, sich zu einem neuen Geschäftsfeld zu entwickeln. Aber folgende Frage ist nach wie vor offen: Ist APE eher kontraproduktiv oder spart es tatsächlich Zeit?

    APE hat bis heute eine ganz ähnliche Entwicklung durchlaufen wie die maschinelle Übersetzung. Bei APE werden Fehler im MT-Output korrigiert, damit am Ende eine „menschlich anmutende“ posteditierte maschinelle Übersetzung (PEMT) entsteht. Das ist das Ziel. Durch APE kann maschinell übersetzter Inhalt optimiert oder an ein bestimmtes Fachgebiet angepasst werden. In proprietären Systemen erweist sich APE ggf. als nützlich, damit das System aus menschlichen Korrekturen lernt und nicht dieselben Fehler immer wieder macht. Aber auch bei einem MT-System, das bereits hochwertige Ergebnisse liefert, kann automatisiertes Post-Editing dazu beitragen, dass weniger menschlicher Korrektureinsatz erforderlich ist.

    APE lässt sich zudem in computergestützte Übersetzungstools (CAT-Tools) integrieren – als Hilfestellung für die inhaltliche Prüfung im Post-Editing-Schritt. In Testläufen hat sich jedoch gezeigt, dass eine solche Anwendung kontraproduktiv ist: Segmente, die vom APE-Tool eine Qualitätsbewertung von 90 % oder höher erhalten hatten, wurden nur flüchtig geprüft und es wurde quasi sofort zum nächsten Segment gewechselt. Das Problem: Ein 90-prozentiger Score ist keinesfalls eine Garantie für ein inhaltlich richtiges Segment. Es mag sein, dass sich der Aufwand für die menschlichen Reviewer dadurch reduziert. Es besteht jedoch die Gefahr, dass am Ende die Qualität des Endprodukts nicht stimmt. Die Bilanz: Es tut sich einiges auf dem Gebiet der prädiktiven Qualitätseinschätzung und der tatsächlichen Qualität. Fortschritte sind da, aber der Weg ist noch weit.

    3. Übersetzung durch Crowdsourcing: zwischen Anspruch und Wirklichkeit

    Crowd Translation galt zunächst als Lösung für Startups oder gemeinnützige Organisationen, die Bedarf an mehrsprachigen Inhalten, aber nur ein kleines Budget für deren Lokalisierung hatten. Inzwischen findet Crowdsourcing durchaus auch beim Post-Editieren maschineller Übersetzungen Anwendung. Die Qualität maschinell übersetzter Inhalte lässt sich dadurch deutlich steigern. Ein Schwachpunkt ist jedoch die Steuerung und Überwachung der Qualität.

    Bei diesem Konzept erfolgt die Übersetzung durch eine „Crowd“ – das kann eine Handvoll Kollegen oder Kunden, aber auch eine ganze Online-Community sein – und die Qualität wird gegenseitig kontrolliert. Jeder ist zu Kommentaren und Korrekturen berechtigt.

    Das Risiko: Die Qualität des Arbeitsergebnisses hängt stark vom Interesse und Einsatz der Beteiligten und von ihrer Bereitschaft ab, mit den „Kollegen“ zusammenzuarbeiten. Zudem ist in der Regel nicht bekannt, wie qualifiziert jeder Einzelne für die Arbeit ist. Auch bei diesem Thema lässt sich sagen: Die Richtung stimmt, aber es liegt noch einiges an Wegstrecke vor uns.

    Die Frage, die über allem steht: Wohin führt uns die technische Entwicklung?

    Die Entwicklung der Content-Technologien erfolgt in atemberaubendem Tempo. Die maschinelle Übersetzung bildet da keine Ausnahme.

    Globales Business und globale Kommunikation finden zunehmend in Echtzeit statt. Hier Schritt zu halten, gelingt nur durch Automatisierung. Weltweit setzen Unternehmen auf maschinelle Übersetzung, um den ständig wachsenden Content-Mengen Herr zu werden und im „Global Village“ mitzuhalten.

    Wie bei jedem großen Entwicklungssprung wirft auch diese technologische Revolution interessante Fragen auf und es treten Dilemmas zutage. Wohin führt uns die Content-Technologie? Gelingt es, sich auf Standards für die Bewertung maschineller Übersetzungen und die Leistung der MT-Systeme zu einigen? Lässt sich ein gleichberechtigter Zugang aller zu den Daten erreichen? Wie sorgen wir für die Integrität von Inhalten? Lässt sich die Qualität maschineller Übersetzung tatsächlich ohne menschliches Zutun beurteilen? Hält die Spracherkennungstechnologie mit der Entwicklung Schritt?

    Als Partner für globale Content-Lösungen ist es für uns natürlich sehr spannend, diese Content-Revolution aktiv mitzugestalten und unsere Kunden weiterhin dabei zu unterstützen, den idealen Technologie-Mix und die richtige Qualitätsebene zu finden, damit sie mit ihren Zielgruppen weltweit wirkungsvoll kommunizieren. Wir sind jedenfalls schon jetzt sehr gespannt, was uns die European Association for Machine Translation (EAMT) beim MT Summit 2020 präsentieren wird!

    Wir bleiben im Gespräch: Die nächste Gelegenheit bietet sich am 30. September in Dublin! In guter Gesellschaft mit Vertretern der Branchenführer werde ich mich dort bei TAUS mit den neuesten Trends in den Bereichen maschinelle Übersetzung, Qualitätseinschätzung und Zukunftstechnologie befassen. Thema wird auch deren Anwendung in der Praxis sein.

     

     

     

     

    Veröffentlicht auf 13/09/19    Zuletzt aktualisiert am 13/09/19

    #Globalisierung, #Maschinelle Übersetzung, #Übersetzung & Lokalisierung

    Über den Autor

    Gráinne Maycock is VP Sales at Amplexor, based in Dublin, Ireland. With over 17 years of executive-level experience in the localization industry, she has worked with many of the world’s largest organizations across the IT, life sciences, consumer products, telecommunications, manufacturing and marketing verticals. With a passion for delivering measurable results, Gráinne helps customers worldwide to create and implement content programs that increase their global market share and revenue. Gráinne was a member of the LocWorld committee and is involved in helping with Brand2Global, a global marketing event. She is also a regular speaker on globalization and localization topics at industry events.

    ABONNIEREN SIE UNSEREN BLOG

    Beteiligen Sie sich an dieser Diskussion