Benötigte Lesezeit: 5 Minuten
1. Wie würdest du einem achtjährigen Kind maschinelle Übersetzungen erklären?
Stell dir vor, es gibt ein neues Spiel, das du spielen möchtest. Aber die Anleitung ist nur auf Englisch verfügbar und du verstehst sie nicht. Es wäre toll, sie auf Deutsch zu haben, oder? Aber niemand von deinen Freunden spricht Englisch, nur dein Englischlehrer könnte den Text mit Sicherheit übersetzen. Leider hat dieser keine Zeit, denn das Übersetzen all dieser Anweisungen dauert sehr lange. Es wäre also großartig, wenn ein Computer einspringen könnte, oder? Und rate was? Es ist möglich! Wir nennen das „maschinelle Übersetzung”, weil es keine Person ist, die von einer Sprache in eine andere übersetzt, sondern eine Maschine. Der Computer kann das zwar noch nicht so perfekt wie dein Englischlehrer, aber es würde ausreichen, um die Spielanleitung zu verstehen.
2. Maschinelle Übersetzung vs. menschliche Übersetzung? – Was sind die Stärken und Schwächen einer Maschine im Vergleich zu einem Menschen?
Die Stärken einer Maschine liegen in der Schnelligkeit und der leichten Verfügbarkeit von Online-Tools. Jeder kann in Sekunden auf eine maschinelle Übersetzung im Web zugreifen. Die Qualität dieser Translationen hat sich in den letzten Jahren deutlich erhöht. Es gibt inzwischen gute Optionen, bei denen Fehler toleriert werden können. Möchte ein Nutzer etwa einen Nachrichtenartikel verstehen oder etwas im Web in einer anderen Sprache finden, dann sind die Grammatik oder der Stil nicht so relevant. Auch wenn die Bedeutung des Originaltextes nicht vollständig übertragen wird, hat dies meistens keine ernsthaften Konsequenzen. Maschinelle Übersetzungen sind also ein ein gutes Hilfsmittel, wenn ein Text nicht perfekt sein muss.
Außerdem kann eine maschinelle Übersetzung die Grundlage für eine professionelle, menschliche Translation sein. Ich möchte jedoch hinzufügen, dass viele professionelle Übersetzer dem nicht zustimmen würden. Sie sind oft verpflichtet, maschinelle Übersetzungen zu nutzen, um den Arbeitsaufwand und damit die Kosten zu minimieren. Ihre Einstellung zu MT ist positiver, wenn sie wählen können, was und wie viel sie nachbearbeiten möchten.
“Es ist nicht empfehlenswert, auf menschliche Beteiligung zu verzichten.”
Es gibt jedoch auch klare Schwächen. Obwohl sich maschinelle Übersetzungen in den letzten Jahren stark verbessert haben, sind selbst die besten Systeme immer noch fehleranfällig und können den Menschen nicht vollständig ersetzen. Es ist daher nicht empfehlenswert, MT für „ernsthafte“ Texte – etwa Auswertungen oder juristische Dokumente – zu verwenden und auf menschliche Beteiligung zu verzichten.
Alles in allem hängt der Grad des menschlichen Eingreifens, der für eine bestimmte Übersetzungsaufgabe erforderlich ist, vom Zweck der Übersetzung und dem Wert des Inhalts ab.
3. Gibt es ein MT-Tool, das du empfehlen würdest?
Zur alltäglichen Verwendung empfehle ich
- Google Translate (unterstützt eine große Anzahl von Sprachpaaren),
- DeepL (Englisch, Deutsch, Französisch, Spanisch, Italienisch, Niederländisch, Polnisch)
Für die Übersetzung großer Textmengen eignet sich Amazon Translate (Arabisch, Chinesisch, Französisch, Deutsch, Portugiesisch, Spanisch, Japanisch, Russisch, traditionelles Chinesisch, Italienisch, Türkisch, Tschechisch)
Und für das Training eigener Systeme für gewünschte Sprachpaare und Domänen, basierend auf eigenen Daten: Sockeye (https://github.com/awslabs/sockeye)
“Es ist erstaunlich, dass neuronale Netze lediglich durch die Kombination mathematischer Funktionen viele verschiedene Dinge lernen können.”
4. Welche kommenden ML-Trends faszinieren dich derzeit am meisten?
Neuronale Netze, aus verschiedenen Gründen. Es ist erstaunlich, dass sie lediglich durch die Kombination mathematischer Funktionen viele verschiedene Dinge lernen können. Es sind außerdem verschiedene Arten von Eingabe-Features möglich. Das ermöglicht im Rahmen der maschinellen Übersetzung nicht nur das Lernen durch Wörter, sondern auch durch Worteinheiten, linguistische Merkmale oder sogar Begriffe aus anderen Sprachen.
Es gibt viele verschiedene Architekturen für künstliche neuronale Netze und das ist faszinierend. Ich muss erwähnen, dass oft unklar ist, was wirklich in einem neuronalen Netz passiert. Daher ist es schwer, Übersetzungsfehler zu analysieren und zu verstehen. Dies ist zwar ein klarer Nachteil, aber solche komplexen Vorgänge zu begreifen, stellt eine Herausforderung dar, die mich interessiert.
5. Wie hast du maschinelle Übersetzung/NLP/NLG als Thema für dich entdeckt?
Der erste Schritt war meine Masterarbeit, die sich mit Sprachverarbeitung beschäftigte. Danach habe ich in einem Forschungsinstitut für Spracherkennung gearbeitet, das Sprachverarbeitung und maschinelles Lernen kombiniert. Während dieser Zeit habe ich etwas über weitere Sprachverarbeitungsaufgaben und die Verarbeitung natürlicher Sprache im Allgemeinen gelernt. Dann bekam ich die Möglichkeit, mit dem Thema maschinelle Übersetzungen zu promovieren. Seitdem beschäftige ich mich hauptsächlich mit MT, aber auch mit anderen NLP Bereichen.
“Die übertriebene Medienberichterstattung ist schädlich für Nutzer und MT Entwickler.”
6. Welchen Rat würdest du einem Laien geben, der sich mit maschinellen Übersetzungen beschäftigen möchte?
Mit dem Buch von Philipp Köhn „Statistical Machine Translation“ zu beginnen, um eine Vorstellung davon zu bekommen, worum es geht. Es umfasst nur phrase-basierte MT, aber ein zusätzliches Kapitel über neuronale MT ist online verfügbar.
Wenn möglich, besuche auch den MT Marathon, wo MT-Experten Vorlesungen für Anfänger halten und Praktika anbieten.
7. Was sagst du Menschen, die Angst vor maschinellem Lernen oder KI haben?
Hab keine Angst 🙂
In den letzten Jahren wurden Verbesserungen, die durch neuronale Netzwerke ermöglicht wurden, von einer übertriebenen Berichterstattung in den Medien begleitet. Einige Berichte deuteten an, dass verschiedene Berufe, einschließlich der des Übersetzers, gefährdet sein könnten. Solche Aussagen, die darauf hindeuten, dass die maschinelle Übersetzung das Niveau der menschlichen Übersetzung erreicht hat, sind sowohl für Benutzer als auch für MT-Entwickler schädlich. Es ist wichtig zu wissen, dass MT kein gelöstes Problem ist. Und das wird es auch nicht in naher Zukunft sein.
Photo DALLE 2
Maja Popović studierte an der Fakultät für Elektrotechnik der Universität Belgrad und setzte ihr Studium an der RWTH Aachen fort, wo sie mit der Arbeit „Maschinelle Übersetzung: Statistischer Ansatz mit zusätzlichem Sprachwissen“ promovierte. Anschließend forschte sie am DFKI Institut und an der Humboldt Universität zu Berlin und jetzt im ADAPT Centre an der Dublin City University. Ihre Forschung konzentriert sich auf verschiedene Ansätze zur Bewertung maschineller Übersetzungen sowie auf andere – teilweise verwandte – NLP-Aufgaben, wie die Textvereinfachung. Darüber hinaus arbeitete sie an der maschinellen Übersetzung für unterrepräsentierte europäische Sprachen und kombinierte sprachliches Wissen und statistische/datengesteuerte Methoden für NLP.
Ich finde es sehr interessant, mehr über die maschinelle Übersetzung und menschliche Übersetzung zu lernen. Vielleicht wäre eine Kombination von beiden am besten? Zuerst wird der Text maschinell übersetzt und ein Mensch prüft und überarbeitet die Übersetzung.
Hallo Ada, maschinelle Übersetzungen sind je nach Sprache inzwischen sehr gut. Trotzdem macht eine Qualitätskontrolle Sinn, gerade bei rechtlichen oder anderweitig sensiblen Inhalten. Du hast also Recht: Maschine und Mensch sind aktuell nur gemeinsam in der Lage eine hohe Content-Qualität zu garantieren.