Videokonferenz (Bild: Fuelrefuel [CC BY-SA 3.0], via Wikimedia Commons)

Microsoft und Google arbeiten an Übersetzung in Echtzeit

Microsoft und Google kommen dem Traum von Übersetzung in Echtzeit immer näher – wann fällt die Sprachbarriere? // von Daniel Kuhn

Videokonferenz (Bild: Fuelrefuel [CC BY-SA 3.0], via Wikimedia Commons)

Als Douglas Adams 1979 seinen Protagonisten Arthur Dent „Per Anhalter durch die Galaxis“ schickte, löste er das alte Problem der Sprachunterschiede mit dem Babelfisch. Dieser kleine gelbe Fisch lebt im Ohr seines Wirts, ernährt sich von dessen Gehirnströmen und hat den positiven Nebeneffekt, dass man alles versteht, was in einer anderen Sprache gesagt wird. Auch wenn dieser Kunstgriff in vielerlei Hinsicht eine Parodie auf die Science-Fiction-Literatur war, hat sie doch zumindest bei Microsoft und Google den Ehrgeiz geweckt, dass Smartphone zu einen eben solchen Echtzeituniversalübersetzer zu machen.


Warum ist das wichtig? Mit universeller Übersetzung in Echtzeit könnte die Sprachbarriere zwischen bereits vernetzten Menschen überwunden werden.

  • Microsoft hat neben der Bing-Textübersetzung auch eine Sprachübersetzung in Echtzeit für Skype vorgestellt, die derzeit in einer Betaphase zugänglich ist und zwischen Englisch und Spanisch übersetzt.

  • Googles Übersetzer-App für Android und iOS kann nun auch Kamerabilder und Sprache nahezu in Echtzeit übersetzen.

  • Beide Systeme sind nicht perfekt, reichen aber für einfache Konversationen bereits aus.


Der Turm von Babel

Bereits in der Bibel ist das Sprachgewirr in der Geschichte um den Turm von Babel thematisiert worden. Genau genommen, nimmt es dort sogar angeblich seinen Anfang. Ganz zufällig hat Douglas Adams den Namen für seinen Babelfisch sicher nicht ausgewählt, der das Sprachgewirr wieder beendet und nebenbei noch der Beweis ist, dass Gott nicht existiert. Der Traum, sich problemlos mit allen Menschen (oder im Falle Douglas Adams mit Aliens) unterhalten zu können, ohne vorher langwierig die Sprache zu lernen, ist wahnsinnig alt. Heute sind wir der Erfüllung dieses Traums näher als je zuvor und das verdanken wir vor allem Microsoft und Google. Beide Unternehmen bieten schon länger die Möglichkeit, Inhalte in Social Networks und sogar ganze Webseiten zu übersetzen. Aber das Ziel ist ein anderes, nämlich die Echtzeitübersetzung von gesprochener Sprache.

Erst vor wenigen Wochen hatte Microsoft ein Übersetzungsprogramm für Skype gestartet, das in Echtzeit Unterhaltungen zwischen Englisch und Spanisch übersetzen kann. Dies konnte Google natürlich nicht auf sich sitzen lassen und veröffentlichte diese Woche ein Update für die eigene Übersetzungs-App. Es bietet nicht nur Echtzeitübersetzung von Sprache an, sondern zudem auch mit der Kamera eingefangene Wörter direkt zu übersetzt. Zweimal Echtzeitübersetzung von Sprache und einmal von Bildern, das klingt doch schon sehr danach, dass der Babelfisch Realität wird. So schön dies auch wäre, kämpfen die vorhandenen Systeme trotz aller beeindruckenden Funktionalität immer noch mit technischen Einschränkungen.

Hauptsache man versteht den Sinn

Sowohl die Übersetzungen von Microsoft und Google für geschriebene als auch für gesprochene Sprache machen deutlich, dass wir noch einen weiten Weg vor uns haben, bis Übersetzungen wirklich nahezu perfekt sind. Sowohl der Bing Übersetzer als auch Google Translate für geschriebene Sprache sind zwar beeindruckend, wenn man zum Beispiel auf eine japanische Seite gelangt, aber auch nur, weil man aus der Sprache, die man an sich gar nicht spricht, wenigstens den groben Inhalt ausmachen kann und das oftmals mit relativ großem Unterhaltungswert. Denn Sprache ist ein derart komplexes System, dass eine sinngemäße Übersetzung eines Satzes selbst für zweisprachig gebildete Menschen eine Herausforderung darstellt. Wörter mit mehreren Bedeutungen, Umgangssprache, Dialekte, Intonation und Humor sind Stolpersteine, an denen auch die aktuellen Übersetzungsprogramme für gesprochene Sprache scheitern.

Selbst wenn es relativ einfache Sprachen wie Deutsch und Englisch sind, reicht es schon, dass sich ein Australier und ein Österreicher unterhalten, um die Maschinen zu überfordern. Aber bei all der Kritik sollte wiederum nicht übersehen werden, dass sowohl Skype Translate als auch Google Translate bereits beeindruckende Ergebnisse liefern, wenn man sich mit den Limitierungen arrangiert, versucht einigermaßen akzentfrei und langsam mit Sprechpausen spricht. Für einfache Zwecke, wie das Bestellen von Essen im Urlaub oder ein kurzes Interview per Skype, sind diese Systeme bereits beeindruckend. Gibt man ihnen noch ein paar Jahre mehr Entwicklungszeit, könnten sie dem Ziel eines Echtzeituniversalübersetzers noch ein ganzes Stück näher kommen. Missverständnisse werden sie zwar nicht verhindern können, aber das hat der Babelfisch schließlich auch nicht geschafft – ganz im Gegenteil.

Better Safe than sorry

Bei aller Magie der Technologien und der Möglichkeiten, die diese Sprachübersetzungsprogramme bereits bieten, darf man allerdings nicht übersehen, dass dadurch einige Sicherheitsbedenken entstehen. Damit die Systeme immer besser werden, lernen die Maschinen von der Nutzung. Dies bedeutet, dass die übersetzte Sprache auch an die entsprechenden Betreiber übermittelt und dort ausgewertet wird. Bedenkt man, wie resistent Maschinen bisher allein gegenüber Intonation und Humor sind, ist die Sorge von einigen Experten nachvollziehbar. Denn genau wie unsere Suchbegriffe oder unsere Facebook Likes, dürften die Sprachfetzen ein gefundenes Fressen für die Werbung und die Strafverfolgungsbehörden werden. Was wäre z.B. wenn eine neue Regierung (oder die derzeitige) die Gesprächsaufnahmen in die Finger bekommt und ihr nicht gefällt, was dort gesagt wird? Strafverfolgung im Internet ist alles andere als ein Neuland.

Zum einen ist es also auch hier sehr wichtig, dass Nutzer besser die eigene Privatsphäre schützen, zum anderen sind aber auch die soclhe Software entwickelnde Unternehmen gefragt. Microsoft und Google nehmen diese Aufgabe bereits sehr ernst. Gegenüber der New York Times erklärt Olivier Fontana, Director of Product Marketing des Skype-Projekts, dass die Konversationen in separate Dateien zerlegt werden, bevor sich ein Team-Mitarbeiter die Qualität der Übersetzung überprüft. Auf diese Weise soll es für niemanden nachvollziehbar sein, nicht einmal die NSA, wer was gesagt hat. Auch Google ist laut Aussage von Macduff Hughes, dem Engineering Director of Google Translate sehr vorsichtig, wenn es darum geht, was sie mit den aufgezeichneten Stimmen anfangen – unter anderem auch aufgrund der Möglichkeit, dass die Stimme eines Tages für die biometrische Sicherheit genutzt wird um z.B. Passwörter zu ersetzen.


Teaser & Image by Fuelrefuel (CC BY-SA 3.0)


Schlagwörter: , , , , ,
Daniel Kuhn

Daniel Kuhn

ist Wahl-Berliner mit Leib und Seele und arbeitet von dort aus seit 2010 als Tech-Redakteur. Anfangs noch vollkommen Googles Android OS verfallen, geht der Quereinsteiger und notorische Autodidakt immer stärker den Fragen nach, was wir mit den schicken Mobile-Geräten warum anstellen und wie sicher unsere Daten eigentlich sind.

More Posts - Website - Twitter - Facebook - Google Plus