KI in der Synchronbranche – VDS fordert Schutzmechanismen

„Schützen wir die künstlerische, nicht die künstliche Intelligenz.“ Mit diesem Appell meldet sich der Verband Deutscher Sprecher*innen zu Wort. In einem Video halten verschiedene Synchronsprecher*innen Bilder ihrer bekanntesten Rollen vor das Gesicht – Figuren oder Schauspieler*innen, die viele sofort wiedererkennen. Dann treten sie selbst hervor, zeigen ihr Gesicht und ihren Namen. Die Botschaft dahinter spricht für sich: Hinter jeder vertrauten Stimme steckt ein Mensch. Einer, der Texte nicht nur spricht, sondern sie deutet, Dialoge formt und Beziehungen hörbar macht. Steht genau dieses Menschliche jetzt zur Debatte? Welche Rolle spielt KI in der Synchronbranche und wie prägt sie die Zukunft des Handwerks? Welche Auswirkungen kann die künstliche Intelligenz für Sprecher*innen, aber auch für die Zuschauer*innen haben und wie gut ist sie eigentlich?

Synthetische Stimmen

Die Technik hinter diesen Fragen und Befürchtungen heißt Voice Cloning – oder auch Audio Deepfake. Mithilfe von künstlicher Intelligenz lassen sich Stimmen täuschend echt nachbilden, oft reichen dafür bereits 30 Minuten geeignetes Audiomaterial aus. Basis dieser Technologie sind tiefe neuronale Netze, ein Verfahren des maschinellen Lernens. Damit erfasst die KI Merkmale wie Klangfarbe, Betonung oder Rhythmus und kann so schließlich jeden beliebigen Satz einer Zielperson in ihrer typischen Sprachmelodie generieren. Entsprechende Software existiert auch als frei verfügbare Open-Source.

Für die Synchronbranche ist diese Entwicklung besonders brisant. Mit Voice Cloning könnten Studios theoretisch auf Sprecher*innen verzichten und Figuren allein per Algorithmus sprechen lassen. So eröffnet KI auf der einen Seite Chancen. Serien lassen sich schneller in viele Sprachen übersetzen und für neue Projekte besteht die Möglichkeit liebgewonnene, aber bereits verstorbene Stimmen wiederzubeleben. Auf der anderen Seite bedeutet es aber auch einen massiven Eingriff in das künstlerische Handwerk oder die Persönlichkeitsrechte. Potenziell kann die KI eine Gefahr für die Existenz einer ganzen Branche darstellen.

KI in der Synchronbranche: Das Beispiel Pumuckl

Ein besonders prominentes Beispiel für den Einsatz von KI ist die Neuauflage der Kultserie Pumuckl. Die unverwechselbare Stimme des kleinen Koboldes ist wahrscheinlich vielen noch immer im Kopf, die mit der Originalserie aus den 1980er Jahren aufgewachsen sind. Gesprochen wurde Pumuckl damals von Hans Clarin, welcher 2005 verstarb. Für die neue Version – eine Art Fortsetzung mit dem Titel „Neue Geschichten vom Pumuckl“ – stellte sich eine zentrale Frage: Wer sollte diesmal die Aufgabe übernehmen, Pumuckl seine einzigartige Stimme zu leihen?

Die Wahl hierfür fiel auf den Schauspieler und Kabarettisten Maxi Schafroth. Mit seiner Live-Darbietung wurde die neue RTL-Serie dann gedreht und geschnitten. Nach eigenen Angaben war die Produktion begeistert von der Darbietung und sehr zufrieden mit Schafroths Interpretation. Für RTL und die Produktionsfirma NeueSuper – die so nah wie möglich am Original bleiben wollten – war dennoch klar, dass sie ihren Zuschauer*innen die Wahl zwischen Schafroths und Clarins Pumuckl bieten wollen. Ein Kobold werde schließlich nicht älter.

Bereits vor Beginn der Dreharbeiten entstand die Idee, künstliche Intelligenz zu verwenden, um Clarins charakteristische Version neu zu beleben. Nach einigen Gesprächen mit verschiedenen Firmen und Start-Ups entschied man sich für die ukrainische Firma Respeecher. Doch bevor dieses Vorhaben umgesetzt werden sollte, wurde Kontakt mit den Angehörigen von Hans Clarin aufgenommen. Zunächst stand seine Familie dem Projekt skeptisch gegenüber. Nachdem sie erste Tests gehört und längere Gespräche mit der Produktionsfirma geführt hatten, stimmten sie aber schließlich zu. In dem Prozess wurde dann quasi die Stimme von Hans Clarin auf Maxi Schafroths Version drübergelegt. So wurde sein Spiel und seine Emotionalität erhalten, aber in der altbekannten Pumuckl-Stimmfarbe.

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Dieser Ansatz ist insofern bemerkenswert, da er einem großen Publikum ganz konkret zeigt, wie KI-Technik genutzt werden kann – im direktem Vergleich zur Originalversion aus der Kindheit und zur Neuinterpretation. So entstand die Möglichkeit, Nostalgie zu wecken und eine verstorbene Kultstimme wieder aufleben zu lassen. Die parallele Besetzung Schafroths zeigt darüber hinaus, wie wichtig menschliche Sprecher*innen für emotionale Nuancen und Schauspiel bleiben. Auch der Konsens der Familie Clarin macht Pumuckl zu einem Positivbeispiel.

Trotzdem wirft dieses Beispiel auch fragen auf. Werden neueren Sprecher*innen wie Maxi Schafroth auf diese Weise nicht potentiell leichter austauschbar und verlieren die Chance sich mit ihrer eigenen Stimme in der Branche zu etablieren? Können KI-Stimmen echte Menschen irgendwann komplett verdrängen?

Stimmen aus der Kreativbranche

Der Verband Deutscher Sprecher*innen

Um der Beantwortung solcher Fragen näher zu kommen, ist es auch wichtig, den Stimmen der Betroffenen Gehör zu schenken. Der VDS, also der Verband Deutscher Sprecher*innen, hat sich intensiv mit dem Thema KI im Synchron auseinandergesetzt. Neben dem eingangs erwähnten Protestvideo veröffentlicht er auch verschiedene Statements auf der eigenen Website.

Der VDS räumt ein, dass die KI-Technik eine sinnvolle Ergänzung zu menschlichen Stimmen sein kann. Dies gilt vor allem in Anwendungsbereichen in denen es lediglich um eine akustische Wiedergabe von Inhalten geht. Dennoch mahnt der Verband vor Missbrauchsrisiken und spricht sich für verschiedene Schutzmechanismen aus. Besonders kritisch steht der VDS dem Einsatz synthetischer Stimmen in den Bereichen gegenüber, in denen es um eine künstlerische Interpretation von Inhalten geht. Grade in Hörbüchern oder in der Synchronisation prägt die individuelle künstlerische Interpretation der Sprecher*innen die Wirkung und den kulturellen Wert der Texte. Ohne sie droht ein Bedeutungsverlust des Werkes.

So formulierte der VDS Rahmenbedingungen, die er später auch mit dem Dachverband United Voice Artist (UVA) abstimmt. Der UVA ist, wie der Name schon vermuten lässt, ein weltweiter Zusammenschluss verschiedener Sprecher*innenverbände. Gemeinsam fordern sie klare Regelungen für den Einsatz von KI-Stimmen. Im Zentrum stehen dabei der Schutz der künstlerischen Leistung und die Wahrung von Persönlichkeitsrechten. Beispielsweise verlangen sie, dass jede Nutzung einer Stimme per KI nur mit ausdrücklicher Zustimmung der Sprecher*innen erfolgen darf, das KI-Stimmen als solche gekennzeichnet werden müssen und das Sprachaufnahmen nicht ohne Erlaubnis zum Training von KI-Systemen genutzt werden dürfen. Bis verbindliche gesetzliche Rahmenbedingungen geschaffen wurden, fordern sie einen Stopp der Nutzung von Voice Cloning.

Um Missbrauch zu verhindern verlangt der VDS auf seiner Seite außerdem eine KI-Auschlussklausel in Verträgen. In manchen Genres und Projekten unterzeichnen die Sprecher*innen umfassende Rechteübertragungen. Häufig wird in den Verträgen jedoch nicht explizit ausgeschlossen, dass die Aufnahmen auch für KI-Zwecke genutzt werden können. Ohne klare Regeln besteht die Angst, dass KI-Systeme die Stimmen von Sprecher*innen dauerhaft nutzen, ohne ihr Wissen und ohne ihre Zustimmung. Das bedeutet nicht nur den Verlust der Kontrolle über die eigenen Stimme, sondern auch die Gefahr dass die Stimme in Projekten auftaucht für die die Sprecher*innen weder bezahlt noch angefragt wurden.

Der VDS betont daher, dass jede Nutzung für KI grundsätzlich der Zustimmung und Vergütung der Sprecher*innen bedarf. Er weißt die Auftraggebenden auf seiner Website darauf hin, dass eine Rechteübertragung immer nur für die konkrete Produktion gilt und nicht darüber hinaus geht.

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Internationale Proteste: Schauspieler*innen und Autor*innen gegen KI

Der Einsatz von KI in kreativen Berufen erzeugte bereits weltweite Aufmerksamkeit. Im Sommer 2023 traten Hollywood-Autor*innen und -Schauspieler*innen auf die Straße, um auf die Risiken der recht neuen Technik aufmerksam zu machen. Sie befürchten, das KI-Tools wie ChatGPT oder Deepfake-Technologien ihre Arbeiten ersetzen oder missbrauchen könnten. Ihre zentralen Forderungen ähneln denen der Sprecher*innen und konzentrieren sich auf die Pflicht zur ausdrücklichen Zustimmung und fairen Vergütung. Diese Proteste und die Forderungen des UVA zeigen eindrücklich, dass die Sorge um künstlerische Kontrolle und faire Entlohnung nicht nur national sondern auch global relevant ist – und das branchenübergreifend.

Zwischen Verantwortung und technischen Möglichkeiten

Die bisherigen Beispiele zeigen, dass der Einsatz von KI im kreativen Bereich sowohl Chancen, als auch Risiken birgt. Auf der einen Seite eröffnet die Technologie neue Möglichkeiten,- beispielsweise das Wiederaufleben lassen von Kultstimmen, zu denen die Zuschauer*innen bereits eine Bindung aufgebaut haben – wie bei Pumuckl. Dennoch gehen mit dem wachsenden Fortschritt auch einige Befürchtungen einher. Werden Sprecher*innen zunehmend austauschbarer oder kann die KI mit laufender Entwicklung die Feinheiten menschlicher Interpretation irgendwann komplett ersetzen? Wird dann, anders als bei Pumuckl, ganz auf menschliche Sprecher*innen verzichtet?

Ethisch stellt sich außerdem die Frage inwieweit es überhaupt vertretbar ist, verstorbene Stimmen nachzuahmen. So können die Menschen schließlich nicht mehr selber einwilligen, wenn andere ihre Stimme für neue Projekte reproduzieren. Die Pumuckl-Produktion ist dabei sehr sensibel mit der Situation umgegangen: Die Familie bestätigte sogar, dass Clarin selbst sehr technikbegeistert war und sich wahrscheinlich gefreut hätte, dem kleinen Kobold erneut seine Stimme zu leihen. Auch wenn der Ansatz insgesamt eher ein Positivbeispiel ist, so bleibt grundsätzlich die Selbstbestimmung der betroffenen Personen berührt. Und auch bei lebenden Sprecher*innen kann die Nachahmung der Stimme Fragen nach Selbstbestimmung und Schutz der künstlerischen Identität aufwerfen – Aspekte die eigentlich im Vordergrund stehen sollten, auch wenn das auf Kosten der Effizienz geht.

Dies ist vor allem vor dem Hintergrund zu betrachten, dass noch kaum rechtliche Regelungen diesbezüglich vorherrschen. Die Befürchtungen des VDS und die Forderung nach Regelungen und Schutzmechanismen sind also durchaus begründet. Die Branche steht demnach vor der Herausforderung, einen verantwortungsvollen Umgang mit KI zu finden, der sowohl Chancen der Technologie nutzt, als auch die Rechte und künstlerische Identität der Sprecher*innen bewahrt.

Wie geht es weiter?

Die Entwicklung von KI in der Synchronbranche – und im kreativen Bereich generell – steckt noch in den Anfängen. Ob sie langfristig als ein Tool zur Unterstützung verstanden wird oder tatsächlich die Arbeit von Künstler*innen ersetzt bleibt abzuwarten und wird wahrscheinlich auch davon abhängen, welche Regelungen, Haltungen und Praktiken sich in den nächsten Jahren durchsetzen. Klar ist wohl: Diese Debatte wird uns noch länger begleiten, sowohl auf rechtlicher als auch auf gesellschaftlicher Ebene.

Wer jetzt neugierig geworden ist und sich am liebsten selber testen möchte, ob er oder sie eine generierte Stimme von einer echten unterscheiden kann, kann sich hier einem Quiz des Fraunhofer-Institutes stellen.


Image by Brett Sayles via pexels

Hat ihren Bachelor in Kulturwissenschaft mit Fokus auf digitale Medien abgeschlossen und verbindet nun ihre Leidenschaft fürs Schreiben mit der Begeisterung für alles, was digital ist. Dabei geht sie gerne den Fragen nach, die unsere vernetzte Welt bewegen und unseren Alltag prägen.


Artikel per E-Mail verschicken