Wie ein 5,4-Gramm-Gadget und 3D-Audio das Podcasting revolutionieren

In den vergangenen zwei Jahren machte bei YouTube „8D-Audio“ die Runde, es ist ein regelrechter Hype darum entstanden. Tausende User:innen haben ihre selbstgemachten 8D-Versionen von bekannten Songs auf der Plattform hochgeladen. Was das Besondere war? Musik klang so, als käme sie statt aus zwei, aus acht verschiedenen Richtungen – mit anderen Worten: dreidimensional. Und an dieser Stelle muss ich den Begriff leider etwas entzaubern.

Denn 8D-Sound ist qualitativ deutlich schlechter, als „echter“ Surround-Sound. Das Problem ist, dass ein solcher Stereo-Mix künstlich aufgeblasen wird. Dadurch klingt er zwar räumlicher, gleichzeitig aber auch verwaschener. Ein weiteres großes Problem bei solchen Fake-Surround-Sounds ist die Im-Kopf-Lokalisation – hier scheinen Audiosignale im Kopf und nicht außerhalb zu liegen, was viele Menschen als sehr unangenehm empfinden.

Man kann 8D-Audio eigentlich gut mit einem Instagram-Filter einerseits und der professionellen Arbeit mit Photoshop andererseits vergleichen. Bei ersterem legt man einfach einen Filter über das komplette Bild – und erhält einen visuellen Effekt, der bei genauem hinschauen oft mehr zerstört, als er verbessert. Bei Photoshop hingegen arbeitet man mit mehreren Ebenen, bearbeitet gezielt einzelne Bildelemente – und erzielt einen viel realistischeren Effekt.

Doch auch wenn ich den 8D-Hype übertrieben – und rein künstlerisch betrachtet auch inakzeptabel – finde, kann ich die Begeisterung für Surround-Sound komplett nachvollziehen. Schließlich habe ich selbst mit Mitte 20 mehrere Tausend Euro an Ersparnissen in eine Surround-Anlage für mein Tonstudio gesteckt.

Heute hingegen habe ich meine In-Ear-Kopfhörer und kann mit einem relativ günstigen und kompakten Set-up nicht nur Musik, sondern auch Podcasts in 3D-Audio hören – damals unvorstellbar. Und auch vor rund 15 Jahren noch unvorstellbar. Denn genau das ist auch der Grund, warum die erste Podcasting-Welle 2005 nicht wirklich funktioniert hat: Die meisten Leute hatten einfach noch nicht die richtigen Devices und auch das ganze Thema Podcast-Hosting war technologisch eher den Nerds vorbehalten.

Surround-Sound – wie fing es an und was ist eigentlich was?

Bei dem Begriff Surround-Sound gibt es vier grundlegende Unterscheidungen – handelt es sich um Fake-Surround (wie z. B. 8D-Audio) oder echten Surround-Sound? Und sprechen wir von Discrete-Sound (es werden mehrere Lautsprecher aufgestellt, die diesen Effekt erzeugen) oder Virtual-Sound (Simulierung der Sound-Ortung über Kopfhörer)?

Bei „echtem“, diskretem Surround-Sound werden beim Hören nicht nur Lautsprecher vor dem Kopf, sondern auch dahinter positioniert. Signale, die akustisch betrachtet, hinter einem stehen, werden dann über die sogenannten „Rear Speaker“ abgespielt. Dadurch entsteht der Eindruck, dass man tatsächlich vom Sound umschlossen ist.

Das erste kommerzielle Format dahingehend war die sogenannte Quadrophonie – oder auch Multikanalaudio genannt. Sie war der Vorläufer des Dolby-Surround-Systems, dessen Nachfolger Dolby 5.1 einen zusätzlichen Lautsprecher in der Mitte und einen Subwoofer für eine bessere Bass-Wiedergabe einführte. Dieses Set-up ist bis heute weit verbreitet. In Kinos gibt es noch komplexere Systeme, die bis 9.1. reichen – das entspricht einem Subwoofer und neun weiteren Lautsprecher.

Darüber hinaus gibt es den sogenannten virtuellen Surround-Sound, der nur über Kopfhörer funktioniert. Entstanden ist er als Lösung für das wohl größte Problem beim Surround-Sound – dem hohen technischen Aufwand der zusätzlichen Lautsprecher, die viele Menschen nicht aufstellen wollten oder konnten. Und natürlich auch, weil Musik und Podcasts immer mobiler werden und nicht nur in den eigenen vier Wänden, sondern auch unterwegs das Hörerlebnis möglichst spannend sein soll.

Deshalb gibt es seit den 1920ern die Idee des „binauralen Hörens“. Um dies zu verstehen, muss man wissen, wie die „Vorne-Hinten-Ortung“ im Kopf funktioniert. Die Form der Ohren und des Kopfes haben einen Einfluss auf die wahrgenommenen Frequenzen, den Frequenzgang und weitere Parameter wie die Phase. Diese Kombination aus Phase und Frequenzgang nennt man Außenohrfunktion.

Weist ein Signal einen spezifischen Phasenverlauf und Frequenzgang auf, wird es im Gehirn bei beispielsweise als „von hinten kommend“ interpretiert. Genau diesen Effekt macht sich das binaurale Hören zu Nutze – hier „codiert“ man bestimmte Signale mit einer Außenohrfunktion. Dieses Signal wird dann vom Hirn etwa als „von hinten kommend“ interpretiert.

Surround-Sound war zu teuer

In den 70er Jahren gab es dann sehr konkrete Forschung, die Außenohrfunktion mechanisch zu simulieren. Das Ergebnis war der sogenannte Kunstkopf –  ein absoluter Quantensprung in der Branche. Er besteht aus einem sehr genauen Nachbildung eines menschlichen Schädels inklusive Ohren. Diese Ohren haben im Gehörgang Mikrofone. Über Kopfhörer wiedergegeben, entsteht so binaurales Hören – also 3D-Audio.

Auch der öffentlich-rechtliche Rundfunk hat sowohl Audio als auch das Thema Surround maßgeblich vorangetrieben. Der ÖRR wurde damals mit viel Geld aufgebaut, das unter anderem in die Entwicklung eigener Technologien geflossen ist. Einige Entwicklungen sind bis heute unerreicht – so ist der vor Jahrzehnten entwickelte Mikrofonvorverstärker auch heute noch mehrere Tausend Euro wert.

Bis zur Jahrtausendwende schien Surround-Sound vorerst wieder vergessen – bis ein paar erfolgreiche Executives aus den USA, teils Musikproduzent:innen, begannen, Surround neu zu denken. Es kam das Home Cinema. Es machte den Markt vermeintlich größer, da sich Konsument:innen verhältnismäßig diskrete 5.1 Lautsprecher für zuhause anschafften und Surround nicht mehr nur im Kino, sondern auch in den eigenen vier Wänden möglich war. Ein teures Vergnügen.

Dauerhaft durchgesetzt hat es sich damals nicht, stattdessen hat aber so manche:r das Auto mit Surround-Sound nachrüsten lassen – doch auch das war unglaublich teuer. Für 3D-Klang waren damals schnell 5.000 Euro und mehr fällig.

Wie 5,4-Gramm-Kopfhörer und Smartphone Podcasting revolutioniert haben

Heute hat es 3D-Audio von großen teuren Anlagen in verhältnismäßig günstige und kompakte Kopfhörer geschafft. Das Beste: (Fast) jede:r hat das perfekte Equipment für binaurales Hören beziehungsweise virtuellen Surround in der Hosentasche.

Ein Umstand, auf den auch Branchenriesen wie Apple und Amazon jüngst reagiert haben. Statt wie bislang komprimiert, werden sie ihren Kund:innen schon bald Musik in Premium-Qualität zur Verfügung stellen. Einer der Gründe ist sicher auch das gestiegene Qualitätsbewusstsein der Zielgruppe: Wer Kopfhörer für mehrere hundert Euro trägt – die „Surround‑Sound wie im Kino“ ermöglichen – hat entsprechend hohe Ansprüche an die Tonqualität.

Der gleiche Effekt trifft auf Podcasts zu: Denn durch 3D-Audio ergeben sich völlig neue Chancen für sogenannte Experience-Driven-Podcasts. Dabei geht es nicht zwangsläufig darum, dass die akustische Atmosphäre spektakulär ist – sie muss sich aber ins Storytelling einfügen. Nachdem wir in den vergangenen Jahren vor allem ein inhaltlich getriebenes Wachstum gesehen haben und es eine unglaubliche Vielfalt an Themen gibt, steht uns nun ein Entwicklungssprung in Sachen Klangqualität und damit einhergehend High-End-Podcast-Formaten bevor. Damit befinden wir uns zu einem großen Teil auf unbekanntem Terrain, das es nun zu erkunden gilt!

Alex Jacobi ist fasziniert von Daten, Kreativität und Mensch-Maschine-Prozessen. Als Chief Exponential Officer seiner vier Unternehmen beschäftigt er sich mit „all things audio": Mit Wundervoices vertont er (FMCG-) Werbespots und Unternehmenskommunikation in 50 Sprachen, With love and data ist eine digitale Kommunikationsagentur für Audioinhalte, die Kreativität aus Daten generiert und mit Sonarbird ermöglicht er Verlagen und Radiosendern das Podcasting. podwatch.io gehört zu Deutschlands meistgeklickten Podcast-Rankings und ergänzt fortan das Portfolio im Bereich Analytics.


Artikel per E-Mail verschicken