Neue KI von Deezer erkennt Emotionen in Musik

Sobald ich meine Musikmediathek öffne, springen sie mir entgegen: Hunderte Playlists, Alben, Künstler und einzelne Titel. Wer auch nur ansatzweise so ein Playlist-Messie ist wie ich, der kennt das Problem: Welche Musik will ich jetzt hören? Zumal ich nicht nur „aufgeräumte“ Playlists habe, für bestimmte Interpreten oder Situationen. Sondern auch Playlists, in denen sich einfach alles Mögliche befindet. Ein einziges Chaos also, das oft darin mündet, dass ich ständig Songs skippe oder durch verschiedene Playlists nach genau diesem einen Song suche, von dem ich mir sicher war, er wäre hier irgendwo…

Der französische Streamingdienst Deezer hat nun einen großen Schritt getan, Playlist-Messies wie mir in Zukunft unter die Arme zu greifen. In einem kürzlich veröffentlichten Dokument haben die Forscher des Musik-Streamingdienstes ein Experiment vorgestellt, in dem sie ihre neue KI zur automatischen Emotions-Erkennung in Songs mit bisher „herkömmlichen“ Methoden vergleichen.

Die bisherigen Methoden

Bisherige Versuche, große Datensätze an Musik mithilfe von Computern eindeutigen Stimmungen und Emotionen zuzuordnen, verliefen eher schleppend. Denn die meisten Experimente in diese Richtung basierten auf festen Datenvorgaben. Betrachtet werden dabei bei jedem Track das Audio-Signal und die Songtexte. Für jeden Song wird vorher festgelegt, ob er eine negative oder positive Stimmung hat, und ob er ruhig oder aufbrausend ist. Doch durch diese einfache Kategorisierung ist nicht genug Differenzierung zwischen einzelnen Tracks möglich gewesen. Somit waren auch die Playlists, die von vorherigen Systemen zusammengestellt wurden, immer noch chaotisch.

Was die KI von Deezer besser macht

Deezer stützt seine KI nun auf ein zweidimensionales Stimmungs-System. Das bedeutet, dass ein Song nun auf einem Skala-Feld liegt. Ein Song kann dann z.B. als 85 Prozent positiv, 15 Prozent negativ, 30 Prozent ruhig und 70 Prozent aufregend eingestuft werden. Aus diesen Daten ergibt sich der genaue Punkt des Songs, den er auf dieser zweidimensionalen Skala einnimmt. Und aus diesem individuellen Punkt lässt sich dann die Emotion bestimmen. Das ermöglicht der KI deutlich mehr zu differenzieren und zudem repräsentiert dieses System die Emotionen-Vielfalt eines Menschen deutlich besser.

Das erste Experiment mit dieser neuen KI wurde mithilfe der Daten von 18.000 Songs durchgeführt. Das Ergebnis dessen war, dass die KI durchaus besser darin ist, zu erkennen ob ein Song eher positiv oder negativ ist. Allerdings ist die Trefferquote bei der Einteilung in ruhige und aufregendere Songs vergleichbar niedrig, wie bei älteren Methoden. Noch hat das Deezer-Team also einige Fehler zu beheben.

Wie diese KI die Art wie wir Musik hören beeinflussen könnte

Jedoch ist der Ansatz, eine KI für die Einteilung von Musik zu verwenden, gar nicht so verkehrt. Die Forscher von Deezer meinten, sie bräuchten Datensätze von synchronisierten Texten zu den Audio-Stücken, um die KI zu verbessern. Sollte diese oder ähnliche KIs dann aber irgendwann ausgereift sein, könnten sie die Art, wie wir Musik konsumieren, revolutionieren. Denn die Idee hinter diesen Vorhaben ist, dass man eines Tages in der Lage ist, die Stimmung von Musikkonsumenten automatisch zu erfassen und genau passende Playlists vorzuschlagen. Individualisiert man diesen Prozess noch weiter, könnten wir irgendwann ein perfekt auf unsere Hörgewohnheiten abgestimmtes Netzwerk aus Künstlern, Playlists und Titeln vorgeschlagen bekommen. Dann würden wir auch automatisch zu den besten Songs, die zu unserer derzeitigen Stimmung passen, geleitet. Und das Playlist-Chaos hätte ein Ende.


Image by freestock-photos/ pixabay.com


Artikel per E-Mail verschicken
Schlagwörter: , , , , , , , , ,