Big Data ist auch keine Lösung (meistens)

Die große Ansammlung von Datenspuren, die jeder Nutzer im Internet hinterlässt – das ist „Big Data“. In der E-Commerce-Welt gilt die Analyse dieser Daten schon seit einigen Jahren als Schlüssel zum Erfolg, nun hat das Thema auch die Medienbranche erreicht. Aber die Analyse von Big Data ist keine Lösung für die Medienzukunft, im Gegenteil (meistens zumindest). 

Der Musikstreamingdienst Spotify hat The Echonest gekauft (Hintergründe in der New York Times). Dieses Unternehmen arbeitet schon seit einigen Jahren an einem Empfehlungssystem für Musik. Es klingt ja eigentlich nicht schlecht: ein System, das aus den Millionen von verfügbaren Titeln bei Spotify die für jeden Nutzer richtigen Lieder heraussucht.  Im Grundsatz bin ich der festen Überzeugung: die Personalisierung der Inhalte wird die Zukunft der Medienwelt sein. Aber dieser Ansatz falsch.

(c) Bigstock Photo
Big Data – (c) Bigstock Photo

Empfehlungssysteme – die drei Ansätze

The Echonest gehört zu den Empfehlungssystemen, die einen rein Massendaten getriebenen Ansatz für ihre Empfehlungen verwenden. Diese Systeme sind ziemlich komplex, lassen sich aber im Falle von The Echonest auf einen einfachen Nenner bringen: Das Nutzungsverhalten von Millionen von Menschen wird  analysiert.

Man kennt das auch von Onlinehändlern wie amazon.: „Kunden, die Ihr Produkt gekauft haben, kauften auch…“. Oder, im Falle von Musik würde das Ergebnis lauten: Menschen, die Mando Diao hören, hören auch Kraftklub.

Der zweite, hauptsächlich in einfachen E-Commerce Anwendungen genutzte Ansatz ist der der direkten Verbindung von Datensätzen über ihre Eigenschaften. In etwa: zum Staubsauger gehören Staubsaugerbeutel, und deshalb werden sie empfohlen.

Den dritten Ansatz nutzen Dienste wie  das Internetradio Pandora, Streamingdienste wie Deezer, Videoplattformen wie Netflix oder Empfehlungssysteme wie my mediaguide. Letztlich sind es hier immer Menschen mit einer bestimmten Expertise, die Zusammenhänge zwischen den einzelnen Medien erkennen und definieren.

Big Data ist nie big enough – und Algorithmen sind dumm

Das Problem der Big Data getriebenen Empfehlungssysteme ist nicht der Algorithmus, sondern die Datenbasis. The Echonest hat vielleicht die Nutzungsdaten von 50 Millionen Kunden weltweit. Klingt viel. Ist aber lächerlich wenig. Denn Musik ist im Grundsatz eine Sache, die sehr von kleinen, teils sogar lokalen Kulturräumen getrieben ist. Die Sprache, regionale Trends oder sogar Lokalpatriotismus spielen eine Rolle in der Entscheidung darüber, ob ein Song gefällt oder nicht.

Rechnet man jetzt diese weltweit (!) 50 Millionen Nutzer auf einzelne, regionale Kulturräume herunter, bleiben nicht mehr sehr viele  relevante Datensätze für Empfehlungen übrig, So passiert es auch amazon. Selbst dieser datengetriebene Empfehlungsalgorithmus empfiehlt zum Computerspiel World Of Warcraft tatsächlich eine Ohrenschmalzspritze als relevantes Produkt – vermutlich nur, weil ein oder zwei World Of Warcraft Käufer mal ein solches Profil hinterlassen haben.

Screenshot: Commendat, Quelle: amazon
Screenshot: Commendat, Quelle: amazon

Dazu kommt das Problem, dass man anhand der Daten zwar Nutzungszusammenhänge erkennen kann, die Ableitung von Nutzungsmotivationen aber nicht gelingt.

Ein Beispiel: Auf der Cebit  2014 hörte ich den Vortrag eines google Chefentwicklers über die neuen, datengetriebene Geschäftsmodelle  googles. So glaubte er, anhand der regionalen Verteilung der Suchanfragen zum Thema „Grippe“  die Ausbreitung einer Grippe-Epedemie darstellen zu können. Mein Einwand dazu: die Häufigkeit der Suchanfragen spiegelt nicht die tatsächlichen Erkrankungen wieder, sondern nur  die regionale Themenrelevanz. Ein einfacher Artikel in der Lokalzeitung über eine anrollende Grippewelle  würde einen Peak in der Suchhäufigkeit erzeugen, obwohl die Menschen gar nicht krank sind.

Oder, um es auf Musik herunterzubrechen. Warum jemand nach Mando Diao Kraftklub hört, sagt Big Data nicht. Selbst, wenn man verschiedene Datenquellen nutzt, gelingt das nicht. So hat man erst vor ein paar Monaten mal die Daten von Facebook mit Nutzungsdaten von Spotify zusammengerechnet. Heraus kam dann: Menschen, die ihren Beziehungsstatus gerade von „Beziehung“ auf „Single“ geändert hatten, hörten besonders häufig den Song „The Cave“ von Mumford & Sons.




Aber auch hier ist keine Aussage darüber möglich, warum eigentlich. Um die Trennung zu verarbeiten? Oder um sich mit dem fröhlich klingenden Song einfach abzulenken? Letztlich braucht es hier den Menschen. Jemanden, der die Bedeutung einer so wunderschön lyrischen Textzeile wie

„And I’ll find strength in pain
And I will change my ways
I’ll know my name as it’s called again“

versteht. Die Essenz dieses Textes kann nur die menschliche Kognition erkennen, und auf absehbare Zeit kein Algorithmus – sei er auch mit noch so viel Big Data gefüttert wie es geht.

Wann Big Data in den Medien funktionieren (kann)

Zu jedem Beispiel gibt es auch den Gegenbeweis. Im Falle von Medien ist es die Serie House Of Cards. Sie wurde vom US Streamingdienst Netflix mit Hilfe der Nutzungsdaten ihrer Kunden produziert. Welchen Regisseur sehen sie gern (David Fincher), welchen Schauspieler (Kevin Spacey), und Geschichten über Macht und Politik kommen gut an …  (Hintergründe zur Konzeption von House Of Cards). Die Serie war in den US ein großer Renner – Big Data kann also beim erfolgreichen Entwickeln eines neuen Formates sehr wohl eine Rolle spielen. Und zwar immer dann, wenn damit der Kundenwunsch einigermaßen valide abgebildet wird.

Um diese kleine Fürsprache für Big Data gleich wieder abzuschwächen: in Deutschland scheiterte die lineare Ausstrahlung bei SAT 1 kläglich. Das beweist, dass die Erkenntnisse aus Big Data eben nicht so einfach auf andere Kulturräume oder Märkte übertragen werden können.

Entwickelt hybrid

Der richtige Ansatz für Medien und Big Data ist meiner Meinung nach einer, der beide Welten verbindet: die der menschlichen Kognition und die er Datensammlung. Die Daten können dann nützlich sein, wenn sie den Kundenwunsch abbilden und wenn Menschen sie mit Verstand interpretieren und in Zusammenhänge stellen. Der rein technologische Ansatz (der in Wahrheit gleichzeitig auch ein Ansatz ist, bei dem sich Manager hinter den Zahlen verstecken und sich so vor echten Entscheidungen herumdrücken können) wird gerade hoch gelobt, führt aber meiner Meinung nach ins nichts.

 

 Weitere Ressourcen zum Thema:
 
Financial Times :“Big Data, are we making a big mistake“ vom 28. März 2014