Newslitter

Everything. Literally.

Big Data als Disziplinarmechanismus

Von Hendrik in Politik am 01.03.2017


Big Data kann ein mächtiges Werkzeug sein — doch nicht in der Form, in der es als solches verstanden wird. Big Data ist vielmehr ein effektiver, aber rein kommunikativer Disziplinarmechanismus.


Auch derartige Symbolbilder wie dieses von einem zufälligen Ausschnitt eines Scriptes können als Disziplinarmechanismus verstanden werden, weil Menschen sie nicht verstehen, aber professionell aussehen (CC Zero by Markus Spiske, http://unsplash.com/photos/Skf7HxARcoc/)
Auch derartige Symbolbilder wie dieses von einem zufälligen Ausschnitt eines Scriptes können als Disziplinarmechanismus verstanden werden, weil Menschen sie nicht verstehen, aber professionell aussehen (CC Zero by Markus Spiske, http://unsplash.com/photos/Skf7HxARcoc/)

Ein Freund hat neulich herausgefunden, dass sich mittels der Graph-API von Facebook die Beiträge von Freunden nach bestimmten Schlagworten durchsuchen lassen und damit spezifische Feeds um verschiedene Themen herum bauen ließen und man somit einen Querschnitt der Einstellungen und Meinungen seiner Freunde (und potenziell auch der Freunde von Freunden) auf einen Blick zusammenstellen kann. Ganz davon ab, dass die Graph-API schon relativ alt ist und mittlerweile auch mittels diverser Tools diese API in ihrer Gänze genutzt werden kann, zeigt das für mich hauptsächlich, dass Big Data immer noch sehr effizient als Disziplinarmechanismus genutzt werden kann, da ihre Anwender immer noch die Illusion aufrecht halten können, Big Data könne zu einer massenhaften Spionage bis ins Privateste hinein verwandt werden.

Dass dies nicht direkt zutrifft und die Gefahren, welche von Big Data ausgehen, vielmehr woanders zu suchen sind, habe ich — Ironie des Schicksals — natürlich zunächst als Facebook-Kommentar unter den Beitrag gestellt. Da ich jedoch denke, dass der Punkt enorm wichtig ist und nicht nur in meinem Freundeskreis verharren sollte, stelle ich den Kommentar hier noch einmal überarbeitet online.


Zum einen ist zu sagen, dass eine Suchfunktion, mittels derer sich Feeds aus verschiedenen Aussagen zu bestimmten Schlagworten zusammenstellen lassen, schon seit den Anfängen von Forensoftware in solchen als auch auf Blogs zu finden ist. Die meisten dieser Suchfunktionen sind zugegebenermaßen nicht allzu präzise, was sie auch nicht sein müssen. Doch für eine mächtige Suchfunktion benötigt es nicht viel mehr als einen Nachmittag Zeit, einen (meist als Open Source im Internet zu findenden) Thesaurus und ein kleines bisschen Hirnschmalz, falls man mal eine bauen möchte.

Doch die Suchfunktion war ja nur der Stein des Anstoßes; die wirkliche Gefahr wird ja in der Macht von Big Data gesehen. Hier, denke ich, wird in vielerlei Hinsicht Big Data sowohl über- als auch unterschätzt. So ist Big Data zunächst keine Gefahr in dem Sinne, wie sie immer dargestellt wird.

Zum einen gibt es in der Tat keinerlei statistische Methoden, mittels derer eine Multiplizität diverser Persönlichkeitsmerkmale durch die Massenanalyse von Posts, egal ob von Facebook, YouTube oder sonstigen Medien, selbst WhatsApp, so effizient reduziert werden kann, dass man mittels dieser Daten verlässliche Aussagen über verschiedene Bevölkerungsgruppen oder einzelne Klassen treffen könnte. Statistische Methoden wurden entwickelt, um von einer Stichprobe auf die Gesamtpopulation zu schließen, nicht umgekehrt. Mich hat es auch gewundert, aber in der Tat gibt es noch keinerlei Modelle, mittels derer der umgekehrte Weg verlässlich beschritten werden kann. Die Technik "Map Reduce" beispielsweise, eine der wenigen Technologien, die spezifisch für Big Data entwickelt wurde, ist, genau wie Apache Hadoop, letztlich nur eine Management-Technologie, nicht zur Analyse selbst gedacht. Auch bezüglich der "Big Five", die vor einiger Zeit durch die OCEAN-Methode wieder an Fahrt gewonnen haben, weil die Erfinder von OCEAN meinten "Hey, damit können wir für jede Person vorhersagen, wie sie tickt", sind nichts mehr als ein etwas verlässlicheres Horoskop einzelner Individuen.

Zum anderen aber wird Big Data massiv unterschätzt. Und zwar liegt die eigentliche Gefahr davon nicht darin, dass man plötzlich alle Personen durchleuchten könnte (nichtmal die NSA kann das; das neueste Datencenter in Utah ist nur dazu gedacht die massiven Mengen verschlüsselter Kommunikation zu speichern; wirklich auswerten können auch die sie nicht, was unter anderem daran liegt, dass moderne Verschlüsselungsmethoden unter Anderem über Faktorisierung mit derart großen Zahlen funktionieren, dass auch Supercomputer ziemlich lange zum Knacken verschlüsselter Kommunikation brauchen).

Die Gefahr liegt vielmehr in den wahrgenommenen Effekten von Big Data im Sinne des Thomas-Theorems ("Wenn die Menschen Situationen als wirklich definieren, sind sie in ihren Konsequenzen wirklich").

Big Data hat vor allen Dingen zwei massive Gefahren: Erstens, dass alle Menschen eine diffuse Angst davor haben; die wirkliche Macht von Big-Data-fähigen UNternehmen wie Google, Facebook, die NSA oder Diensten wie Cloudflare oder Digital Ocean (die interessanterweise nur sehr sporadisch in den Medien überhaupt auftauchen, obgleich sie über ähnlich große Datenbestände wie Google etc. verfügen) liegt also nicht darin, dass sie wirklich Macht ausüben könnten oder rumspionieren können, sondern dass wir Angst haben, dass sie das könnten, wodurch sich unser Verhalten zum Teil massiv verändert. Alleine die Ankündigung von Big Data erzeugt ja schon Angst und Schrecken und wird genutzt, um politische wie ökonomische Macht aufzubauen.

Die zweite große Gefahr von Big Data liegt in Teilen in der Unfähigkeit statistischer Methoden, von der Population auf eine Stichprobe zu schließen, begründet. Werden also tatsächlich Aussagen basierend auf Big-Data-Analysen getroffen, ist es vielfach so, dass damit nur ein gesellschaftlicher Durchschnitt berechnet werden kann. Die Aussage hinter jeder Big-Data-Aussage ist letztlich die "durchschnittlich verhält sich jeder Mensch mit folgenden Persönlichkeitsmerkmalen so und so". Hier ist es ein bisschen Mindfuck, zur Metaaussage zu gelangen, aber einfach gefragt: Wer ist der Durchschnittsmensch? Gibt es ihn? Nein, niemand verhält sich also so wie im Durchschnitt. Doch sobald dir jemand erzählt "Weil du kein Fleisch isst, hast du eine größere Tendenz, politischen Verschwörungstheorien Glauben zu schenken" und das dann vorgeblich mit großen Datenbeständen zu untermauern schafft, ist zumindest die Idee, da könnte was dran sein, in deinem Kopf. Ein bisschen öfter damit konfrontiert fängst du entweder irgendwann an, doch wieder Fleisch zu essen (womit die Big-Data-Aussage widerlegt wäre) oder aber du fängst an, zumindest im Geheimen wirklich an Verschwörungen zu glauben, womit du dich quasi an die Aussage "angepasst" hast.

Letztlich, und ich denke, das ist der zentrale Punkt an der ganzen Geschichte, ist Big Data ein ziemlich effektiver Disziplinarmechanismus für den aufgeklärten Teil der Gesellschaft, der sich zumindest partiell damit auskennt und um die vermeintlichen Konsequenzen zu wissen glaubt (die, wie ich ja schrieb, in ihren Konsequenzen tatsächlich real sind). Big Data also kann uns tatsächlich disziplinieren — nur eben nicht so, wie die Vertreter der Technik meist behaupten.


Sharing is caring :)