Die Welt ist eine Google

Als 1998 das Unternehmen Google Inc mit seiner gleichnamigen Suchmaschine die Schaubühne des Internets betrat konnte noch niemand ahnen, dass aus diesem lustigen Wort einst der teuerste Markenname der Welt werden sollte. Aus einer Suchmaschine wurde inzwischen ein fast nicht mehr zu überschauendes Paket aus unterschiedlichsten Diensten. GMail, Google Adsense, Google Analytics, Google Maps, Google Earth, Google Desktop, Google News, Knol, Chrome, Android und Youtube, um nur einige zu nennen.

Die meisten, wenn nicht alle, der Google-Dienste funktionieren nicht oder nur eingeschränkt ohne bestehenden Internetzugang. Jeder einzelne verschickt unterschiedlichste Daten, die schlussendlich alle in einem großen Topf landen.

Schon seit Jahren ist für jeden Depp Microsoft das böse Imperium. Doch der Betriebssystemhersteller hat nicht einmal ansatzweise eine solch ungeheure Vormachtstellung und Allgegenwart erreicht. Microsoft-Produkte laufen nun einmal nur unter Windows. Google-Produkte laufen größtenteils im Browser und sind daher plattformübergreifend nutzbar – und trotz vieler Alternativen anscheinend das Maß aller Dinge.

Zur Verdeutlichung, warum die Vergoogelung der Welt so gefährlich ist, hier ein kleines (und etwas vereinfachtes) Gedankenspiel:

Ein moderner Johnny Cash-Fan möchte sich gern eines seiner Konzerte auf DVD kaufen, und beginnt seine Suche nach Informationen darüber, wie das heutzutage üblich ist, bei Google. Schon beim Öffnen der Seite erhält Google die IP-Adresse des Besuchers. Diese Adresse ist eine eindeutige Identifikationsnummer, die jeder ans Internet angeschlossene Computer benötigt – anonym ist hier also schon mal keiner. Teilweise kann man seine IP mit so genannten Anonymisierern verbergen.

Gibt man nun seinen Suchbegriff, in diesem Fall zum Beispiel „Johnny Cash DVD“ in das Suchfeld ein, kann Google diesen Begriff mitsamt der IP speichern. Man kann sich das als Zeile einer Tabelle vorstellen. Als weitere Spalten speichert das System nun, welche Suchergebnisse der Nutzer schließlich anklickt. Die meisten privaten Computer haben heutzutage dynamische IP-Adressen. Das heißt, dass die IP sich durchaus täglich oder häufiger ändern kann. Damit wären die unter einer IP gespeicherten Daten nur noch halb so wertvoll. Um dieses Problem zu umgehen, versucht Google Cookies zu setzen, mit deren Hilfe sich dann die Suchen ohne IP-Adressen miteinander verbinden lassen.

Vielleicht sucht der Nutzer später einmal nach „Neil Diamond neues album“, würde wieder so eine Tabellenzeile entstehen, nur mit anderer IP. Verhindert der Musikfan die Nutzung von Cookies nicht, indem er Cookies ganz verbietet, oder wenn nötig, nur Sitzungscookies erlaubt, könnten beide Tabellenzeilen durch das Cookie zusammengeführt werden und so eine neue, detailliertere Zeile mit mehr Spalten ergeben.

Eines der angeklickten Ergebnisse für eine der Suchen könnte irgendein DVD-Forum sein, welches sich mit Google Adsense und Analytics finanziert. Der Surfer entdeckt ein ihn ansprechendes Werbebanner, vielleicht eben von der gesuchten DVD und gelangt so zu einem Internetshop. Ohne dafür Google selbst genutzt zu haben, können durch verschiedene Skripte und mithilfe der Cookies auch diese Klicks in die Tabellenzeile eingetragen werden – außerdem Informationen, wie lange der Mauszeiger über welchen Bildbereichen war, wie lange man sich auf welcher Seite aufgehalten hat und so weiter. Die Datensammlung durch Dienste wie Google Analytics kann zum Beispiel durch das Firefox-Addon Adblock Plus verhindert werden. Außerdem natürlich durch äußerst sparsamen Einsatz von Cookies.

Vielleicht nutzt unser Google-Freund auch nicht irgendeinen Browser, sondern den neuen Browser Chrome, natürlich ein Google-Produkt, welcher jedem Nutzer eine eindeutige ID zuordnet. Diese bleibt auch gleich, wenn man Chrome deinstalliert und später wieder neu installiert. Löschen lässt sie sich zur Zeit nur mit externen Programmen anderer Anbieter. Google könnte nun also dieser ID die verschiedenen IP-Adressen oder Cookies, die der Nutzer im Laufe der Zeit so hat, zuordnen. Nutzt man den Google-Browser nicht, entfällt diese Möglichkeit schon mal.

Vielleicht wird stattdessen aber Google Maps beziehungsweise Google Earth genutzt – Programme, die ohne Frage toll und unbestritten auch nützlich sind. Doch auch diese Programme funktionieren nur mit einer bestehenden Internetverbindung. Sucht man nun eine Strecke, müssen auf jeden Fall wieder die IP und außerdem natürlich der Start und Zielort der Strecke versendet werden. War der Nutzer vorher mit einem Browser online, könnte die aktuelle IP mithilfe eines Cookies bereits im Datensatz vermerkt sein, womit diese Daten dann mit den Streckendaten verknüpft werden können. Sucht ein Nutzer also zum Beispiel mehrfach nach Wegen, die allesamt in Hamburg auf der Goethestraße 12 beginnen, kann dies mit ziemlicher Sicherheit als Wohnort angenommen werden.

Damit hat man schon eine ganz schön breite Tabelle, die sich aber noch beliebig erweitern lässt. Nutzt man zum Beispiel GMail oder andere anmeldepflichtige Dienste, können noch viel persönlichere Daten zusammengetragen werden (so werden wohl auch aus automatisch gelesenen Mails Werbeeinblendungen generiert). Man kann seine Termine im Google Calendar planen, über Google Talk chatten und so weiter.

Ich weiß natürlich nicht, inwiefern Google diese Daten tatsächlich zusammenführt. Genau hier liegt aber auch der Hauptteil dieses Problems: Niemand außerhalb von Google kennt die genauen Mechanismen und den Umfang dieser Datensammlung. Die Privacy Policies sind diesbezüglich oft sehr ungenau, was nichts Gutes vermuten lässt.

Wie kann man sich also schützen? Die Antwort darauf ist natürlich klar. Für die meisten Google Tools gibt es gleichwertige oder bessere Alternativen. Am schwersten dürfte es wohl sein, nicht mehr ständig die Google Suche zu verwenden und diese als einzig verfügbares Werkzeug anzusehen.

Eine der besten Alternativen ist ixquick.com. Diese Suche funktioniert vollkommen ohne die sonst typischen Datensammeleien. Außerdem werden mit einem Suchdurchgang gleich mehrere Suchmaschinen durchstöbert, was auch für eine größere Ergebnisvielfalt sorgt.

So always remember:

Google may be evil!

Update:
Dank an Koloradokäfer. Die Addons sind sehr empfehlenswert.
Hier ein noch ein paar Tipps, wie man möglichst viele Felder im Anonymitätstest auf grün bekommt:

Referer: RefControl installieren und im Plugin dann bei „Standard für alle nicht aufgeführten Seiten“ <ersetzen> einstellen.

User-Agent: Siehe Koloradokäfers Tipp, am besten mit „Mozilla/5.0 (en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2“.

Cookie: Cookies nicht zulassen.

Sprache: Extras-Einstellungen-Inhalt-Sprachen-Erweitert. Hier nur eine Sprache auswählen, am besten Englisch, da dies die meisten Leute nutzen.

Zeichensatz: Extras-Einstellungen-Inhalt-Schriften und Farben-Erweitert-Zeichenkodierung. Hier UTF-8 wählen.

Dateitypen: in der Adressleiste about:config eingeben und nach „network.http.accept.default“ filtern. Dort als Wert */* eintragen.

Kodierung: Sollte ohne weiteres grün sein.

Die ganzen Informationen darunter kann man unterbinden, indem man Java/Javaskript deaktiviert. Am bequemsten geht das mit NoScript.

Um das oberste Feld mit der IP grün zu bekommen, muss man einen Anonymisierer verwenden, wie zum Beispiel Tor. Eine gute Anleitung zur Einrichtung desselben gibt es auf netzwelt.de.

Dieser Beitrag wurde unter Netzkultur, Software, Zeitgeschehen veröffentlicht. Setze ein Lesezeichen auf den Permalink.

2 Antworten auf Die Welt ist eine Google

  1. He, cool! Wieder eine Artikel ohne Rechtschreibfehler. (Zumindest nachdem du meine e-Mail bearbeitet haben wirst.)

    Feine Sache! Hinzuweisen ist hier noch darauf, dass Google einen auch an der Browserkennung, per Flash-Cookie oder per JavaScript wiedererkennen kann.
    – Browserkennung, z.B. Mozilla/5.0 (X11; ; Linux x86_64; rv:1.9.0.3) Gecko/2008092510 Ubuntu/8.04 (hardy) Firefox/2.0.0.0
    -> ziemlich eindeutige Kennung
    -> https://addons.mozilla.org/de/firefox/addon/967 einen Header namens User-Agent anlegen und obige Universalbrowserkennung eingeben
    – JavaScript liefert Informationen über Browser, Betriebssystem, Uhrzeit des Systems (sehr eindeutig, wenn die Uhr nicht exakt auf die Millisekunde gestellt ist)
    -> ziemlich eindeutige Kennung
    -> https://addons.mozilla.org/de/firefox/addon/722
    -> mit NoScript sieht man auch, wo Google, GoogleAnalytics und GoogleSyndicates überall schnüffeln (etwa 50% der Webseiten, die ich besuche und ich google fast gar nicht)
    – Flash-Cookies
    -> eindeutige Wiedererkennung
    -> http://objection.mozdev.org/
    -> Flash-Cookies regelmäßig mit Objection löschen

    Testen, wieviele Informationen man Preis gibt kann man gut hier:
    https://www.jondos.de/de/anontest – Sehr empfehlenswert!

    Nähere Fragen zu den Addons beantworten wir (das Trio macht bestimmt mit) gern hier in den Kommentaren.

    Ach ja, sehr lobenswert, dass man jetz gleich ins Blog gelangt!

  2. onkelerika sagt:

    Vielen Dank für die Ergänzungen, die Addons sind wirklich sehr zu empfehlen. Wenn dich die nicht vorhandenen Rechtschreibefehler so stören, warum machst du dann noch neue rein? 😛

    Ich habe den Artikel noch um ein paar Tipps erweitert.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.