Google Dance

Die Bezeichnung "Google Dance" war eine passende Umschreibung des Verhaltens der Suchmaschine Google im Laufe eines Index-Updates. Das Update fand regelmässig einmal im Monat statt, man erkannte es daran, daß die Ergebnisse bei jedem Suchlauf anders aussahen. Es sah so aus, als würde einzelne Webseiten den Index rauf und runter "tanzen" Das kommt daher, das Google verschieden Datencenter benutzt um Daten abzurufen, diese Datencenter werden der Reihe nach upgedatet, dadurch passiert es das eine Suchanfrage den alten Datenbestand trifft, und die nächste mit den selben Suchbegriffen den neuen. So entstand dieses Dance-Verhalten. Das Update ging allerdings nicht auf einen Schlag los, es wurde Rechenzentrum für Rechenzentrum upgedatet, Zunächst erschienen Ergebnisse aus dem neuen Index nur sporadisch. Später tauchten sie immer häufiger auf. Man sprach die gesamte Phase über vom "Google Dance".

Mittlerweile ändern sich die Ergebnisse der Suchmaschine Google nicht mehr regelmässig einmal im Monat, sondern z.T. mehrmals täglich - mal mit grösseren Unterschieden, mal nur in Form kleinster Änderungen.
Entweder kann man von einem permantenten "Tanzen" der Ergebnisse sprechen, oder man könnte genau so gut behaupten, dass es nun keinen echten Google-Dance mehr gibt.


Technische Hintergründe des "Google Dance":


Die Suchmaschine Google liefert Suchergebnisse von mehr als 10.000 Servern, bei denen es sich um einfache Linux-PCs handelt (Google bezeichnet diese auch als Low-Cost-Pc`s). Das Update kann natürlich nicht gleichzeitig auf allen Servern aufgespielt werden, es muss jeder PC einzeln bestückt werden.

Während des Dances werden Suchanfragen wie immer durch die DNS zu einem Server weitergeleitet, wenn dieser bereits die neuen Daten hat waren unter Umständen andere Ergebnisse als noch 1 Minute vorher zu sehen, obwohl Sie die selben Suchbegriffe verwendet haben.


DNS (Domain Name System) und Google Datencenter

Es wäre zwar theoretisch denkbar, dass alle Suchanfragen zentral erfasst und dann an die einzelnen Rechenzentren verteilt würden. Dies ist allerdings offensichtlich ineffizient. Jedes Rechenzentrum hat vielmehr eigene IP-Adressen und die Art und Weise, wie auf diese IP-Adressen zugegriffen wird, regelt das Domain Name System.

Das DNS funktioniert grundsätzlich folgendermaßen: Datentransfers erfolgen im Internet immer nur zwischen IP-Adressen. Informationen darüber, welche Domain zu welcher IP-Adresse gehört, halten die Name Server des DNS bereit. Gibt ein Nutzer eine Domain in seinen Browser ein, ermittelt der lokal konfigurierte Name Server die dazugehörige IP-Adresse, indem er den für die jeweilige Domain zuständigen Name Server kontaktiert. (Dabei ist das DNS hierarchisch strukturiert. Eine Wiedergabe des exakten Vorgangs würde an dieser Stelle jedoch zu weit führen.) Diese IP-Adresse wird dann im lokal konfigurierten Name Server gespeichert, damit nicht bei jeder Verbindung eine Anfrage über das DNS erfolgen muss.

Für jede Domain gibt es eine unterschiedliche "Lebensdauer" TTL (Time to Live". Bei der Domain Google.com ist dieser Wert auf 5 Minuten beschränkt, d.h. nach 5 Minuten wird die IP aus dem Cache gelöscht und bei einer erneuten Suchabfrage wir eine neue IP über das DNS vergeben. Daher werden also ständig wechselnde Rechnzentren abgefragt. Und es kommt während einem Update zu dem "Google Dance" da nicht alle Datencentren gleichzeitig den neuen Index erhalten.


Es gibt mittlerweile 10 Datencentren, die auch über eine eigene Domain zu erreichen sind. Hier eine Liste der aktuellen Datencentren mit Ip-Adresse:

www-ex.google.com 216.239.33.100
www-sj.google.com 216.239.37.100
www-va.google.com 216.239.37.100
www-dc.google.com 216.239.39.100
www-ab.google.com 216.239.51.100
www-in.google.com 216.239.53.100
www-zu.google.com 216.239.55.100
www-cw.google.com 216.239.57.100
www-fi.google.com 216.239.41.100
www-gv.google.com 216.239.59.100

Die Google Dance Testdomains www2 und www3
Der Beginn eines Google Dance konnte stets anhand der beiden Testdomains www2.google.com und www3.google.com beobachtet werden. Den beiden Domains ist im Zeitablauf relativ fix jeweils eine (oft die gleiche) IP-Adresse zugeordnet. Vor Beginn des Google Dance wurde zumindest einer der beiden Domains über das DNS die IP-Adresse desjenigen Rechenzentrums zugewiesen, dessen Server den neuen Index zuerst erhalten.