PageRank

Aus MedienWiki

Wechseln zu: Navigation, Suche

Als PageRank bezeichnet man ein Ranking-Verfahren, mit dem die Suchmaschine Google die Seiten in ihrem Index bewertet. Erstmals veröffentlicht wurde der dem PageRank zu Grunde liegende Algorithmus von den beiden Google-Gründern Lawrence Page und Sergey Brin, wobei der PageRank nach ersterem benannt wurde.

Funktionsweise

Anders als bei herkömmlichen Ranking-Verfahren gelten beim PageRank nicht nur solche Seiten als populär, auf die möglichst viele Links treffen - sondern solche, die von selbst als "wertvoll" eingeschätzten Seiten verlinkt werden. Bildlich ausgedrückt schenkt der PageRank-Algorithmus der Restaurant-Empfehlung eines Fünf-Sterne-Kochs mehr Vertrauen als der eines Laien, weil der Koch selbst von vielen anderen empfohlen wurde. Ob das Restaurant tatsächlich gut ist, macht kaum Unterschied: Wichtig ist, dass der Koch genug Ansehen genießt.

Schematische Darstellung des Pagerank-Verfahrens

Wenn Seite A von vielen, hoch gerankten Seiten empfohlen (verlinkt) wird, dann wird sie von Google als relevanter ("treffender") eingestuft - ihr Ranking steigt. Damit hat ein Link von Seite A auf Seite C mehr Gewicht, auch Seite C wird höher geranked..

Wird Seite B von wenigen, niedrig gerankten Pages verlinkt, dann hat ihr Verweis auf Seite C weniger Gewicht, Seite C wird geringer gewertet.

Das Mysterium PageRank

Die genaue Formel, mit der die Seiteneinstufung errechnet wird, dürfte sich seit ihrer ersten Formulierung durch Lawrence Page wohl geändert haben. So wird darüber spekuliert, ob manche Seiten von Google einen Bonus bekommen oder andere bestraft werden (BadRank). Google verteidigt die Geheimhaltung des Algorithmus damit, dass man schwarzen Schafen keine Chance geben will, sich in der Trefferliste weiter nach oben zu mogeln.

Probleme und Manipulationsmöglichkeiten

Auch der PageRank kann beeinflusst werden - besonders bei gängigen Begriffen findet man oft inhaltsleere Seiten, die den Algorithmus überlistet haben, indem sie bestimmte Begriffe vielfach wiederholen (Doorway Page). Andererseits haben es (noch) unbekannte Seiten schwer, sich zu etablieren - besonders, wenn sie nicht für Suchmaschinen optimiert worden sind. Hier zeigt sich eine Schwäche der Page-Rank-Idee: Gute Seiten zu einem bestimmten Thema müssen nicht unbedingt von jedem verlinkt werden. Schon länger versucht man deshalb, Suchmaschinen die "Inhaltsanalyse" beizubringen. Außerdem "glaubt" der Algorithmus einem Link, dass die von ihm anvisierte Seite auch tatsächlich das Enthält, was der Link verspricht. Wenn beispielsweise genug Leute mit dem Begriff "Failure" auf die Biografie von George W. Bush verweisen, dann steigt diese im Ranking nach oben, obwohl sie dem amerikanischen Präsidenten sicher kein "Versagen" zuschreibt. Das massenhafte Ausnutzen der "Gutgläubigkeit", dass hinter der Bezeichnung eines Links auch tatsächlich der passende Inhalt steht, nennt sich Google bombing.

Durch die Beinahe-Monopolstellung von Google kann das Ranking-Verfahren mit über den Erfolg einer Webseite entscheiden - das macht den Algorithmus für Google so wertvoll und verleiht dem Unternehmen gleichzeitig auch Macht. Niemand weiß, nach welchen Kriterien die Webseiten tatsächlich gewichtet werden und nach welchen Kritierien bestimmte Webseiten (z.B. Amazon oder die Wikipedia) bevorzugt werden. Andererseits können Webseiten bei einer Verletzung der Google-Regeln auch ganz aus dem Suchindex ausgeschlossen werden (PageRank 0) - damit werden sie bei einer Suche überhaupt nicht mehr gefunden. Vor diesem Schicksal sind auch große Seiten nicht sicher, wenn sie - wie zum Beispiel die BMW-Homepage im Februar 2006 (->Doorway Page) - gegen die Regeln von Google verstoßen.

Genaue Erklärung des PageRank-Algorithmus

Persönliche Werkzeuge
Navigation
Organisatorisches