www.infos-aus-germanien.infoBy Germanien | Startseite | Impressum | Sitemap | Webtips
 

PageRank

www.infos-aus-germanien.info



PageRank (nach einem seiner Erfinder, Lawrence Page und von engl. rank - Rang) ist das von der Internet-Suchmaschine Google genutzte System fĂŒr die Bewertung der gelisteten Seiten.

Das Grundprinzip lautet: Je mehr Links auf eine Seite verweisen, um so wichtiger ist sie. Je wichtiger wiederum die verweisenden Seiten sind, um so grĂ¶ĂŸer der Effekt (Vererbung). Daraus resultiert ein PageRank von 0-10. Normale Webseiten haben einen Rank von 1-5. Wichtige oder speziell optimierte Seiten erreichen Werte von 5-7. Seiten mit einem PageRank von 8 und höher sind sehr selten, z.B. die des Weißen Hauses oder die Firmenseite von Microsoft.

FrĂŒher hatte ein hoher PageRank eine deutlich gehobene Positionierung in den Suchergebnissen bei Google zur Folge. Nach dem Jahreswechsel 2003/2004 ist nach einigen Änderungen dieser Effekt nicht mehr so stark zu spĂŒren. Es ist eher eine Stabilisierung der Position von hoch bewerteten Seiten in der Trefferliste zu vermerken. Dennoch bringt ein hoher PageRank Vorteile fĂŒr eine Webseite. So spidert (durchsucht) Google z.B. Webseiten mit einem hohen PageRank öfter und tiefer.

Aufgrund strikter Geheimhaltung lĂ€sst sich ĂŒber die genaue Funktionsweise des heutigen PageRank-Verfahrens nur spekulieren. Zudem Ă€ndert Google regelmĂ€ĂŸig das Verfahren, um die QualitĂ€t der Suchergebnisse auf einem gleichmĂ€ĂŸigem Niveau zu halten. Die Form des ersten Algorithmus aus der Arbeit (siehe Litertur) von Lawrence Page und Sergey Brin ist jedoch bekannt.

Der PageRank-Algorithmus

Das grundsĂ€tzliche Prinzip des ursprĂŒnglichen PageRank-Algorithmus ist, dass jede Seite ein Gewicht besitzt, das um so grĂ¶ĂŸer ist je mehr Seiten mit einem hohen eigenem Gewicht auf diese Seite verweisen. Das PageRank-Gewicht <math>R_i<math> einer Seite <math>i<math> berechnet sich also aus den Gewichten <math>R_j<math> der auf <math>R_i<math> verlinkenden Seiten <math>j<math>. Verlinkt <math>R_j<math> auf insgesamt <math>C_j<math> verschiedene Seiten, so wird das Gewicht von <math>R_j<math> anteilig auf diese Seiten aufgeteilt. Durch wiederholtes Anwenden der folgenden Berechnungsvorschrift konvergieren die Gewichte der einzelnen Seiten zu einem stabilen Wert:

<math>R_i = (1-d) + d \sum_{ji}{R_j/C_j}<math>

Dabei ist <math>d<math> ein DĂ€mpfungsfaktor zwischen 0 und 1, mit dem ein kleiner Anteil des Gewichts einer jeden Seite abgezogen und gleichmĂ€ĂŸig auf alle Seiten verteilt wird. Dies ist notwendig, damit das Gewicht nicht zu Seiten „abfliesst“, die auf keine andere Seite verweisen. ZusĂ€tzlich muß ein Link von jeder Seite zu sich selbst hinzugefĂŒgt werden.

Die Gewichte der einzelnen Seiten lassen sich unter UmstÀnden auch mit einem linearen Gleichungssystem lösen, da eine stabile Lösung ein Eigenwertproblem darstellt (siehe Markovkette).

<math>\vec R = ( (1-d)/n I + dM ) \vec R<math>

Dabei ist ergibt sich <math>M<math> aus der Adjaszenzmatrix <math>A<math> mit <math>m_{ij}=a_ji/C_j<math>.

Normiert man den PageRank auf 1 und interpretiert das Gewicht einer Seite als Wahrscheinlichkeit, so gibt es die Wahrscheinlichkeit an, dass ein zufÀlliger Surfer (siehe Zufallspfad) sich auf einer Seite befindet.

Der heute von Google verwendete PageRank hat sicher nicht mehr exakt diese Form, geht aber auf diese Formel zurĂŒck. Der von Google angezeigte PageRank einer Seite ergibt sich wahrscheinlich durch logarithmierung des Seitengewichts. Ein alternativer Algorithmus ist das Verfahren der Hubs und Authorities von Jon Kleinberg.

Dieses Verfahren verstÀrkt nebenbei einen Effekt eines "skalenfreien Netzwerks", den "MatthÀus-Effekt" nach Barabåsi. Dieser Effekt wird in der Netzwerktheorie beschrieben. Stark vereinfacht bedeutet er: "Wer hat, dem wird gegeben." D.h. neu hinzukommende Seiten verweisen vor allem auf bereits bekannte Seiten. Diese werden dadurch schneller bekannt und ziehen mehr Links an, als unbekannte Seiten von gleicher QualitÀt.

Dieses sinnvolle System wird in der Praxis von Seach Engine Optimizers (SEO) oft durch Cloaking, Spamming, dem Betreiben einer Linkfarm und anderen unseriösen Methoden missbraucht, da ein höherer PageRank durchaus ansehnliche wirtschaftliche Vorteile bringen kann.

Siehe auch: Sponsored Links, Natural Listings, Suchmaschinen-Optimierung, Search Engine Marketing, Click Popularity

Weblinks









Info Hinweis: Dieser Artikel basiert auf dem Ursprungsartikel PageRank aus der Wiki pedia und er steht unter der GNU-Lizenz link fuer freie Dokumentation, eine Autoren-Liste ist ebenfalls verfuegbar.