Vor einer Woche veröffentlichte Matt Cutts, seines Zeichens “die Stimme von Google für Webmaster”, in der Reihe “Google Webmaster Help” ein interessantes Video zu der Frage “How many pages can Google index from a single site?” (Video siehe weiter unten).
Matt Cutts erzählt in dem Video, dass die maximale Anzahl indexierter Seiten pro Website im Zusammenhang mit dem PageRank (PR) steht. Er sagt auch, dass man sich darüber keine Sorgen machen sollte. Ich gehe aber davon aus, dass es durchaus einige Websites geben könnte, die bei der Indexierung von Seiten an ihre PR-Grenzen stoßen. Oder kommt es doch nur auf die Menge “Unique Content” an und es gibt wirklich keine Grenzen, die man beachten muss?
Um das herauszufinden, möchte ich gerne zusammen mit Euch versuchen, diese Grenzen zu ermitteln und zu einer gemeinsamen Studie, der “Index-Jagd” aufrufen. Dabei gibt es auch etwas zu gewinnen. Mitmachen lohnt sich also. Jeder, der bis zum 29. Juni 2009 zu einer der zehn PR-Stufen (PR 1, PR 2, PR 3 usw.) in einer der beiden Kategorien “Domain” oder “Hostname” die Website mit der höchsten Anzahl indexierter Seiten findet, gewinnt ein Poken! Ein Poken ist ein neues Gadget, welches als Schlüsselanhänger Kontaktdaten und Profile aus verschiedenen sozialen Netzwerken als Ersatz zur Visitenkarte zwischen den Benutzern austauscht.
Bevor wir zum Gewinnspiel kommen, schaut Euch erst einmal das Video von Matt Cutts an.
Hier die Regeln des Gewinnspiels:
- Wer bis zum 29. Juni 2009 in einer PR-Stufe (1-10) die Domain oder einen Hostnamen mit der größten Anzahl indexierter Seiten findet, gewinnt ein Poken. Es werden also bis zu 20 Pokens verlost (10 mal Domain und 10 mal Hostname)
Beispiel:
Domain: google.com (Abfrage site:google.com)
Hostname: www.google.com (Abfrage site:www.google.com) oder video.google.com (site:video.google.com) - Es zählen nur die Ergebnisse von Abfragen über Google Deutschland (http://www.google.de/).
- Liegt die Vermutung nahe, dass eine Abstrafung des angezeigten PR stattgefunden hat, wird die Domain nicht gezählt.
- Als abgestrafte Domains zählen grundsätzlich alle Domains auf der Liste “abgewertete Domains” von SISTRIX.
- Damit die Studie keine abgewerteten Domains enthält, werden zudem alle Domains ausgeschlossen, bei denen die SISTRIX-Toolbox einen PR-Verlust seit dem 07.04.2008 anzeigt, der nicht wieder aufgeholt wurde.
- Um die Entwicklung des PR überprüfen zu können, werden nur Domains gezählt, zu denen die SISTRIX-Toolbox Werte liefert.
- SISTRIX darf auch bei dem Gewinnspiel mitmachen, da sein Poken defekt ist ;-(, aber maximal 1 Poken gewinnen.
- Bei den Domains darf keine Subdomain einen höheren Wert als die Top-Level-Domain (TLD) besitzen, da sonst die Ergebnisse verfälscht werden (z.B. gigajob.com PR 4 und at.gigajob.com PR 5).
- Die Zahlen der SISTRIX-Toolbox aus der KW 27 (29. Juni 2009 bis 05. Juli 2009) gelten als offizielles Ergebnis zur Ermittlung der Gewinner.
- Falls die Anzahl indexierter Seiten einer Website bis zum Monatsende steigt, gewinnt die Person, welche die Domain bzw. den Hostnamen zuerst gemeldet hat und nicht die Person, die den höchsten Stand gemeldet hat.
- Last, but not least: Die Regeln können bei Bedarf geändert und ergänzt werden. Der Rechtsweg ist ausgeschlossen 😉
Um die Messlatte einigermaßen hoch zu legen, gebe ich schon einmal ein paar Werte vor:
Domains (TLD):
PR 10: google.com (93.400.000 Seiten)
PR 9: yahoo.com (684.000.000 Seiten)
PR 8: blogspot.com (336.000.000 Seiten)
PR 7: ebay.de (31.000.000 Seiten)
PR 6: shopping.com (33.900.000 Seiten)
PR 5: 123people.de (15.200.000 Seiten)
PR 4: quoka.de (5.590.000 Seiten)
PR 3: hausgarten.net (48.600 Seiten)
Hostname:
PR 10: www.google.com (4.980.000 Seiten)
PR 9: www.youtube.com (146.000.000 Seiten)
PR 8: www.myspace.com (144.000.000 Seiten)
PR 7: www.klicktel.de (13.200.00 Seiten)
PR 6: www.yatego.com (11.500.000 Seiten)
PR 5: www.123people.com (15.100.000 Seiten)
PR 4: www.quoka.de (2.000.000 Seiten)
PR 3: www.hausgarten.net (48.500 Seiten)
Ich bin mir sicher, dass Ihr noch viele Domains und Hostnamen findet, die höhere Werte aufweisen. Viel Spaß bei der Index-Jagd!
P.S: Wenn jemand für dieses Gewinnspiel gerne als Sponsor auftreten möchte, kann er sich gerne bei mir melden (kronenberg@seo-strategie.de). Verbesserungsvorschläge für die Methodik und die Spielregeln sind immer willkommen.
site:wordpress.com
wäre mein erster Kandidat.
Ergebnisse 1 – 10 von ungefähr 116.000.000 von wordpress.com.
@André: wordpress.com hat PR 9 und liegt bei der Anzahl indexierter Seiten deutlich hinter yahoo.com (s.o. ungefähr 684.000.000 Seiten)
Hehe, das ist mal witzig (und gar nicht so einfach). Habe schon einiges ausprobiert, aber noch nichts gefunden. Noch ist ja etwas Zeit.
@Sasa: Für PR 1 und PR 2 habe ich ja noch gar nichts vorgeschlagen, da ist momentan jede Nennung ein Treffer 😉
Na, dann, PR1:
Results 1 – 10 of about 6,790,000 from downloadfile.org
@Johannes: Auf solche Beispiele habe ich gewartet.
Ich werfe mal bing.com ins Rennen mit 970.000 indexierten Seiten bei PR 2. Ich hoffe das entspricht den Regeln !?
@Peer: sicherlich ist bei Bing der angezeigte PR wesentlich geringer als der tatsächliche PR, da die Seite noch sehr neu ist. Aber das gehört ja dazu, solche Fälle zu identifizieren. Wenn aber jemand noch eine “echte” und alte PR 2 Domain mit möglichst hoher Anzahl indexierter Seiten findet, wäre es prima.
Reden wir hier vom sichtbaren exportierten PR (der so oder so immer ein veraltetes Ergebnis ist) oder vom interne Google PR der sich permanent in der Google DB ändert?
Nur mal so eingeworfen… 😉
Hupps Hanns da hatte ich nicht refresht und deinen Kommentar nicht gesehen 😉
Schön unser Hausgarten.net auf dieser Liste zu finden. Die 49.000 Seiten sind alle, die wir auch tatsächlich haben. Ich schätze im PR3-Bereich gibt es einige Portale, zumindest aber sicher “Affiliate-Shops”, die hundertausende Seiten in den Index jagen. Ich werde mich auf die Suche machen.
Kategorie Hostname PR9
site: http://www.twitter.com
Ja, so kreativ bin ich nicht von unten anzufangen. Hab auch meinen Stolz 😉 Ich habe ja diverse probiert. Amazon, livejournal, etc. aber deine Beispiel sind wirklich schon sehr hoch gewählt. Mal gespannt auf die Ergebnisse.
Nach dem Johannes hier nen PR1 mit 6,790,000 Sites reingeworfen hat traut man sich ja kaum noch was zu posten 😀
bing.com ist heute auf 833.000 gefallen !?
Darum lege ich mal nach mit
PR2 3.150.000 von http://www.bing.com
PR4 16.300.000 von cylex.de
nach.
@Peer: Vor ein paar Tagen wurde über Bing und deren robots.txt getwittert. Derzeit schließen sie ihre Suchergebnisseiten aus, vielleicht sinkt deswegen die Anzahl indexierter Seiten.
Die Website von cylex.de hatte ich auch auf dem Schirm. Aber bei denen kann man mit hoher Wahrscheinlichkeit davon ausgehen, dass der angezeigte PR abgestraft wurde. Bis Ende April 2008 hatten sie noch PR 6 und sind dann plötzlich auf PR 3 gefallen. Ich gehe daher davon aus, dass sie tatsächlich PR 5 oder PR 6 haben.
@DenisW: Bei site:www.twitter.com habe ich 2 Treffer 😉 Nimmt man die ganze Domain site:twitter.com sind es aber auch “nur” 101.000.000, also weniger als yahoo.com
Na also, geht doch:
PR 9: http://www.flickr.com (254.000.000 Seiten)
🙂
fürn PR9 Hostename site:www.facebook.com
PR5: http://www.preisroboter.de
Gibt’s auch was für die wenigsten indexierten Seiten? Dann werfe ich mal folgendes ins Rennen:
PR 7: site:www.ebay.de – ganze 129 Seiten!
Hier hab ich noch einmal was für einen PR 7 gefunden: site:photobucket.com (34.700.000 Seiten)
Habe noch etwas gefunden 😀 PR8: site:yahoo.co.jp hat 553.000.000 Seiten.
So hoffe ma das da keiner rüber kommt 😀 Werd aber natürlich gespannt verfolgen wie sich hier alles entwickelt 😉
Grüße Matze
openpr.de
1.580.000
PR 3
@Max (Nr. 23): openpr.de steht leider auf der Liste der Domains, bei denen der PageRank vermutlich herabgesetzt wurde
@Mario (Nr. 18): preisroboter.de ist leider auch von PR 6 auf PR 5 gefallen (Regel 5)
@Matze (Nr. 21 und 22): photobucket.com ist leider ebenfalls gefallen, von PR 8 auf PR 7 und auch yahoo.co.jp ist von PR 9 auf PR 8 gefallen
Es ist sehr interessant, dass fast nur Beispiele gefunden werden, die einmal einen höheren PR hatten (und deswegen mehr Seiten in den Index bekommen haben?).
http://www.dailymotion.com
PR 7
35.400.000
@Max (Nr. 25): site:www.dailymotion.com und auch site:dailymotion.com sind sehr gut!
http://www.facebook.com
PR 9
230.000.000
http://www.bing.com
PR2
612.000
Reicht leider nicht ganz an ebay, aber vielleicht trotzdem interessant für Schwellwerte oder so.
craigslist.org
PR 7
26.700.000
Und gleich nochmal was kleines:
hi5.com
PR 7
51.800.000
Hab auch noch was gefunden: site:fc2.com (PR6 und 36.300.000 Seiten)
site:livedoor.com (PR7 und 80.500.000 Seiten)
site:www.amazon.com (PR9 und 249.000.000 Seiten)
na ok soll erstmal reichen^^ hoffe die sind nich im pr gefalln
@Matze (Nr. 30): fc2.com ist leider von PR 7 auf PR 6 gefallen. livedoor.com ist ein sehr guter Fund und schließt sehr schön die Lücke zwischen PR 6 und PR 8. Bei amazon.com springen die Zahlen derzeit ziemlich hin und her, mal sehen wie es zum Stichtag aussieht, könnte eng werden.
PR6
com.cn
329.000.000
Um aktuelle PR-Werte für die Index-Jag zu haben, habe ich bei Google ein außerplanmäßiges PR-Update bestellt, was jetzt geliefert wurde 😉 bing.com ist wie zu erwarten stark gestiegen und hat jetzt PR 9. Die Karten wurden also noch einmal neu gemischt. Auf zum Endspurt bei der Google-Index-Jagd!
Wann gibt’s denn die ersten Ergebnisse?
Und, wie ist es nun ausgegangen?
Ich habe die Ergebnisse über die Toolbox gezogen, aber noch nicht ausgewertet. Da ich gerade mitten im Umzug stecke, wird es leider noch ein paar Tage dauern.
Heute habe ich es endlich einmal geschafft die Gewinner Sistrix, Peer, Michael, Matze und Max zu benachrichtigen. Sorry, noch einmal für die Verspätung, aber der Umzug hatte mich ganz aus dem Konzept geworfen.