Google Patent "Historische Daten"

Sidebar
Menu

Teil 11: Ranking-Historie



Gemäß einer Implementierung konform der Grundsätze der Erfindung, können Informationen mit Bezug auf frühere Ranglisten-Positionierungen eines Dokuments verwendet werden, um eine Bewertung (oder eine Änderung dieser) eines Dokuments vorzunehmen. Suchmaschine 125 kann beispielsweise überprüfen, wie die zeitabhängige Rangfolge eines Dokuments in den Suchergebnissen für Suchanfragen über Suchmaschine 125 ist. Suchmaschine 125 kann feststellen, dass ein Dokument, welches in der Rangfolge und quer über viele Anfragen springt, ein thematisches Dokument sein könnte, oder aber auch ein Spam-Versuch an Suchmaschine 125 darstellt.

Daher kann die Quantität oder die Rate, mit der ein Dokument seine Rangfolge in einem Zeitraum ändert, genutzt werden, um zukünftige Bewertungen des Dokuments zu beeinflussen. Bei einer Implementierung kann ein Dokument gewichtet werden, und zwar je nach seiner Position innerhalb der Top N Ergebnisse einer jeden Suchergebnis-Liste. Setzt man N=30, könnte eine Beispielfunktion lauten: [((N+1)-SLOT)/N].sup.4. In diesem Fall erhält das Top-Ergebnis einen wert 1, das Nte Ergebnis erhält hingegen einen Wert von nahe 0.

Eine Suchanfragen-Sammlung (z.B. kommerzielle Suchanfragen) kann wiederholt werden, Dokumente die hierbei mehr als M% in der Rangliste hinzugewinnen konnten, werden markiert, oder aber der Wachstums-Prozentsatz dient als Signal für die Bewertung der Dokumente. Suchmaschine 125 kann beispielsweise feststellen, dass eine Suchanfrage wahrscheinlich kommerziell ist, wenn die durchschnittliche (Median) Bewertung der Top-Ergebnisse relativ hoch ist und es von Monat zu Monat einen signifikanten Wechsel bei den Top-Ergebnissen gibt. Suchmaschine kann auch Ausfall als Indikator für eine kommerzielle Suchanfrage werten. Bei kommerziellen Suchanfragen ist die Spam-Gefahr größer, dementsprechend wird Suchmaschine 125 Dokumente in Zusammenhang mit solchen entsprechend behandeln.

Ergänzend zu Ranking-Historie (oder Rangfolge-Historie) von Dokumenten bei bestimmten Suchanfragen, kann Suchmaschine 125 ein oder mehrere anderer Faktoren beobachten (auf Seiten-, Host-, Dokumenten- und/oder Domain-Basis), wie z.B. die Zahl der Suchanfragen, für die, oder die Rate (steigend/sinkend), mit der, ein Dokument im Laufe der Zeit als Suchergebnis ausgewählt wurde; Saisonalität, plötzlicher Zuwachs, oder andere Muster, nach denen ein Dokument im Laufe der Zeit als Suchergebnis ausgewählt wurde; und/oder Bewertungsveränderungen für URL-Anfrage-Paarungen.

Außerdem, oder alternativ, kann Suchmaschine 125 eine Zahl von dokumentenunabhängigen (z.B. URL), Suchanfrage-basierten Kriterien über einen Zeitraum verfolgen. So kann Suchmaschine 125 beispielsweise die durchschnittliche Bewertung einer Top-Liste von Suchergebnissen für eine bestimmte Anfrage oder ein Bündel von Anfragen beobachten und die Bewertung dieser Ergebnisse und/oder anderer Ergebnisse für diese Anfrage oder dieses Bündel von Anfragen anpassen. Insbesondere kann Suchmaschine 125 im Laufe der Zeit die Zahl der Suchergebnisse für eine bestimmte Anfrage oder ein Bündel von Anfragen beobachten. Wenn Suchmaschine 125 feststellt, dass die Anzahl der Ergebnisse ansteigt oder dass es eine Veränderung in der Anstiegsrate gibt (z.B. kann ein solcher Anstieg ein Indikator für ein „hot topic“ (heißes Thema) oder ein anderes Phänomen sein), kann Suchmaschine 125 diese Ergebnisse zukünftig höher bewerten.

Zusätzlich, bzw. alternativ, kann Suchmaschine 125 die Rangfolge von Dokumenten im Laufe der Zeit beobachten, um plötzliche Spitzen in den Rangfolgen dieser Dokumente zu entdecken. Eine solche Spitze kann entweder ein thematisches Phänomen (z.B. „hot topic“) oder aber ein Spam-Versuch an Suchmaschine 125 durch z.B. Link-Tausch oder Link-Link-Kauf sein. Suchmaschine 125 kann Maßnahmen ergreifen, um sich gegen solche Spamversuche zu schützen, indem z.B. Hysterese angewendet wird um die Rangfolge nur in bestimmten raten ansteigen zu lassen. In einer anderen Implementierung, kann der Rangfolge eines Dokuments ein maximaler Schwellenwert für die Wachstumsrate innerhalb eines vordefinierten Zeitfensters zugewiesen werden. Als weitere Maßnahme, ein Dokument, welches an ein thematisches Phänomen gekoppelt ist, von einem Spam-Dokument zu unterscheiden, kann Suchmaschine 125 Nennungen des Dokuments in anderen Nachrichten-Artikeln, Diskussionsgruppen, etc. berücksichtigen, basierend auf der Theorie, dass Spam-Dokumente in z.B. Nachrichten nicht erwähnt werden. Eine dieser oder eine Kombination dieser Techniken kann angewandt werden, um Spamversuche zu unterbinden.

Suchmaschine 125 kann auf Basis der ermittelten (Teil-)Autorität von Dokumenten, wie solche von Behörden, Web-Directories (z.B. Yahoo) oder solche, die im Laufe der Zeit ein stabiles und hohes Ranking aufweisen, Ausnahmen machen. D.h., wenn für ein solches Dokument eine plötzliche Spitze in der Anzahl oder der Rate der Links, die auf das Dokument verweisen auftritt, kann Suchmaschine 125 beispielsweise ein solches Dokument nicht als Spam einstufen und daher einen relativ hohen oder sogar gar keinen Schwellenwert für (den Anstieg der) die Rangfolge festlegen.

Zudem kann Suchmaschine 125 signifikante Rangfolgeverluste von Dokumenten als Indikator nutzen, diese Dokumente als „nicht mehr erwünscht“ oder veraltet einzustufen. Wenn beispielsweise ein Dokument im Laufe der Zeit signifikant an Rangfolgeplätzen verliert, kann Suchmaschine 125 dieses Dokument als veraltet einstufen und entsprechend bewerten.

Zusammengefasst kann Suchmaschine 125 eine Bewertung für ein Dokument erstellen (oder ändern), zumindest zum Teil, basierend auf Informationen über die bisherige Rangfolge dieses Dokuments.

weiter zu Teil 12: Nutzergenerierte oder -instandgehaltene Daten

Kommentare zum Google Patent "Information retrieval based on historical data" im Blog von seo-stratgie.de

Inhalt dieses Dokumentes




Vorbemerkung: Deutsche Übersetzung Google Patent "Information retrieval based on historical data"

Teil 1:
Einführung Google Patent "Informationsbeschaffung basierend auf historischen Daten"
  • Bereich der Erfindung
  • Beschreibung
  • Zusammenfassung der Erfindung
  • Kurzbeschreibung der Zeichnungen

Teil 2: Detailbeschreibung der Erfindung
  • Beispielhafte Netzwerkkonfiguration
  • Beispielhafte Client/Server Architektur
  • Exemplarische Suchmaschine

Teil 3: Exemplarische Historische Daten: Entstehungsdatum eines Dokumentes (Document Inception Date)

Teil 4: Exemplarische Historische Daten: Updates/Veränderungen des Inhalts (Content Updates/Changes)

Teil 5: Exemplarische Historische Daten: Suchanfragen-Analyse (Query Analysis)

Teil 6: Exemplarische Historische Daten: Link-basierte Kriterien (Link-Based Criteria)

Teil 7: Exemplarische Historische Daten: Ankertext (Anchor Text)

Teil 8: Exemplarische Historische Daten: Traffic (Traffic)

Teil 9: Exemplarische Historische Daten: Nutzerverhalten (User Behavior)

Teil 10: Exemplarische Historische Daten: Domain-bezogene Informationen (Domain-Related Information)

Teil 11: Exemplarische Historische Daten: Ranking-Historie (Ranking History)

Teil 12: Exemplarische Historische Daten: Nutzergenerierte oder -instandgehaltene Daten (User Maintained/Generated Data)

Teil 13: Exemplarische Historische Daten: Einzigartige Wörter, Digraphen oder Sätze im Ankertext (Unique Words, Bigrams, Phrases in Anchor Text)

Teil 14: Exemplarische Historische Daten: Verlinkung unabhängiger Peers (Linkage of Independent Peers)

Teil 15: Exemplarische Historische Daten: Dokumententhemen (Document Topics)

Teil 16: Exemplarischer Prozessablauf (Bewertung von Dokumenten aufgrund historischer Daten)

Teil 17: Schlussfolgerung

Quelle: Google Patent "Information retrieval based on historical data"

Kommentare zum Google Patent "Information retrieval based on historical data" im Blog von seo-stratgie.de