Google Patent "Historische Daten"

Sidebar
Menu

Teil 6: Link-basierte Kriterien



Gemäß einer Implementierung konform der Grundsätze der Erfindung, können ein oder mehrere Link-basieret Faktoren genutzt werden, um eine Bewertung eines Dokuments zu erstellen (oder zu ändern). In einem Fall können sich die Link-basierten Faktoren auf Daten beziehen, an denen neue Links auf ein Dokument auftauchen und existierende Links verschwinden. Das Erscheinungsdatum eines Links kann der erste Zeitpunkt sein, an dem Suchmaschine 125 den Link entdeckt oder aber das Datum des Dokuments, welches den Link enthält (z.B. der Zeitpunkt, zu dem das Dokument mit dem Link gefunden wurde, bzw. das Datum des letzte Updates). Der Zeitpunkt des Verschwindens eines Links kann der erste Zeitpunkt zu dem das Dokument, welches den Link enthält, diesen zum ersten Mal nicht mehr aufweist oder aber das Dokument selbst verschwindet.

Diese Daten können von Suchmaschine 125 während eines Crawls oder eines Index-Update-Vorgangs bestimmt werden. Unter Verwendung dieser Daten als Referenz-Daten, kann Suchmaschine 125 das zeitabhängige Verhalten von Links zu einem Dokument beobachten, wie z.B. das Entstehen oder Verschwinden von Links, die Rate, mit der Links im Laufe der Zeit entstehen oder verschwinden, wie viele Links während eines bestimmten Zeitraums entstehen oder verschwinden, ob es einen Trend zum Entstehen neuer bzw. zum Verschwinden bestehender Links zum Dokument gibt, etc.

Durch Verwendung von Informationen über das zeitabhängige Verhalten von Links zu (und/oder von) einem Dokument, kann Suchmaschine 125 das Dokument entsprechend bewerten. So kann ein im Laufe der Zeit abnehmender Trend in der Zahl oder der Rate der neuen Links (z.B. basierend auf einem Vergleich zwischen der Zahl oder der Rate neuer Links in einem aktuellen Zeitabschnitt mit einem älteren Zeitabschnitt) Suchmaschine 125 veralten des Dokuments signalisieren, worauf Suchmaschine 125 die Bewertung des Dokuments entsprechend herabstuft. Entsprechend kann ein steigender Trend ein „frisches“ Dokument (z.B. ein Dokument, dessen Inhalt „frisch“, also aktuell ist – kürzlich erstellt oder geändert) anzeigen, welches als relevanter eingestuft wird, abhängig von der jeweiligen Situation und Anwendung.

Durch Analyse der im Laufe der Zeit beobachteten Veränderung in der Zahl oder Rate der Zunahme/Abnahme von Backlinks zu einem Dokument (oder Seite), kann Suchmaschine 125 wertvolle Signale über den Aktualitätsgrad (Frischegrad) eines Dokuments ableiten. So kann beispielsweise, wenn die Analyse eine fallende Kurve aufweist, hieraus eine Veraltung des Dokuments abgeleitet werden (z.B. nicht länger aktualisiert, abnehmende Bedeutung, von einem anderen Dokument verdrängt oder durch ein anderes ersetzt).

Gemäß einer weiteren Anwendung, kann die Analyse auf der Zahl neuer Links zu einem Dokument basieren. So kann Suchmaschine 125 z.B. die Zahl der neuen Links zu einem Dokument in den letzten n Tagen im Vergleich mit der Zahl der neuen Links seit dem Zeitpunkt des ersten Auffindens des Dokuments beobachten. Alternativ kann Suchmaschine 125 das höchste Alter der letzten y% der Links bestimmen und dieses mit dem Alter des ersten gefundenen Links vergleichen.

Zur Illustration nehmen wir an y=10 und 2 Dokumente (in diesem Fall Webseiten), die beide vor 100 Tagen erstmals gefunden wurden. Für die erste Website wurden 10% der Links vor weniger als 10 Tagen gefunden, während für die zweite Seite 0% der Links vor weniger als 10 Tagen gefunden wurden (m.a.W. sie wurden alle früher gefunden). In diesem Fall ergeben die Werte 0,1 für Seite A und 0,0 für Seite B. Die Werte können entsprechend skaliert werden. In einer anderen beispielhaften Anwendung können die Werte durch verhältnismäßig detailliertere Analysen der Datenstreuung angepasst werden. So können z.B. Modelle erstellt werden, die aufzeigen, ob eine bestimmte Datenstreuung einen besonderen Seitentyp repräsentiert (z.B. eine Seite die nicht länger aktualisiert wird, steigenden oder abnehmende Popularität, ersetzt, etc.).

Eine wieder andere Implementierung kann auf einer Gewichtung der Links basieren. In diesem Fall wird jeder Link basierend auf einer Funktion, die mit der zunehmenden Aktualität des Links ansteigt. Die Aktualität eines Links wird bestimmt auf Basis des Erscheinung-/Änderungsdatums des Links, des Erscheinungs-/Änderungsdatums des zugehörigen Ankertextes oder des Erscheinungs-/Änderungsdatums des Dokuments, welches den Link enthält. Das Erscheinungs-/Änderungsdatum eines Dokuments, welches einen Link enthält kann als besserer Indikator für die Aktualität eines Links gewertet werden, wenn man davon ausgeht, dass ein guter Link unverändert fortbesteht, wenn er sich bei Aktualisierung des Dokuments immer noch als relevant und treffend herausstellt. Um nicht den Aktualitätsgrad jedes Links auf Basis von kleinen, irrelevanten Änderungen am Dokument zu aktualisieren, kann jedes Dokument auf signifikante Änderungen überprüft werden (z.B. Veränderungen an großen Teilen des Dokuments oder Veränderungen an vielen kleinen Teilen des Dokuments), und der Aktualitätsgrad des Links kann entsprechend aktualisiert (oder nicht aktualisiert) werden.

Links können auch anderweitig gewichtet werden. Beispielsweise kann die Gewichtung der Links auf Basis der Vertrauenswürdigkeit der die Links enthaltenden Dokumente (z.B. kann die Vertrauenswürdigkeit von Behördendokumenten hoch eingestuft werden) erfolgen. Links können auch, oder alternativ, auf Basis der Autorität der die Links enthaltenden Dokumente (z.B. kann die Autorität eines Dokumentes auf Basis eines Vorgehens ähnlich US Patent No. 6.285.999 bestimmt werden) gewichtet werden. Ebenso, oder alternativ, können Links auf Basis des Aktualitätsgrades der Dokumente gewichtet werden, die die Links enthalten, wobei der Aktualitätsgrad auf andere Weise bestimmt wird (z.B. ein Dokument, dass häufig aktualisiert wird (z.B. die Yahoo-Homepage), welches plötzlich einen Link auf ein Dokument fallen lässt).

Suchmaschine 125 kann die Bewertung eines Dokuments auf welches Links verweisen steigern oder senken, basierend auf einer Funktion aus der Summe der Gewichtungen der Links, die auf das Dokument verweisen. Diese Technik kann auf bekannte Weise eingesetzt werden. Beispielsweise kann man davon ausgehen, dass Dokument S 2 Jahre alt ist. Dokument S kann als aktuell angesehen werden, wenn n% der Links, die auf S verweisen, aktuell sind oder aber die Dokumente, welche Forward Links auf S enthalten, als aktuell eingestuft werden. Letzteres kann an Hand des Entstehungsdatums des Dokuments überprüft werden und durch Einsatz dieser Technik auf die bekannte Weise.

Gemäß einer anderen Technik, kann die Analyse von einer Altersstruktur der auf das Dokument verweisenden Links abhängig sein. D.h., die Zeitpunkte, zu denen Links auf ein Dokument erstellt wurden, können bestimmt werden und werden in eine Funktion eingegeben, die die Altersstruktur berechnet. Es darf davon ausgegangen werden, dass die Altersstruktur eines veralteten Dokuments sich stark von der Altersstruktur eines aktuellen Dokuments unterscheidet. Suchmaschine 125 kann dementsprechend die Dokumente, zumindest zum Teil, basierend auf der Altersstruktur der Dokumente bewerten.

Die Erscheinungsdaten von Links können auch zum Entdecken von Spam beitragen, wenn Eigentümer von Dokumenten oder deren Kollegen Links zum eigenen Dokument erstellen, mit dem Zweck, die Bewertung des Dokuments zu stärken, die durch eine Suchmaschine erstellt wurde. Ein typisches „rechtmäßiges“ Dokument zieht Backlinks eher langsam an. Eine starke Spitze in der Quantität der Backlinks kann auf ein thematisches Phänomen (z.B. kann die Website der Gesundheitsbehörde (CDC – Center for Disease Control) schnell viele Links entwickeln, wenn z.B. ein aktueller Ausbruch eines Virus (SARS) vorliegt) oder eben auf einen Spam-Versuch (zum Erhalt einer besseren Bewertung und somit einer höheren Platzierung in der Ergebnisliste zur Suchanfrage) hinweisen, indem Links getauscht, gekauft oder Links von Dokumenten erhalten werden, die keinen redaktionellen Einfluss auf die Erstellung von Links haben. Beispiele für solche Dokumente sind u.a. Gästebücher, Referrer oder offen zugängliche Seiten, die es jedem User ermöglichen, einem Dokument einen Link hinzuzufügen.

Gemäß einer weiteren Anwendung, kann die Analyse auch auf dem Datum des Verschwindens von Links basieren. Das Verschwinden einer großen Anzahl von Links kann bedeuten, dass das Dokument, zu dem die Links verweisen, veraltet ist (z.B. nicht mehr aktualisiert wird oder durch ein anderes Dokument überholt oder ersetzt wurde). Suchmaschine 125 kann beispielsweise den Zeitpunkt an dem ein oder mehrere Links verschwinden, die Anzahl der Links die innerhalb eines Zeitfensters verschwinden oder eine andere zeitabhängige Abnahme der Links (oder Links/Aktualisierungen an den Dokumenten, welche solche Links enthalten) auf ein Dokument überwachen, um so veraltete Dokumente zu identifizieren. Wenn ein Dokument als veraltet eingestuft wurde, können die darin enthaltenen Links von Suchmaschine 125 herabgewertet oder ignoriert werden, wenn sie Dokumente bewertet, auf die diese Links verweisen.

In einer anderen Anwendung, kann die Analyse, neben dem Alter der Links auf das Dokument, auch von der Dynamik der Links abhängen. In dem Fall kann Suchmaschine 125 Dokumente, die täglich einen anderen besonderen Link haben, anders gewichten (z.B. niedriger), als Dokumente, die regelmäßig aktualisiert werden und immer wieder auf das gleiche Zieldokument verweisen. So kann Suchmaschine 125 beispielsweise eine Bewertung für ein Dokument erstellen, basierend auf den Bewertungen der Dokumente mit Links auf dieses Dokument, für alle Versionen der Dokumente innerhalb eines Zeitfensters. In einer Variation dieser Anwendung, kann Abwertung/Verfall mit in die Integration einbezogen werden, und zwar auf Basis der größten Aktualisierungen des Dokuments.

Zusammengefasst kann Suchmaschine 125 eine Bewertung für ein Dokument erstellen (oder ändern), die, zumindest zum Teil, auf einem oder mehreren Link-basierten Faktoren beruht.

weiter zu Teil 7: Ankertext

Kommentare zum Google Patent "Information retrieval based on historical data" im Blog von seo-stratgie.de

Inhalt dieses Dokumentes




Vorbemerkung: Deutsche Übersetzung Google Patent "Information retrieval based on historical data"

Teil 1:
Einführung Google Patent "Informationsbeschaffung basierend auf historischen Daten"
  • Bereich der Erfindung
  • Beschreibung
  • Zusammenfassung der Erfindung
  • Kurzbeschreibung der Zeichnungen

Teil 2: Detailbeschreibung der Erfindung
  • Beispielhafte Netzwerkkonfiguration
  • Beispielhafte Client/Server Architektur
  • Exemplarische Suchmaschine

Teil 3: Exemplarische Historische Daten: Entstehungsdatum eines Dokumentes (Document Inception Date)

Teil 4: Exemplarische Historische Daten: Updates/Veränderungen des Inhalts (Content Updates/Changes)

Teil 5: Exemplarische Historische Daten: Suchanfragen-Analyse (Query Analysis)

Teil 6: Exemplarische Historische Daten: Link-basierte Kriterien (Link-Based Criteria)

Teil 7: Exemplarische Historische Daten: Ankertext (Anchor Text)

Teil 8: Exemplarische Historische Daten: Traffic (Traffic)

Teil 9: Exemplarische Historische Daten: Nutzerverhalten (User Behavior)

Teil 10: Exemplarische Historische Daten: Domain-bezogene Informationen (Domain-Related Information)

Teil 11: Exemplarische Historische Daten: Ranking-Historie (Ranking History)

Teil 12: Exemplarische Historische Daten: Nutzergenerierte oder -instandgehaltene Daten (User Maintained/Generated Data)

Teil 13: Exemplarische Historische Daten: Einzigartige Wörter, Digraphen oder Sätze im Ankertext (Unique Words, Bigrams, Phrases in Anchor Text)

Teil 14: Exemplarische Historische Daten: Verlinkung unabhängiger Peers (Linkage of Independent Peers)

Teil 15: Exemplarische Historische Daten: Dokumententhemen (Document Topics)

Teil 16: Exemplarischer Prozessablauf (Bewertung von Dokumenten aufgrund historischer Daten)

Teil 17: Schlussfolgerung

Quelle: Google Patent "Information retrieval based on historical data"

Kommentare zum Google Patent "Information retrieval based on historical data" im Blog von seo-stratgie.de