Google Patent "Historische Daten"

Sidebar
Menu

Teil 4: Updates/Veränderungen des Inhalts (Content Updates/Veränderungen)



Bei einer Implementierung konform der Grundsätze der Erfindung, können Informationen über die Art einer inhaltlichen Veränderung eines Dokuments zur Erstellung (oder Anpassung) einer Bewertung des Dokuments genutzt werden. So kann beispielsweise ein Dokument, dessen Inhalt häufig geändert wird anders bewertet werden als ein Dokument, dessen Inhalt im Laufe der Zeit statisch bleibt. Auch kann ein Dokument, bei dem sich im Laufe der Zeit große Teile des Inhalts ändern, anders bewertet werden als ein Dokument, bei dem im Laufe der Zeit nur ein kleiner Teil des Inhalts angepasst wird.

In einer Implementierung kann Suchmaschine 125 eine Content-Update Bewertung (U) wie folgt bestimmen:

U=f(UF, UA),

wobei f für eine Funktion steht (z.B. Summe, gewichtete Summe), UF für eine Update-Frequenz-Bewertung steht, welche beschreibt, wie oft ein Dokument (oder eine Seite) aktualisiert wird und UA für eine Update-Mengen-Bewertung steht, welche beschreibt, in welchem Umfang das Dokument (oder eine Seite)im Laufe der Zeit verändert wurde. UF kann auf diverse Arten bestimmt werden, wie z.B. eine durchschnittliche Zeit zwischen Updates, die Zahl der Veränderungen während eines bestimmten Zeitraums, etc.

UA kann ebenfalls als Funktion eines oder mehrerer Faktoren bestimmt werden, wie z.B. die Zahl „neuer“ oder einzigartiger der dem Dokument zugehörigen Seiten. Ein weiterer Faktor kann das Verhältnis zwischen neuen oder einzigartigen der dem Dokument zugehörigen Seiten und der Gesamtzahl der dem Dokument zugehörigen Seiten sein. Ein weiterer Faktor kann die Zahl der Dokumenten-Updates im Laufe eines oder mehrerer Zeiträume sein (z.B. n% des sichtbaren Inhalts eines Dokuments ändern sich innerhalb eines Zeitraums t (z.B. letzte m Monate)), dies kann ein Durchschnittswert sein. Ein weitere Faktor kann die Anzahl sein, die ein Dokument (oder Seite) innerhalb eines oder mehrerer Zeiträume verändert wurde (z.B. innerhalb der letzten x Tage).

Gemäß einer beispielhaften Implementierung, kann UA als Funktion von unterschiedlich gewichteten Teilen des Dokumenteninhalts bestimmt werden. So kann z.B. Inhalt, der als irrelevant angesehen wird, bei Updates/Veränderungen bei der UA Bestimmung mit geringer Gewichtung versehen oder sogar gänzlich ignoriert werden, wie beispielsweise JavaScript Anmerkungen, Werbung, Navigationselemente, Abspann (Footer, Boilerplate Materia)l, oder Zeit/Datum Tags. Andererseits können Inhalte, die bei Update/Veränderung (z.B. häufiger, aktueller, ausgiebiger, etc.) als wichtig angesehen werden, wie z.B. der Titel den Forward-Links zugehörige Ankertexte, bei der UA Bestimmung eine stärkere Gewichtung erhalten als Änderungen bei anderen Inhalten.

UF und UA auch auf andere Weise eingesetzt werden, um die Bewertung eines Dokuments zu beeinflussen. Es kann z.B. die Veränderungsrate in einem aktuellen Zeitfenster mit der Veränderungsrate in einem anderen (z.B.: vorhergehenden) Zeitfenster verglichen werden, um einen steigenden oder abnehmenden Trend zu bestimmen. Dokumente mit einer steigenden Änderungsrate können höher bewertet werden als Dokumente mit einer konstanten Änderungsrate, selbst wenn diese auf relativ hohem Niveau liegt. Die Quantität der Veränderungen kann bei dieser Bewertung ebenfalls ein Faktor sein. So kann es beispielsweise sein, dass Dokumente die eine steigende Veränderungsrate aufweisen und die Quantität der Änderungen über einem gewissen Schwellenwert liegt, höher bewertet werden als Dokumente, bei denen eine konstante Änderungsrate vorliegt und die Quantität der Änderungen den Schwellenwert unterschreitet.

In bestimmten Fällen können Datenspeicher-Ressourcen unzulänglich sein um die Dokumente zu speichern, wenn sie auf Inhaltsänderungen überprüft werden. In solchen Fällen kann Suchmaschine 125 Stellvertreter dieser Dokumente speichern und diese Stellvertreter auf Veränderungen prüfen. So kann Suchmaschine 125 beispielsweise „Signaturen“ eines Dokuments statt des (ganzen) Dokuments speichern um Veränderungen im Dokumenteninhalt zu erkennen. In einem solchen Fall kann Suchmaschine 125 einen Begriffe-Vektor für ein Dokument (oder Seite) speichern und diesen auf relativ große Änderungen überprüfen. Bei einer anderen Implementierung kann Suchmaschine 125 einen relativ kleinen Teil des Dokuments (z.B. einige Begriffe) speichern und überprüfen, der als wichtig eingestuft wird oder am häufigsten vorkommt (mit Ausnahme von sog. „stop words“).

Gemäß einer anderen Implementierung kann Suchmaschine 125 eine Zusammenfassung oder andere Stellvertreter des Dokuments speichern und diese Information auf Änderungen überprüfen. Schließlich kann es vorteilhaft sein, die Bewertung eines Dokuments auf Basis der Differenz zwischen dem durchschnittlichen Änderungszeitpunkt der Ergebnissammlung anzupassen. Anders ausgedrückt, Suchmaschine 125 kann für jedes der Dokumente in der Ergebnissammlung den letzten Änderungszeitpunkt bestimmen, das durchschnittliche Änderungsdatum für diese Dokumente errechnen und somit die Bewertung eines jeden Dokuments auf Basis der Differenz zwischen tatsächlichem Änderungsdatum und Durchschnittlichem Änderungsdatum anpassen (positiv oder negativ).

Zusammenfassend kann gesagt werden, dass Suchmaschine 125 eine Bewertung (oder eine Änderung einer Bewertung) eines Dokuments vornehmen kann, zumindest zum Teil, basierend auf Informationen über die Art der inhaltlichen Veränderung eines Dokuments. Bei großen Dokumenten, die Inhalte umfassen, welche mehreren Individuen oder Organisationen „gehören“, kann die Bewertung mit jedem der einzelnen Sub-Dokumente korrespondieren (d.h. der Inhalt, der einem Individuum oder einer Organisation „gehört“ und von diesem/dieser aktualisiert oder geändert wird).

weiter zu Teil 5: Suchanfragen-Analyse

Kommentare zum Google Patent "Information retrieval based on historical data" im Blog von seo-stratgie.de

Inhalt dieses Dokumentes




Vorbemerkung: Deutsche Übersetzung Google Patent "Information retrieval based on historical data"

Teil 1:
Einführung Google Patent "Informationsbeschaffung basierend auf historischen Daten"
  • Bereich der Erfindung
  • Beschreibung
  • Zusammenfassung der Erfindung
  • Kurzbeschreibung der Zeichnungen

Teil 2: Detailbeschreibung der Erfindung
  • Beispielhafte Netzwerkkonfiguration
  • Beispielhafte Client/Server Architektur
  • Exemplarische Suchmaschine

Teil 3: Exemplarische Historische Daten: Entstehungsdatum eines Dokumentes (Document Inception Date)

Teil 4: Exemplarische Historische Daten: Updates/Veränderungen des Inhalts (Content Updates/Changes)

Teil 5: Exemplarische Historische Daten: Suchanfragen-Analyse (Query Analysis)

Teil 6: Exemplarische Historische Daten: Link-basierte Kriterien (Link-Based Criteria)

Teil 7: Exemplarische Historische Daten: Ankertext (Anchor Text)

Teil 8: Exemplarische Historische Daten: Traffic (Traffic)

Teil 9: Exemplarische Historische Daten: Nutzerverhalten (User Behavior)

Teil 10: Exemplarische Historische Daten: Domain-bezogene Informationen (Domain-Related Information)

Teil 11: Exemplarische Historische Daten: Ranking-Historie (Ranking History)

Teil 12: Exemplarische Historische Daten: Nutzergenerierte oder -instandgehaltene Daten (User Maintained/Generated Data)

Teil 13: Exemplarische Historische Daten: Einzigartige Wörter, Digraphen oder Sätze im Ankertext (Unique Words, Bigrams, Phrases in Anchor Text)

Teil 14: Exemplarische Historische Daten: Verlinkung unabhängiger Peers (Linkage of Independent Peers)

Teil 15: Exemplarische Historische Daten: Dokumententhemen (Document Topics)

Teil 16: Exemplarischer Prozessablauf (Bewertung von Dokumenten aufgrund historischer Daten)

Teil 17: Schlussfolgerung

Quelle: Google Patent "Information retrieval based on historical data"

Kommentare zum Google Patent "Information retrieval based on historical data" im Blog von seo-stratgie.de