Sitemap

Was ist semantische Suche: Ein tiefer Einblick in die entitätsbasierte Suche

Seit 2013 entwickelt sich Google schrittweise zu einer 100% semantischen Suchmaschine.

Was genau ist semantische Suche?Wenn Sie Google nach einer Antwort auf diese Frage durchsuchen, finden Sie viele Erklärungen – aber die meisten davon sind ungenau und führen zu Missverständnissen.

Dieser Artikel hilft Ihnen umfassend zu verstehen, was semantische Suche ist.

Googles Weg zur semantischen Suchmaschine

Die Bemühungen von Google, eine semantische Suchmaschine zu entwickeln, lassen sich bis ins Jahr 1999 zurückverfolgen (wie in diesem Beitrag des verstorbenen Bill Slawski zu sehen ist). Konkreter wurde dies mit der Einführung des Knowledge Graph im Jahr 2012 und der grundlegenden Änderung seines Ranking-Algorithmus im Jahr 2013 (im Volksmund bekannt als Hummingbird).

Alle anderen großen Innovationen wie RankBrain, E-A-T, BERT und MUM unterstützen direkt oder indirekt das Ziel, eine voll semantische Suchmaschine zu werden.

Durch die Einführung der Verarbeitung natürlicher Sprache (NLP) für die Suche bewegt sich Google exponentiell auf dieses Ziel zu.

Googles Weg zu einer semantischen Suchmaschine

Kolibri: „Not strings, but things“ = Entitäten

Hummingbird ist der Startschuss für Googles Entwicklung hin zu einer semantischen Suchmaschine.

Es war die größte Änderung bei der Verarbeitung und Rangfolge von Suchanfragen, die jemals von Google vorgenommen wurde, und betraf bereits 2013 über 90 % aller Suchanfragen.Hummingbird hat einen Großteil der bestehenden Ranking-Algorithmen grundlegend ersetzt.

Durch Hummingbird war Google sofort in der Lage, im Knowledge Graph aufgezeichnete Entitäten für die Abfrageverarbeitung, das Ranking und die Ausgabe von SERPs einzubeziehen.

Eine Entität beschreibt das Wesen oder die Identität eines konkreten oder abstrakten Objekts des Seins.Entitäten sind eindeutig identifizierbar und daher eindeutig aussagekräftig.

Grundsätzlich kann zwischen benannten Entitäten und abstrakten Begriffen unterschieden werden.

  • Benannte Entitäten sind reale Objekte wie Personen, Orte, Organisationen, Produkte und Ereignisse.
  • Abstrakte Konzepte sind physischer, psychologischer oder sozialer Natur, wie Entfernung, Menge, Emotionen, Menschenrechte, Frieden usw.

Vor Hummingbird hat Google hauptsächlich Keyword-Dokumente für das Ranking abgeglichen und konnte die Bedeutung einer Suchanfrage oder eines Inhalts nicht erkennen.

Was ist eine semantische Suchmaschine?

Eine semantische Suchmaschine berücksichtigt den semantischen Kontext von Suchanfragen und Inhalten, um die Bedeutung besser zu verstehen.Semantische Suchmaschinen berücksichtigen auch die Beziehungen zwischen Entitäten, um Suchergebnisse zurückzugeben.

Im Gegensatz dazu arbeiten rein schlagwortbasierte Suchsysteme nur auf Basis einer Schlagwort-Text-Übereinstimmung.

Was ist semantische Suche?

Viele Definitionen der semantischen Suche konzentrieren sich darauf, die Suchabsicht als ihre Essenz zu interpretieren.Aber in erster Linie geht es bei der semantischen Suche darum, die Bedeutung von Suchanfragen und Inhalten anhand der auftretenden Entitäten zu erkennen.

Semantik = Theorie der Bedeutung.

Aber „Bedeutung“ ist nicht dasselbe wie „Absicht“. Die Suchabsicht beschreibt, was ein Nutzer von den Suchergebnissen erwartet.Bedeutung ist etwas anderes.

Das Identifizieren von Bedeutung kann helfen, die Suchabsicht zu erkennen, ist aber eher ein zusätzlicher Vorteil der semantischen Suche.

Die Rolle des Knowledge Graph in der semantischen Suche von Google

Entitätsbasiertes Ranking erfordert auch entitätsbasierte Indizierung.Der Knowledge Graph ist der Entitätsindex von Google, der Beziehungen zwischen Entitäten berücksichtigt.

Klassische Indizes sind tabellarisch organisiert und erlauben es daher nicht, Beziehungen zwischen Datensätzen abzubilden.

Der Knowledge Graph ist eine semantische Datenbank, in der Informationen so strukturiert sind, dass aus den Informationen Wissen entsteht.Dabei werden Entitäten (Knoten) über Kanten miteinander in Beziehung gesetzt, mit Attributen und anderen Informationen versehen und in thematische Zusammenhänge oder Ontologien gestellt.

Entitäten sind das zentrale Organisationselement in semantischen Datenbanken wie dem Knowledge Graph von Google.

Zusätzlich zu den Beziehungen zwischen den Entitäten verwendet Google Data Mining, um Attribute und andere Informationen über die Entitäten zu sammeln und sie um die Entitäten herum zu organisieren.

Beispielentitäten und ihre Attribute: „Joe Alwyn“ und „Taylor Swift“

Sie erhalten einen Eindruck davon, welche Quellen und Informationen Google für eine Entität berücksichtigt, wenn Sie danach suchen.

„Taylor Swift“ als Entität in der Google-Suche

Die bevorzugten Quellen, Attribute und Informationen variieren je nach Entitätstyp.Die Quellen einer Personenentität unterscheiden sich von einer Ereignisentität oder einer Organisationseinheit.Dies wirkt sich auf die in einem Knowledge Panel angezeigten Informationen aus.

Die Struktur eines entitätsbasierten Index ermöglicht Antworten auf Fragen, die nach einem Thema oder einer Entität suchen, die in der Frage nicht erwähnt werden.

„Canberra“ ist ein mit „Australien“ verbundenes Unternehmen

In diesem Beispiel sind „Australia“ und „Canberra“ die Entitäten und der Wert „capital“ beschreibt die Art der Beziehung.Eine schlüsselwortbasierte Suchmaschine hätte diese Antwort nicht liefern können.

Als Grundlage für einen Knowledge Graph dienen drei Ebenen:

  • Entitätenkatalog: Hier werden alle im Laufe der Zeit identifizierten Entitäten gespeichert.
  • Wissensspeicher: In einem Wissensspeicher werden Entitäten mit Informationen oder Attributen aus verschiedenen Quellen zusammengeführt.Hier geht es vor allem darum, Beschreibungen zusammenzuführen und zu speichern und semantische Klassen oder Gruppen in Form von Entitätstypen zu bilden.Google generiert die Daten über den Knowledge Vault und betreibt dort Data Mining aus unstrukturierten Quellen.
  • Knowledge Graph: Entitäten werden mit Attributen verknüpft und Beziehungen zwischen Entitäten hergestellt.

Google kann verschiedene Quellen verwenden, um Entitäten und die damit verbundenen Informationen zu identifizieren.

Nicht alle im Wissensspeicher erfassten Entitäten sind im Knowledge Graph enthalten.Folgende Kriterien könnten die Aufnahme in den Knowledge Graph beeinflussen:

  • Nachhaltige gesellschaftliche Relevanz.
  • Ausreichende Suchtreffer für die Entität im Google-Index.
  • Anhaltende öffentliche Wahrnehmung.
  • Einträge in einem anerkannten Wörterbuch oder Lexikon oder in einem Fachnachschlagewerk.

Es ist davon auszugehen, dass Google in einem Wissensspeicher wie dem Knowledge Vault deutlich mehr Long-Tail-Entitäten erfasst hat als im Knowledge Graph und diese für die semantische Suche nutzt.

Durch das Crawlen des offenen Internets und die Verarbeitung natürlicher Sprache ist Google in der Lage, skalierbares Entity- und Data-Mining unabhängig von strukturierten und halbstrukturierten Datenbanken durchzuführen.Dadurch erhält der Knowledge Vault immer mehr Informationen, auch zu Long-Tail-Entitäten.Mehr dazu finden Sie hier.

Wie funktioniert Google als semantische Suchmaschine?

Google verwendet die semantische Suche in folgenden Bereichen:

  • Suchabfragen oder Entitäten in der Suchabfrageverarbeitung verstehen.
  • Inhalt über Entitäten für das Ranking verstehen.
  • Inhalte und Entitäten für Data Mining verstehen.
  • Kontextbezogene Klassifizierung von Entitäten für die spätere E-A-T-Bewertung.

Die Google-Suche basiert nun auf einem Suchabfrageprozessor für die Interpretation von Suchabfragen und die Zusammenstellung von Korpussen aus Dokumenten, die für die Suchabfrage relevant sind.Hier können BERT, MUM und RankBrain ins Spiel kommen.

Bei der Suchanfragenverarbeitung werden die Suchbegriffe mit den in den semantischen Datenbanken erfassten Entitäten verglichen und ggf. verfeinert oder umgeschrieben.

Im nächsten Schritt wird die Suchabsicht bestimmt und ein passendes Korpus von X-Inhalten ermittelt.

Google nutzt den klassischen Suchindex sowie eine eigene semantische Datenbank in Form des Knowledge Graph.Es ist wahrscheinlich, dass über eine Schnittstelle ein Austausch zwischen diesen beiden Datenbanken stattfindet.

Es gibt eine Scoring-Engine, die aus verschiedenen Algorithmen besteht, die auf dem Kernalgorithmus von Hummingbird basieren.Es ist dafür verantwortlich, Inhalte zu bewerten und sie dann basierend auf der Bewertung in eine Reihenfolge zu bringen.Beim Scoring geht es um die Relevanz von Inhalten in Bezug auf die Suchanfrage oder Suchabsicht.

Da Google neben der Relevanz auch die Qualität der Inhalte bewerten möchte, muss auch eine Bewertung nach E-A-T-Kriterien erfolgen.Welche Kriterien das sein könnten, erfahren Sie auf 14 Arten, wie Google E-A-T bewerten kann.

Für diese E-A-T-Bewertung muss Google die Expertise, Autorität und Vertrauenswürdigkeit der Domain, des Herausgebers und/oder Autors bewerten.Grundlage hierfür können die semantischen Entitätsdatenbanken sein.

Suchergebnisse werden dann über eine Bereinigungsmaschine von Duplikaten befreit und eventuelle Strafen berücksichtigt.

Was bedeutet das für semantisches SEO?

Ich lese viel über strukturierte Daten, die semantische Optimierung von Inhalten und den Aufbau semantischer Themenwelten, wenn es um semantisches SEO geht.

Ja, es ist sinnvoll, Google zu zeigen, dass Sie mit Ihren Inhalten bestimmte Themen komplett abdecken und somit Expertise zeigen.

Einige Patente befassen sich mit dem Abgleich von dokumenteninternen Knowledge Graphen mit dem Google Knowledge Graph.Die Theorie dabei ist, dass eine hohe Übereinstimmung zwischen den in einem Text verwendeten Entitäten und den Beziehungsstrukturen der Hauptentität in der semantischen Datenbank von Google zu besseren Rankings führt.

Das klingt logisch.Aber seien wir ehrlich, am Ende unterscheidet sich die Keyword-basierte Optimierung nicht wesentlich von der Entity-basierten Content-Optimierung.

Auch der Aufbau von Themenwelten macht Sinn, wobei man sagen muss, dass in Zeiten des Passagenrankings folgendes zu beachten ist:

  • Inwieweit wird ein Thema in verschiedene Unterthemen zerlegt?
  • Wird für jedes Unterthema separater Inhalt erstellt?
  • Wird nur ein ganzheitliches Content-Asset erstellt?

Und strukturierte Daten…

Ja, strukturierte Daten können Google helfen, semantische Zusammenhänge zu verstehen, aber nur so lange, bis sie nicht mehr benötigt werden.Und das wird bald sein.

Meiner Meinung nach ist Google so gut im maschinellen Lernen, dass sie strukturierte Daten verwenden, um die Algorithmen schneller zu trainieren.

Nehmen wir als Beispiel Markups für Social-Media-Profile.Es dauerte nur etwa ein Jahr von der Empfehlung von Google bis zur Ankündigung, dass soziale Profile ohne strukturierte Daten automatisch angezeigt werden können.

Es ist nur eine Frage der Zeit, bis Google keine strukturierten Daten mehr benötigt.

Auch strukturierte Daten sind keine gute Grundlage für eine Bewertung.Entweder man hat sie oder man hat sie nicht.

Das alles kann man zum semantischen SEO zählen.Was ich jedoch oft vermisse, ist die globale Sicht auf Unternehmen als Verleger und Autoren.Hier spielen mehr Offpage- als Onpage-Signale eine Rolle.Basierend auf den Beziehungen zwischen maßgeblichen und glaubwürdigen Entitäten möchte Google bestimmen, welche Domains und Autoren laut E-A-T die qualitativ besten Quellen für ein Thema sind.

  • Wer ist mit wem verwandt?
  • Wer empfiehlt wen?
  • Wer hängt mit wem zusammen?

Als Faktoren für diese Nähe zwischen Behördeneinheiten können Links und Kookkurrenz von Google herangezogen werden.Und mit semantischem SEO meine ich auch deren Optimierung.

Da wir gerade beim Thema Kookkurrenz sind, sollten Sie bei der Optimierung von Inhalten auch berücksichtigen, wie NLP funktioniert.Google verwendet NLP, um Entitäten und ihren Kontext zu identifizieren.Das funktioniert über grammatikalische Satzstrukturen, Tripel und Tupel aus Substantiven und Verben.

Deshalb sollten wir auch beim semantischen SEO auf einen grammatikalisch einfachen Satzbau achten.Verwenden Sie kurze Sätze ohne Personalpronomen und Verschachtelungen.So dienen wir den Nutzern in Sachen Lesbarkeit und Suchmaschinen.

Die Zukunft der semantischen Suche: Wann kann eine 100 % entitätsbasierte Google-Suche erreicht werden?

Ich denke, dass es in Zukunft einen verstärkten Austausch zwischen dem klassischen Google-Suchindex und dem Knowledge Graph über eine Schnittstelle geben wird.

Je mehr Entitäten im Knowledge Graph erfasst sind, desto größer ist ihr Einfluss auf die SERPs.Allerdings steht Google immer noch vor der großen Herausforderung, Vollständigkeit und Genauigkeit in Einklang zu bringen.

Für das eigentliche Scoring von Hummingbird spielen die Entitäten auf Dokumentebene keine große Rolle.Vielmehr sind sie ein wichtiges Organisationselement zum Aufbau ungewichteter Dokumentenkorpusse auf der Suchindexseite.

Das eigentliche Scoring der Dokumente erfolgt durch Hummingbird nach klassischen Information-Retrieval-Regeln.Auf Domain-Ebene sehe ich jedoch den Einfluss von Entitäten auf das Ranking viel höher.Geben Sie E-A-T ein.

In den nächsten Jahren werden wir höchstwahrscheinlich den zunehmenden Einfluss von Entitäten in der Google-Suche sehen.Das neue Erscheinungsbild der entitätsbasierten Suche zeigt deutlich, wie Google die Indexierung von Informationen und Inhalten um eine Entität herum schrittweise organisiert.Dies deutet darauf hin, wie stark Innovationen wie MUM der Idee einer semantischen Suche folgen.

Die in diesem Artikel geäußerten Meinungen sind die des Gastautors und nicht unbedingt Search Engine Land.Mitarbeiter Autoren sind hier aufgelistet.