Sitemap

Die Algorithmus-Ranking-Faktoren von Twitter: Ein definitiver Leitfaden

Twitter-Patente und andere Veröffentlichungen enthüllen wahrscheinliche Aspekte, wie Tweets in den Timeline-Feeds von Benutzern beworben werden.

Einige der Ranking-Faktoren auf der Zeitleiste von Twitter sind sehr überraschend, und eine Anpassung Ihrer Herangehensweise an das Tweeten kann Ihnen helfen, eine größere Sichtbarkeit Ihrer Tweets zu erreichen.

Basierend auf einer Reihe wichtiger Patente und anderer Quellen habe ich hier eine Reihe wahrscheinlicher Ranking-Faktoren für den Algorithmus von Twitter skizziert.

Die Twitter-Timeline

Twitter begann erstmals im Jahr 2016 mit der Verwendung einer algorithmusbasierten Zeitleiste, als es von einem rein chronologischen Feed von Tweets aller Konten, denen man folgte, umstellte.Durch die Änderung wurden die Timelines der Benutzer in eine Rangfolge gebracht, damit sie „die besten Tweets zuerst“ sehen konnten.Twitter hat seitdem bis heute mit Variationen davon experimentiert.

Ein Feed-basierter Algorithmus für soziale Medien ist keine Seltenheit.Facebook und andere Social-Media-Plattformen haben dasselbe getan.

Die Gründe für diesen Wechsel zu einer algorithmischen Mischung von Timeline-Tweets sind ziemlich klar.Eine rein persönliche, chronologische Zeitleiste, die nur aus den Konten besteht, denen man gefolgt ist, ist sehr isoliert und daher begrenzt – während das Einführen von Posts von Konten außerhalb der eigenen direkten Verbindungen das Potenzial hat, die Zeit zu verlängern, die man auf der Plattform verbringt, was wiederum die allgemeine Klebrigkeit erhöht, was wiederum den Wert des Dienstes für Werbetreibende und Datenpartner erhöht.

Verschiedene Interessenklassifikationen von Benutzern und Interessensthemen, die mit ihren Konten und Tweets verbunden sind, ermöglichen ferner ein Potenzial für eine zielgerichtete Werbung basierend auf Benutzerdemografien und Inhaltsthemen.

Twitter-Power-User haben möglicherweise einige Intuitionen über verschiedene Tweet-Faktoren entwickelt, die zu einer größeren Sichtbarkeit innerhalb des Algorithmus führen können.

Eine Erinnerung an Patente

Konzerne melden ständig Patente für Erfindungen an, die sie nicht wirklich im Live-Betrieb nutzen.Als ich bei Verizon gearbeitet habe, habe ich persönlich eine Reihe von Patententwürfen für verschiedene Erfindungen geschrieben, die meine Kollegen und ich im Laufe unserer Arbeit entwickelt haben – darunter auch Dinge, die wir nicht in der Produktion verwendet haben.

Die Tatsache, dass Twitter Patente hat, die Ideen dafür erwähnen, wie Dinge funktionieren könnten, garantiert keineswegs, dass die Dinge so funktionieren.

Außerdem enthalten Patente in der Regel mehrere Ausführungsformen, die im Wesentlichen verschiedene Möglichkeiten darstellen, wie eine Erfindung implementiert werden könnte – Patente versuchen, die Schlüsselelemente einer Erfindung so umfassend wie möglich zu beschreiben, um jede mögliche Verwendung zu beanspruchen, die ihr zugeschrieben werden könnte.

Schließlich ist es, genau wie beim berühmten PageRank-Algorithmus-Patent, das die Grundlage der Google-Suchmaschine war, in Fällen, in denen Twitter eine Ausführungsform aus einem ihrer Patente verwendet hat, sehr wahrscheinlich, dass sie die beschriebenen einfachen, umfassenden Erfindungen geändert und verfeinert haben. und werde dies auch weiterhin tun.

Trotz all dieser typischen Vagheit und Ungewissheit fand ich eine Reihe sehr interessanter Konzepte in den Twitter-Patentbeschreibungen, von denen viele höchstwahrscheinlich in ihr System integriert werden.

Twitter und Deep Learning

Eine zusätzliche Einschränkung, bevor ich fortfahre, betrifft, wie der Timeline-Algorithmus von Twitter Deep Learning in seine DNA integriert hat, gepaart mit verschiedenen Ebenen menschlicher Überwachung, was es zu einem sich häufig, wenn nicht ständig, selbst entwickelnden Tier macht.

Dies bedeutet, dass sowohl große als auch kleine, inkrementelle Änderungen bei der Durchführung des Content-Rankings auftreten können und werden.Darüber hinaus kann dieser Ansatz des maschinellen Lernens dazu führen, dass die Techniker von Twitter aufgrund der Abstraktion der erstellten Ranking-Modelle möglicherweise nicht direkt genau wissen, warum einige Inhalte angezeigt werden oder andere Inhalte übertreffen, ähnlich wie ich es beschrieben habe, als ich über die von Google erstellten Modelle geschrieben habe Qualitätsranking durch maschinelles Lernen.

Trotz der Komplexität und Raffinesse der Funktionsweise des Twitter-Algorithmus kann das Verständnis der Faktoren, die wahrscheinlich in die Black Box einfließen, immer noch zeigen, was die Rankings beeinflusst.

Die ursprüngliche Zeitleiste von Twitter bestand einfach aus allen Tweets der Konten, denen man seit seinem letzten Besuch gefolgt ist, die gesammelt und in umgekehrter chronologischer Reihenfolge angezeigt wurden, wobei die neuesten Tweets zuerst angezeigt wurden und jeder frühere Tweet nacheinander beim Scrollen angezeigt wurde nach unten.

Der aktuelle Algorithmus besteht immer noch größtenteils aus derselben umgekehrt chronologischen Auflistung von Tweets, aber Twitter führt eine Neurangfolge durch, um zu versuchen, die interessantesten Tweets in erster Linie aus den letzten Tweets anzuzeigen.

Im Hintergrund wird den Tweets von einem Relevanzmodell ein Ranking-Score zugewiesen, der vorhersagt, wie interessant jeder Tweet voraussichtlich für Sie sein wird, und dieser Score-Wert gibt die Rangfolge vor.

Die Tweets mit den höchsten Punktzahlen werden zuerst in deiner Timeline-Liste angezeigt, während die restlichen neuesten Tweets weiter unten angezeigt werden.Bemerkenswert ist, dass in Ihrer Chronik jetzt auch Tweets von Accounts eingestreut sind, denen Sie nicht folgen, sowie einige Werbe-Tweets.

Das Verbindungsdiagramm von Twitter

Zunächst einmal ist einer der einflussreichsten Aspekte der Twitter-Timeline, wie Twitter jetzt Tweets anzeigt, basierend nicht nur auf Ihren direkten Verbindungen zu diesem Zeitpunkt, sondern im Wesentlichen auf Ihrem einzigartigen sozialen Diagramm, das Twitter in Patenten als „ Verbindungsdiagramm“.

Das Verbindungsdiagramm stellt Konten als Knoten und Beziehungen als Linien („Kanten“) dar, die einen oder mehrere Knoten verbinden.Eine Beziehung kann sich auf Verknüpfungen zwischen Twitter-Konten beziehen.

Zum Beispiel Folgen, Abonnieren (z. B. über das Super Follows-Programm von Twitter oder möglicherweise für die angekündigte Abonnementfunktion von Twitter für Schlüsselwortabfragen), Liken, Markieren usw. – all dies schafft Beziehungen.

Beziehungen im eigenen Verbindungsdiagramm können unidirektional (z. B. ich folge dir) oder bidirektional (z. B. wir folgen uns beide) sein. Wenn ich dir folge, aber du mir nicht folgst, hätte ich eine größere Erwartung, dass deine Tweets und Retweets in meiner Chronik erscheinen, aber du würdest nicht unbedingt erwarten, meine zu sehen.

Einfach basierend auf dem Verbindungsdiagramm sehen Sie wahrscheinlich Tweets und Retweets von denen, denen Sie folgen, sowie Tweets, die Ihren Verbindungen gefallen oder auf die sie geantwortet haben.

Der Twitter-Algorithmus hat Tweets erweitert, die Sie möglicherweise über die Konten hinaus sehen, mit denen Sie direkt interagiert haben.Die Tweets, die du möglicherweise in deiner Chronik siehst, umfassen jetzt auch Tweets von anderen, die über Themen posten, denen du gefolgt bist, Tweets, die in gewisser Weise Tweets ähneln, die du zuvor mit „Gefällt mir“ markiert hast, und Tweets, die auf Themen basieren, die der Algorithmus vorhersagt, die dir gefallen könnten.

Selbst unter diesen erweiterten Arten von Tweets, die Sie möglicherweise erhalten, gilt das Ranking-System des Algorithmus – Sie erhalten nicht alle Tweets, die Ihren Themen, Vorlieben und vorhergesagten Interessen entsprechen – Sie erhalten eine Liste, die durch den Algorithmus von Twitter kuratiert wird.

Ranking der Interessantheit

In der DNA einer Reihe von Patenten und Algorithmen von Twitter zum Ranking von Tweets steckt das Konzept der „Interessanz“.

Dies wurde höchstwahrscheinlich von einem 2006 an Yahoo erteilten Patent mit dem Titel „Interessanz-Ranking von Medienobjekten“ inspiriert, das die Ranking-Methoden beschrieb, die im Algorithmus für Flickr verwendet wurden (der dominierende Social-Media-Foto-Sharing-Dienst, der später von Instagram und Instagram in den Schatten gestellt wurde Pinterest).

Dieser frühere Algorithmus für Flickr weist viele Ähnlichkeiten mit den zeitgenössischen Patenten von Twitter auf.Es wurden ähnliche und sogar identische Faktoren zur Berechnung der Interessantheit verwendet.Diese enthielten:

  • Standortinfo.
  • Content-Metadaten.
  • Chronologie.
  • Benutzerzugriffsmuster.
  • Signale von Interesse (z. B. Markieren, Kommentieren, Favoriten).

Man könnte den Algorithmus von Twitter leicht so beschreiben, dass er den Interessantheitsalgorithmus von Flickr übernimmt, einige der beteiligten Faktoren erweitert, ihn durch einen ausgeklügelteren maschinellen Lernprozess berechnet, Inhalte basierend auf der Verarbeitung natürlicher Sprache (NLP) interpretiert und eine Reihe zusätzlicher Variationen integriert Ermöglichen Sie eine schnelle Präsentation nahezu in Echtzeit für eine gigantische Anzahl von Benutzern gleichzeitig.

Twitter-Ranking und Spam

Es ist auch von Interesse, sich auf Methoden zu konzentrieren, die von Twitter verwendet werden, um Spam, Spam-Benutzerkonten zu erkennen und Spam-Tweets aus der Ansicht abzustufen oder zu unterdrücken.

Die Überwachung von Desinformationen, anderen gegen die Richtlinien verstoßenden Inhalten und Belästigung ist ebenfalls intensiv, aber das stimmt nicht unbedingt mit Ranking-Bewertungen überein.

Einige der Spam-Erkennungspatente sind interessant, weil ich sehe, dass Benutzer häufig ziemlich unbeabsichtigt auf die Spam-Unterdrückungsprozesse von Twitter stoßen, und es gibt eine Reihe von Dingen, die man tun kann, die zu Sandbaging-Bemühungen führen, um das Twitter-Publikum zu fördern und mit ihm zu interagieren.Twitter musste aggressive Watchdog-Prozesse aufbauen, um Spam zu überwachen und zu entfernen, und selbst die prominentesten Benutzer können von Zeit zu Zeit mit diesen Prozessen in Konflikt geraten.

Daher kann es wichtig sein, die Spam-Faktoren von Twitter zu verstehen, da sie dazu führen können, dass die eigenen Tweets von der sonst möglichen Interessantheit abgezogen werden, und dieser Verlust der Relevanzwerte kann die Sichtbarkeit und Verbreitungskraft Ihrer Tweets verringern.

Twitter-Ranking-Faktoren

Welche Faktoren werden also in den Patenten von Twitter zur Bewertung von „Interesse“ erwähnt und welche beeinflussen, wie Twitter Tweets für Rankings bewertet?

Aktualität des Tweet-Postings

Neuere werden im Allgemeinen viel bevorzugter.Abgesehen von bestimmten Schlüsselwörtern und anderen Suchtypen stammen die meisten Tweets aus den letzten Stunden.Einige "falls Sie es verpasst haben"Es können auch Tweets enthalten sein, die sich hauptsächlich über die letzten ein bis zwei Tage zu erstrecken scheinen.

Bilder oder Videos

Im Allgemeinen haben Google und andere Plattformen angegeben, dass Nutzer dazu neigen, Bilder und Videomedien mehr zu bevorzugen, sodass ein Tweet, der beides enthält, möglicherweise eine höhere Punktzahl erhält.

Twitter zitiert insbesondere Bild- und Videokarten, was sich auf Websites bezieht, die Twitter Cards implementiert haben, was es Twitter ermöglicht, auf einfache Weise reichhaltigere Vorschau-Snippets anzuzeigen, wenn Tweets Links zu Webseiten mit dem Karten-Markup enthalten.

Tweets mit Links, die Bilder und Videos zeigen, sind im Allgemeinen ansprechender für Benutzer, aber es kann einen zusätzlichen Vorteil für Tweets geben, die auf die Seiten mit dem Karten-Markup verlinken, um den Karteninhalt anzuzeigen

Interaktionen mit dem Tweet

Twitter nennt „Gefällt mir“-Angaben und Retweets, aber möglicherweise gelten hier auch zusätzliche Metriken im Zusammenhang mit dem Tweet.Zu den Interaktionen gehören:

  • Likes
  • Retweets
  • Klicks auf Links, die möglicherweise im Tweet enthalten sind
  • Klicks auf Hashtags im Tweet
  • Klicks auf Twitter-Konten, die im Tweet erwähnt werden
  • Detail Expands – Klicks, um Details über den Tweet anzuzeigen, z. B. um anzuzeigen, wem er gefallen hat oder wer ihn retweetet hat.
  • Neue Follower – wie viele Personen sind über den Benutzernamen gefahren und haben dann geklickt, um dem Konto zu folgen.
  • Profilbesuche – wie viele Personen auf den Avatar oder Benutzernamen geklickt haben, um das Profil des Posters zu besuchen.
  • Shares – wie oft der Tweet über die Share-Schaltfläche geteilt wurde.
  • Antworten auf den Tweet

Impressionen

Während die meisten Impressionen von der Anzeige des Tweets in Timelines stammen, werden einige Impressionen abgeleitet, wenn Tweets durch Einbetten in Webseiten geteilt werden.Es ist möglich, dass diese Impressionszahlen auch den Interessantheitswert für den Tweet beeinflussen.

Wahrscheinlichkeit von Wechselwirkungen

Ein Twitter-Patent beschreibt die Berechnung einer Punktzahl für einen Tweet, die darstellt, wie wahrscheinlich es ist, dass Follower des Tweet-Autors im Social-Messaging-System mit der Nachricht interagieren, wobei die Punktzahl auf der berechneten Interaktionsniveauabweichung zwischen dem beobachteten Interaktionsniveau von Followern von basiert der Autor und das erwartete Interaktionsniveau der Follower.

Länge des Tweets

Eine Art der Klassifizierung ist die Länge des im Tweet enthaltenen Textes, die als numerischer Wert klassifiziert werden könnte (z. B. 103 Zeichen) oder einer von wenigen Kategorien zugeordnet werden könnte (z. B. kurz, mittel oder lang). .

Je nachdem, um welche Themen es in einem Tweet geht, kann er als mehr oder weniger interessant bewertet werden – bei manchen Themen kann ein kurzer Tweet vorteilhafter sein, und bei einigen anderen Themen kann eine mittlere oder lange Länge den Tweet interessanter machen.

Interaktionen mit früheren Autoren

Frühere Interaktionen mit dem Autor eines Tweets erhöhen die Wahrscheinlichkeit (und den Ranking-Wert in der eigenen Timeline), dass man andere Tweets desselben Autors sieht.

Diese Social Graph-Interaktionsmetriken können eine Bewertung nach dem Ursprung der Beziehung umfassen.

Wenn also in der Vergangenheit auf die Tweets eines Autors geantwortet, diese mit „Gefällt mir“ markiert oder retweetet wurden, kann dies die Wahrscheinlichkeit erhöhen, dass man seine neuesten Tweets sieht, selbst wenn man diesem Konto nicht folgt.

Es besteht die Möglichkeit, dass die jüngsten Interaktionen mit einem Tweet-Autor ebenfalls eine Rolle spielen. Wenn Sie also längere Zeit nicht mit einem seiner Tweets interagiert haben, kann die potenzielle Sichtbarkeit seiner neueren Tweets für Sie abnehmen.

Im Kontext des Algorithmus werden „Autor“ und „Konto“ im Wesentlichen mit derselben Bedeutung verwendet, sodass Tweets von einem Unternehmenskonto genauso behandelt werden wie Tweets von einer Einzelperson.

Bewertung der Glaubwürdigkeit des Autors

Diese Punktzahl kann anhand der Beziehungen und Interaktionen eines Autors mit anderen Benutzern berechnet werden.

Das im Patent angegebene Beispiel ist, dass ein Autor, dem mehrere hochkarätige oder produktive Konten folgen, eine hohe Glaubwürdigkeitsbewertung haben würde.

Während ein Bewertungswert „niedrig“, „mittel“ und „hoch“ genannt wird, schlägt das Patent auch eine Skala von Bewertungswerten von 1 bis 10 vor und kann einen qualitativen und/oder quantitativen Faktor enthalten.

Ich würde vermuten, dass ein Bereich wie 1 bis 10 viel wahrscheinlicher ist.Es scheint wahrscheinlich, dass einige der Spam-Bewertungswerte verwendet werden könnten, um von einer Glaubwürdigkeitsbewertung des Autors abzuziehen.Mehr zu potenziellen Spam-Bewertungsfaktoren im letzten Teil dieses Artikels.

Autorenrelevanz

Es ist möglich, dass Autoren, die für ein bestimmtes Thema als relevanter eingestuft werden, einen höheren Autorenrelevanzwert haben.Außerdem kann die Erwähnung eines Autors ihn im Kontext der Tweets, in denen er erwähnt wird, relevanter machen.

Die Patente sprechen auch über die Zuordnung von Autoren zu Themen, sodass es möglich ist, dass Autoren, die häufig zu bestimmten Themen twittern, zusammen mit guten Interaktionsraten eine höhere Relevanz haben, wenn ihre Tweets dieses Thema betreffen.

Autorenmetriken

Tweets können basierend auf Eigenschaften des Autors klassifiziert werden.Diese Metriken können die relative Interessantheit der Nachrichten des Autors beeinflussen.Zu solchen Autorenmetriken gehören:

  • Ort des Autors (z. B. Stadt oder Land)
  • Alter (basierend auf dem Geburtsdatum, das in den Kontodetails angegeben werden kann)
  • Anzahl der Follower
  • Anzahl der Konten, denen der Autor folgt
  • Verhältnis der Anzahl der Follower zu den Accounts, denen gefolgt wird, da eine größere Anzahl von Followern im Vergleich zu Gefolgten zusammen mit der reinen Follower-Zahl eine größere Popularität vermittelt.Ein Verhältnis, das näher bei 1 liegt, würde auf eine Gegenleistung hinweisen, die der Philosophie des Autors folgt, was es weniger möglich macht, auf Popularität zu schließen, und den Anschein künstlicher Popularität erweckt.
  • Anzahl der vom Autor geposteten Tweets pro Zeitraum (z. B. pro Tag oder pro Woche).
  • Alter des Kontos (z. B. Monate seit Kontoeröffnung) – bei Konten, die erst vor kurzem eingerichtet wurden, wird ein viel geringeres Gewicht beigemessen.
  • Vertrauen.

Themen

Tweets werden nach den Themen klassifiziert, die sie betreffen.An der Klassifizierung der Tweets sind einige sehr ausgefeilte Algorithmen beteiligt.

Twitter-Nutzer haben häufig Themen ausgewählt, die mit ihren Konten verknüpft werden sollen, und Ihnen werden offensichtlich beliebte Tweets zu den von Ihnen ausgewählten Themen angezeigt.Aber Twitter erstellt auch automatisch Themen basierend auf Schlüsselwörtern, die in Tweets gefunden werden.

Basierend auf Ihren Interaktionen mit Tweets und den Konten, denen Sie folgen, sagt Twitter auch Themen voraus, an denen Sie wahrscheinlich interessiert wären, und zeigt Ihnen einige Tweets aus diesen Themen, obwohl Sie die Themen nicht offiziell abonniert haben.

Phrasenklassifizierung

Das System von Twitter ist sehr komplex und ermöglicht die potenzielle Anwendung benutzerdefinierter Ranking-Modelle auf Tweets für bestimmte Themen und wenn bestimmte Phrasen vorhanden sind.

Twitter hat eine große Belegschaft, die daran arbeitet, Modelle für bestimmte „Kundenreisen“ zu entwickeln, und dies scheint mit Patentbeschreibungen übereinzustimmen, wie Redakteure Regeln für themenorientierte Posts und Schlüsselwörter oder Phrasen in Posts festlegen könnten.

Posts mit Texten wie „jetzt einstellen“ oder „wird im Fernsehen laufen“ könnten beispielsweise als langweilig für ein Thema angesehen werden, während Ausdrücke wie „frisch“, „im Angebot“ oder „nur heute“ möglicherweise stärker gewichtet werden dürfte interessanter werden.

Dies könnte ziemlich schwierig zu bewältigen sein, da es ein riesiges Feld potenzieller Themen und benutzerdefinierter Gewichtungen gibt, die angewendet werden könnten.

Eine aktuelle Stellenausschreibung auf Twitter für einen Produktdesigner, Customer Journey, beschrieb, wie die Position helfen würde:

„Ob Sie nach Ariana Grande-Fanart, #herpetology oder extremem Einradfahren suchen, auf Twitter passiert alles. Unser Team ist dafür verantwortlich, neuen Mitgliedern dabei zu helfen, sich in den vielfältigen öffentlichen Gesprächen auf Twitter zurechtzufinden und schnell ein Zugehörigkeitsgefühl zu finden…“

„Sammeln Sie Erkenntnisse aus Daten- und qualitativer Forschung, entwickeln Sie Hypothesen, skizzieren Sie Lösungen mit Prototypen und testen Sie Ideen mit unserem Forschungsteam und in Experimenten.“

„Dokumentieren Sie detaillierte Interaktionsmodelle und UI-Spezifikationen.“

„Erfahrung im Entwerfen für maschinelles Lernen, reichhaltige Taxonomien und/oder Interessendiagramme.“

Diese Beschreibung klingt sehr ähnlich zu dem, was in Twitters Patent für „System und Methode zur Bestimmung der Relevanz sozialer Inhalte“ beschrieben wird, wo:

„Redakteure könnten Regeln aufstellen, um bestimmte Phrasen als mehr oder weniger interessant zu klassifizieren …“

„…ein Redakteur kann entscheiden, dass einige Sätze und Attribute in allen Inhalten interessant sind, unabhängig von der Kategorie des Ortes, der den Inhalt verfasst. Beispielsweise kann der Ausdruck „im Angebot“ oder „Veranstaltung“ in allen Fällen interessant sein und positiv gewichtet werden.“

Ein Patent beschreibt, wie Tweets, die mit kommerzieller Sprache erkannt wurden, eine niedrigere Punktzahl zugewiesen werden konnten als Tweets ohne kommerzielle Sprache. (Im Gegensatz dazu könnten solche Gewichtungen umgedreht werden, wenn der Benutzer Suchen durchführte, die ein Kaufinteresse bekundeten, sodass Tweets, die kommerzielle Sprache enthielten, eine höhere Gewichtung erhalten könnten.)

Uhrzeit

Die Tageszeit kann verwendet werden, um die Relevanz zu beeinflussen.Beispielsweise könnte eine Regel implementiert werden, um Tweets, in denen „Kaffee“ zwischen 8:00 und 10:00 Uhr erwähnt wird, und/oder Tweets, die von Cafés gepostet werden, mehr Gewicht zu verleihen.

Standorte

Patente beschreiben, wie „Ortsreferenzen“ in Tweets Tweets über einen Ort und/oder Konten, die mit der Ortsreferenz verknüpft sind, mehr Gewicht verleihen könnten als andere Konten, die den Ort lediglich erwähnen.Auch die geografische Nähe zwischen dem Standort des Geräts eines Benutzers und dem Standort, der mit Inhaltselementen (Text, Bild, Video und/oder Autor des Tweets) verknüpft ist, kann die potenzielle Relevanz erhöhen oder verringern.

Sprache

Die Sprache des Tweets kann klassifiziert werden (z. B. Englisch, Französisch usw.).

Die Sprache kann unter Verwendung verschiedener automatisierter Sprachbewertungstools automatisch bestimmt werden.

Ein Tweet in einer bestimmten Sprache wäre für Sprecher der Sprache von größerem Interesse und für andere weniger interessant.

Antwort-Tweets

Tweets können danach klassifiziert werden, ob sie Antworten auf frühere Tweets sind.Ein Tweet, der eine Antwort auf einen früheren Tweet ist, kann als weniger interessant erachtet werden als ein Tweet zu einem neuen Thema.

In einer Patentbeschreibung könnte das Thema eines Tweets bestimmen, ob der Tweet dazu bestimmt ist, einem anderen Konto angezeigt oder in die Nachrichtenströme anderer Konten aufgenommen zu werden.

Wenn du deine Chronik ansiehst, gibt es Fälle, in denen einige Antworten auf einen Tweet auch mit dem Haupt-Tweet angezeigt werden – beispielsweise wenn die Antwort-Tweets von Konten gepostet werden, denen du folgst.In den meisten Fällen sind die Antwort-Tweets nur sichtbar, wenn man auf den Thread klickt oder auf den Tweet klickt, um alle Antworten anzuzeigen.

"Gesegnet"Konten

Dies ist ein seltsames Konzept, von dem ich glaube, dass es möglicherweise nicht in Produktion ist.

Twitter beschreibt gesegnete Konten als innerhalb des Diagramms einer bestimmten Konversation identifiziert, wobei der ursprüngliche Autor in einer Konversation als „gesegnet“ gelten würde, und aus den nachfolgenden Antworten auf den ursprünglichen Beitrag jede der Antworten, auf die anschließend von geantwortet wird gesegnetes Konto wird ebenfalls „gesegnet“.

Diese Tweets, die von gesegneten Konten in der Konversation gepostet wurden, würden erhöhte Relevanzbewertungen erhalten.

Website-Profil

Dies wird in Twitter-Patenten nicht erwähnt, aber es macht im Zusammenhang mit all den anderen Faktoren, die sie erwähnt haben, zu viel Sinn, um darauf zu verzichten.

Die Links vieler großer Content-Websites werden häufig auf Twitter geteilt, und Twitter könnte leicht einen Reputations-/Beliebtheitswert für das Website-Profil erstellen, der auch in die Rangfolge von Tweets einfließen könnte, wenn Links zu Inhalten auf den Websites gepostet werden.

Nachrichtenseiten, Informationsquellen, Unterhaltungsseiten – all diese könnten Punktzahlen haben, die aus den gleichen Faktoren entwickelt wurden, die zur Bewertung von Twitter-Konten verwendet werden.Tweets von Websites, die besser gefallen und mit denen man besser interagiert, könnte ein größeres Gewicht beigemessen werden als relativ unbekannte Websites, mit denen weniger interagiert wird.

Twitter verifiziert

Ja, wenn Sie vermutet haben, dass das blaue Abzeichen neben Benutzernamen eine bevorzugte Behandlung vermittelt, gibt es in einem der Twitter-Patente spezifische Formulierungen, die bestätigen, dass sie dies zumindest in Betracht gezogen haben.

Da mit verifizierten Konten oft bereits verschiedene andere Beliebtheitsindikatoren verknüpft sind, ist nicht ohne weiteres ersichtlich, ob dieser Faktor verwendet wird oder nicht.Tweets, die von einem verifizierten Konto gepostet werden, können eine höhere Relevanzbewertung erhalten, wodurch sie häufiger erscheinen als die Tweets unverifizierter Konten.

Hier die Patentbeschreibung:

„In einer oder mehreren Ausführungsformen der Erfindung umfasst das Konversationsmodul ( 120 ) eine Funktionalität zum Anwenden eines Relevanzfilters zum Erhöhen der Relevanzbewertungen eines oder mehrerer Autorenkonten des Konversationsgraphen, die in einer Whitelist verifizierter Konten identifiziert sind. Beispielsweise kann die Whitelist verifizierter Konten eine Liste von Konten sein, bei denen es sich um hochkarätige Konten handelt, die anfällig für Identitätsdiebstahl sind. In diesem Beispiel würden Prominenten- und Geschäftskonten von der Messaging-Plattform (100) verifiziert, um Benutzer der Messaging-Plattform (100) zu benachrichtigen, dass die Konten authentisch sind. In einer oder mehreren Ausführungsformen der Erfindung ist das Konversationsmodul (120) so konfiguriert, dass es die Relevanzbewertungen verifizierter Autorenkonten um einen vordefinierten Betrag/Prozentsatz erhöht.“

Hat Tendenz

Dies ist ein binäres Flag, das angibt, ob der Tweet als Thema identifiziert wurde, das zum Zeitpunkt der Übertragung der Nachricht im Trend lag.

App hat Geschlecht, sexuelle Orientierung und Interessen erkannt

Twitter kann möglicherweise die Mobilgeräteinformationen eines Kontoinhabers verwenden, um auf das Geschlecht des Kontoinhabers oder Interessen an Themen wie Nachrichten, Sport, Krafttraining und anderen Themen zu schließen.

Einige Mobilgeräte stellen Informationen zu anderen Apps bereit, die auf dem Telefon geladen sind, um mögliche Konflikte bei der Anwendungsprogrammierung zu diagnostizieren.Daher könnten einigen Tweets, die Ihrem Geschlecht, Ihrer sexuellen Orientierung und Ihren aktuellen Interessen entsprechen, mehr Interessantheitspunkte gegeben werden, einfach basierend auf Schlussfolgerungen aus den Apps Ihres Telefons. (Siehe: https://screenrant.com/android-apps-collecting-app-data/ )

Und mehr Ranking-Faktoren

Twitter gibt an, dass:

„Unsere Liste der berücksichtigten Merkmale und ihrer vielfältigen Wechselwirkungen wächst ständig und informiert unsere Modelle über immer nuanciertere Verhaltensmuster.“

Diese Liste von Faktoren ist also wahrscheinlich eine Unterrepräsentation der Faktoren, die sie möglicherweise verwenden, und ihre Liste kann erweitert werden.

Stellen Sie sich auch vor, dass eine benutzerdefinierte Kombination einiger der oben genannten Faktoren als Modelle für Tweets zu bestimmten Themen angewendet werden kann, was den Rankings durch maschinelle Lernmethoden ein großes Potenzial an Komplexität verleiht. (Auch hier ist das maschinelle Lernen, das angewendet wird, um Ranggewichtungsmodelle zu erstellen, die für bestimmte Suchanfragen oder Themen angepasst sind, Methoden sehr ähnlich, die wahrscheinlich bei Google verwendet werden.)

Twitter hat erklärt, dass die Bewertung von Tweets jedes Mal erfolgt, wenn man Twitter besucht, und jedes Mal, wenn man seine Timeline aktualisiert.In Anbetracht einiger der beteiligten komplexen Faktoren ist das sehr schnell!

Twitter verwendet A/B-Tests der Gewichtung von Ranking-Faktoren und andere Algorithmusänderungen und bestimmt, ob eine vorgeschlagene Änderung eine Verbesserung darstellt, basierend auf dem Engagement und der Zeit, in der ein Tweet angezeigt/mit ihm interagiert wird.Dies wird verwendet, um Ranking-Modelle zu trainieren.

Die Einbeziehung von maschinellem Lernen in diesen Prozess legt nahe, dass Ranking-Modelle für viele spezifische Szenarien und möglicherweise spezifisch für bestimmte Themen und Benutzertypen erstellt werden könnten.Nach der Entwicklung kann das Modell getestet werden, und wenn es das Engagement verbessert, kann es schnell für alle Benutzer eingeführt werden.

Wie Vermarkter diese Informationen nutzen können

Es gibt viele Schlussfolgerungen, die aus der Liste der potenziellen Ranking-Faktoren gezogen werden können und die von Vermarktern verwendet werden können, um ihre Tweeting-Taktiken zu verbessern.

Ein Twitter-Konto, das nur Ankündigungen zu seinen Produkten und Werbeinformationen über sein Unternehmen veröffentlicht, wird wahrscheinlich nicht so viel Sichtbarkeit haben wie Konten, die interaktiver mit ihrer Community sind, da Interaktionen mehr Ranking-Signale und potenzielle Vorteile erzeugen.

Social-Media-Experten empfehlen seit langem einen Ansatz, bei dem Posttypen gemischt werden, anstatt nur selbstreferenzielle Werbung zu veröffentlichen – diese Strategien umfassen „Die Drittel-Regel“, „Die 80/20-Regel“ und andere.

Die Twitter-Ranking-Faktoren stützen wahrscheinlich diese Theorien, da es wahrscheinlicher ist, die Sichtbarkeit eines Kontos zu erhöhen, wenn mehr Interaktionen mit einer Anzahl von Twitter-Nutzern ausgelöst werden.

Beispielsweise könnte ein großes Unternehmenskonto mit vielen Followern eine interessante Umfrage veröffentlichen, um Ratschläge zu erhalten, welche Funktionen zu seinem Produkt hinzugefügt werden sollten.Die von den Benutzern geposteten Stimmen und Kommentare sorgen dafür, dass die Befragten aufgrund der jüngsten Interaktionen mit viel größerer Wahrscheinlichkeit den nächsten Beitrag des Unternehmens sehen und dass der nächste Beitrag etwas Neues fördern oder ankündigen könnte.Und die Follower der Befragten sehen möglicherweise auch eher den nächsten Beitrag des Unternehmens, da Twitter anscheinend berücksichtigt, dass Benutzer mit ähnlichen Interessen möglicherweise offener dafür sind, Inhalte zu sehen, die ihren Interessen entsprechen.

Außerdem deuten die Faktoren auf eine Reihe potenziell vorteilhafter Ansätze hin.

Wenn Sie einen Tweet posten, der für ein Produkt wirbt oder eine Ankündigung macht, könnte das Kombinieren von etwas, um eine Antwort von Ihren Followern hervorzurufen, die Präsenz auf der Plattform leicht erhöhen, da die Antworten jedes Befragten auf Ihren Tweet die Wahrscheinlichkeit erhöhen können, dass ihre direkten Follower den ursprünglichen Tweet und ihre sehen Antwort-Tweet von Connection.

Die Nutzung des Social Graph-Aspekts des Twitter-Algorithmus kann dazu beitragen, die Interessantheit Ihrer Tweets zu erhöhen und die Sichtbarkeit Ihrer Tweets für andere Benutzer zu erhöhen.

Spam-Faktoren können sich negativ auf Tweet-Rankings auswirken

Spam-Erkennungsalgorithmen können sich negativ auf die Ranking-Fähigkeit von Tweets auswirken.

Zum einen ist Twitter sehr schnell dabei, Konten zu sperren, die eklatant spammen, und in Fällen, in denen es offensichtlich und eindeutig ist, kann man damit rechnen, dass das Konto abrupt gekündigt wird, wodurch alle seine Tweets aus den Konversationsdiagrammen und Zeitleisten verschwinden, und wodurch das Kontoprofil nicht mehr zur Ansicht verfügbar ist.

In noch anderen Fällen, in denen nicht so klar ist, ob ein Konto spammt, könnten die Tweets des Kontos einfach durch die Anwendung negativer Ranggewichtungswerte herabgestuft werden, oder die Tweets könnten gesperrt oder ausgesetzt werden, bis oder wenn der Kontoinhaber eine Korrekturmaßnahme ergreift oder überprüft ihre Identität.

Beispielsweise könnte ein Twitter-Konto mit einer langen Geschichte guter Tweets plötzlich damit beginnen, Viagra-Anzeigen oder Links zu Malware zu posten, beispielsweise wenn ein etabliertes Konto gehackt wurde.Twitter kann das Konto vorübergehend sperren, bis Korrekturmaßnahmen ergriffen wurden, z. B. das Bestehen einer CAPTCHA-Bestätigung oder das Empfangen eines Bestätigungscodes über das Mobiltelefon und das Ändern von Passwörtern.Ein weiteres Beispiel könnte ein neuer Benutzer sein, der versehentlich eine bestimmte Schwelle überschreitet, indem er innerhalb eines kurzen Zeitraums zu vielen Konten folgt oder etwas zu häufig postet.

Twitter setzt eine Reihe von Methoden ein, um Spam zu erkennen und auszublenden, damit Benutzer ihn weniger sehen.

Ein Großteil der automatisierten Erkennung beruht auf der Erkennung einer Kombination aus Kontoprofilmerkmalen, Tweetverhalten des Kontos und in den Tweets des Kontos gefundenen Inhalten.

Twitter hat eine Reihe charakteristischer „Fingerabdrücke“ von Spam entwickelt, um eine schnelle Mustererkennung durchzuführen.Ein Twitter-Patent beschreibt, wie:

„Spam wird bestimmt, indem die Merkmale identifizierter Spam-Konten verglichen werden und ein „Ähnlichkeitsdiagramm“ erstellt wird, das mit anderen Konten verglichen werden kann, die im Verdacht stehen, Spam zu sein.“

Tweets, die potenziell Spam enthalten, könnten mit einem binären Wert wie „Ja“ oder „Nein“ gekennzeichnet werden, und dann können gekennzeichnete Tweets aus Zeitleisten herausgefiltert werden.

Es ist ebenso möglich, dass es eine Skala von Spam gibt, die aus mehreren Faktoren berechnet wird, und sobald ein Tweet oder Konto einen Schwellenwert überschreitet, wird es herabgestuft.Ich denke, es lohnt sich, diese zu erwähnen, da Twitter-Nutzer die Auswirkungen der Nutzung der Plattform möglicherweise nicht verstehen.Beispielsweise kann sich das Posten eines übermäßig aggressiven Tweets für einige Zeit negativ auf die nachfolgenden Tweets eines Kontos auswirken.Wiederholtes nervöses Verhalten kann zu Schlimmerem führen, wie z. B. einer vollständigen Kontolöschung, ohne dass eine Wiederherstellungsmöglichkeit besteht.

Ich werde hier einige Faktoren hinzufügen, die nicht ausdrücklich in Twitter-Patenten oder Blog-Beiträgen erwähnt werden, da Twitter aus offensichtlichen Gründen nicht alle Spam-Identifizierungsfaktoren offenlegt.Einige Merkmale von Spam und Spam-Konten scheinen jedoch so offensichtlich zu sein, dass ich einige aus persönlichen Beobachtungen oder aus angesehenen Forschungsquellen hinzufüge, um ein breiteres Verständnis dafür zu vermitteln, was zu Spam-Herabstufungen führen kann.

Spam-Faktoren und andere negative Ranking-Faktoren

  • Tweets, die eine kommerzielle Nachricht enthalten, die ohne Follower/Followee-Beziehung oder in einer unidirektionalen Beziehung gepostet wird (der Autor des Tweets folgt dem Konto, das er erwähnt, aber das empfangende Konto folgt dem Autor nicht), aber sie hatten keine vorherigen Interaktionen, beginnen zu erscheinen verdächtig.Wenn dies viele Male mit ähnlichem oder identischem Text geschieht, wird es nicht lange dauern, bis dies als Spam-Aktivität angesehen wird, insbesondere bei neueren Konten.
  • Kontoalter – wobei das Alter zeigt, dass das Konto erst vor kurzem eingerichtet wurde. (Die jüngsten Untersuchungen von SparkToro zu Twitter-Spam legen ein Kontoalter von 90 Tagen oder weniger nahe.)
  • NSFW-Flag des Kontos – Das Konto hat ein Flag, das anzeigt, dass es für Links zu Websites identifiziert wurde, die in einer schwarzen Liste potenziell anstößiger Websites dokumentiert sind (z. B. Websites mit Pornos, expliziten Materialien, Gore usw.).
  • Anstößige Markierung – der Tweet enthält einen oder mehrere Begriffe aus einer schwarzen Liste anstößiger Begriffe.
  • Potenziell gefälschtes Konto – das Konto steht im Verdacht, sich als eine echte Person oder Organisation auszugeben, und wurde nicht verifiziert.
  • Kontobuchung Häufige Urheberrechtsverletzung
  • Blacklisting – Ein Patent schlägt die Verwendung einer Blacklist vor, die einen Relevanzfilter anwendet, um die Relevanzwerte von Konten zu verringern, die Folgendes umfassen können, aber nicht darauf beschränkt sind: Spammer, potenziell gefälschte Konten, Konten mit einem Potenzial oder einer Vorgeschichte zum Posten von Inhalten für Erwachsene, Konten mit ein Potenzial oder eine Geschichte des Postens illegaler Inhalte, Konten, die von anderen Benutzern gemeldet wurden, und/oder das Erfüllen anderer Kriterien zum Markieren von Konten.
  • Konto-Bot-Flag – Identifizierung, dass das Konto, das den Tweet sendet, als möglicherweise von einer Softwareanwendung und nicht von einem Menschen betrieben identifiziert wurde.Dieses spezielle Kriterium hat eine Reihe von Auswirkungen, insbesondere für Konten, die Arten von Planungsanwendungen zum Posten von Tweets oder andere Software verwendet haben, die automatisierte Tweets generiert.Beispielsweise kann das Planen zu vieler Tweets, die pro Zeitraum über eine App wie Hootsuite oder Sprout Social gepostet werden sollen, dazu führen, dass das Benutzerkonto gesperrt wird oder der App-Zugriff über die Twitter-API gesperrt wird.Dies kann besonders ärgerlich sein, da das Konto keine Probleme bekommen würde, wenn die gleiche Anzahl von Tweets pro Zeitraum manuell gepostet würde.Unter Vermarktern auf Facebook und Twitter besteht seit langem die Überzeugung, dass die jeweiligen Algorithmen die Sichtbarkeit von Posts, die über Software veröffentlicht werden, im Vergleich zu manuell beeinträchtigen könnten, und diese Komponente legt nahe, dass dies bei Twitter sehr wohl der Fall sein könnte.
  • Tweets, die anstößige Sprache enthalten, dürfen möglicherweise ihren Interessantheitswert untergraben.
  • Tweets, die über die APIs von Twitter gepostet werden, z. B. durch Verwaltungstools für soziale Medien, die sich auf die API von Twitter stützen, werden im Allgemeinen einer genaueren Prüfung unterzogen, da Twitter beschrieben hat: „Das Problem kann sich verschärfen, wenn ein Content-Sharing-Dienst seine Anwendungsprogrammierschnittstelle (API) für Entwickler öffnet .“Meine Beobachtung ist, dass Accounts, die ausschließlich auf Posting-Anwendungen und APIs von Drittanbietern angewiesen sind – insbesondere neuere Accounts – ihre Verteilungsfähigkeit möglicherweise etwas eingeschränkt sehen.Neuere Konten sollten sich zunächst durch menschliche Nutzung etablieren, bevor sie sich mehr auf Planungs- und Veröffentlichungsanwendungen verlassen, und selbst etablierte Konten sehen möglicherweise ein größeres Vertriebspotenzial, wenn sie einige menschliche manuelle Veröffentlichungen in Kombination mit ihren geplanten/automatisierten/Drittanbietern mischen -Bewerbungsstellen.
  • Konten, die für einen langen Zeitraum ruhen – Konten, die für eine lange Zeit nicht gepostet wurden und dann plötzlich zum Leben erwachen, haben nicht sofort die Ranking-Fähigkeit, die sie sonst hätten.Der Grund dafür ist, dass Spammer manchmal erfolgreich inaktive Konten kapern können, um ein zuvor gutgläubiges Konto dazu zu bringen, Spam zu posten.
  • Geräteprofil im Zusammenhang mit Spammer oder anderen Richtlinienverletzern – Im Wesentlichen deuten Patente darauf hin, dass Twitter Browser-Fingerabdruck und Geräte-Fingerabdruck verwendet, um Spammer und andere schlechte Spieler zu erkennen.Fingerabdrücke ermöglichen es technischen Diensten, Profile aus einer Kombination von Daten zu erstellen, die Dinge wie IP-Adresse, Geräte-ID, Benutzeragenten, Browser-Plug-ins, Geräteplattformmodell und -version sowie App-Downloads enthalten, um eindeutige „Fingerabdrücke“ zur Identifizierung bestimmter Geräte zu erstellen.Eine wichtige Erkenntnis daraus ist, dass, wenn Sie zwei oder mehr Twitter-Konten haben, die Sie mit Ihrem Telefon oder Browser verwenden, wenn Sie über eines dieser Konten missbräuchlich twittern, die sehr reale Möglichkeit besteht, dass dies die Platzierungen in einem „professionelleren“ Umfeld beeinträchtigen könnte ”-Konto, das Sie auf demselben Gerät betreiben.Im schlimmsten Fall könnte es sogar dazu führen, dass Sie beide Konten für das, was Sie auf einem tun, gesperrt werden.Dies hat ziemlich schwerwiegende Auswirkungen auf Unternehmen und Agenturen, deren Mitarbeiter professionelle Tweets durchführen, während sie ihr Gerät möglicherweise auch zum Posten persönlicher Tweets einschalten.Zu den Arten von Tweets, die Probleme verursachen könnten, gehören: Spam, Belästigung, falsche oder irreführende Informationen, Drohungen, wiederholte Urheberrechtsverletzungen, das Posten von Malware-Links und wahrscheinlich mehr.Während ich theoretisiere, dass ein privates Konto auch ein professionelles Konto auf demselben Gerät sperren könnte, würde ich die Vermutung wagen, dass es nur das professionelle Konto für diesen bestimmten Geräteinhaber sperren könnte und auf das professionelle Konto anschließend über ein anderes Gerät zugegriffen werden könnte .
  • Mangel an anderen App-Nutzungsdaten – Es ist sehr wahrscheinlich, dass Twitter Daten von mobilen Geräten empfangen kann, die angeben, ob der Gerätebetreiber neben der Twitter-App andere Apps auf das Gerät heruntergeladen oder kürzlich verwendet hat. (Siehe: https://screenrant.com/android-apps-collecting-app-data/ ) Ein häufiges Merkmal von Spam-Konten ist, dass sie keine andere App-Nutzung widerspiegeln, da das Gerät in erster Linie für das Spammen von Twitter bestimmt ist und keine Menschen anzeigt Gebrauchseigenschaften.Oder das Konto wird auf einem Webserver statt auf einem Mobilgerät gehostet und versucht, das Nutzungsprofil eines menschlichen Benutzers nachzuahmen.
  • Sperren – Konten, die andere Benutzer mehrfach blockiert haben, oder Konten, die über einen bestimmten Zeitraum gesperrt wurden, können auf ein Spam-Konto hinweisen.
  • Häufigkeit von Tweets – Wenn eine Anzahl von Tweets, die von demselben Konto in einem bestimmten Zeitraum gesendet werden, einen Schwellenwert überschreitet, kann dieses Konto als Spam gekennzeichnet und das Senden weiterer Tweets verweigert werden.Dies ist keine feste Regel, oder sie ist variabel in der Anwendung, da es größere Unternehmenskonten mit vielen Mitarbeitern gibt, die das Posten von Tweets an einen großen Kundenstamm bearbeiten, wie im Fall von American Airlines.Es gibt Konten wie dieses, die zu Whitelists hinzugefügt werden, um eine automatische Sperrung aufgrund der großen Menge an Tweets zu vermeiden, die sie möglicherweise innerhalb kurzer Zeiträume posten.
  • Hohes Volumen an Tweets mit dem gleichen Hashtag oder Erwähnungen des gleichen @Benutzernamens – Offensichtlich sind hochvolumige Tweets riskant, und wenn Sie Ihr Volumen innerhalb kurzer Zeit erhöhen, wird Ihr Konto immer näher daran gehindert, als das eines Spammers eingestuft zu werden.Daher wird der Versuch, die Zeitleiste eines bestimmten Hashtags zu überfordern, als lästig und potenziell spammig angesehen.Ebenso wird das Beharren darauf, die Aufmerksamkeit eines bestimmten Kontos zu erregen, indem man es wiederholt erwähnt, als lästige, unnötige, missbräuchliche Belästigung und/oder Spam erscheinen.
  • CAPTCHA – Bei Spam-Verdacht kann der Dienst verhindern, dass ein Tweet geschrieben oder veröffentlicht wird, indem das Benutzerkonto zunächst eine CAPTCHA-Abfrage bestehen muss, um festzustellen, dass das Konto von einem Menschen betrieben wird. (Meine Agentur ist darauf gestoßen, als wir neue Konten im Auftrag von Kunden eingerichtet haben. Dies ist wahrscheinlicher, wenn der Computer, der zum Einrichten des Kontos verwendet wird, kürzlich zum Einrichten anderer Konten verwendet wurde und das Konto eingerichtet ist Verwenden Sie kostenlose E-Mail-Dienstkonten anstelle von Mobiltelefonen. Twitter erfordert auch oft das Senden einer mobilen Textnachricht, um eine Telefonnummer zu bestätigen, bevor das Konto entsperrt wird.)
  • Kontoregistrierung spiegelt Anomalie wider – Neue Konten werden innerhalb der Twitter-Systeme einer größeren Prüfung und Misstrauen ausgesetzt, und eine Möglichkeit, neue Konten zu kritisieren, basiert auf Daten, die mit der anfänglichen Kontoregistrierung verbunden sind, da Spammer die Automatisierung verwendet haben, um zu versuchen, große Mengen neuer Konten zu erstellen für Bot-Nutzung.Die Twitter-Nutzung kann echte oder falsche Account-Setups widerspiegeln, daher hat Twitter viele falsche Accounts analysiert und Fingerabdruck-Muster entwickelt, um wahrscheinliche Spam-/Bot-Accounts zu erkennen.Wenn beispielsweise ein menschlicher Benutzer in einem Browserfenster auf die Kontoanmeldeseite von Twitter zugreift, um Registrierungsinformationen zu übermitteln, sendet der Browser schnell Rückrufe an die Twitter-Server für Dutzende von Elementen, die zum Erstellen der Seite im Browser verwendet werden – wie z Javascripts, Cascading Stylesheets und Bilder.Es ist wahrscheinlicher, dass Bots Registrierungsinformationen übermitteln, ohne zuerst alle Elemente der Registrierungsseite aufzurufen.Bildanfragen und andere Dateitypanfragen, die einer Registrierungsübermittlung vorausgehen, können also verwendet werden, um zu bestimmen, ob eine neue Anmeldung eine Anomalie widerspiegelt, die darauf hinweist, dass eine Bot-generierte Anmeldung aufgetreten ist.Daher können die Tweets von Konten, die mit anomalen Merkmalen angemeldet wurden, in der Relevanz etwas abgezogen werden.
  • Bulk-Follow von verifizierten Konten – Spam-Konten folgen häufig prominenten und/oder verifizierten Konten, um in der sozialen Grafik Fuß zu fassen.Als wir zuvor ein Twitter-Konto für einen echten, menschlichen Benutzer eingerichtet haben, folgten wir einer Handvoll der von Twitter vorgeschlagenen verifizierten Konten während des Anmeldevorgangs.Seltsamerweise kann allein dieses Verhalten dazu führen, dass ein Konto gesperrt wird, bis ein CAPTCHA oder eine andere Überprüfung bestanden wird.Folgen Sie also nicht all den vielen Konten, die Ihnen im Anmeldeprozess vorgeschlagen werden, wenn Sie ein neues Konto einrichten.Verwenden Sie auf keinen Fall einen dieser automatisierten Follow-Dienste, die die Leute vor vielen Jahren verwendet haben, oder Ihr Konto könnte in seiner Relevanz herabgestuft oder gesperrt werden.
  • Wenige Follower – Spam-Konten sind oft neuer, und weil sie sich oft nicht auf eine Weise bewerben, die der Community zugute kommt, inspirieren sie nur sehr wenige Follower.Ein niedriges Follower-Konto kann also in Kombination mit anderen ein Faktor sein, um einen potenziell spammigen Benutzer zu identifizieren.
  • Irrelevante Hashtags in Antwort-Tweets – Hashtags in Tweets, die nicht das Thema des ursprünglichen Tweets betreffen.
  • Tweets mit Affiliate-Links – selbsterklärend.
  • Häufige Anfragen, sich in kurzer Zeit mit Benutzern anzufreunden
  • Reposting von doppelten Inhalten über mehrere Konten hinweg – Insbesondere doppelte Inhalte, die zeitnah gepostet werden.
  • Konten, die nur URLs twittern
  • Posten von irrelevanten oder irreführenden Inhalten zu Trendthemen/Hashtags
  • Falscher oder fiktiver Profilstandort – Zum Beispiel würde ein Profilstandort, der „Poughkeepsie, NY“ anzeigt, aber die IP des Benutzers China ist, zu einer offensichtlichen Nichtübereinstimmung führen, die auf ein potenzielles Betrüger- oder Spammerkonto hinweist.
  • Konto-IP-Adresse, die mit Kontobereichen von Missbrauchern oder Länderstandorten übereinstimmt, von denen ein größeres Ausmaß an Missbrauch ausgeht – zum Beispiel Russland.Ebenso sind allgemein bekannte Proxy-IP-Adressen für Twitter leicht erkennbar und werden als verdächtig gekennzeichnet.
  • Standardprofilbild – Menschliche Benutzer richten mit größerer Wahrscheinlichkeit angepasste Kontobilder („Avatare“) ein, daher ist die Nichteinrichtung und fortgesetzte Verwendung des Standardprofilbilds von Twitter ein Warnsignal.
  • Doppeltes Profilbild – Ein über viele Konten dupliziertes Profilbild ist ein Warnsignal.
  • Standard-Titelbild – Wenn kein benutzerdefiniertes Titelbild im Impressum des Profils eingerichtet wird, ist dies nicht so verdächtig wie die fortgesetzte Verwendung eines standardmäßigen Profilbilds, aber die Verwendung eines anderen Titelbilds ist repräsentativer für ein echtes Konto.
  • Nicht auflösende URL im Profil – SparkToro schlägt dies vor und stimmt mit vielen Spam-Konten überein.Manchmal liegt dies daran, dass Spammer eher Websites einrichten, die wahrscheinlich gesperrt werden, oder Domains typosquattieren, die darauf abzielen, Trojaner-Websites zu erstellen, die ebenfalls gesperrt werden können.
  • Profilbeschreibungen, die mit Spammer-Schlüsselwörtern/-Mustern übereinstimmen
  • Anzeige von Benutzernamen entspricht Spam-Mustern – Benutzernamen, die bedeutungslose alphanumerische Sequenzen oder Eigennamen gefolgt von mehreren numerischen Ziffern sind, spiegeln einen Mangel an Vorstellungskraft seitens der Spammer wider, die möglicherweise versuchen, Hunderte von Konten in großen Mengen zu registrieren, wobei jeder Name zufällig generiert wird. oder jeder Benutzername, der durch Hinzufügen der nächsten Zahl in einer Sequenz generiert wird.Beispiel: John32168762 ist die Art von Benutzernamen, die die meisten Menschen als unerwünscht empfinden.
  • Muster – Profil- und Tweet-Muster, die von Spammern verwendet werden, enthüllen oft Spammer-Konten.Wenn zum Beispiel eine Anzahl von Konten mit Standard-Twitter-Profilbildern und ähnlich gemusterten Anzeige-Benutzernamen alle Links zu einer bestimmten Seite oder Domäne twittern, werden diese Konten alle extrem einfach zu identifizieren und an den Rand zu drängen.

Das bloße Auflisten von Spam-Identifikationsfaktoren untertreibt die ausgeklügelten Systeme von Twitter, die für die Spam-Identifikation und das Spam-Management verwendet werden, deutlich.

Große Technologieunternehmen aus dem Silicon Valley kämpfen seit Jahren oft gegen Spam, und es wurde als eine Art Wettrüsten beschrieben.

Das Technologieunternehmen wird eine Methode entwickeln, um den Spam zu erkennen, und die Spammer entwickeln dann ihre Prozesse weiter, um der Erkennung zu entgehen, und dann wiederholt sich der Zyklus immer wieder.

Abschließend

Die Patente von Twitter veranschaulichen eine enorme Raffinesse in Bezug auf den Einsatz von Komponenten der künstlichen Intelligenz, der Social Graph-Analyse und Methoden, die synchrone und asynchrone Verarbeitung kombinieren, um Inhalte extrem schnell bereitzustellen.

Zu den KI-Komponenten gehören:

  • Neuronale Netze.
  • Verarbeitung natürlicher Sprache.
  • Circumflex-Berechnung.
  • Markov-Modellierung.
  • Logistische Regression.
  • Entscheidungsbaumanalyse.
  • Random-Forest-Analyse.
  • Überwachtes und unüberwachtes maschinelles Lernen.

Da die Rangordnungsbestimmungen auf einzigartigen, abstrahierten Modellen des maschinellen Lernens gemäß bestimmten Ausdrücken, Themen und Interessenprofilen basieren können, kann das, was für einen Interessenbereich funktioniert, für andere Interessenbereiche etwas anders funktionieren.

Trotzdem denke ich, dass die Betrachtung dieser vielen potenziellen Ranking-Faktoren, die in Twitter-Patenten beschrieben wurden, für Vermarkter nützlich sein kann, die eine größere Präsenz auf der Twitter-Plattform erreichen möchten.

Offenlegung des Autors

Ich habe dieses Jahr als Sachverständiger in einem Schiedsverfahren zwischen einem Unternehmen gedient, das Twitter wegen unlauterer Handelspraktiken verklagt hat, und der Fall wurde kürzlich gütlich beigelegt.

Als Sachverständiger bin ich oft in geheime Informationen eingeweiht, einschließlich privater Kommunikation wie Mitarbeiter-E-Mails in großen Unternehmen sowie anderer wichtiger Dokumente, die Daten, Berichte, Präsentationen, Mitarbeiteraussagen und andere Informationen enthalten können.

In solchen Fällen bin ich durch gesetzliche Schutzanordnungen und Vereinbarungen verpflichtet, mir offenbarte Informationen nicht weiterzugeben, um über die Angelegenheiten, zu denen ich um Stellungnahme gebeten werde, ausreichend informiert zu sein, und dies war keine Ausnahme.

Ich habe in diesem Artikel keine unter die Schutzanordnung fallenden Informationen aus meinem kürzlich gelösten Fall offengelegt.

Ich habe ein besseres Verständnis und Einblicke in einige Aspekte der Funktionsweise von Twitter aus dem Kontext, Beobachtungen von Twitter in der öffentlichen Nutzung, logischen Projektionen basierend auf ihren verschiedenen Algorithmusbeschreibungen und durch das Lesen von Twitters Patenten und anderen öffentlichen Offenlegungen nach der Lösung des Falls I gewonnen zugestellt, einschließlich der folgenden Quellen:

Die in diesem Artikel geäußerten Meinungen sind die des Gastautors und nicht unbedingt Search Engine Land.Mitarbeiter Autoren sind hier aufgelistet.