Spam in der Suchmaschine

Spam im Zusammenhang mit E-Mails kennen wohl alle. Aber was hat es mit Spam in der Suchmaschine auf sich?

Im Zusammenhang mit Suchmaschinen werden Webseiten, die eine grosse Menge von Wörtern beinhalten, die nicht in erster Linie für den Besucher bestimmt sind, als "Spam" bezeichnet. Diese Wörter dienen lediglich dazu, die Position im Ranking der Suchmaschinen zu verbessern.

Näheres zu diesem Thema finden Sie in den folgenden Unterkapiteln.

Spam-Richtlinien der Suchmaschinen

Spam-Praktiken bei Suchmaschinen

Abbildung: Anmeldungsprozess einer Webseite

Spam-Richtlinien der Suchmaschinen

Durch „spamming“ wird versucht, die Ranking-Algorithmen der Suchmaschinen zu überlisten. Verständlicherweise sind Suchdienste nicht daran interessiert, solche Seiten in ihren Index aufzunehmen.

Allerdings ist nicht einheitlich festgelegt, was als Spam betrachtet wird. Vielmehr hat jede Suchmaschine ihre eigenen Richtlinien. Auch die Vorgehensweise unterscheidet sich. Manche Suchmaschinen werden erst auf Beschwerden von Benutzern hin aktiv und verlassen sich im Übrigen auf die abschreckende Wirkung ihrer Spam-Richtlinien. Andere setzen Spam-Filter ein und versuchen, solche Seiten bereits im Vorfeld zu entdecken und gar nicht erst in den Index aufzunehmen.

Wird ein Anbieter erst einmal beim „spamming“ erwischt, führt das im Allgemeinen zur dauerhaften Sperrung der Seite. Da es kein Recht auf Aufnahme in den Index einer Suchmaschine gibt, hat es meist auch keinen Erfolg, gegen eine Sperrung vorzugehen. Vor allem kommerzielle Anbieter sollten deshalb alles vermeiden, was als Spam ausgelegt werden könnte.


Zum Seitenanfang

Spam-Praktiken bei Suchmaschinen

Wie weiter oben erwähnt, dienen Spam-Praktiken dazu, die Position einer Webseite im Ranking der Suchmaschinen zu verbessern. Obwohl die Richtlinien, wie schon erwähnt uneinheitlich sind, gibt es einige Praktiken, die von den meisten Suchmaschinen als Spam betrachtet werden. Dazu gehören:

  • Cloaking: Diese Technik führt, wenn es entdeckt wird, meist zur Sperrung der Seite. Zur Enttarnung des Cloakings senden einige Suchmaschinen inzwischen mehrere Spider aus: eine offizielle, die sich als Suchmaschine zu erkennen gibt und eine andere, die sich wie ein normaler Benutzer anmeldet.
  • Texte oder Wortpassagen werden für Besucher unsichtbar gemacht: Da kein Benutzer glücklich wäre, wenn zeilenweise die gleichen Schlüsselwörter auftauchen, wird der Text auf der Seite „versteckt“. Dazu kann beispielsweise der Text die gleiche Farbe wie der Hintergrund haben. Dabei wird der Text vor einem unruhigen Hintergrund dargestellt und ist daher für den Besucher nicht sichtbar. Oder der Text ist so klein, dass ihn das menschliche Auge nicht wahrnehmen kann usw.
  • Häufige Wiederholung desselben Schlüsselwortes: Dies kann vor allem in den Elementen der Webseite vorkommen, die der Browser nicht anzeigt, z. B. Alt-Text einer Grafik und Meta-Tags.
  • Häufige Wiederholung desselben Schlüsselwortes im Seitentext: Je nach Suchmaschine wird eine Wiederholungsrate des Schlüsselworts von 1 -7% akzeptiert. Nicht als Wiederholung zählen dagegen verschiedene Variationen eines Schlüsselwortes z. B. Singular/Plural, Substantiv/Adjektiv oder diverse zusammengesetzte Begriffe.
  • Schlüsselwörter, die nichts mit dem Thema zu tun haben: Dabei werden meistens Wörter, nach denen bekanntermassen häufig gesucht wird, in die Metatags aufgenommen. Bei rein maschineller Indizierung ist diese Form des „spamming“ nur sehr schwer aufzudecken.
  • Für die Suchmaschine optimierte Weiterleitungsseiten: Dies sind Seiten, mit denen der Besucher nichts anfangen kann, die ihn aber sofort zur eigentlichen Homepage weiterleiten. Solche Seiten werden, wenn sie entdeckt werden, aus dem Index gestrichen.
  • Linkfarmen: Linkfarmen bestehen aus einem Netzwerk stark miteinander verlinkter Seiten. Einziges Ziel der Links ist es, die Linkpopularität zu erhöhen.
  • Mehrfachanmeldung einer Webseite unter verschiedenen URLs: Bei der redaktionellen Begutachtung fällt es im Allgemeinen auf, wenn eine Seite mehrmals auftaucht. Die Konsequenz daraus ist, die Streichung aller Seiten.


Zum Seitenanfang

Abbildung: Anmeldungsprozess einer Webseite

Abb. 1: Anmeldungsprozess einer Website