Duplicate Content

Duplicate Content umfasst gleiche oder stark ähnliche Inhalte auf unterschiedlichen URLs. Die Gründe hierfür können variieren, meist produziert man sogar unbemerkt duplizierten Inhalt. Suchmaschinen reagieren auf doppelte Inhalte nicht immer positiv, können mittlerweile in der Regel zwischen mutwillig und unabsichtlich produziertem Duplicate Content unterscheiden. Mutwillig verursachte doppelte Inhalte können ernste negative Konsequenzen mit sich führen.

Wie kommt es zu Duplicate Content?

Die simpelste und auffälligste Art, Duplicate Content zu erstellen ist das altbekannte „Copy & Paste“. Gleiche Inhalte erscheinen auf unterschiedlichen Webpräsenzen online, meist mit dem Ziel, das Ranking der Suchmaschinen zu eigenen Gunsten zu beeinflussen. Dieses Vorgehen sehen die Suchmaschinen nicht gerne und ahnden es entsprechend. Es steckt nicht immer eine böswillig Absicht hinter doppeltem Inhalt, in den allermeisten Fällen fällt dem Betreiber noch nicht einmal auf, dass Duplizierter Inhalt besteht. Darum ist die Website in regelmäßigen Abständen zu prüfen, ob doppelte Inhalte bestehen.

Duplicate Content liegt immer vor, wenn Inhalte in auffallend ähnlicher oder gar exakt gleicher Form auf verschiedenen Seiten bestehen. Das passiert zum Beispiel, wenn eine Seite mit unterschiedlichen URLs erreichbar ist, etwa „www.hierbeispiel.de“ / „hierbeispiel.de“. Beide URLs führen auf ein und dieselbe Seite mit demselben Inhalt, erscheinen den Suchmaschinen allerdings als unterschiedliche URLs. Somit hat es hier den Anschein von Duplicate Content. Häufig bieten verschiedene Diskussionsforen ebenfalls mehrere URLs für unterschiedliche Endgeräte an, was wiederum Duplicate Content kreiert. Druckversionen von verschiedenen Webseiten stellen im weitesten Sinne ebenso Duplicate Content für die Suchmaschinen dar, da sie unterschiedliche Internetadressen aufweisen.

Welche Folgen hat Duplicate Content?

Es kommt stark auf die dahinterstehende Absicht an, ob und welche Folgen Duplicate Content hat. Suchmaschinen filtern die Inhalte erst einmal, da sie mittlerweile zwischen mutwillig und unabsichtlich erstelltem doppelten Inhalt unterscheiden können. Besteht allerdings der Verdacht, dass es sich um mutwillig erstellten Duplicate Content handelt, passiert es unter Umständen, dass die Suchmaschinen die entsprechenden Seiten im Ranking der Suchergebnisse niedriger einstufen. Meist geschieht das parallel mit einer Warnung der Suchmaschine an den Websitebetreiber. Erfolgt hierauf keinerlei Reaktion oder bemerken die Suchmaschinen häufige Verstöße gegen die Unique Content-Regel, löschen sie die entsprechenden Seiten im schlimmsten Fall gänzlich aus dem Index. Sie tauchen somit überhaupt nicht mehr in den Suchergebnissen auf. Für ein kleineres oder jüngeres Unternehmen hat das unter Umständen erhebliche negative Konsequenzen, wenn die Kunden es nicht mehr bei der Internetrecherche finden und somit die Mitbewerber stärker in den Fokus rücken. Hier können Umsatzeinbußen und Imageschäden die Folge sein.

Erkennen die Suchmaschinen hingegen unabsichtlich erstellten Duplicate Content, folgt eine Warnung meist ohne Herabstufen des Rankings in den Suchergebnissen. Der Seitenbetreiber hat die Möglichkeit, zu reagieren und den doppelten Content zu beseitigen, bevor es zu weiteren Konsequenzen kommt.

Duplicate Content verhindern

Duplicate Content zu vermeiden ist relativ einfach, da es mehrere unterschiedliche Methoden gibt, um ihn zu umgehen oder so zu kennzeichnen, dass Suchmaschinen ihn nicht als solchen werten.

  • Ist eine Seite unter mehreren URLs (beispielsweise mit bzw. ohne „www“) erreichbar, ist es sinnvoll, eine permanente Weiterleitung einzurichten. Dies geschieht mit einem 301-Link in der HTACCESS Datei der Webseite. Daran können die Suchmaschinen erkennen, dass die Seiten zusammengehören und keineswegs unterschiedliche Seiten mit gleichem Inhalt sind.
  • Mehrere Linkvariationen für eine Webseite sind zu vermeiden („/seite1“; „/seite1/“; „/seite1/index.htm“ – Suchmaschinen werten dies ebenfalls als Duplicate Content.
  • Bevorzugte URLs beim Indizieren der Webseiten angeben (mit/ohne „www“)
  • Anzahl wiederkehrender Textbausteine minimieren, wo es möglich ist. Dadurch lässt sich ein erheblicher Teil des Duplicate Content vermeiden.
  • Content Management Systeme (CMS) regelmäßig analysieren, ob Texte wie beispielsweise Blogbeiträge auf unterschiedlichen Seiten auftauchen. Manche Blogposts erscheinen häufig sowohl auf der Startseite bei den aktuellen Meldungen, als auch auf der eigentlichen Blogseite. Dies werten Suchmaschinen ebenfalls als doppelten Content.
  • Seiten mit ähnlichem Content entweder thematisch ausbauen und differenzieren oder in einem großen Thema zusammenfassen und dadurch Duplicate Content umgehen.
  • Nicht vermeidbaren Duplicate Content mit dem Canonical Tag ( rel=“canonical“) kennzeichnen, um den Ursprungstext zu kennzeichnen. Somit indexieren Suchmaschinen nur diesen Text, nicht die „Kopien“. Der Canonical Tag ist im Quelltext des Header-Bereiches einzubauen.