SEO

Duplicate Content – und wie Sie ihn beim Relaunch vermeiden

Duplicate Content bezeichnet identische oder ähnliche Inhalte auf mehreren Seiten innerhalb einer oder auf verschiedenen Domains. Gerade bei einem Relaunch ist die Gefahr groß, dass durch das Kopieren alter Inhalte Duplicate Content entsteht.

Lena Schröder


Duplicate Content ist ein unbeliebtes Phänomen: unbeliebt beim Nutzer, der auf unterschiedlichen Seiten ständig dasselbe liest. Unbeliebt bei Suchmaschinen, die diese Seiten deshalb mit schlechten Rankings bestrafen. Unbeliebt bei Anbietern, deren Websites nicht mehr aufgerufen werden. Bei einem Relaunch sind deshalb einige Faktoren zu beachten, um Duplicate Content zu vermeiden.

Duplicate Content
Niemand möchte überall das Gleiche sehen.

Es gibt zwei Formen von Duplicate Content: Internen und externen. Interner Duplicate Content sind identische oder sehr ähnliche Inhalte auf einer Domain, die der Nutzer aber über verschiedene URLs abrufen kann. Anders ausgedrückt: Ein Inhalt kommt auf ein und derselben Website doppelt vor. Bei externem Duplicate Content handelt es sich um identischen oder ähnlichen Content auf verschiedenen Domains, verschiedene Websites haben also voneinander abgeschrieben.

Wie reagiert Google auf Duplicate Content?

Wenn mehrere Seiten den gleichen Content bereitstellen, buhlen diese um das Google-Ranking. Das kann zweierlei Folgen haben. Liegt der Inhalt auf der eigenen Website zweimal vor, verschlechtert sich dadurch das eigene Ranking. Wird ein Originalinhalt von einer externen Seite kopiert, straft Google den Plagiator ab.

Die Suchmaschine versucht beim Crawling immer, den „Heimatort“ des Original-Contents zu finden, also die Website, auf der der Inhalt das erste Mal aufgetaucht ist. Alle anderen Seiten straft Google mit einem schlechten Ranking ab. Google bevorzugt einzigartigen Content. Und Nutzer tun das ebenso.

Es gibt sie leider – die absichtliche Duplizierung von Content auf verschiedenen Domains, mit dem Ziel, das Ranking in Suchmaschinen zu beeinflussen. So glauben manche Website-Betreiber, es helfe ihrer eigenen Beliebtheit auf die Sprünge, wenn sie fremde, bei Google gut gerankte Inhalte kopieren. Ein Irrtum, wie sich zeigt. Den Nutzern wird dann unter verschiedenen Suchergebnissen immer wieder derselbe Content präsentiert – dies führt zu Frustration. Auch bei Google – deshalb straft es diese Praxis ab.

Es gibt verschiedene Gründe für Duplicate Content – manche sind offensichtlich zu erkennen, andere stellen sich erst beim Überprüfen der Server-Konfiguration oder des CMS (Content-Management-Systems) der Website heraus. Die folgende Checkliste hilft Ihnen, Duplicate Content zu beheben.

Duplicate Content – wo kommt er her, wie werde ich ihn los?

 

  • Ihre Website hat eine inkonsistente URL-Struktur.
    Sie ist zum Beispiel mit und ohne www oder über http und https erreichbar. Suchmaschinen finden Ihre Website dann doppelt. Oder Sie haben nach einem Relaunch Ihre alte URL-Struktur von /jfoiejoir7e4wurijflejlj.html auf /ich-heisse-so-wie-der-Titel-des-Artikels.html ersetzt. Mit dem Statuscode 301-redirect können Sie die Ziel-URL festlegen, auf die alle anderen URLs umgeleitet werden.
  • Ihre Website ist auf eine andere Domain umgezogen.
    Alle Seiten sind noch unter der alten Domain indexiert, während die neue Seite den gleichen Content unter einer völlig anderen URL bietet. Auch hier hilft der Statuscode 301-redirect. Noch besser: Sie nehmen die alte Domain aus dem Index, sodass Google sie nicht mehr "kennt".
  • Druckversionen von Seiteninhalten sind indexiert.
    Wenn Sie Ihren Kunden Druckversionen der verschiedenen Seiten anbieten, dürfen diese nicht indexiert werden. Dies funktioniert zum Beispiel mit dem Meta-Tag „noindex“.  
  • Interner und externer Duplicate Content: Ihre Inhalte sind auf mehreren Seiten verfügbar.
    Wenn Sie Inhalte mehrfach auf Ihrer eigenen Website oder bei anderen Anbietern bereitstellen, kann schnell Duplicate Content entstehen. Bewusste Syndizierung, also die Verteilung eigener Inhalte auf verschiedenen Websites, muss durchdacht sein. Einerseits brauchen die syndizierten Inhalte eine Quelle, die entsprechend auf die Original-Website verlinkt. Andererseits müssen Sie auch Google klar machen, dass Ihre Website der Urheber des Original-Contents ist – dies legen Sie mit dem Canonical-Tag fest. Das Canonical-Tag ist eine Angabe im Quellcode der Website, die auf die Originalressource des Inhalts hinweist. So erkennt die Suchmaschine, welche URL der "Urheber" des Original-Inhalts ist.
    Das Canonical-Tag ist ebenso relevant bei Inhalten, die Sie gewollt mehrfach auf Ihrer eigenen Website bereitstellen. Doppelte Inhalte können zum Beispiel Produktseiten sein, auf denen sich die Beschreibung immer wiederholt, oder die deutsche und die österreichische Version Ihrer Website. Auch hier legen Sie dann mit dem Canonical-Tag fest, welche Seite von Google bewertet werden soll.
  • Inhalte werden verkauft oder illegal kopiert.
    Vor bewussten Plagiaten durch andere Website-Anbieter kann sich keiner komplett schützen. Daher ist es wichtig, immer wieder zu überprüfen, ob der eigene Content illegal kopiert wurde. Verschiedene Tools helfen dabei. Sie können aber auch einfach Stichproben-Tests durchführen: Kopieren Sie Teile Ihres Contents in den Suchschlitz von Google und versehen Sie ihn mit Anführungszeichen. Google zeigt Ihnen an, ob jemand Ihren Content illegal kopiert hat. Auch deshalb ist es wichtig, dass Sie die URL des Original-Inhalts immer mit dem Canonical-Tag markieren.

 

Weitere Tipps für den Umgang mit Duplicate Content

Identische Inhalte sollten nicht nur vermieden sondern auch identifiziert werden. Vielen fällt das Phänomen nämlich erst auf, wenn es schon zu spät ist und die eigene Website bereits auf den letzten Plätzen in den Suchergebnissen landet. Da die Indexierung über die Suchmaschinen-Robots immer schneller passiert, sind identische Inhalte auch schneller im Web. Deshalb müssen Webmaster und SEOs so schnell wie möglich handeln, um nicht von Google und Co. abgestraft zu werden.

1. Nutzen Sie einen Duplicate Content-Checker
Copyscape ist ein kostenloses Online-Tool, das Plagiate von Website-Texten identifizieren soll. Dafür gibt man die „Heimatadresse“ des Originalinhalts an, sodass das Tool eine Liste der Websites erstellen kann, die Kopien des Original-Content bereitstellen. Oft sind Onlineshops davon betroffen, wenn ihre Anzeigen auf Preisvergleichs-Portalen identisch angezeigt werden. Ein anderes kostenloses Tool ist siteliner, das Ihnen eine Liste aller Seiten mit Angaben zur prozentualen Übereinstimmung von Inhalten bietet.

2. Nutzen sie Googles Webmaster Tools
Hier können Sie genau festlegen, wie Google Ihre Seite indexiert.

3. Stellen Sie individuellen Content bereit
Und zwar für jede Domain und jede Unterseite, auf der Sie Inhalte veröffentlichen. Immer wiederkehrende Inhalte haben keinen Mehrwert für den Nutzer. Das individuelle Texten zahlt sich aus: Die eigene Seite wird gestärkt und Google und die Nutzer freuen sich über relevante neue Inhalte auf verschiedenen Seiten, die schließlich auch besser gerankt werden.

Fazit

Duplicate Content ist nicht zwangsläufig etwas Schlimmes. Wenn er jedoch eingesetzt wird, um Suchmaschinen zu manipulieren, reagieren Google und Co. mit schlechten Rankings.

Struktur vorab genau definieren.

Da es sich bei internem Duplicate Content hauptsächlich um ein technisches Problem handelt, das in der Programmierung bzw. im Content-Management-System begründet liegt, empfehlen wir, bei einem Launch oder Relaunch einer Website die Seitenstruktur und -hierarchie vorher genau zu planen. Textlich gilt: Je individueller, desto besser – für Nutzer und Google.