Nach Googles Idealvorstellung des Internets besteht jede Webseite aus einzigartigem und interessantem Inhalt. Doppelter Inhalt – Duplicate Content genannt – kann daher als schlecht eingestuft und entsprechend tiefer in den Suchergebnissen platziert werden. Google kommt zu dieser Einschätzung, weil es den Vorlieben seiner Nutzer entspricht, die ungerne sich wiederholende Inhalte auf mehreren Seiten vorfinden möchten. Jedoch ist das Netz voll von identischen Inhalten. Es gibt viele Ursachen dafür, in den seltensten Fällen tritt Duplicate Content aus böswilliger Absicht auf. In diesem Beitrag wird erklärt, wie Duplicate Content entsteht und wie man ihn auf der eigenen Seite vermeidet.
Arten von Duplicate Content
Grundsätzlich ist zwischen zwei Arten von Duplicate Content zu unterscheiden. Externer Duplicate Content auf verschiedenen Websites und Interner Duplicate Content innerhalb einer Domain. Beide Formen gilt es so gut wie möglich zu vermeiden, da sie das eigene Ranking verschlechtern können.
Externer Duplicate Content
Wenn sich auf zwei unterschiedlichen Domains große Inhaltsblöcke gleichen, stuft Google diesen Inhalt als Duplicate Content ein. Ursache hierfür sind z.B. kopierte Inhalte, um Seiten schnell mit Leben zu füllen. Wenn beispielsweise Produktbeschreibungen eines Herstellers auf mehreren Onlineshops auftauchen, sind diese für Google als solche erkennbar. Bei kopierten Inhalten weiß Google in der Regel den Urheber und stuft diesen (in den meisten Fällen) höher als die Kopie ein. Auch sehr ähnlicher Inhalt wird als Near Duplicate Content erkannt.
Mehr als nur schwarz/weiß – das Panda Update
Googles Algorithmus wird regelmäßig verfeinert, immer mit dem obersten Ziel, den Suchenden jederzeit das passendste Suchergebnis zu liefern. 2011 bezog das sogenannte Panda Update erstmals die Qualität von OnPage-Inhalten in die Bewertung mit ein. Jede Seite wird seitdem darauf untersucht, wie einzigartig – also unique – die Inhalte sind. Minderwertige Inhalte fallen im Ranking deutlich ab. Welche Kriterien dabei genau welche Rolle spielen ist Googles Geheimnis, die Erfahrung zeigt jedoch, dass für ein gutes Ranking dem Nutzer auch etwas geboten werden muss.
Unique Content
Da Googles Bots beständig das Internet und seine Inhalte überblicken, fällt Duplicate Content schnell auf. Was in Googles Augen wirklich heraussticht ist Unique Content – Inhalte, die es sonst auf keiner zweiten Seite so zu finden gibt und die sich durch ihren Informationsgehalt, ihre Aktualität und die Schreibweise von anderen Seiten abheben. In der Regel bedeutet Einzigartigkeit auch ein hohes Interesse und gutes Benutzerverhalten – beides sind wichtige Kriterien für Googles Einschätzung des Inhaltswerts. Google erkennt einzigartigen Content besser als jeder Lehrer, der auf Auffälligkeiten in Schüleraufsätzen achtet. Es gilt heute mehr denn je: Eigene Arbeit wird belohnt, Abschreiben wird bestraft.
Interner Duplicate Content
Duplicate Content kann aber auch innerhalb einer Seite auftreten und zählt in Googles Augen als Indikator für die Seitenqualität. Wer seinen Besuchern auf mehreren URLs identische Inhalte präsentiert, vermindert das Benutzererlebnis. Und was den Nutzer stören könnte, stört Google bereits vor dem Eintreten dieses Falls. Oft tritt auch die gleiche Seite unter unterschiedlichen URLs auf, die für das Ranking in den Suchergebnissen untereinander konkurrieren und die Platzierung verschlechtern. Wenn eine Website beispielsweise sowohl mit dem Präfix “www.” als auch ohne dieses aufrufbar ist, können bereits diese beiden URLs konkurrieren. Ein weiterer Fall kann auftreten, wenn die mobile Version einer Seite als gleichwertige URL auftritt oder regionale Unterseiten eine eigene Domain besitzen, aber die gleichen Inhalte anzeigen. Wenn mehrere Seiten innerhalb einer Website für dasselbe Keyword ranken, kann Google im schlimmsten Fall eine oder mehrere dieser Seiten ignorieren. Diese sogenannte Keyword-Kannibalisierung dezimiert das mögliche Ranking.
Duplicate Content durch Produkt-Varianten in Onlineshops
Häufig tritt Duplicate Content in Onlineshops auf. In Shops ähneln sich einzelne Artikelseiten häufig, v.a. wenn es mehrere Varianten eines Produktes gibt, die unter unterschiedlichen URLs aufrufbar sind. Da sich der Inhalt dieser Produktseiten oftmals nur in einem Kriterium unterscheiden, entsteht schnell Duplicate Content. Nach klassischen Mechanismen der Suchmaschinenoptimierung verfasst man nun zu jedem einzelnen Artikel einen einzigartigen Text. Abhängig von der Zahl an Produktseiten bzw. -varianten ist diese Methode allerdings schnell zu aufwendig. Hier kommen Canonical Tags ins Spiel.
Canonical Tags
Canonical Tags sind Einstellungen im Quellcode von Webseiten, die dem Google Bot zeigen, dass zu einer anderen Seite verwiesen wird. Google wird dadurch vermittelt, dass eine bestimmte URL gegenüber den Duplikaten bevorzugt werden soll. URLs mit (fast) identischem Inhalt können so kanonisiert werden, wodurch ein negativer Effekt durch Duplicate Content neutralisiert wird. Dem Duplikat wird direkt eine bevorzugte URL zugewiesen, die auch für Bots und Google eindeutig zu bevorzugen ist. In einem Shop können so beispielsweise die verschiedenen URLs zu den jeweiligen Farben eines Produkts auf eine URL gelenkt werden. Meistens ist das die URL mit den meisten Aufrufen, also die beliebteste Produktfarbe. Wenn Google das Canonical Tag als korrekt gesetzt einschätzt, lässt sich das Ranking für relevante Keywords auf einer Produktseite bündeln.
Interner Duplicate Content
Duplicate Content kann aber auch innerhalb einer Seite auftreten und zählt in Googles Augen als Indikator für die Seitenqualität. Wer seinen Besuchern auf mehreren URLs identische Inhalte präsentiert, vermindert das Benutzererlebnis. Und was den Nutzer stören könnte, stört Google bereits vor dem Eintreten dieses Falls. Oft tritt auch die gleiche Seite unter unterschiedlichen URLs auf, die für das Ranking in den Suchergebnissen untereinander konkurrieren und die Platzierung verschlechtern. Wenn eine Website beispielsweise sowohl mit dem Präfix “www.” als auch ohne dieses aufrufbar ist, können bereits diese beiden URLs konkurrieren. Ein weiterer Fall kann auftreten, wenn die mobile Version einer Seite als gleichwertige URL auftritt oder regionale Unterseiten eine eigene Domain besitzen, aber die gleichen Inhalte anzeigen. Wenn mehrere Seiten innerhalb einer Website für dasselbe Keyword ranken, kann Google im schlimmsten Fall eine oder mehrere dieser Seiten ignorieren. Diese sogenannte Keyword-Kannibalisierung dezimiert das mögliche Ranking.
Duplicate Content durch Produkt-Varianten in Onlineshops
Häufig tritt Duplicate Content in Onlineshops auf. In Shops ähneln sich einzelne Artikelseiten häufig, v.a. wenn es mehrere Varianten eines Produktes gibt, die unter unterschiedlichen URLs aufrufbar sind. Da sich der Inhalt dieser Produktseiten oftmals nur in einem Kriterium unterscheiden, entsteht schnell Duplicate Content. Nach klassischen Mechanismen der Suchmaschinenoptimierung verfasst man nun zu jedem einzelnen Artikel einen einzigartigen Text. Abhängig von der Zahl an Produktseiten bzw. -varianten ist diese Methode allerdings schnell zu aufwendig. Hier kommen Canonical Tags ins Spiel.
Canonical Tags
Canonical Tags sind Einstellungen im Quellcode von Webseiten, die dem Google Bot zeigen, dass zu einer anderen Seite verwiesen wird. Google wird dadurch vermittelt, dass eine bestimmte URL gegenüber den Duplikaten bevorzugt werden soll. URLs mit (fast) identischem Inhalt können so kanonisiert werden, wodurch ein negativer Effekt durch Duplicate Content neutralisiert wird. Dem Duplikat wird direkt eine bevorzugte URL zugewiesen, die auch für Bots und Google eindeutig zu bevorzugen ist. In einem Shop können so beispielsweise die verschiedenen URLs zu den jeweiligen Farben eines Produkts auf eine URL gelenkt werden. Meistens ist das die URL mit den meisten Aufrufen, also die beliebteste Produktfarbe. Wenn Google das Canonical Tag als korrekt gesetzt einschätzt, lässt sich das Ranking für relevante Keywords auf einer Produktseite bündeln.
Duplicate Content finden
Um Duplicate Content zu verhindern, sollten grundsätzlich alle Inhalte auf der eigenen Seite auch aus eigener Hand stammen. Wer Inhalte von anderen Seiten übernimmt, muss immer den Aspekt des Duplicate Content mit bedenken. Sollten eigene Inhalte von fremden Seiten kopiert werden, erkennt Google die ursprüngliche Quelle in der Regel als Urheber an. Bereits bestehender Duplicate Content lässt sich auf mehrere Arten aufspüren. Externen Duplicate Content finden Plagiats-Tools wie Copyscape, über die Google Suche lassen sich aber auch direkt Textbausteine suchen. Für internen Duplicate Content dienen die gängigen SEO-Tools. Um innerhalb einer Seite den Anteil des Duplicate Content zu ermitteln, hilft das kostenlose Online-Tool Siteliner. Es bietet auch einen Überblick, wie gewöhnlich oder einzigartig die Inhalte auf der Domain sind. Für das Aufspüren duplizierter URLs dienen Crawler wie beispielweise Screaming Frog. Zu Duplicate Content äußert sich auch Google offiziell in seinen Richtlinien.