NETPROFIT - Online erfolgreich
NETPROFIT
assets/images/a/google-1a023849.jpg
  • Start
  • Blog
  • Tagging or not, duplicate content oder Fokussierung
Google, Optimierung, Suchmaschinen

Tagging or not, duplicate content oder Fokussierung

 · 20. Oktober 2007  · 
Inhaltsübersicht

… oder gibt es etwas dazwischen? Im Zuge des Hypes um Weblogs und Web 2.0 kommt nun auch die populäre Blog-Software WordPress (wird auch hier verwendet) serienmäßig ab der Version 2.3 mit Tagging-Funktion. Tags sind Stichwörter oder Schlagwörter, welche man einem Artikel zuweisen kann – parallel oder anstatt den bislang üblichen Kategorien.

Im Folgenden möchte ich aus meiner persönlichen Sicht Tags kurz erläutern sowie deren Vorteile und Risiken beschreiben. Da mich diese Thematik schon lange beschäftigt, wird der Artikel etwas umfangreicher ausfallen, aber natürlich keinen Anspruch auf Vollständigkeit erheben. Eines Vorweg: ich verwende Tags bei manchen Projekten absolut nicht, bei manchen dagegen durchaus gerne und mit Strategie. So richtig glücklich bin ich allerdings nicht immer damit.

Was sind Tags?

Wie bereits eingangs erläutert, kann man mit Tagging jedem Artikel, jeder Seite bestimmte Stichwörter (Tags) zuweisen, diese dann zum jeweiligen Artikel oder generell für die komplette Seite (auch gewichtet) anzeigen lassen. Auf vielen Seiten entdeckt man mittlerweile so genannte TagClouds – also eine Ansammlung (Wolke) von Stichwörtern, meist nach Verwendungshäufigkeit in der Größe abgestuft.

Tags aus Suchmaschinensicht

Tagging kann sowohl für Suchmaschinen als auch für Besucher Sinn machen – oder eben auch nicht.

Die Long-Tail-Nischen

Unbestritten kann man mit Tags relativ einfach eine ganze Bandbreite an wichtigen, zusätzlichen (Schlüssel-)Begriffen nutzen, die ansonsten in einer Artikelüberschrift nicht Platz hätten. Das gilt umso mehr, wenn man sich bei den Kategorien auf wenige, übersichtliche beschränken will.
Weiters kann/ soll man für die Tag-Seiten suchmaschinenoptimierte Templates erstellen, so dass Suchmaschinen zu den (vielen) Schlüsselbegriffen je Tag eine darauf optimierte, eigene Seite finden. Im Gegensatz zu den meist (zu) generellen Kategorien ranken manche dieser eher speziellen Tagseiten exzellent und besetzen so zahlreiche Nischen. Die Trefferfläche für Suchmaschinen würde enorm steigen. Mit recht überschaubarem Aufwand käme man damit dem so genannten Long-Tail-Ansatz näher.
So weit so gut.

Duplicate Content – Filtergefahr

Wie vielleicht bemerkt steht im vorletzten Satz „käme“. Denn Tagging bringt auch Nachteile oder zumindest Risiken mit sich.
Denn die so enorm aufgeblähten Seiten lassen sich Google und Co. nicht so einfach als zusätzlichen Inhalt (Stichwort: unique content) unterjubeln. Vor allem muss man aufpassen, dass man nicht Unmengen doppelter Inhalte (duplicate content) erzeugt, den Suchmaschinen allenfalls am Ende der Trefferlisten anzeigen.

Offiziell gibt es von Google zu duplicate content recht wenige Aussagen. Adam Lasnik nennt im Official Google Webmaster Central Blog einige generelle Hinweise und Vanessa Fox meint, dass doppelter Inhalt an sich nicht weiter schädlich ist, nur bloß nicht wirklich rankt. Google filtert doppelt erscheinende Seiten also einfach aus.
Ab wann nun genau doppelte Inhalte vorliegen, ist offiziell nicht bekannt – man kann es also nur testen, analysieren und bewerten.

Wann liegt denn nun duplicate content vor?

Dazu kann man sich das Experiment bei SEOChat anschauen oder als Indiz für die eigene Seiten folgendes Supplemental-Tool nutzen. Denn doppelte Inhalte landen im so genannten supplemental index, früher als ausdrücklich gekennzeichnete zusätzliche Ergebnisse am Ende der Trefferlisten.

Ist duplicate content auch ein Qualitätskriterium?

Beachten sollte man, dass eine hoher Anteil doppelten Inhalts wohl durchaus ein Qualitätskriterium einer Webseite sein dürfte – eventuell auch ein Ansatz, um Missbrauch zu erkennen. Offiziell sieht Google etwa bei Foren die parallele suchmaschinengerechte Version nicht so dramatisch, allerdings zieht Google erfahrungsgemäß generell die Grenze für doppelte Inhalte zunehmend enger, so dass zunehmend schneller bei auch nur teilweiser Übereinstimmung bereits doppelte Inhalte vorliegen. Dies gilt zwar nicht bei wenigen Autoritätsseiten, aber sehr wohl für die Vielzahl an Webseiten. Suchmaschinen versuchen so die Qualität der Ergebnisse zu erhöhen und zugleich (offenbar knappe) Ressourcen zu schonen. Wie Suchmaschinen versuchen doppelte Inhalte zu erkennen, beschreibt beschrieb Fridaynite in seinem Artikel Duplicate Content Strafe vermeiden (offline) recht anschaulich.

Fazit aus Suchmaschinensicht

Wenn man nun auf Tags bezogen doppelte Inhalte vermeiden will, müssen sich die einzelnen Tagseiten möglichst stark von anderen Seiten unterscheiden:

  • Dazu sollte man keine Tags verwenden, die bereits als Kategorien verwendet werden.
  • Auch sollte man individuelle Zusatzinhalte wie verwandte Tags an wichtigen Stellen aufführen. Das dies (noch) hervorragend klappt, zeigt etwa Mister Wong, wobei ein gewisser Autoritätsstatus hier sicher eine Rolle spielt.
  • Auch problematisch ist die Frage nach der Anzahl der verwendeten Tags. So muss man aufpassen, dass nicht ein Großteil nur einmal verwendet wird.

Eine nette Lösung ist, die Tagseiten auf <strong>noindex, follow</strong> zu setzen, damit folgt Google den Links zu den Einzelartikel, gibt auch die Relevanz an diese weiter, zeigt aber die (oft mit doppeltem Inhalt bestückten) Tagseiten nicht als Suchtreffer an.
Der Original Bayerische Seoblogger hat hatte eine ganz anschauliche E-Mail-Diskussion zum Thema duplicate content dazu veröffentlicht. Im Übrigen plädiert Andreas, wenn ich es richtig im Kopf habe, dafür nur auf die Einzelartikel alles Gewicht zu setzen, also alle Kategorien, tags etc. auf noindex, follow zu setzen.
Damit wären doppelte Inhalte soweit unproblematisch und die eigentlichen Inhalte, die Artikel, hätten optimale Power (Fokussierung).

Allerdings geht der Long-Tail-Ansatz verloren, damit für spezielle Nischenwörter zu ranken und Besucher zu erhalten.
So kann man mit Tags ja sehr spezielle Begriffe oder falsche Schreibweisen abdecken.
So könnte man etwa jede Tagseite ab Seite 2 usw. erst auf noindex, follow setzen – und auch ab und zu eine Tagseite direkt von außen verlinken.
So ranken die wichtigen Tags bei Nischenthemen und der Anteil doppelten Inhalts lässt sich bei sorgfältiger Handhabung in natürlichem Rahmen halten.

Tagging aus Besuchersicht

Nicht vergessen sollte man auch die Besuchersicht. Hier spielt natürlich die Zielgruppe eine wesentliche Rolle. Auf Blogs wird eine TagCloud (vgl. oben) sicher die wenigsten Besucher irritieren.
Auch bietet sich eventuell ein guter Zusatznutzen, wenn man mit Tags etwas anderes abdeckt wie mit den Kategorien.

  • Beispielsweise könnte man Produktgruppen mit Kategorien und Hersteller oder Farben mit Tags abbilden.
  • Eurosport-Yahoo nutzt dies beispielsweise, um Sportlernamen mit Tags zu clustern. So hat dann jeder Sportler eine „Tagseite“.

Aufpassen sollte man meines Erachtens, den Besucher nicht zu überfordern. Viele Seiten (auch diese) sind eigentlich überladen. Wenn man nun noch alle Tags auf eine Seite quetscht, wird es regelmäßig der informationelle Overkill. Wenn aber ein Besucher speziell danach sucht, kann man ihm den Klick anbieten und dann auch eine umfangreichere TagCloud präsentieren. Ob diese aber oft benutzt wird, wage ich zu bezweifeln.

Kommentare zu Tagging or not, duplicate content oder Fokussierung

1. Kommentar
Klaus |

Guter und ausführlicher Beitrag zum Thema Tagging. Vor allem wegen DC muss man aber aufpassen.

2. Kommentar
Seoblogger |

Exakt erkannt. Tag-Seiten sind aus SEO-Sicht absolut tödlich. Das Beispiel mister-wong hinkt übrigens...die jungs könnten momentan wohl auch mit einer nackten seite ohne inhalt ranken. Noch...

3. Kommentar
Robert |

"(...) Das dies (noch) hervorragend klappt, zeigt etwa Mister Wong, wobei ein gewisser Autoritätsstatus hier sicher eine Rolle spielt.(...)" :-)

4. Kommentar
Constantins Wochenrückblick 42/07: Mehr Sitelinks » S |

[...] Robert Hartl macht sich in seinem Blog allgemeine Gedanken zu Tagging. [...]

5. Kommentar
Marc |

Wirklich ein guter ausführlicher Bericht bezüglich Duplicate Content mit Hilfe von Tags, hab da auch noch einen Test laufen, scheinbar stimmen die Erkenntnisse aber zu fast 100%,

6. Kommentar
Martin Viehver |

die duplicate content Problematik war mir vorher gar nicht bewusst. Danke für die Tipps!

7. Kommentar
Martin |

Ich habe mir nun auch die ein oder andere Tag-Seite von (alten) Projekten angeschaut und in der Tat könnte das wirklich DC sein.. Das erklärt dann im nachhinein doch das ein oder andere ;-)

8. Kommentar
Sandra |

Das mit den Tag-Seiten leuchtet mir nicht so ein. Wenn Du da den ganzen artikel anzeigst ok - dann ist das ein Problem. Aber wenn Du einen Teasersatz veröffentlichst, wie hier zum Thema Duplicate Content beschrieben, sollte das doch kein Problem sein. BEi manchen Websites frag ich mich auch wie hoch ist der Anteil von Content an der Seite, und wie sehen das die SEs?

9. Kommentar
Robert Hartl |

Nun ja Sandra, leider ist die Sache nicht ganz so einfach und Google differenziert zunehmend bei dieser Frage. 1. Am besten alles außer die Seiten mit den wirklichen Inhalten auf noindex, follow in der robots-Anweisung im head-Bereich. Damit ist man auf der sicheren Seite. 2. Hat man sehr viele Inhalte und will mit Tags, Kategorien etc. Besucher abgreifen, wird es schwierig(er). Erstens ist eine gewisse Seitenstärke im Sinne von Seriösitätsbonus oder Schwergewicht bei Google wichtig. Denn als schwach verlinkte Seite bekommt man diese Wiederverwerterseiten nicht (mehr) wirklich zum Ranken. Zweitens muss man auf den Tag- oder Kategorieseiten andere Ausschnitte, Inhalte anbieten als anderswo. Habe ich also auf der Startseite die ersten 50 Wörter, nehme ich auf Tagseiten/ Suchergebnisseiten/ ... am besten andere Ausschnitte (wenn möglich den mit dem jeweiligen Tag/ Kategorienamen/ Suchbegriff ...). Optimalerweise reichert man diese Tagseiten noch mit einem individuellen Absatz (Beschreibung, Erklärung zum Tag) an. Sind viele Links auf einer solchen Seite sollte der einzigartige Zusatz umfangreicher ausfallen. Meine Empfehlung ist also Punkt 1 bei neuen, kleinen Seiten und wenn überhaupt aufwändige und überlegte Tagseiten.

10. Kommentar
Veronika |

Wie ist das mit NICHT VERWENDETEN (Haupt-)Kommentaren (in einem Blog wie Wordpress) - Kommentare können ja ihrerseits hierarchisch genutzt werden - so könnte eine "Krücke" genutzt werden, um für sich selbst zu schauen, welche Kategorie die passende wäre - und über einen Tag dann die allgemeine Zuordnung? Würde dann das "googelnde" System dennoch ZWEI identische Inhalte erkennen? (Ganz abgesehen davon, dass es einen inhaltlichen Bezug geben sollte, in welchem das jeweilige Wort ja auch vorkommt, aber dazu kenne ich mich zu wenig mit der Programmierung von Suchmaschinenroutinen aus) Beispiel: Krankheit als (nicht zu verwendene) Kategorie mit den Unterkategorien Masern und Mumps (die dann jeweils durchaus verwendet würden, wo sie zutreffen) und dann zudem als Tag "Krankheit", "Masern", "Medikamente" (oder was auch immer) - das sollte in meiner Vorstellung dazu führen, dass der betreffende Artikel durch das Raster von DC fällt, oder? Wobei ich schätze, dass die o.g. "Empfehlung" bei "normalen" Nutzenden von Blogs ohnehin keine Rolle spielen dürfte, weil solche Personen keinen Einfluss auf den Headbereich nehmen können i.S.v. "setzen auf noindex, follow" - das aber nur mal am Rande...

11. Kommentar
Florian Weber |

Ich persönlich finde den Ansatz alles außer echtem Content/Artikeln auf noindex zu setzen und dem Besucher trotzdem über eine moderate Menge an Tags eine zusätzliche Navigationshilfe zu geben optimal. Zwar ist die Idee mit den rankenden Tagseiten nicht von der Hand zu weisen, allerdings setzt dieser Ansatz auch eine extreme Menge an Content voraus um nicht zu einzelnen Tags nur ein einziges Ergebnis vorzufinden. Für große Portale oder Social Bookmarking Dienste sicher gut, für die durchschnittliche Seite/den durchschnittlichen Blog aber meist wenig sinnvoll.

* Diese Felder bitte ausfüllen.

Kommentare werden erst nach manueller Freischaltung sichtbar. Die übermittelten Daten werden entsprechend der Datenschutzerklärung zur Verarbeitung des Kommentars gespeichert.

Was ist die Summe aus 4 und 9?
zurück zu Übersicht
Suche