Das Google Panda Update – Wer betroffen war und warum

2. Juli 2012 / Dirk Preuten

Google räumt auf - und zwar (wieder mal) den eigenen Index. Was bei Panda im Fokus stand und worauf Sie künftig acht geben müssen.

Im April 2011 veröffentlichte Google ein Update, welches unter dem Namen „Panda“ bekannt wurde. In Deutschland wurde es offiziell erst im August ausgerollt. Panda sollte helfen den Index von unerwünschten Spam Seiten zu befreien. Und, wie wir jetzt wissen, war Panda ein Vorreiter für das ein Jahr später folgende Pinguin Update.
Das Panda Update betraf ganze Domains indem deren Unterseiten auf einige wiederkehrende Muster untersucht wurden. Das Ziel von Panda ist klar: Reduktion von Spam in den Suchergebnislisten. Panda erkennt diese Spam Seiten und bewirkt eine seitenübergreifende Abstrafung, da diese Muster in aller Regel nicht nur auf einzelnen Seiten vertreten, sondern seitenübergreifend oft tief im Template verankert sind.

Was ist durch Panda konkret und nachvollziehbar in den Fokus gerückt worden?

Werbung! Und zwar in mehrfacher Hinsicht!
In einem interessanten Whitepaper untersucht Searchmetrics Anfang 2012 gezielt Korrelationen zwischen dem Vorhandensein von Werbung und den Positionen der entsprechenden Webseiten. Auffällig war, dass das Vorhandensein von AdSense übermäßig häufig auf Webseiten zu finden war, die schlechter positioniert waren. Eine der daraus geschlussfolgerten These: AdSense steht einer guten Positionierung im Wege!

Werbung stört beim lesen des Contents massiv.

Ein Banner mitten im Content platziert, stört den Leser zweifelsohne.

Da aber im Whitepaper nur Korrelationen untersucht wurden und keine kausalen Zusammenhänge, ist eine weitere These denkbar (auch im benannten Whitepaper erläutert): Nicht das Vorhandensein von AdSense ist die Ursache von schlechten Positionen, schlichtweg finden sich auf Seiten mit niedrigeren Platzierungen übermäßig oft AdSense Kampagnen.
Diese Erkenntnis ist eine der Hauptsäulen von Panda: Das erkennen und automatisierte abstrafen von solchen Seiten, die einzig und allein der Refinanzierung irgendwelcher Internetprojekte gelten. Nochmals sei wiederholt: Nicht das Vorhandensein von Werbung allein rückt eine Webseite in den Fokus von Panda – nur dann, wenn sie (die Werbung) übermässig vorhanden ist und den Nutzer massiv vom Konsum des Contents abhält, ist eine Abstrafung durch Panda wahrscheinlich (gewesen).

Wie hält Werbung einen Nutzer nun vom Konsum des Contents ab?

Indem die Werbung massiv die Headline vom Content trennt.
Jeder wird`s kennen – beim betreten der Seite ist die Headline noch gut above-the-fold sichtbar, danach kommt eine große Werbefläche die den eigentlichen Content soweit nach unten schiebt, dass der Nutzer scrollen muss.
Indem die Werbung über dem Content liegt.
Auch das wird jeder schon gesehen haben: Beim betreten der Seite legt sich ein großformatiges oder gar ganzseitiges Werbebanner auf den Content und muss per „Schließen“ weggeklickt werden. Ganz perfide dabei: Der „Schließen“ Befehl ist versteckt oder mit anderen Funktionen vertauscht, so dass der Nutzer zwangsläufig zunächst auf den Banner klicken muss bevor der ursprüngliche Content gelesen werden kann.
Diese Formen der Werbung dienen nur dem Zweck der Klickratenfälschung – der Publisher erhöht so künstlich die Klickraten gegenüber dem Advertiser und hofft auf weitere gewinnbringende Werbeeinnahmen.
Zuviel Werbung.
Seit langem ist Google technisch in der Lage eine Webseite in deren Bestandteile aufzuschlüsseln: Der Head(er), die Sidebar, der eigentliche Content und der Footer, wenn wir mal einfach gestrickte Webseiten zugrunde legen. Jeder dieser Bereiche lässt sich durch eigene, technische Merkmale vom jeweils anderen abgrenzen und automatisch erkennen. Dadurch kann die Suchmaschine durchaus schlüssig und sicher den eigentlichen Contentbereich identifizieren und ihn mit den anderen umgebenden Elementen vergleichen. Befindet sich nun um den Content herum oder gar in ihm selbst viel Werbefläche und besteht der eigentliche Content aus nur wenigen Zeilen, ist das Verhältnis – aus Sicht der Maschine – nicht in Ordnung.

Dünner Content steht ebenfalls im Visier

Ähnliche Inhalte oder Inhalte, die durch mangelhafte Rechtschreibung oder falsch zusammengestellte Sätze auffallen. Auch hier gilt: Eine mangelhafte Rechtschreibung ist kein Grund für eine Abstrafung, aber abgestrafte Seiten weisen eine gewisse Rechtschreibschwäche auf.
Im Grunde ist auch bei diesem Kriterium der Refinanzierungsgedanke, Affiliate Seiten oder falsch verstandenes SEO der Auslöser. Schnell werden automatisiert Hunderte von Webseiten erschaffen, die wiederum Werbung oder Links auf die Seiten des SEO`s enthalten. Mehrwert für den Nutzer? Tendiert gegen 0!
Diese automatisierten Seiten enthalten dann als logische Konsequenz übermäßig häufig Rechtschreibfehler oder werden gleich durch Übersetzungsdienste automatisiert als Content ausgeworfen. Dadurch entsteht dann eine effektiv hohe Korrelation zwischen Content und Abstrafung durch Google. Vielleicht dient folgendes als Richtschnur: Je höher der Grad der automatisierten Contenterstellung meiner Seite ist, umso höher die Gefahr einer automatisierten Abstrafung durch Google.

Content Farmen und Preisvergleicher fielen dem Panda ebenfalls zum Opfer. Warum? Dünner Content! Bei Content Farmen stimmt diese Begründung zwar nicht unmittelbar, trotzdem sind suite101 und Konsorten auf der Seite der Verlierer zu finden. Hier wird Content nur zum Gewinn an Page Impressions geschrieben, die dann wiederum durch Werbung massiv zur Refinanzierung beitragen. Ähnlich erging es Online Presseportalen.
Preisvergleicher teilen sich ihren Inhalt oft mit allen anderen Preisvergleichern – welcher Online Händler schreibt schon gern für jedes Portal eigene und neue Texte? Auch hier wird der Content nur zu dem einen Zweck erzeugt: der Kommerzialisierung. Daher zählen auch viele Preisvergleicher zum Kreis der Panda Verlierer.

Aber vielleicht spielt bei den Preisvergleichern auch noch ein anderes Detail eine entscheidende Rolle: Seit längerem testet Google mit der Integration von produktrelevanten Daten in den Suchergebnisse mehr oder weniger erfolgreich „herum“. Im Bereich der vertikalen Suche kennen wir mittlerweile „Google Shopping“, dessen Startseite in Deutschland heute recht langweilig und unspektakulär herüberkommt.
Sieht man sich zu Vergleichzwecken einmal die Google Shopping Seite in den USA an, wird schnell klar warum die Preisvergleicher Google ein Dorn im Auge sind:

Die Startseite von Google Shopping aus den USA

Die aktuelle Google Shopping Seite in den USA - ein Angriff auf deutsche Preisvergleicher?

Wer sind die Gewinner von Panda?

Eigentlich alle, die eine klassische Internetseite betreiben und sich an ihren eigenen Nutzern und deren Bedürfnissen orientieren. Solange Sie

den Inhalt Ihrer Seite nicht einzig daran ausrichten was zu besseren Positionen führt
Werbung nicht zu aufdringlich gestalten – wenn Sie sie überhaupt benötigen
Relevanten Content zu schreiben anstatt sich Ihre Inhalte zusammenklauben

Die Gewinner von Panda sind eindeutig die Nutzer der Suchmaschine. Panda verfolgt das Ziel den Index aufzuräumen und Webseiten mit minderwertigem Content von dem höherwertigen zu trennen. Daneben haben auch alle redlichen Webseitenbetreiber gewonnen, deren Webseiten tatsächlich produktrelevante Informationen beinhalten und ihre Nutzer nicht mit zahllosen Werbebannern langweilen. Für die SEO Szene rücken damit nutzerspezifische Verhaltensmuster und die Optimierung derselben stärker in den Fokus. Seit längerem bekannt ist, dass die Bouce Rate (= Absprungsrate nach dem erstmaligen betreten einer Seite) ein immer wichtiger werdender Faktor zur Neuberechnung der aktuellen Positionen wird. Daraus folgt, dass zukünftig die SEO Arbeit an Keyworddichten, interner wie externer Verlinkung weniger quantitaiv als vielmehr qualitativ betrieben werden muss. Ein SEO wird in nicht allzu langer Zeit nicht mehr ohne A/B Testings oder Usability Experten erfolgreich sein. Eigentlich eine schöne Vorstellung – führt sie den ehrenvollen SEO doch zurück auf lang verloren geglaubte Tugenden: Wahrhaftig relevanten Content schreiben (lassen) und verlinken… Danke Google!

Korrelation vs. kausaler Zusammenhang

Im Text oben ist oft die Rede von einer gewissen „Korrelation“. Korrelationen sind Zusammenhänge, die aber nicht gegeneinander einen Einfluß haben. Oben findet sich auszugsweise die Frage, ob eine gutes Ranking nur durch viele Social Signals (bspw. getwitterte URLs) zustande kommt, oder ob die Seite deswegen so viele Social Signals hat, weil sie eben guut rankt und daher massiven Traffic abbekommt.

Bei Korrelationen ist also durchaus Raum für individuelle Interpretationen da kein ursächliches aufeinander-folgen nachweisebar ist. Etwas anders ist dies bei kausalen Zusammenhängen, deren Auswirkung ursächlich und eindeutig auf einzelne Ursachen rückzuführen sind.

Dirk Preuten

Dirk war geschäftsführender Gesellschafter der conversionmedia GmbH & Co. KG