So funktioniert die Google-Suche
Ohne Inhalt, aber mit viel Webmarketing und neuen Tricks schleichen sich Spam-Seiten auf die ersten Plätze der Google-Suche. Wir erklären warum das so ist.

Wie schön war die Zeit, als Google noch das Tor zur weiten Welt des Internets bedeutete! Ein Suchbegriff genügte und schon zeigte die Suchmaschine viele Seiten mit relevanten Informationen zum eingegebenen Thema an. Heute sieht man jedoch immer öfter Preissuchmaschinen, automatische Datensammler ...
Wie schön war die Zeit, als Google noch das Tor zur weiten Welt des Internets bedeutete! Ein Suchbegriff genügte und schon zeigte die Suchmaschine viele Seiten mit relevanten Informationen zum eingegebenen Thema an. Heute sieht man jedoch immer öfter Preissuchmaschinen, automatische Datensammler oder schlicht Seiten ohne verwertbaren Inhalt unter den Top-Ten-Treffern, obwohl wir danach gar nicht suchen.
Es ist kein Zufall, dass gerade die Top-Platzierungen so zugespammt werden, sind das doch die werbeträchtigsten Platzierungen. Eine gute Positon ist im Rennen um gut verkaufte Werbung also alles, wobei Google diese Positionierung jedes Suchtreffers mithilfe des eigenen Algorithmus festlegt. Voraussetzung dafür ist die Indizierung durch hauseigene webcrawler, die pausenlos das Web durchkämmen. Seiten, die auf diese Weise als besonders treffend beurteilt wurden, wandern auf dem Index für ihr jeweiliges keyword dann eben nach ganz oben.
SEO und unique content als Kriterium Nummer 1

Warum sind dann die Top-Platzierungen der Sucheregbnisse immer weniger wirklich zutreffend? Hier kommt die Strategie der Suchmaschinen-Optimierung (kurz: SEO) zum Tragen, ein eigentlich völlig legitimes Mittel, um die Sichtbarkeit und Reichweite der eigenen Seite im Google-Index zu erweitern.
Die meisten SEO-Firmen überschreiten jedoch nicht selten die Grenze zwischen legitimen, so genannten white-hat-SEO-Maßnahmen und black-hat-SEO-Maßnahmen, die nur darauf aus sind, auch ohne Inhalt und Nutzen bestimmte Webseiten gegen Auftrag nach oben zu boxen. Rechtswidrig ist das übrigens per se erstmal nicht, aber es widerspricht den Grundsätzen eines sinnvoll miteinander verknüpften Internets und der Fairness gegenüber dem Benutzer - deshalb betont Google so gern auch den unique content.
Auch der Einsatz von so genannten landing pages, die zu Hunderten oder sogar Tausenden eine einzige Webseite bewerben und so künstlich deren Gewichtung im Google-Algorithmus erhöhen, gehört zu den üblichen Methoden des SEO-Spamming.
Content Farmen als Überlistungsversuch

Das wichtigste Ziel dieser Maßnahmen ist es, die crawler von Google davon zu überzeugen, dass sich wertvoller Inhalt auf der im Ranking zu pushenden Seite befindet. Bislang hatte Google dieses Problem sogar leidlich im Griff, denn der gefälschte Content war als solcher aufgrund der maschinell erzeugten, sinnlosen Texte oft auch als solcher zu erkennen, doch nun heißt es: Vorhang auf für Content Farmen! Auch hier werden inhaltsarme Pseudo-Webseiten geschaffen - aber mit "echten", von Menschen geschaffenen Inhalten.
Dafür werden gern freiberufliche Billigkräfte von Firmen wie Demand Media Inc. aus den USA angeheuert, die dann für wenige Dollar unrecherchierte Artikel schreiben, in denen nur allgemeine Weisheiten stehen, beispielsweise Sätze wie "Homöopathie ist eine Alternative zur Schulmedizin". Dabei werden Themen mit möglichst langer Gültigkeit bevorzugt wie etwa die Beschreibungen allgemeiner Sachverhalte ("Kängurus - Mit mobiler Kinderstube durch den Busch") oder Anleitungen zu alltäglichen Tätigkeiten ("Brot backen - schnell und einfach").
Andere Content Farmen bedienen sich zum Befüllen solcher Seiten einfach von anderer Stelle (typischerweise Wikipedia). Damit die Taktik nicht auffällt, lassen Content Farmen Wörter gegebenenfalls durch Thesaurus-Datenbanken ersetzen oder suchen gezielt nach nicht-deutschen Inhalten und übersetzen diese halbherzig. Noch ausgefeilter sind die Techniken des automatischen web scraping. Darunter fällt Software, die ähnlich wie ein webcrawler Seiten absucht und deren Inhalte automatisch aberntet.
Erfolgreiche Content Farmen nutzen diese Methoden so gut, dass sie auf den ersten Blick kaum von seriöseren Quellen unterscheidbar sind. Um so schwerer hat es der Google-Crawler, der diese Einschätzung automatisch machen muss. Die Folge: Wer nach großen Themengebieten mit nur einem Stichwort sucht, erhält im Grunde nur noch Ergebnismüll.
Eindämmung durch neuen Algorithmus

Was aber tut Google nun dagegen? Laut SEO-Experte Alexander Holl deutet viel darauf hin, dass Google seinen Algorithmus derzeit so abändert, dass vor allem Verlinkungen von "vertrauenswürdigen" Webseiten bevorzugt werden sollen. Dies lassen jedenfalls die Patente vermuten, die Google in den letzten Jahren zum Thema "Trust Rank" angemeldet hat.
Diese Trust Ranks berechnen sich auch daraus, wie sehr die zu bewertende, verlinkte Homepage mit verdächtigen Seiten verknüpft ist, zum Beispiel Seiten zu den Themen Online-Glücksspiel, Pornografie oder schlicht solche, die Malware verbreiten. Webseiten mit inhaltsarmen oder sinnlosen Inhalten hätten es so schwerer, sich auf die höheren Index-Plätze zu schummeln. Trust Ranks könnten sich allerdings als Wolf im Schafspelz entpuppen.

Kleine Webseiten wie Blogs, die nicht selten aus einem einzigen Mitarbeiter bestehen, hätten es besonders schwer, sich gegen ein Establishment von großen Webseiten durchzusetzen, die mit ihren hohen Trust Ranks punkten können. Selbst mit unique content geht Gefahr vom Vertrauenskonzept aus. Wird ein Artikel auf verschiedenen Plattformen veröffentlicht, ist es wahrscheinlicher, dass Google den Originaltext auf derjenigen Seite vermutet, die einen höheren Trust Rank aufweist.
Dem will der Konzern durch Einführung eines author tag entgegentreten, einer Art Unterschrift, mit der der Verfasser seinen Beitrag im HTML-Code unterzeichnet. Alexander Holl vermutet in Zukunft außerdem eine Abkehr von keywords zugunsten von Themenfeldern. Dadurch entscheidet nicht mehr der genaue Wortlaut des Suchbegriffs über die erfolgreiche Suche, sondern es reicht bereits ein Wort mit ähnlichem Sinn.
Bleibt also die Frage, wer in Zukunft die Rolle des Hasen oder Igels übernimmt - noch ist das Rennen nicht entscheiden.
So suchen Sie richtig
Hilfe zur Selbsthilfe: Damit Sie beim nächsten Mal nicht schon wieder kostbare Zeit verschwenden, sich durch den Berg an Google-Müll zu wühlen, beachten Sie lieber die folgenden Tipps.
- Google sucht präzise: Wenn Sie mehrere Begriffe eingeben, werden nur Ergebnisse angezeigt, die jeden einzelnen davon enthalten. Der "+"-Modifikator muss nur auf Begriffe angewandt werden, die Google normalerweise ignoriert, z.B. Zahlen. Wenn ein Synonym für eines Ihrer Begriffe genügt, benutzen Sie den "~"-Modifikator.
- Entscheiden, wo eingeschränkt wird:Wenn Sie vor, hinter oder inmitten eines Suchbegriffs den "*"-Modifikator benutzen, dient das Zeichen als Platzhalter für Wörter, die Sie eventuell nicht ausschließen wollen.
- Keine Landing Pages mehr:Schließen Sie Begriffe mit dem "-"-Modifikator aus, um etwa Preisvergleichsportale zu vermeiden, z.B. Auto -kaufen
- Auf die Seite genau: Sie können Google mit dem "site:"-Modifikator dafür verwenden, eine bestimmte Webseite zu durchsuchen, z.B. festplatten site:www.connect-living.de
- Automatisch PDFs ausspucken: Sie können Ihre Suche auf bestimmte Dateitypen eingrenzen, z.B. bundesregierung filetype:pdf