S rostoucím počtem internetových prezentací už není klíčem k úspěchu pouze samotný web, nýbrž pozice ve vyhledávačích. Vyhledávače se v podstatě stávají online tržištěm, kde se střetává poptávka (dotazy uživatelů) a nabídka (obsahy webů). Pochopitelným cílem je tak pro mnohé majitele webů obsazení prvních míst ve výsledcích vyhledávačů a dosažení vyšší návštěvnosti.
Ukořistit přední pozice ve fulltextových vyhledávačích nebývá nic jednoduchého. V takových případech přichází chvíle tajů SEO a dalších technik, které ale občas opouštějí rámec fair play. Na provozovatele vyhledávačů pak čeká nesnadný úkol nastavit parametry svého stroje takovým způsobem, aby webům umožnili rovnou soutěž a zároveň nabídli hledajícím uživatelům to nejlepší z dostupných webových zdrojů.
Poměrně banální příklad, který si v dnešním článku představíme, přitom odhalí, jak snadné je dobýt přední místa ve vyhledávačích na konkrétní frázi, aniž by s ní měl váš web něco společného. Anebo jinak – dnešní text budiž důkazem, jak lehce stále některé vyhledávače (Seznam, Google, Atlas) otevírají dvířka SEO spammerům.
Zrádné referery
Začněme obecně: na vašich stránkách se objeví na jednom místě skupina slov, které dohromady dávají vyhledávanou frázi. Roboti ji samozřejmě indexují. Slepená fráze nemá s obsahem webu pranic společného, a tak vyhledávač umístí daný web hluboko ve svých výsledcích, řekněme na desáté stránce. Potud je vše v naprostém pořádku.
Vyhledávač navštíví uživatel a zadá dotaz na „naši“ frázi. Ve výsledcích listuje hluboko, až potká odkaz na váš web. Klikne. Nerelevantním obsahem je pochopitelně zklamán a urychleně odchází.
Na vašich stránkách máte ovšem veřejně přístupnou statistiku přístupů, na kterou odkazujete. Přístup onoho uživatele z vyhledávače na danou frázi se zde samozřejmě zaznamená. Stránku statistik přístupů navštíví robot vyhledávače; s potěšením zjišťuje přítomnost oblíbené fráze a posouvá váš web na vyšší pozici.
Díky tomu přichází druhý den na zmíněný dotaz více návštěvníků. Na tuto skutečnost reagují referery a na ně opět indexující vyhledávač. Vzniká tím vlastně smyčka: čím více návštěvníků chodí z vyhledávače na konkrétní frázi, tím častěji se tato fráze objevuje v refererech webu. Čím častěji se v refererech webu objevuje daná fráze, tím lepší hodnocení web od vyhledávače dostává a tím se objevuje ve výsledcích výše… až se váš web ocitne na prvním místě na frázi, s jejíž tématickou oblastí nemá nic společného.
Konkrétní příklad s tetováním
Od obecného přejděme na konkrétní příklad. Náš laskavý čtenář Michal Škrabálek provozuje stránky www.dreamface.net/michal zaměřené na vlastní hudební a webovou produkci. Kdysi kdesi se na jeho stránkách objevila kombinace těchto slov: tetování, motivy a vzory. Náhodou se jedná o frázi, na kterou průměrně směřuje přes 700 dotazů denně ve vyhledávači Seznamu.
Další průběh je totožný s tím, který jsme naznačili výše. Robot vyhledávače Seznamu stránky Michala Škrabálka indexoval a někdo na ně přes vyhledávač vstoupil. To nenechalo chladným jeho veřejný log přístupů. Vyhledávač Seznamu zde zaregistroval výskyt fráze „tetování motivy a vzory“ a přisoudil těmto statistikám, které jsou vlastně automaticky generovanou stránkou, vyšší váhu. Čím více přes vyhledávač chodilo uživatelů, tím stránky ve výsledcích stoupaly, až se objevily na prvním místě. Před publikováním tohoto článku klesly na druhou pozici.
Je chování vyhledávačů správné?
Stejně jako Seznam se chová Atlas a také Google, kde stránka refererů webu Michala Škrabálka obsadila přední pozice. Můžete namítnout, že jde o přirozené chování vyhledávačů, které prostě nabízejí stránku, kde se daná fráze „tetování motivy a vzory“ vyskytuje. Do jisté míry máte pravdu – vyhledávače vycházejí z obsahové nabídky webů a ta je v tomto případě žalostná – prakticky žádné body art studio evidentně nemá (optimalizovaný) web počítající s klienty hledající nabídku tetování online. Na výhodné umístění v případě jiných dotazů, na které je ve vyhledávačích konkurenční mela, by pouhé vystavení logů přístupů určitě nestačilo.
Podobný názor zastává Seznam prostřednictvím své mluvčí Rity Gabrielové: Vyhledávač Seznamu dává stránce relevanci nikoli proto, že by na ni chodili lidé ze Seznamu, nýbrž proto, že se na ní vyskytuje text, který lidé hledají. Je to přirozený výsledek algoritmů. Robot našel na stránce nějaký text a tento text zaindexoval. To, jak se text na stránku dostal, robot není schopen zjistit. Pokud stránka obsahuje hledaný text, má být ve výsledcích.
Problém je, že statistiky přístupů nejsou obyčejnou stránkou se statickým obsahem, nýbrž stránkou automaticky generující odkazy. Text zde se vyskytující není pro hledajícího uživatele užitečný a mnohdy může být také značně zavádějící.
Michal Illich, provozovatel konkurenčního vyhledávače Jyxo.cz, se domnívá, že podobné chování vyhledávačů je chyba. Statistiky Jyxo.cz obvykle indexuje (stejně jako většinu ostatních stránek), ale snažíme se vyhledávač naprogramovat tak, aby nezvýhodňoval stránky, na které vedou umělé (scripty generované) odkazy,
říká Michal Illich. Jeho slova potvrzují výsledky na Jyxo.cz, na Atlasu (kterému Jyxo svou technologii poskytuje) ale dochází k opaku.
Tato smyčka je důsledkem toho, že na stránce je automat, který vyhodnocuje a zobrazuje přístupy,
tvrdí Rita Gabrielová. Nelze to ošetřit jinak než ruční kontrolou.
Možné zneužití v SEO
Je zřejmé, že indexace statistik přístupů vyhledávači, jak jsme poznali, nepřináší zhola nic dobrého. Návštěvníka přistupujícího přes vyhledávač těžko může při hledání informací seznam refererů uspokojit a jen stěží získá důvěru ve v Česku stále relativně nové fulltextové vyhledávání. Tvůrci webů nemají příliš důvod vítat „zájezdy“ lidí hledajících zcela jiný obsah. V lepším případě tito návštěvníci zklamaně odejdou, v horším se stanou zdrojem potíží (obtěžující e-maily, vzkazy).
Pro některé vykutálence se mohou logy stát vítanou metodou v SEO, byť nepříliš korektní. Jistě, někteří SEO odborníci se pokusí využít/zneužít každé skuliny, na kterou přijdou,
tvrdí Michal Illich. I Rita Gabrielová teoretické zneužití v SEO přiznává: O tomto problému víme.
Nevystavujte své referery
V každém případě je nejlepší radou logy přístupů veřejně nevystavovat, nebo alespoň zakázat jejich indexaci. Důvody jsou minimálně tři. Za prvé, referery bývají poměrně cennou informační zprávou pro majitele webu (i z hlediska marketingu) a není důvod, proč by k nim měl mít kdokoli jiný přístup. Navíc je můžeme považovat i za „polosoukromý statek“, jenž se svými návštěvníky de facto sdílíte.
Za druhé, veřejně přístupné referery k vám mohou přilákat návštěvníky z oblastí, o které zrovna dvakrát nestojíte (jak jsme viděli na konkrétním příkladu; představte si také, že by na vás někdo schválně odkazoval z pornografických stránek, nebo že se stanete obětí referového spamu). A za třetí, až se někdy vyhledávače rozhoupou k „čistce“, nač jim dávat dobrovolně do ruky klacek, namísto kvalitního obsahu?
Také proto například měřící server Navrcholu.cz ve výpisu refererů zakazuje jak indexaci stránky, tak sledování odkazů. Obojí můžete na své stránce dosáhnout třeba dosazením meta tagu meta name="robots" content="noindex, nofollow"
v hlaviččce HTML stránky (více o zakázání přístupu robotům). Vyhledávač Jyxo ale meta tagy robots nerespektuje.