Co je to Našeptávač, asi bude většina z vás vědět. Při zadávání hledané fráze do vyhledávacího formuláře na Seznamu vám jsou „našeptávány“ různé možnosti podle počátečních znaků, které jste již napsali, a podle statistiky všemi uživateli Seznamu nejhledanějších hesel. Pokud do onoho políčka třeba napíšete pouze písmeno „a“, objeví se deset tipů, co byste možná chtěli hledat, seřazených podle jejich oblíbenosti od „annonce“ po „aha deník“.
Našeptávač není úplně originální nápad Seznamu. Řada světových vyhledávačů různě experimentuje s využitím JavaScriptu pro usnadnění a urychlení práce s nimi. Za nejzajímavější takový experiment považuji AllTheWeb Livesearch od Yahoo, který se nejen snaží odhadnout, kterou frázi máte na mysli, ale rovnou v reálném čase ukazuje výsledky hledání ještě v průběhu zadávání dotazu. Ostatně studii něčeho takového nedávno představil i Seznam pod názvem Seznam Albert.
Hlavní inspirací pro Našeptávače však asi byl Google Suggest. Tato experimentální služba funguje spíše jako technologická demonstrace, dočkala se však integrace například do Google Toolbaru, podobně jsou vám také našeptávány e-maily adresátů při psaní zpráv v Gmailu. Google tvrdí, že k určování pořadí nabízených frází používá více faktorů, tím hlavním ale také určitě budou informace o počtu hledání. Ovšem že to není jediné kritérium, lze poměrně snadno ověřit. Pokud do Google Suggestu zadáte frázi „google“, na prvních místech vám je nabídnuta pětice „google“, „google.com“, „google toolbar“, „google maps“ a „google scholar“. Pokud stejné dotazy použijete ve službě Google Trends, která ukazuje schématické grafy porovnávající oblibu různých frází, pořadí je v podstatě shodné. Jedinou výjimkou jsou „google maps“, které by podle Google Trends měly být na druhém místě. Samozřejmě je otázkou, jak často se aktualizují data pro Google Suggest i Google Trends.
Seznam není jediný, kdo u nás používá nějaký ekvivalent Google Suggest. Podobnou službu představilo i Centrum, které jí říká Rádce. Ten se dočkal poněkud kontroverzního přijetí, vzhledem k obvinění Josefa Šímy, že Centrum okopírovalo zdrojové kódy Našeptávače. Rádce funguje velmi podobně jako již dříve zmíněné funkce, jeho použitelnost je možná ještě o trochu lepší. Když totiž do Seznamu i Googlu napíšete třeba „lupa“, budou vám nabídnuty pouze fráze začínají na toto slovo, například „lupa adsl přehled“. Centrum naopak do nabídky zahrne všechny fráze, které obsahují slovo „lupa“, bez ohledu na jeho pozici – nabídne vám tak i „křišťálová lupa“.
V tomto článku bych rád ukázal některá data z Našeptávače. Z toho lze získat nejzajímavější informace nejen proto, že se jedná o nejoblíbenější český vyhledávač, ale také kvůli jedné významné věci, kterou se liší od Suggestu i Rádce. Tyto služby v seznamu navržených frází shodně uvádějí také počet výsledků, které člověk na takovýto dotaz může dostat. Našeptávač oproti tomu uvádí statistiku průměrného hledání dotazu za den. Díky tomu z něj můžeme vytáhnout více údajů a jednoduše porovnat popularitu jednotlivých frází.
Zajímavou otázkou je, jaký mají tyto našeptávače vliv na chování uživatelů. Myslím, že můžeme předpokládat dva efekty, které však nemohu nijak průkazně doložit. Dá se očekávat, že se zmenší různorodost hledaných frází, že více lidí bude při hledání používat identické dotazy. Pokud hledáte videa Hvězdné pěchoty ze Superstar, můžete svůj požadavek formulovat nejrůznějším způsobem. Pokud se však podíváme do Našeptávače, tak se zdá, že jeden způsob jasně vítězí. „superstar 3 hvezdna pechota videa“ s 559 hledáními za den jasně vede, jiné možnosti jako „superstar hvězdná pěchota video“ apod. jsou na tom již v popularitě daleko hůře. Když se podíváme na možný jiný tvar dotazu, který by začínal „hvězdná pěchota“, opět zde je jeden dominantní tvar – „hvězdná pěchota superstar 3 videa“ s 57 hledáními.
Pokud tato čísla nemohu srovnat s vyhledávačem, který žádný našeptávač nepoužívá, nemohu jasně rozhodnout, jestli takovéto rozložení počtu hledání je dáno Našeptávačem, nebo jestli se jedná o zcela přirozenou věc a „superstar 3 hvezdna pechota videa“ je zkrátka tou první možností, kterou člověka hledajícího tento obsah napadne. Ovšem s velkou důvěrou můžeme věřit, že za tím skutečně stojí Našeptávač, ostatně něco naznačuje už to, že v jednom případě nabízí frázi s diakritikou a v druhém bez. Seznam diakritiku ve vyhledávání ignoruje, takže podoba v Našeptávači je asi určena tím, jestli diakritiku použil první hledač, nebo možná jestli ji používá většina lidí. Jako příklad „podezřelého“ dotazu, který má podivně velkou oblibu bych uvedl třeba „super star 3 a jejich soutezici“ se 149 hledáními denně. Jedná se o dosti dlouhou a komplikovanou frázi, která navíc obsahuje chybu (mezeru mezi super a star), takže pochybuji, že by skutečně vznikla spontánně.
Druhým předpokládaným efektem je zkonkretizování dotazů, prodloužení jejich délky. Abych zůstal u Superstar – nejjednodušším dotazem pro informace o této soutěži je prosté „superstar“. A je také pravda, že podle Našeptávače jsou fráze „superstar 3“ a „superstar“ jasně neoblíbenějšími tvary. V nabídce se však objevují i výrazně sofistikovanější dotazy, které již přesněji specifikují, o co mají uživatelé zájem. Na relevantní analýzu by bylo zapotřebí daleko více dat, než lze z Našeptávače dostat. Můj subjektivní dojem však je, že Našeptávač skutečně způsobuje zvyšování kvality hledaných dotazů. Mimochodem „zvyšování kvality hledaných dotazů“ je trochu odvážné tvrzení, jelikož Našeptávač také občas zakonzervovává některé chybné tvary, protože co se do něj jednou jakoukoliv náhodou dostane, to jen velmi pomalu mizí.
Pokud zmíněné vlivy jsou skutečné, máme našeptávače vnímat pozitivně, nebo ne? Z pohledu vyhledávačů se možná jedná o jisté zjednodušení jejich práce, s trochou nadsázky by mohly manuálně nastavit výsledky pro jisté množství nejoblíbenějších frází a zajistily by tím vynikající kvalitu vyhledávání pro většinu uživatelů. Ve skutečnosti tomu tak samozřejmě není, stále existuje spousta dotazů, které pokládá příliš málo lidí na to, aby je Našeptávač zachytil.
Z pohledu uživatelů je význam našeptávačů sporný. Já osobně jej mám pro webové vyhledávání vypnuté, jelikož chci svůj dotaz zformulovat sám a nevidím v našeptávači žádnou pomoc. Pro řadu lidí se však může jednat o příjemné usnadnění, kdy místo vymýšlení fráze prostě jen z nabídky odkliknou to, o co mají zájem. Mimochodem Seznam Našeptávače nepoužívá jen ve webovém vyhledávání, ale i ve slovníku a v mapách. Využití ve slovníku je vzhledem k velikosti databáze téměř nulové (Seznam zde navíc k řazení nepoužívá informace o počtu hledání). Pro hledání v mapách se mi naopak zdá ideální, odpadá tím nudné vypisování kompletní adresy.
Pro provozovatele webových stránek je Našeptávač úžasný nástroj. Omezení různých tvarů vyhledávání téhož umožňuje zoptimalizovat stránky na jeden nejpoužívanější tvar a nebát se, že vám nějaký návštěvník uteče jen proto, že svůj dotaz formuloval trochu jinak. To ovšem také znamená zúžení toho hrdla, přes které vyhledávače přeposílají své uživatele k vám, a tedy i možné velké zvýšení konkurence o pozice na těch zásadních frází, pod heslem vítěz bere vše.
Podívejme se, jak vypadá seznam všech frází s vyšším počtem hledání než 500:
Pořadí | Heslo | Počet hledání | Pořadí | Heslo | Počet hledání |
---|---|---|---|---|---|
1. | freefoto | 6546 | 90. | o2.cz | 801 |
2. | libimseti.cz | 4465 | 91. | google vyhledávač | 798 |
3. | freefoto.cz | 3807 | 92. | superstar | 789 |
4. | superhry | 3540 | 93. | nova tv | 787 |
5. | mp3s.nadruhou.net | 3383 | 94. | aaa auto | 785 |
6. | blesk | 3274 | 95. | for arch 2006 | 783 |
7. | idos | 3264 | 96. | wallpapers | 778 |
8. | xchat | 3179 | 97. | mp3 ke stažení zdarma hudba | 777 |
9. | 2945 | 98. | jízdní řády vlaků | 765 | |
10. | www.servis24.cz | 2903 | 99. | www.rande.cz | 753 |
11. | o2 | 2313 | 100. | reality | 751 |
12. | www.freefoto.cz | 2279 | 101. | sazka | 748 |
13. | sms zdarma | 2230 | 102. | t-mobile | 736 |
14. | telefonní seznam | 2190 | 103.-104. | icq 5.1 čeština | 735 |
15. | sexyvidea | 2122 | 103.-104. | česká pošta | 735 |
16. | mp3 ke stažení zdarma | 2029 | 105. | webhry | 730 |
17. | t-music | 2020 | 106. | erotika | 727 |
18. | vodafone | 2018 | 107. | katastrální úřad | 726 |
19. | jízdní řády | 1945 | 108. | tv program | 718 |
20. | centrum | 1941 | 109.-110. | psč | 703 |
21. | hry | 1938 | 109.-110. | rajsmichu.cz | 703 |
22. | www.superhry.cz | 1930 | 111.-112. | ge money bank | 701 |
23. | annnonce | 1922 | 111.-112. | www.csob.cz | 701 |
24. | sex | 1896 | 113. | mp3 přehrávače | 698 |
25.-26. | erotické povídky | 1881 | 114. | www.mobile.de | 695 |
25.-26. | www.freevideo.cz | 1881 | 115. | www.superstar.nova.cz | 690 |
27. | www.libimseti.cz | 1863 | 116. | ares | 681 |
28. | spolužáci.cz | 1792 | 117. | www.annonce.cz | 679 |
29. | vodafone.cz | 1773 | 118. | www.t-mobile.cz | 673 |
30. | freevideo | 1750 | 119.-120. | realitní kanceláře | 666 |
31. | rande.cz | 1749 | 119.-120. | rande | 666 |
32. | t-mobile.cz | 1719 | 121.-122. | icq 5.1 download | 648 |
33. | česká spořitelna | 1683 | 121.-122. | tokio hotel | 648 |
34. | idos jízdní řády | 1654 | 123. | volny.cz | 647 |
35. | obchodní rejstřík | 1637 | 124. | filmy ke stažení zdarma | 646 |
36. | atlas | 1628 | 125. | živnostenský rejstřík | 642 |
37. | sms zdarma na eurotel | 1597 | 126. | zlaté stránky | 641 |
38. | freevideo.cz | 1594 | 127. | www.spoluzaci.cz | 640 |
39. | sexyfoto | 1574 | 128. | eurotel.cz | 639 |
40. | idnes | 1560 | 129. | tesco | 633 |
41. | stahuj.cz | 1538 | 130. | tipsport | 629 |
42. | www.1000her.cz | 1492 | 131. | vtipy | 619 |
43. | superstar 3 | 1415 | 132. | sony ericsson | 618 |
44. | mapy.cz | 1400 | 133. | jobs.cz | 617 |
45. | seznamka | 1368 | 134. | aha deník | 613 |
46. | www.vodafone.cz | 1360 | 135. | sportka výsledky | 609 |
47. | jízdní řády autobusů | 1305 | 136. | nova | 606 |
48. | mp3 | 1303 | 137. | obrázky na plochu | 605 |
49. | icq | 1251 | 138. | poštovní spořitelna | 602 |
50. | tapety na plochu | 1213 | 139. | slunecnice.cz | 600 |
51. | katastr nemovitostí | 1209 | 140.-141. | mojehry | 599 |
52. | hry zdarma | 1189 | 140.-141. | oskar | 599 |
53. | horoskopy | 1169 | 142. | www.eurotel.cz | 597 |
54. | hry online | 1162 | 143. | tapety na plochu pc | 593 |
55. | sudoku | 1146 | 144. | www.alik.cz | 583 |
56. | úřad práce | 1123 | 145. | ftipky.cz | 576 |
57. | teletext | 1107 | 146. | teletext ct | 573 |
58. | sex videa zdarma | 1105 | 147. | skype | 566 |
59. | ikea | 1102 | 148. | www.nova.cz | 563 |
60. | libimseti | 1064 | 149.-151. | fortuna | 555 |
61. | sms zdarma na oskar | 1059 | 149.-151. | www.t-music.cz | 555 |
62. | superstar 3 hvezdna pechota videa | 1057 | 149.-151. | www.stahuj.cz | 555 |
63. | www.idos.cz | 1043 | 152. | nahé české celebrity | 554 |
64. | amatérské fotky | 1032 | 153. | hvězdná pěchota superstar | 553 |
65. | seznamka.cz | 1021 | 154.-155. | hry ke stažení zdarma | 552 |
66. | online hry | 995 | 154.-155. | minibazar | 552 |
67. | obrázky | 981 | 156.-157. | sazka sportka výsledky | 548 |
68. | t-zones | 975 | 156.-157. | www.mp3s.nadruhou.net | 548 |
69. | student agency | 972 | 158. | telefonica o2 czech republic | 546 |
70. | slovník cizích slov | 968 | 159. | spolužáci | 541 |
71. | česká televize | 940 | 160. | www.t-zones.cz | 539 |
72. | mobilní telefony | 931 | 161. | tiscali.cz | 538 |
73. | eurotel | 927 | 162. | o2 telefonica | 532 |
74. | nokia | 916 | 163.-165. | digi tv cz | 529 |
75. | minihry | 894 | 163.-165. | inzerce | 529 |
76. | sms | 890 | 163.-165. | katastr nemovitostí nahlížení | 529 |
77. | autobazary | 887 | 166. | sexy holky | 526 |
78. | digi tv | 882 | 167. | mhd praha | 521 |
79.-80. | erotické video zdarma | 881 | 168. | práce.cz | 519 |
79.-80. | www.volny.cz | 881 | 169.-170. | www.mapy.cz | 518 |
81. | recepty | 877 | 169.-170. | česká pojišťovna | 518 |
82. | annonce.cz | 869 | 171. | superhry.cz | 517 |
83. | sportka | 868 | 172. | snář | 516 |
84. | mapy | 861 | 173. | sexite.org | 513 |
85. | rozzlobenimuzi.com | 852 | 174. | exim tours | 510 |
86. | práce | 823 | 175. | stahuj | 507 |
87. | www.mojebanka.cz | 817 | 176. | dvd obaly | 506 |
88. | počasí | 815 | 177. | radio impuls | 503 |
89. | evropa 2 | 807 |
Data pocházejí z 23. září 2006, mohou se tyto jemně lišit od těch aktuálních. Seznam z Našeptávače vyřazuje některá slova, která jsou: „širší veřejností chápána jako neslušná.“ Fráze jako „porno“ by tak asi v necenzurovaném žebříčku získala významnou pozici.
Každý člověk si z tohoto žebříčku vybere něco jiného, co ho zaujme. Mě například zarazila ohromná obliba některých serverů a služeb. Že je Líbímseti masivně populární, to je celkem známé. Ale úspěch hned několika webů zaměřených na hraní flashových her online (Superhry, Minihry, RájSmíchu, 1000her) je zajímavý. Jedná se totiž o oblast, která není příliš podchycena žádným velkým portálem, z velké míry asi kvůli problémům s autorskými právy (podobné stránky totiž odkazují cizí hry, a to často takovým způsobem, že z toho jejich tvůrci nic nemají). Nebo slyšeli jste někdy o MP3s.nadruhou.net? A přesto se jedná o zjevně mimořádně oblíbenou stránku, ze které si můžete stáhnout spoustu empétrojek. Za povšimnutí také stojí vysoké umístění řady českých bank a stránek jejich internetového bankovnictví.
Pokud si sečteme počet hledání u všech hesel ze žebříčku, vyjde nám úctyhodné číslo lehce přesahující 200.000. Nemáme jej sice moc s čím porovnat, ale přesto mi tak velký význam „Top 177“ připadá mimořádný a zapříčiněný existencí Našeptávače. Pokud se podíváme do obdobného žebříčku na Jyxu, zdá se být potvrzena i druhé teorie o vlivu Našeptávače. Fráze ze žebříčku Seznamu jsou obecně výrazně delší a komplikovanější. Ostatně počet víceslovních spojení v Top 177 je u Seznamu 64, na Jyxu 39. Pokud bychom porovnávali podíl troj- a víceslovních frází, byl by tento poměr ještě výraznější. Těžko přitom tvrdit, že Jyxo používají méně pokročilí internetoví uživatelé než Seznam.
Tato tabulka má ale ještě jeden, možná největší význam. Pokud se namátkou podíváte, které stránky se objevují ve výsledcích některých silně populárních dotazů, spatříte často záplavu špatně nebo zcela neoptimalizovaných webů. Jak lákavé by bylo získat všechny tyto uživatele pro sebe. Až se v Česku objeví nějaký efektivní způsob, jakým vyždímat peníze i z tak náhodných uživatelů, jako jsou ti, co chodí přes vyhledávače, dočkáme se stejné záplavy SEO spamu, která na anglickojazyčném Internetu již dnes likviduje kvalitu výsledků řady lukrativních dotazů.