„Klábosení právě archivuje 22 821 470 pípnutí od 100 081 českých nebo slovenských uživatelů.“ na www.klaboseni.cz z minulého týdne je jistým důvodem k oslavě, byť je potřeba zdůraznit, že Klábosení.cz do tohoto čísla zahrnuje skutečně české a slovenské uživatele a rozhodovacím kritériem není jenom jazyk příspěvků, ale také prosté „přihlášení se“ územní. Důvod k oslavě tu přesto je, protože „český Twitter“ je se slovenským hodně propojený. A těžko se od sebe odděluje. A když už nebudeme brát v úvahu číslo samotné, je zde stálý viditelný růst.
„Konkurenční“ www.zoomsphere.com aktuálně pro Českou republiku uvádí, že eviduje 42 229 účtů, ale i zde narazíte na typické problémy s „detekcí“ (hlavně v podobě přítomnosti účtů, které rozhodně nejsou české, problém společný pro oba systémy). Svým způsobem je zajímavé, jak obtížné je určení toho, kolik uživatelů má určitá sociální síť či služba v určité zemi. A jak obtížné je vůbec tyto uživatele najít.
Česky a slovenský Twitter, Zdroj: Klaboseni.cz
Připomeňme, že Google DoubleClick Ad Planner odhaduje návštěvnost českého Twitteru na 290 tisíc měsíčních unikátních uživatelů a soudě podle grafu je konstantní zhruba od druhé poloviny loňského roku. V případě Twitteru slovenského je odhad 150 tisíc a graf má stoupající tendenci, také od druhé poloviny loňského roku. Celosvětová návštěvnost je Google odhadována na 170 milionů uživatelů.
Samotný Twitter udává, že má 100 milionů aktivních uživatelů (přihlašujících se alespoň jednou měsíčně a jde o údaj ze září loňského roku) a 200 milionů registrovaných účtů (údaj z dubna loňského roku). Podle TwopChars.com je aktuální počet registrovaných účtů 584 milionů a odhady založené na této službě hovoří o tom, že na konci tohoto roku by Twitteru mohl mít až 250 milionů aktivních účtů.
České TOP 15
Zoomsphere.com |
Klábosení.cz |
|||
1. | @AwwBieber | 171 406 | @AwwBieber | 171 406 |
2. | @weluvbrazil | 109 526 | @LoreleiWeb | 113 620 |
3. | @PragueBob | 73 181 | @weluvbrazil | 109 526 |
4. | @avast_antivirus | 50 069 | @PragueBob | 73 181 |
5. | @webnode | 30 289 | @avast_antivirus | 50 069 |
6. | @ProSyn | 28 172 | @webnode | 30 289 |
7. | @ZoomSphere | 24 492 | @ProSyn | 28 172 |
8. | @vtipy | 21 865 | @vtipy | 21 865 |
9. | @Roman86_K | 21 569 | @SmurfyHayden | zrušený účet |
10. | @oriolesland | 17 356 | @Roman86_K | 21 569 |
11. | @computer_zive | 16 621 | @zdenekstybar | 17 552 |
12. | @arkellsmusic | 15 521 | @computer_zive | 16 621 |
13. | @belamionline | 15 176 | @Cibulkova | 16 205 |
14. | @MilanBaross | 14 162 | @belamionline | 15 176 |
15. | @pixmac | 13 605 | @MilanBaross | 14 162 |
Mezi největšími účty na Twitteru jsou časté záhady
Největší z uváděných účtů @AwwBieber toho moc českého nenabízí ani nepředstavuje (má ale 171 305 sledujících). Stejně tak je otázkou, kam vlastně zařadit @weluvbrazil aneb „Tchecas do brasil“ (najdete na druhém místě s 109 541 sledujícími). Stejně tak @OriolesLand není český (v Zoomsphere navíc chybně zaznamenaný odkaz na účet). Mezi těmi největšími (už s „pouhými“ 15 391 sledujícími) pak najdete třeba i @arkellsmusic patřící zjevně do Kanady. A co teprve taková @SilviaSaint_, jejíž webová stránka pouze sděluje, že „SORRY BUT THIS PAGE IS NOT AVAILABLE IN YOUR COUNTRY“. Smutné, když česká porno hvězda nemyslí na své krajany, i tak by se to dalo říci.
Mimochodem, on například @AwwBieber je skutečně z Česka, byť to taky nevypadá. A u některých z oněch „záhad“ také nějakou českou vazbu najdete. Byť je do „českého“ Twitteru dokážete pocitově zařadit jenom velmi těžko.
Pro Slovensko ZoomSphere eviduje na Twitteru 5528 účtů, takže pokud to sečteme, dojdete zhruba k 50 tisícům česko-slovenských účtů. Versus 100 tisíc v případě Klábosení. A to v případě Slovenska je (podle Zoomsphere) největší účet @ValBloomberg (21 741 sledujících) rozhodně jako „slovenský“ nevypadající. Další dostupné odhady velikosti slovenského Twitteru přitom hovoří o desítkách tisíc účtů.
Klábosení a Zoomsphere.com se v žebříčku patnácti největších účtů liší jenom mírně, můžete se na to ostatně podívat sami ve výše uvedeném přehledu. Občas někde něco přebývá, stejně tak jako občas někde něco chybí.
Co na velmi rozdílné výsledky říká Josef Šlerka z Klábosení.cz?
Prohledáváme sledované a sledující uživatelů Twitteru, které máme a testujeme, zda se buď explicitně hlásí k českému nebo slovenskému prostoru či zda mají alespoň 15 procent tweetů v češtině nebo slovenštině. Možné je, že tak přijdeme na účty, které mají třeba i nízkou frekvenci tweetování. Pokud jde o jazykový detektor, tak si myslím, že máme přibližně 5% false positive. Řekl bych tedy, že číslo 100 000 jsme ještě přímo v Klábosení nepřekonali, ale už jsme hodně blízko
Pokud jde Slovensko zvlášť, tak myslím, že číslo 5528 není úplně správné, viz prezentace třeba i konkurenčního projektu http://www.slideshare.net/andrej_probst/twitter-in-slovak-republic
Jakub Mach ze společnosti Micromedia (Zoomsphere.com) k tomu říká:
Do nedívna jsme používali mechaniku podobnou tomu popisu Pepy Šlerky, ale od doby, co jsme globálním projektem, tak řešíme jen TOP 1000 účtů v každé zemi. Sestaveni žebříčku sice předchází také projetí ostatních účtů, ale neděláme si už ambici projíždět každý účet, procházíme jen ty aktivní, které mohou promluvit do žebříčku.
Dan použil číslo, které uvádíme v závorce při výběru země. To číslo nevyjadřuje ale celkový počet registrací, ale de facto spíše počet účtů které jsme vzali v potaz při aktualizaci žebříčku. Každopádně je to naše hloupost, že to tam máme, chápu, že je to zavádějící. Na testovací verzi to není, na ostré jsme to zapomněli odstranit. Omlouvám se za uvedení v omyl.
Přesné číslo počtu registrací v ČR teď neznám. Ono indexovat pouze CR je snadné, ale indexovat všechny účty na Twitteru celosvetově prostě nejde a my se vyvarujeme toho, abychom dělali extrabuřty pro nějakou zemi, tím spíše, že pro ČR to nemá ani moc komerční význam.
Závěr aneb co z toho plyne?
Něco tak zdánlivě jednoduché jako „změřit český Twitter“ vůbec jednoduché není. Na obou příkladech je vidět, že automatické hledání „českých“ účtů selhává a ruční práce se nevyplatí – se stoupajícím počtem uživatelů Twitteru je to více a více obtížné. Samotný Twitter to také neusnadňuje, uživatelské účty toho o sobě moc neříkají. Určovat český účet podle češtiny je jedním z použitelných způsobů, ale vede to k tomu, že nejsou nalezeny neaktivní účty – tedy takové, které jejich uživatelé používají pouze pro sledování. Ty Klábosení najde prostřednictvím vazeb na další české účty, ale nedokáže už zjistit, jestli je jejich uživatelé skutečně používají, nebo zda to byl jenom ojedinělý pokus a uživatel již Twitter opustil.
Z komentáře od Jakuba Macha plyne i další úskalí. Je lepší být „světoví“, než se věnovat malé české kotlině. Na světovosti lze lépe vydělat. A ze slov Jakuba Macha také plyne, že je lepší „klouzat po povrchu“ a omezit snahu o detailnost či přesnost. Míra pracnosti prostě neznamená odpovídající vyšší přínos. O čemž samozřejmě lze polemizovat, ale tady je podstatné, na koho vlastně ZoomSphere míří.