Kolaborativní software je založený na spolupráci (dobrovolné či nevědomé) lidí, přičemž kvantita je zde rozhodujícím faktorem ovlivňujícím kvalitu výsledné analýzy. Asi nejlépe bude ukázat si to rovnou na příkladu.
Ti, co si koupili tuto knihu, si koupili také tuto
Jedním z nejúspěšnějších implementátorů kolaborativního software je Amazon. V jeho případě software porovnává, jaké knihy jste si prohlíželi a koupili, s tím, jaké knihy si prohlížel a koupil někdo jiný. Software pak vybere lidi, kteří jsou vám podobní svými nákupními preferencemi (hovoříme o stejném vkusu) a nabídne vám knihy, které si ti lidé koupili a vy ještě ne. Předpoklad je zde jednoduchý: pokud si vybíráte stejné knihy, je velmi pravděpodobné, že i ta další kniha, kterou ještě koupenou nemáte, by vás mohla zaujmout.
Už na první pohled je patrné, že použitá metoda má své obrovské výhody i nevýhody. Výhodou je, že zatímco klasický systém doporučování byl bez vhodného zužitkování telepatie nutně odkázán jen na náhodný výběr založený na tom, že když jste si koupili tři detektivky od Christie, asi už koupíte i tu čtvrtou. A když ne od Christie, tak nějakou jinou. Jenže algoritmem založeným na analýze výhradně vašich vlastních preferencí typu autor, téma, druh literatury se těžko dostanete do zcela jiné žánrové a autorské kategorie. U kolaborativního software je tomu jinak – software je schopný zjistit, že lidé, kteří si koupili tři detektivky od Christie, si také koupili Clavellova Šóguna. Fakt, že jste o té knize nikdy neslyšeli, není vůbec na škodu, je docela pravděpodobné, že vás zaujme kniha vybraná podle vkusu lidí se vkusem podobným vašemu.
Na druhý pohled jsou patrné i limity kolaborativního software. Tak především je potřeba, aby porovnávaná množina osob byla dostatečná, protože pokud software má doporučovat na základě shodnosti vašeho vkusu se vkusem dalších dvou osob, je statistická pravděpodobnost, že se do vašeho vkusu takto netrefí, docela vysoká. Právě nadkritická masa je schopná eliminovat výstřelky, které nutně vznikají například tak, že jednu z těch osob poprosila babička o nákup kuchařky.
To také předznamenává problémy: kolaborační algoritmy se nemají uplatňovat v případě, že kritické masy nebylo dosaženo – to je také důvod, proč Amazon používá jiný algoritmus doporučování při prvních návštěvách. A je to také důvod, proč si Amazon svojí sbírky údajů o zákaznících tolik váží. Zákazníci jsou dnes tolik zahlceni zbožím, že úkol strefit se jim do vkusu je pro obchodníka jedním z nejdůležitějších.
Dalším příkladem aplikace kolaboračního software může být americký NetFlix, online půjčovna DVD. Pokud si na NetFlixu vyberete DVD, jsou vám ihned doporučována DVD, která si půjčují lidi se stejným vkusem jako vy. Pro zákazníka je to velmi výhodné – NetFlix má v nabídce kolem 15.000 DVD a vybrat si z nich ta, která jsou zajímavá, je opravdu docela náročné. Takhle vychází obchodník zákazníkovi vstříc a doporučuje mu DVD, u nichž je opravdu dobrý důvod se domnívat, že by se zákazníkovi mohla líbit.
O důležitosti zpráv rozhodují lidé, ne stroje
Kolaborativní software nekončí se svými schopnostmi ve webových krámcích, jeho možností se uplatňují i v mnoha jiných případech, kde je velmi složité vymyslet ten správný rozhodovací algoritmus.
Příkladem může být spam. Zatím jsme se ještě neshodli na tom, jak zní přesná definice „nevyžádanosti“ v případě sousloví nevyžádaná pošta, ale můžeme předpokládat, že pokud devět z deseti zubních lékařů označí došlý email jako spam, asi opravdu půjde o spam. Úkol, na kterém si vylámala zuby heuristická a jiná analýza, vyřídí nyní sami uživatelé, kteří případné zprávy označí za spam. Takto funguje kupříkladu software SpamNet společnosti Cloudmark.
Kolaborativní přístup se používá i u analýzy zpráv. Příkladem může být projekt Gixo, kde záleží na tom, jak jednotliví čtenáři hodnotí určité články. Samozřejmě je nesmysl předpokládat, že čtenář přijde na server, poctivě ohodnotí všechny články a odejde – kolaborace může být nevědomá a spočívat v tom, že server zvýší prioritu článku podle počtu kliknutí. Však je to logický předpoklad, že článek, na který si více lidí kliká, také více lidí zaujme…
Nástup kolaborativního software byl také jednou z příčin postupného ochabnutí zájmu o personalizaci. Ukázalo se, že kolaborativnost přináší podstatně lepší výsledky než personalizace – a to ve stejném segmentu trhu. Namísto toho, abyste uživatele nutili vyplnit oblasti, o které se zajímá, jen potichu sledujete, co ho zajímá, a porovnáváte to se vkusem ostatních lidí a podle toho jim nabízíte další zprávy…
Není bez zajímavosti, že jedním z průkopníků kolaborativního software byl v této oblasti i český projekt Sféra z dílny Magea, dnes už ovšem nefungující. Kolaborativní mechanismy používá i Femigo, Kuro5hin a další weby, pro označování kvality diskusních příspěvků také Slashdot.
Kolaborace s vyhledávači
Kolaborativní přístup má být jednou z dalších zbraní vyhledávačů. Známá je samozřejmě Alexa a její spolupráce s vyhledávači, podívejme se ale třeba na StumbleUpon. V tomto případě jde o software, který sleduje, jaké stránky používáte (činí tak lištičkou v prohlížeči) a jak je hodnotíte. Podle toho vám dokáže vybrat další vhodné stránky na určitá témata – samozřejmě porovnává váš vkus se vkusem jiných uživatelů a doporučuje vám jimi kladně hodnocené stránky.
Podobným systémem je bookmarkový systém Delicious. Ten vás provádí světem záložek a autoři jej přímo nazývají „social bookmarks manager“. Funkce je zase založená na kolaborativnosti: komparací vašeho vkusu se vám doporučují bookmarky, které by se vám mohly líbit. A funguje to zajímavě, mně to hned z kraje doporučilo hezkou stránku věnovanou návrhu firemního loga, což jsem si se zájmem prošel…!
Problémy? Jsou, jistě…
Kolaborativní software nemá jen výhody, má i svoje nevýhody. Především je náchylný na různé chytristiky uživatelů – kupříkladu dosáhnout dobré pozice na stránce, která pozici vyhodnocuje na základě kolaborativního filtrování, je jednoduché: stačí klikat a klikat na svůj odkaz, dokud se nedostane nahoru. Kolaborativní algoritmy se proti takovým technikám musí bránit.
Stejně tak jsou napadnutelné lidskou chybou: když omylem označíte email jako spam, co s tím? Jak tento omyl detekovat a rozpoznat? Kolaborativní filtry to většinou řeší další kontrolou a citlivým nastavením hranic i tolerancí, například pokud více jak 90 procent lidí označí email za spam a těch lidí je minimálně tisíc, lze už jej za spam považovat. V případě tak citlivém, jako je spam, se kolaborativní filtry stávají spíše více či méně důležitým doplňkem jiných filtrů – to podle toho, jak který výrobce věří tomu, že na užívání svého produktu dokáže zlákat rozhodující masu uživatelů.
Kolaborace a social networking
Kolaborace nekončí u textů a Internetu, posouvá se i do mezilidských vztahů. I tady je předpoklad jednoduchý: pokud je někdo sympatický někomu, kdo má stejný vkus jako vy, mohl by být sympatický i vám. Tak se například rozhoduje Friendster jako „new way to meet people“. A není asi zbytečné se domnívat, že podobnou cestou se vydá i nedávno spuštěný Orkut – to samozřejmě v době, kdy už nabere kritickou masu uživatelů.
Podobně si můžete hledat přátele i na starém dobrém IRC – k tomu zase existují softwary jako PieSpy, přezdívaný autorem jako „social network bot“.
Na Internetu najdete řadu dalších materiálů věnovaných kolaboračnímu software a hlavně dnes ještě módnějšímu „collaborative networking“. Pokud právě píšete business plán své firmy pro amerického investora, nebude na škodu toto slovní spojení párkrát zmínit. Ale opatrně – serverů, které na kolaboraci a social networkingu (SN) staví svoji budoucnost, je na Internetu už docela dost. Pokud tyto hype slova použijete jako koření obchodního záměru, rozhodně nešlápnete vedle…