Proč jsou pro web důležité náhodné odkazy

24. 8. 2007
Doba čtení: 5 minut

Sdílet

Budoucnost. Zdroj: sxc.hu Autor: 74287
Budoucnost. Zdroj: sxc.hu
Má Internet blíže k hierarchické, nebo náhodně propojené síti? Jakým dalším strukturám se podobá? Je třeba analogií fungování vazeb existujících v lidské společnosti nebo v jiných biologických systémech? Jak souvisí Internet a poměrně známý koncept „světa na šest kroků“, mají snad obdobu webové pavučiny také bakterie?

Nedávno se na trhu objevila kniha s názvem Staré pověsti (po)zemské. Jde o docela netradičně pojatou historii života na Zemi, kterou napsali Anton Markoš a László Hajnal z pražské Přírodovědecké fakulty UK. Byla by škoda, kdyby knihu četli pouze biologové a zbytek světa zcela minula (název tedy rozhodně nevybízí k tomu, aby po publikaci sáhli odborníci na TCP/IP), a proto vznikl následující článek.

Autoři textu pohlížejí na biosféru jako na síť, kterou neustále tečou chemické látky. Důležité nejsou ovšem tyto molekuly jako takové, ale spíše jimi nesená informace. Po molekulárně-biologické revoluci čeká vědy o živé přírodě revoluce informační. Budoucnost biologie nás z hlediska náplně Lupy samozřejmě nemusí zajímat, při tomhle pohledu nicméně není divu, že autoři se dostanou k povaze sítí – ať už je chápeme jako abstraktní matematickou strukturu, síť sociálních interakcí nebo třeba Internet. Přitom uvádějí celkem známé koncepce, o kterých jsme psali už i na Lupě  – třeba na tzv. koncept „šesti stupňů odloučení“, podle kterého spojuje v podstatě libovolné dva lidi na Zemi síť známých, která by neměla mít více než šest kroků. Zajímavé je, že třeba e-mail tento stav zase tolik nezměnil a vzdálenosti mezi lidmi nezkrátil.

Co dělá svět malým

Autoři v zásadě rozlišují sítě do tří skupin:

  • pravidelné,
  • náhodné,
  • sítě malého světa.

Pravidelná síť může mít buď hierarchickou strukturu s „hvězdou“ uprostřed nebo může být třeba každý bod spojený s každým či každý bod s dalšími dvěma „po obvodu“. Náhodná síť je prostě náhodná. Nejzajímavější vlastnosti vykazují tzv. „sítě malého světa“, jakési kombinace obou předešlých struktur, snad jakási analogie systémů na pomezí řádu a chaosu v chemii a fyzice. Když už jsme zmínili „šest stupňů odloučení“ (vlastně překvapivě málo), je asi jasné, že současná lidská společnost i Internet patří právě do této třetí skupiny. Tím se primárně myslí samozřejmě provázání jednotlivých stránek odkazy a způsob, jak se sítí šíří informace – nejde o fyzickou infrastrukturu ani třeba o doménový systém.

Jaký typ vazeb v sítích malého světa převládá? V jeho základu stojí pravidelná síť (samozřejmě ne toho typu, kde je každý bod spojen s každým), ke které je přidáno velmi málo, třeba 1 % náhodných propojení. Tímto způsobem dramaticky klesne průměrná vzdálenost mezi jednotlivými body. Můžeme si to ilustrovat na příkladu shánění zaměstnání. Ačkoliv se celý proces v poslední době asi trochu mění (formalizuje), stále platí, že jednotlivé práce si mezi sebou nejčastěji dohazují známí. Nejde ovšem o blízké kamarády, kteří spolu pravidelně chodí na pivo, ale spíše o vzdálené náhodné známé, k nimž obvykle nemáme žádný osobní vztah – známé známých. Tato skutečnost se nejjednodušeji vysvětluje tak, že s blízkými přáteli sdílíme informace přímo; co vědí oni, vím i já, těžko mi mohou tedy dohodit nabídku, na kterou bych nenarazil i sám. Okruh „blízkých známých“ by se dal považovat za pravidelnou síť (kde jsou téměř všichni propojeni se všemi). K určité informaci (nabídka zaměstnání), která leží mimo tento okruh, se dostaneme v reálném čase jenom díky několika náhodným propojením. Jak vidno, povrchnost ve vztazích se vyplácí, alespoň tedy v našem případě.

Příkladů těchto sítí existuje celá řada i mimo lidskou společnost. Přímo k Internetu autoři přirovnávají genetickou síť u prokaryontních organismů (to jsou ty, které v buňce nemají jádro, řekněme „bakterie“). Důležité je, že vzhledem ke způsobu, jak tyto organismy fungují, je pro ně mnohem jednodušší vyměňovat si genetický materiál a používat ho (nám bohužel alespoň prozatím není dáno, když u svého souseda spatříme nějakou zajímavou vlastnost, od něj získat kopii odpovídajícího genu a zabudovat si ji do vlastního genomu). Říká se tomu horizontální přenos genetické informace, na rozdíl od přenosu vertikálního, tj. rodič-potomek. Protože se bakterie k informaci musí dostat v reálném čase, typ sítě, který k tomu zvolily, je právě sítí malého světa. Dělá nám to i starosti: jakmile se jednou třeba někde objeví rezistence k antibiotiku, šíří se velice rychle, a to také horizontálně. Bakterie si ovšem mezi sebou nepřenášejí jen informace v podobě genetického materiálu, ale komunikují spolu i pomocí celé řady chemických signálů.

(Tady předpokládáme, jako by bakterie spolu v dojemné shodě kooperovaly. To může znít divně, každopádně to ale neznamená, že mezi sebou současně nesoupeří a že mezi nimi nedochází k přírodnímu výběru. Vysílají si také signály „záměrně“ klamné, nebo takové, kterou jsou srozumitelné jen někomu, nikoliv však konkurentovi – tedy jakási obdoba šifrování. Pro nás je však v našich úvahách o sítích důležitá spíše rychlost celé komunikace než „motivace“ jejích účastníků.) Podobně se rychlý přenos informace využívá v živé přírodě i jinde, výsledně můžeme často pozorovat „koordinované“ chování.

Náhoda a Google

Zpět k sítím počítačovým. Bez náhodných propojení, i když jich stačí málo, by se Internet rozpadl na téměř izolované skupiny, respektive cesta z jakéhokoliv bodu jinam by trvala strašně dlouho. Tady samozřejmě vyvstává jedna vážná námitka: Takto by to fungovalo, pokud bychom skákali po klasických hyperlincích a nepoužívali vyhledávače.

Takový Google dnes ovšem můžeme pokládat za téměř univerzální katalog všeho, na co na webu vede zvenku nějaký odkaz. Máme tedy před sebou kromě naší „hyperlinkové“ sítě malého světa navíc pravidelnou síť s jediným centrem, které je propojeno strašlivě hustou pavučinou s téměř všemi dalšími body. (Což je vlastně přímo opak původních záměrů, když byl Internet za studené války záměrně navržen jako distribuovaná síť, kterou by nešlo vyřadit jediným úderem proti jejímu centru. Síť mezi bakteriemi může být z řady důvodů těžko tohoto typu, nicméně i kdyby náhodou k takovému druhu propojení směřovala, byla by pak velmi zranitelná.)

MM 25 baliček

Nicméně se zdá, že i ve světě Googlu mají náhodná propojení svoji vážnost. Samozřejmě nevím, jak přesně funguje řadící algoritmus Googlu, předpokládá se však, že do určité míry zohledňuje právě tohle: odkazy ze samotného serveru ani odkazy mezi servery patřícími do stejné stáje nejsou hodnoceny nijak vysoko. Vysoce hodnocená jsou naopak propojení, která směřují napříč jednotlivými „ostrovy“.

Možná by stálo za úvahu se touto optikou podívat na to, jaké internetové projekty mají větší šanci na úspěch. Ty, které tvoří tvrdé jádro nadšenců, nebo spíše takové, které občas mírně zaujmou někoho vně natolik, že na ně udělá odkaz, ač je mu to celé vlastně šumafuk? Nevzniká třeba v rámci opěvovaného Webu 2.0 obsah, který sice s velkou slávou vytvářejí samotní uživatelé aplikace, ale mimo ně už nikoho nezajímá? Na to by se zase dalo namítnout, že množství odkazů a pozice ve výsledcích vyhledávání přetavená v návštěvnost nemusí mít zase tolik společného s komerční využitelností (pro inzerenta mohou být zajímavé právě úzce vyprofilované, de facto uzavřené skupiny), tyhle otázky by nás však od bakteriálního webu odvedly příliš daleko…

Přečtete si knihu Staré pověsti (po)zemské?

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).