Pokud jsem správně otázku pochopil, tak děláme i to. Pro jistotu to přeformuluju vlastními slovy: pokud je na zahraniční doméně česky psaná stránka, tak stáhneme i všechny cíle odkazů z ní.
Pan Illich dobre vi o cem mluvi.
Napr vyhledavaci engine Morfeo od Centrum.cz je mozne ziskat za 1/4 cenu. Navic s kontextovym systemem adFOX za Morfeo neplatite vubec nic, jeste jako provozovatel na vydelate na PPC modelu.
Kdezto Jyxo stoji od 40 tisic nahoru a obchodni model typu PPC Jyxu chybi jako praseti drbani.
A to jeste velmi osklivou fotku (ve smyslu kvality snimku, s layoutem obliceje toho moc neudelaji) :-)
Nicmene tenhle pripad ukazuje, ze soucasne hledani v obrazcich ma hodne velke rezervy. Nehleda totiz v obrazcich, ale v textu okolo. Relevance takoveho vyhledavani je, priznejme, neprilis velka.
Zajimave je, ze i kdyz ma google z hlediska vyhledavani potencialne zajimavy web picasa, u ktereho je mozne ocekavat relevantnejsi vysledky, nevyhledava v nem.
Takže neděláte "Každý odkaz, který vede z české [domény] do zahraniční domény, prozkoumáme a pokud je výsledná stránka napsána česky zařadíme ji do indexace." , ale "Každý odkaz, který vede z české=česky psané stránky, prozkoumáme a pokud je výsledná stránka napsána česky zařadíme ji do indexace."
Ale špatně jsem si to asi vyložil spíš já. Nebylo mi ve Vaší odpovědi ve článku příliš jasné, co je "vede z české", proto jsem se chtěl ujasnit a teď vímě, že nebylo myšleno z české domény. Tohle chování je celkem podstatné. Díky za upřesnění.
Strategie některých jiných SE svého času byly takové, pokud byly popsané správně a interpretoval jsem je správně, že projely nějaký katalog českého internetu, odkazy na weby mimo .cz z katalogu načetly a zaindexovaly, ale příliš se už nevěnovaly odkazům z těchto stránek na jiné než .cz domény vedoucích mimo .cz.
Jak to ten Google má jednoduché, když ho nezajímá při crawlingu hranice domén ani jazyků...
No ja nemluvim o to, co google pripravuje, ale o tom, co provozuje. Moje alba (tykajici se letadel) na Picase jsou verejna a vyhledatelna - bohuzel (z hlediska relevance) pouze na Picase.
Pokud vim, na Picase je relativne jednoduche vyreportovat to, co neodpovida tagum - na rozdil od webu. Co se tyce obrazku, myslim, ze tagovat a vytvaret webovy spam je zhruba stejne narocne ;-)
Co se tyce problemu hledani v oblicejich, problem neni v tom, ze by neznal oblicej Michala Illicha hledajici. Problem je, ze ho nezna Google. Ostatne, kdysi jsem o tom psal, tusim i Lupe, v clanku o vyhledavani videa. Z tohoto hlediska by mel Google koupit nejaky nejmenovany stat, ktery vyzaduje viza. Pak bude mit spoustu obrazku obliceju i s prislusnymi metadaty :-)
A kdo to vase spickove hledani ve zbozi zna a pouziva? Pustte do sveta cisla a ne jen reci o tom jak jste dobri. Fakta mistre a ne reci. Zatim jste tady jen mluvil o tom jak jste dobri ale cisla zadne. Myslim, ze Vam ujel vlak.
Jak jste na tom s indexací domén, které nemají koncovku .cz?
"Každý odkaz, který vede z české do zahraniční domény, prozkoumáme a pokud je výsledná stránka napsána česky zařadíme ji do indexace."
Pokusím se tu zeptat - jak by asi vzrostla náročnost na systém, kdyby crawler zkoušel stránky schované za odkazy i v případě české stránky mimo doménu .cz? A byla by tam nějaká výtěžnost?
Martine Hruško, kdysi jsem si myslel, že jste odborník na slovo vzatý, který do diskusí přispívá, aby upozornil na nedostatky, kterých si díky své odbornosti všimnul.
Po té co jste začal úroveň manažera posuzovat podle množství hrubek v jeho textu, jsem si začal všímat, že vaše příspěvky nejsou odborné, ale spíše arogantní a vlezlé.
Kde se ve vás bere ta povýšenost? Jako velkovezír se chováte spíše vy sám. Vy jediný rozumíte všemu, byl jste všude a od všeho máte klíče?
Jméno "Martin Hruška" vidím jen v diskusích. Co jste kromě arogantní a namyšlené kritiky dokázal? Možná umíte výborně česky a také skvěle odsuzovat lidi. Co umíte ještě?
Nikdo nevíme, co vše Google dělá za pokusy, jak vytěžuje tagování obrázků, kolik z jeho compů teď prohání obrázky skrz neuronové sítě. Možná by byl s hledáním ve fotobankách typu Picasa problém kvůli tomu, že by lidi tagovali o106 nesmyslné obrázky s nějakou reklamou, aby se prodrali do výsledků. Je mnohem těžší udělat smysluplnou stránku s podvrženým reklamním obrázkem než otagovat nesmysly reklamy. Možná Google chrání i soukromí a bere ten obsah jako soukromý a nechává na lidech, co nechají aspoň nějak vyhledávat. Defaultně tam vidím "Your public albums are not included in Picasa Web Albums community search. Change this setting"
Koukám, že na Flickru je několikrát "Illich" jako transkripce osoby jménem Ильич Ульянов, dotaz tedy hází jako výsledky věci jako ttp://www.flickr.com/photos/jries/70227217/. Michalovi Illichovi se tímto moc omlouvám. Jako V.I. Lenin se vždy prezentoval přece Yuhů z jiného fulltextového týmu.
Já mám taky svůj vyhledávací problém, mám jmenovce Libora Nováčka, mladšího o pár let, moc úspěšného klavíristu, působícího v zahraničí, takže vždy když hledám, kdo zase umístil nějaké mé pikantní foto na net, musím se šikovně zbavovat pianistů :-)
V hledání obrázků na Googlu lze aspoň omezit na hledání obličejů, krásný příklad s hledání Paris v obrázcích - http://images.google.com/images?q=paris&imgtype=face Ovšem na Michala Illich je zrovna ten filtr docela na nic - ukáže se foto Čunka, Dany Bérové a dalších. Kdo neví, jak MI vypadá, je mu hledání na nic. Snad jen pojmenování souboru jeho jménem může být jistým pomocným vodítkem.
No, tak s tím Atlasem nemáte pravdu, tam jej nahradil až nyní Seznam a to jen ve fultext... v ostatních (zboží, obrázky atd...) jyxo zůstalo... Sám Michal Illich to v jednom nedávném článku k přechodu Atlasu na Seznam zmínil... A mám pocit, že i u toho Seznamu budu mít pravdu, opět jsem to tuším někde četl v rozhvoru s Lukačovičem...(ale stopro si jistý nejsem)
Osobne jyxo pouzivam k hledani zbozi a porovnavani cen na jednotlivych shopech a sem velice spokojen, s timto asi nema jyxo v cr velkou konkurenci (i kdyz uvidime co predvede miton s www.heureka.cz).