Skutečnost, že katalog Klikni vykazuje nadměrné množství chyb a nepřesností už zjistil asi každý, kdo v něm zkoušel něco vyhledat. Chybovat je samozřejmě lidské, katalog Klikni však obsahuje chyb a nedostatků tolik, že to až bije do očí.
Podívejme se podrobněji na druhy chyb, které se v katalogu vyskytují nejčastěji:
1. Překlepy a pravopisné chyby
Mohlo by se zdát, že překlepy jako „archiv fotogragií, stránky pro dostpělé, sexxshop, vidoekazety“ vznikly tím, že katalogizátory rozrušilo prohlížení erotických stánek (navíc v rušném pracovním prostředí). Překlepy a pravopisné chyby ale obsahují i zcela obyčejné kategorie. „Sexxshop“ tak přijde o návštěvníky, kteří jej budou hledat jako sexshop, ale stávají se i horší věci.
2. URL zdroje často absolutně nesouhlasí s anotací či titulkem
Tuto chybu si můžeme ukázat dokonce i na záznamu (jednoho z mnoha) o našem serveru Lupa
Lupa
Server o českém internetu. Obsahuje množství informací z různých oblastí života společnosti. Doménová centrála, zpravodajství.
Sekce: Internetové zpravodajství, Technické zpravodajství, Internet
www: http://www.hokejka.cz
Katalogizátoři pracovali se „slepou“ databází URL a vše nasvědčuje tomu, že i s databází českých domén. Jak je vidět na příkladu s Lupou, v době tvorby katalogu URL http://www.hokejka.cz odkazovalo na stánky Lupy, což nikomu z katalogizátorů při tvorbě záznamu nevadilo. I jinak jsou často záznamy s jedním URL v katalogu mnohonásobně, občas pak zařazeny zcela v neodpovídajících kategoriích.
3. Anotace obsahují zbytečné informace, důležité pak vůbec
Mnoho anotací začíná velmi popisným či přímo „vypravěčským stylem“, např.: server obsahující informace… informace o… představení toho či onoho… ceník… objednávka… kontaktní adresy… e-mail. Místy najdeme perly typu „Uvdeny veškeré informace o firmě a její činnosti“ (uvádíme i s překlepem) nebo „Stránka poskytuje informace“.
Informace či adresu firmy spolu s e-mailem jistě očekává na WWW stránkách firemní prezentace každý. Pokud by uvádění těchto informací bylo součástí metodiky tvorby katalogu, měl by je pak obsahovat každý záznam – to ale neobsahuje. Často chybějí názvy značek produktů a služeb, které jsou v působnosti katalogizovaných subjektů. Katalog je prostě chudý na jména značek, které v jiných katalozích majitelé stránek ve svých záznamech potřebují prosadit a které ve svých popisech uvádějí. Navíc „vyprávěčský styl“ způsobuje, že mnoho záznamů obsahuje termíny v jiném pádě než prvním. Např. termín „opravna“ tedy uživatel najde spíše jako „(stránky) opravny či (informace o) opravně“, což činí navigaci pomocí fulltextového prohledávání katalogu značně složitější. U konkurenčních katalogových služeb se spíše setkáváme s popisem, který se ztotožňuje s prvními pády slov, které pravděpodobně uživatel spíše využije při vyhledávání.
Mravenčí práce
Pojďme se podívat, co by mohlo být příčinou tohoto nezdaru. Podařilo se nám malinko pohlédnout pod pokličku tvorby tohoto katalogu. Informace jsme získali od člověka, který se jako student-brigádník spolupodílel na tvorbě tohoto katalogu a který si nepřeje být jmenován. Tvorba katalogu se odehrávala v prostorách firmy PROFESSIONAL CALL CENTER SOLUTIONS, s. r. o. v Čestlicích u Prahy. PCC Solutions, jak se občas sama zkráceně tato firma přezdívá, je též podle internetového obchodního rejstříku majitelem společnosti SHOPCENTER.CZ, s. r. o., která provozuje na stejnojmenné adrese SHOPCENTER.CZ elektronický obchod. Tento obchod se z pohledu uživatele jeví, díky menu iDnes v horní a dolní části obchodu, jako integrální součást portálu iDnes. PCC Solutions je především telemarketingová firma a call centrum. V minulosti již ale pro společnost MAFRA pomáhala zpracovávat např. jejich soutěž MOTYNKA.
V Čestlicích na katalogu pracovalo podle odhadu našeho informátora vždy minimálně dvacet lidí. Placeni byli personální agenturou, náš člověk dostával 50 korun čistého na hodinu. Nejprve prý byla práce měřená podle množství vytvořených odkazů za hodinu. Výkonnostní laťka nastavená na 14 záznamů za hodinu však byla postupem času přehodnocena a šéfové začali žádat kvalitu před kvantitou. Přesto však podle našeho informátora nebylo výjimkou, že brigádníci zneužívali připojení k Internetu poskytnuté k práci pro soukromé účely – vyřizovali si e-maily, posílali SMS. Aby pak tento čas nahnali výkonem, stávalo se, že navštívili stránku, zkopírovali některou ze stěžejních vět prezentace z domácí stránky a záznam byl pro ně hotov.
Katalogizátoři prošli – a někteří i několikrát – zaškolením. Je tedy s podivem, že výsledek práce jednotlivých pracovníků je v mnohých případech velmi špatný. Katalogizování Internetu není jednoduchá záležitost ani pro profesionály, např. knihovníky, kteří mají k problematice pořádání informací velice blízko. Na začátku požadované tempo analýzy stránek a následné tvorby anotací lze z knihovnického hlediska označit za přímo vražedné.
Každý záznam ještě kontrolovala další osoba, náš člověk se domnívá, že nešlo o obyčejné brigádníky, ale o řádné zaměstnance. Pokud se jim záznam nelíbil, mohli jej buď změnit nebo zadat popisovanou adresu znovu do databáze určené ke zpracování.
Z hodinové mzdy brigádníků, pokud by dodržovali vysoké tempo 14 odkazů za hodinu, by se při uváděném počtu 100.000 záznamů dalo spočítat, že si brigádníci přišli na 357.000 korun. PCC Solutions však brigádníci nepřišli na pouhou jim vyplácenou mzdu, agentuře vyplácející tyto brigádníky musela zaplatit firma desítky procent navíc. Navíc tempo 14 dokazů za hodinu je vražedné a další pracovníci se zabývali kontrolou. Zdarma není ani připojení k Internetu a provoz počítačů, koordinace projektu. Společnost se jistě do projektu pustila i kvůli zisku. Náklady na tvorbu takto rozsáhlého katalogu se pak celkově mohou hravě přehoupnout daleko přes milion korun.
Říká se, že kdo šetří, má za tři. Trojku by možná s odřenýma ušima dostalo Klikni v Internetové škole. :-) Díky nekvalitně provedené práci se však provoz katalogu v jeho začátcích společnosti MAFRA notně prodraží. Další pracovní síly nyní budou potřeba na to, aby opravily záznamy uživatelů. Uživatelů, kteří budou mít to štěstí, že zaznamenají existenci tohoto nového katalogu a zjednají si vlastnoručně nápravu.
Samozřejmě nevíme, zda třeba veškeré reklamace nepadají na hlavu zpracovatele či zda se na tvorbě katalogu nepodílel ještě někdo jiný. Je škoda, že přestože společnost MAFRA nedávno vstoupila do společnosti Mobil Media, která ještě nedávno sama jeden katalogový server provozovala, pustila se do tvorby katalogu zcela od začátku.
Výše popisovaný případ Klikni jen vysvětluje důvod, proč lidé tak rádi používají katalogový vyhledávač na Seznamu (či americkém Yahoo!). Tento katalog totiž vznikal převážně tím způsobem, že záznamy do něj přidávali téměř od samého počátku Internetu sami majitelé stránek. A jedině majitel stránky ví nejlépe, jak popsat jádro svých služeb. S tímto faktem v budoucnosti málokdo něco udělá. A přinutit tvůrce stránek, aby používali některý z rodících se standardů pro popis obsahu stránek pomocí meta informací (např. Dublin Core Metadata), se jeví v příštích několika letech jako nereálné. Samy tyto standardy totiž mají daleko k dokonalosti. MAFRA se pustila do louskání tvrdého oříšku, navíc v době kdy se zdá, že pro budování katalogů od nuly je už i ten náš český Internet přiliš rozjetý.