Nadace Johna S. a Jamese L. Knightových chce ve víru technologických změn podpořit profesi, která si umí posvítit do temných koutů státní správy a držet zkrátka rozhazovačná ministerstva, úplatné poslance i místní zastupitele. Proto rozděluje už pátým rokem vždy přibližně pět milionů dolarů mezi autory neotřelých nápadů, které by důkladné žurnalistice pomohly přežít ekonomický kolaps tištěných médií a zachovat ji pro novou dobu, v níž nejdůležitějším komunikačním médiem je internet.
Za pět let nadace posoudila 12 tisíc neziskových i komerčních projektů z celého světa a 76 z nich podpořila celkem 27 miliony dolarů. K nejznámějším vítězům minulých ročníků patří vlajková loď lokální datové žurnalistiky EveryBlock, washingtonské Newseum, nebo třeba sdružení Ushahidi, jež vzniklo při násilnostech po keňkých volbách v roce 2008 a nyní se věnuje rozvíjení nástrojů pro sběr, třídění a publikování informací získaných metodou crowdsourcingu při komplikovaných a rozsáhlých událostech jako jsou války, živelní pohromy, stávky či revoluce.
Nejnápadnějším trendem mezi oceněnými weby je letos snaha o lepší využití, zpřehlednění a strojové zpracování již existujících obřích souborů dat, ať už pocházejí od vlád nebo od jednotlivců propojených díky internetu do účinně spolupracujících sítí. V tomto ročníku byly přihlášky poprvé rozděleny do čtyř kategorií: mobilita, autenticita, udržitelnost a komunita. Co si pod tak obecnými termíny představit? A kdo tedy letos vyhrál? Proklikejte si tabulku s výsledky.
Název | Co nabízí | Přidělená dotace (USD) |
iWitness | agregátor obsahu publikovaného v sociálních médiích při velkých zpravodajských událostech | 360 000 |
Overview | webová aplikace vyvíjená agenturou Associated Press má novinářům pomoci hledat a vizualizovat souvislosti a témata v obrovských souborech dat, například ve stozích soudních dokumentů | 475 000 |
Awesome Foundation | rozdělování tisícidolarových mikrograntů mimo jiné na pokusy s lokální občanskou žurnalistikou | 244 000 |
PANDA | zatímco velké noviny v USA mívají na práci s vládními databázemi vyčleněné rozpočty i specializované datové novináře, lokální média jsou na tom hůř a navíc se musí potýkat s méně kvalitními daty jednotlivých měst a států; projekt PANDA deníku Chicago Tribune jim chce přinášet open-source webové nástroje a návody, jak s daty pracovat | 150 000 |
DocumentCloud Reader Annotations | nástroj oceněný už v roce 2009 již používají stovky redakcí k efektivnější spolupráci při zkoumání rozsáhlých dokumentů jako byly ty zveřejněné organizací WikiLeaks; grant udělený letos umožní do tohoto procesu lépe zapojit také četnářstvo | 320 000 |
FrontlineSMS | software pro rozesílání zpráv obyvatelům rozvojových zemí na mobilní telefony přes SMS | 250 000 |
Zeega | open-source software, ve kterém si může kdokoli vytvořit interaktivní dokument složený z textu, videa, fotek nebo map a publikovat ho ve formátu HTML na web, mobily i tablety | 420 000 |
State Decoded | nepřehledná státní legislativa a judikatura prezentovaná tak, aby ji dokázal pochopit i prostý občan – přehledné formátování, vložené vysvětlivky a definice, propojení s Twitterem a Google News, otevřené API | 165 000 |
Poderopedia | crowdsourcovaná databáze má zpřehlednit vztahy mezi bohatými a mocnými a upozornit na střety zájmů | 200 000 |
NextDrop | propojí vodárny a 800 tisíc obyvatel indického města Hubli informačním systémem založeným na SMS zprávách, takže se lidé včas dozvědí, kdy v jejich čtvrti či ulici poteče voda, která je tu velmi vzácná | 375 000 |
Spending Stories | dodá širší kontext do článků zabývajících se utrácením či šetřením veřejných peněz – například kolik se za stejnou položku utratilo ve srovnatelné zemi či v sousedním okresu; metodou je zčásti strojová analýza dat, zčásti práce přes internet propojených lidí, které baví se v rozpočtech rýpat | 250 000 |
Public Laboratory | sběr dat pro vědecké účely s využitím místních komunit a jednoduchých kutilských technik – například pomocí balonků naplněných héliem a digitálních fotoaparátů se loni podařilo přesně zmapovat rozsah ropné skvrny v Mexickém zálivu | 500 000 |
ScraperWiki | dává dohromady zájemce o data dostupná věřejně na internetu a programátory, kteří je umí pomocí „scrperů“ vytěžit a uložit ve strukturované, strojově zpracovatelné podobě | 280 000 |
Tiziano 360 | vybaví místní obyvatelstvo technikou, tréninkem a webovou platformou, která umožní novnářům z lidu popisovat v přitažlivé multimediální formě popisovat své zážitky a problémy, s nimiž se jejich komunity potýkají; pilotní projekt se zaměřil na obyvatele Kurdistánu | 200 000 |
OpenBlock Rural | univerzitní projekt má pomoci malým lokálním a komunitním novinám v Severní Karolíně sbírat, agregovat, analyzovat a publikovat data státní správy a samosprávy, například o kriminalitě, nemovitostech či úrovni škol | 275 000 |
Ushahidi: SwiftRiver | pomáhá novinářům, ale také třeba humanitárním pracovníkům sledovat a třídit příliv informací ze sociálních sítí, ověřuje je, zda pocházejí od nezávislých zdrojů, odstraňuje duplicitní zprávy a určuje relevanci těch, které po filtrování zbydou | 250 000 |
Zatímco dat hodných hlubší analýzy přibývá závratnou rychlostí, novináři, kteří by měli čas jít pod jejich povrch a nacházet v nich zajímavé a důležité souvislosti, chybějí. Na pomoc jim musí přijít stroje. Velmi užitečné mohou například při prosívání zpráv ze sociálních sítí (iWitness, Ushahidi SwiftRiver), při analýze primárních zdrojů jako jsou vládní dokumenty uniklé v kauze Wikileaks (Overview, Document Cloud Reader Annotations), to vše se dá částečně crowdsourcovat a výsledky převyprávět veřejnosti lehce stravitelným způsobem pomocí nových publikačních platforem (Zeega, Tiziano 360). K tomu pak přistupuje tradiční americká péče o informovanost lokálních komunit (PANDA, OpenBlock Rural). Jenže ty v Evropě a u nás fungují hodně odlišně.
Účetnictví nuda je, má však cenné údaje
Není na světě mnoho věcí nudnějších než veřejné rozpočty. Přitom ale právě jejich kvalita úzce souvisí s kvalitou demokracie, s mírou korupce, s tím, jestli mají občané ze země, kde žijí, docela dobrý pocit, nebo jsou z ní spíš otrávení. Vtáhnout občany do světa fádních, ale o to důležitějších čísel, slibují Spending Stories, projekt britské Open Knowledge Foundation. Že umí mimořádně komplikované soubory dat přetavit v zajímavou a každému daňovému poplatníkovi snadno srozumitelnou interaktivní grafiku, už dokázala dvěma staršími a stále působivými vizualizacemi rozpočtů.
Na Where Does My Money Go si britský občan nastaví svůj roční příjem, klikne a hned vidí, že každý den přispívá například na armádu třemi librami a jedenadevadeáti pencemi, na kulturu librou třicet devět a na důchodce a sociálně slabé jedenadvaceti librami a šestaosmdesáti pencemi. Může tyto údaje srovnávat s uplynulými lety nebo třeba se spoluobčany žijícími v jiných regionech a platících odlišné daně. Chtěli byste něco takového také pro nepřehledný český rozpočet, o němž se dlouhá léta říkalo, že mu vlastně opravdu rozumí jen jeden jediný muž?
Také Open Spending od stejných autorů nechává občany nahlédnout do nepřehledné struktury veřejných financí a pochopit, kam vlastně všechny ty peníze mizí. Příslušná data přitom může do sytému vložit kdokoli, proto jsou tu vedle britského rozpitvány také italský či izraelský státní rozpočet. Český zatím chybí, ale co není, může být.
Rovněž chilská Poderopedia („Encyklopedie mocných“), která mapuje vztahy mezi ekonomickými a politickými špičkami země by mohla v Česku najít dobré uplatnění. Potřebovala by ale osvíceného investora, nebo nadaci, která by zaplatila práci profesionálních ověřovačů údajů získaných crowdsourcingem. Dobrým výchozím bodem by mohla být přehledná vizualizace vztahů zaznamenaných v obchodním rejstříku, dostupná také u nás od letošního jara zdarma (dlouhá léta ji některé firmy nabízeli jako draze placenou službu).
Vizualizovat tato data není snadné, ale získat přístup k jejich aktuální verzi ve strojově zpracovatelném formátu nejlépe přes veřejné API – to je v České republice i v roce 2011 stále hudba daleké budoucnosti. Kdo si chce s obchodním rejstříkem, ale i s většinou ostatních veřejných databází, takto zahrávat, musí si naprogramovat tak zvaný scraper a „pokoutně“ je stahovat. Scraper Wiki oceněná 280 tisíci dolarů od Knightovy nadace slouží právě k tomu, aby dala dohromady zájemce o podobné sady dat a programátory schopně takový nástroj pro parsování dat z webových stránek napsat. Mezi stovkami prozkoumaných a zpracovaných datových zdrojů z celého světa lze už najít první české vlaštovky.
Není to jediný důkaz toho, že také u nás se zájem o datovou žurnalistiku pomalu probouzí. Pozornost mainstreamových médií upoutal na začátku roku projekt na hodnocení veřejných zakázek zIndex. V únoru k nejzajímavějším přednáškám na vsetínském Barcampu patřila Datová žurnalistika v Brně Jana Bočka. V ní posluchačům představil propracovaný datažurnalistický projekt Mapy hazardu. Na jaře se příznivci otevřených dat setkali na celodenním semináři Big Clean. První pokusy s počítačovou analýzou a vizualizací rozsáhlých dat dělají i tradiční noviny. A minulý týden vznikl český Datablog inspirovaný stejnojmenným projektem britského Guardianu.