Hlavní navigace

Benedikt Kotmel (Operátor ICT): Datovou platformu vydáme jako open source. Dat je moc, ale málo se používají

1. 3. 2019
Doba čtení: 9 minut

Sdílet

Umíme posbírat obrovské množství dat o Praze, teď ale musíme s politiky mluvit o tom, jak je konkrétně použít ve prospěch města, říká šéf pražské Datové platformy.

Máme více přístupů k datům, než dokážeme zpracovat, říká v rozhovoru pro Lupu šéf Datové platformy hlavního města Praha Benedikt Kotmel. Projekt, který vyvinula městská firma Operátor ICT, se chystá vstoupit do ostrého provozu. Ještě předtím ale platformu čeká zásadní změna: přechod z dosavadního technického řešení, nakoupeného u externích dodavatelů, na řešení vlastní. Ta má být založena na open source technologiích a Operátor ICT je chce zdarma nabídnout i dalším městům v Česku i v cizině.

Platforma zároveň řeší další problém: jak přesvědčit magistrát a městské části, aby nasbíraná data skutečně používaly pro řešení konkrétních problémů. „Nějaké výsledky tady jsou, ale není to tak, jak si to možná často někdo představuje: že se posbírají nějaká data a okamžitě je někdo začne používat,“ popisuje Kotmel.

Mluví také o nově vyvíjeném nástroji na zpracování dat od mobilních operátorů, výsledcích pilotního projektu chytrého osvětlení v Karlíně, analýze Airbnb nebo zelených střech a dalších projektech, které na datové platformě běží.

Jaké nejzajímavější datové zdroje jste pro pilotní provoz do Datové platformy získali? 

Máme třeba real-time data z Waze o stavu dopravy v Praze. Nemůže je zveřejnit, to nám Waze nedovolí, ale rozhodně se dají využít pro strategické plánování a rozhodování města, monitorování situace a porovnávání stavu před a po nějaké změně. Můžete třeba detekovat dojezdovou dobu a říct, že se třeba dnes něco změnilo a z dat exaktně víte, jaký dopad to mělo na řidiče.

Máme také přístup k řadě dat, která není složité technologicky zpracovat, ale není možné je využít jinak než k jejich prvotnímu účelu. Typicky jde o strategické dopravní detektory, které monitorují, jaká vozidla projíždějí Prahou – měření je buď bodové, nebo úsekové. Ale když z těchto dat chcete udělat nějakou analýzu nebo živý model, který by dokázal půl hodiny dopředu predikovat, co se bude dít, musíte ta data hodně čistit a třeba půl roku na tom pracovat. Jsou to totiž záběry z kamer, na kterých jednou svítí slunce, podruhé sněží, náhodně vám vypadávají… Prvotní účel těch dat prostě byl jen ten, aby se někdo na záběry podíval a viděl aktuální stav. Máme prostě spoustu dat a víme, že je možné je získat. Teď musíme mluvit o tom, jak je opravdu využít. A u řady projektů nejspíš dojde k tomu, že to nepůjde tak, jak si to někdo představoval.

Je tedy z města nebo z městských částí poptávka po konkrétních řešeních?

Pro nás jsou nejdůležitější asi tři skupiny uživatelů. Jednou je samozřejmě magistrát, který si nás objednává. Druhou jsou městské společnosti – například s ROPIDem teď budeme ještě vylepšovat real-time data o zpoždění vozů v MHD. Model jsme s ROPIDem spoluvytvářeli a zatím se data napřímo poskytují Googlu a Seznamu, ale od března poběží u nás a my jej budeme zveřejňovat ve formě otevřeného API.

Nemůžu se nezeptat – budete mít už i data Dopravního podniku? 

Bohužel nebudeme, tam je situace složitější.

Škoda. A třetí skupina uživatelů služeb Datové platformy?

To jsou městské části. Zjistili jsme, že u nich jsou největší příležitosti, kde můžeme pomoci. Podívali jsme se, jaké všechny Smart Cities projekty mají městské části v plánu – v rámci podmínek magistrátních grantů totiž musejí předávat data do datové platformy. Zjistili jsme, že dělají řadu projektů – instalují senzory na sledování kvality ovzduší, na počítání lidí, chytré lampy, chytré koše… Vlastně se dost opakují, ale v rámci každého projektu obvykle vznikají separátní datové platformy, které integrují data ze senzorů a umožní starostovi vidět data v nějakém dashboardu. Kromě toho, že získáváme data ze všech městských částí a pak je můžeme nějak centrálně využívat, tak chceme městským částem poskytovat také službu datové platformy. Říkáme jim: nedělejte si vlastní datové platformy, poptejte od dodavatelů data jako službu a my vám datovou platformu zajistíme. Tím vám za prvé výrazně ušetříme, za druhé se vyhnete vendor lock-inu a za třetí budete mít výrazně lepší možnosti, jak s daty pracovat. A na to potřebujeme vyvinout vlastní software.

Stávající řešení, které běží na softwaru od firmy Cisco, nevyhovuje?

Potřebujeme dělat integraci dat a teď máme objednanou službu, ale když se něco stane a někdo něco chce, nemůžeme rychle reagovat, musíme zadat nějaký požadavek a podobně. Před asi půl rokem jsme si udělali analýzu a zjistili jsme, že si nejlepší systém dokážeme vyvinout sami. Prozkoumali jsme, jaká jsou k dispozici krabicová řešení, ale žádné nám úplně nevyhovovalo. Teď vytváříme vlastní software, který bude celý pod naší kontrolou. Zároveň ho celý zveřejníme jako open source a dáme ho k dispozici i jiným městům.


Autor: Operátor ICT

Na jakých technologiích nová Datová platforma poběží – screenshot z analýzy Operátora ICT

Nový systém úplně nahradí ten stávající?

Ano. Pracujeme v podstatě se všemi typy dat a takhle široce vlastně žádný systém nenavrhnete. Jádro datové platformy proto dimenzujeme právě na Smart Cities projekty. Jde o to, že máte konektory na určité typy dat, které jednou vyvinete a pak je jednoduše replikujete. Různé senzory a typy měření pak připojujete v podstatě „plug&play“ a k tomu pak máte řadu navazujících služeb jako alerting (třeba pro překročení hodnot), ukládání dat, historizaci, dashboardy, analýzy, poskytování openAPI a další. Vlastně konkurujeme běžným komerčním řešením, která – jak jsem viděl třeba ne nedávné Smart City Expo – obvykle chtějí, aby všechno běželo u poskytovatelů – chtějí totiž prodávat cloudové služby, výkon a celé balíčky služeb.

Když jste u toho Expa – nemá podobné řešení třeba nějaké jiné světové město? Nedalo se použít něco už hotového?

Nikde jsem neviděl, že by to pojímali takto komplexně. Vždycky mají nějaké řídicí ústředí, operační středisko, dispečink, ale že by to řešili takhle na celoměstské úrovni, to ne. I ta komerční řešení jsou většinou implementována na nějakou úzkou část, třeba svoz odpadu. Neviděli jsme, že by někde bylo v rámci open source nějaké řešení, které bychom mohli převzít. Na náš systém jsme strašně pyšní a chceme software nabídnout kromě Prahy i dalším městům. Chceme jej zveřejnit tak, že to bude instalační balíček, který půjde jednoduše stáhnout a spustit. Doufáme, že tím dosáhneme i klasické výhody open source a někdo s námi na softwaru začne pracovat. Vymýšlíme teď třeba spolupráci s Brnem, které svou datovou platformu nemá.

Uvažujete i o tom, že byste svou platformu nabízeli do světa?

Rozhodně. A myslím, že po ní bude poptávka. Města nemusí software přejímat celý, mohou použít jen některé jeho části. Počítáme s tím, že budeme věnovat velkou kapacitu na správu open source, a když někdo vyvine něco nového, budeme to schopní i sami využít.

Kolik bude vývoj vlastní datové platformy stát?

Mělo by to být v řádu několika milionů Kč. Největší náklady jsou na lidi, menší část pak na infrastrukturu. V první fázi poběží v cloudu, později ji chceme převést na nějaké on-premise řešení.

Máte s městskými částmi domluvená nějaká pilotní řešení, na kterých novou platformu vyzkoušíte?

Jsme domluvení v Praze 3, kde chystají projekt chytré cyklostezky Vítkov, kde budou instalovány různé senzory. Další projekt je chytrý park Židovské pece, kde podle původního záměru měli poptávat integrátora dat, ale my jsme nabídli, že to pro ně uděláme a pomůžeme také s vypsáním zakázky. Podstatné je, že už máme velkou část vlastní datové platformy vyvinutou, protože jsme si dělali prototyp a teď už na něj některé služby migrujeme. Je tam ale pořád ještě hodně práce, aby to byl plnohodnotný software. Takže teď sháníme vývojáře, kteří by na projektu s námi pracovali. Proto jsme také zveřejnili zprávu, ze které je vidět, na jakých technologiích bude platforma postavená. Vzhledem k tomu, že to bude open source, myslím, že to může být pro vývojáře zajímavé, protože se pak budou moci pochlubit, na čem pracovali.

Pode vašich plánů má datová platforma v ostrém provozu fungovat od července letošního roku. Stihnete to?

Migraci chceme mít hotovou do konce května, pak by měl přijít několikaměsíční paralelní provoz.

Rýsují se nějaké zajímavé nové datové zdroje, které byste mohli do datové platformy přidat?

Budeme dávat do otevřených dat k dispozici například zmiňovaná data ze strategických dopravních detektorů. Půjde o už vyčištěná data za jeden rok. Ve spolupráci s Institutem plánování a rozvoje (IPR) také připravujeme nástroje na zpracování dat mobilních operátorů. IPR má inovační projekt, ve kterém se snaží zjistit, co všechno se z dat operátorů vůbec dá zjistit. Ta data jsou velmi složitá a je potřeba nejdříve znát konkrétní problémy, které by mohla pomoci řešit. Na konci by pak mohla být nějaká služba, například by si starosta městské části mohl zjistit, kolik a z jaké městské části do jeho obvodu jezdí lidí. Měl by mít rozhraní, ve kterém by si to prostě jen naklikal, přitom by všechno běželo na Datové platformě a na naší infrastruktuře.

Sbírat a zpracovávat data evidentně umíte, ale jak je to s dosavadním využitím dat k řešení konkrétních problémů? Máte nějaké konkrétní příklady, kde se to daří?

Dělali jsme například také analýzu zelených střech. Vzali jsme model IPR a pomocí různých filtrů jsme počítali, jaký má teoreticky Praha potenciál a kde všude by mohly být střechy pokryté aspoň z části zelení. Zjistili jsme při tom, že jde o spoustu střech ve vlastnictví města a městských částí. Takže jsme udělali tuto analýzu, určitě jsme rozvířili nějakou debatu, ale nakonec to musí stejně být magistrát nebo radnice, kdo to dovede k nějakým konkrétním dopadům.

Zanalyzovali jsme také data Airbnb a poprvé jsme řekli, kolik je v Praze bytů, které můžeme považovat za využívané pro byznys. Na základě dat tvrdíme něco dost jiného, než se dosud tvrdilo. Ukázalo se, že Airbnb není tak velký problém, jak se říká, a možná naše analýza přispěje k tomu, že se chystaná regulace nějakým způsobem změní a město k ní přistoupí nějak jinak.

Připravujeme teď například také závěrečnou zprávu o datech z pilotního projektu chytrého osvětlení v Karlíně. Popisujeme v ní, co jsme měřili, čím jsme to měřili a srovnáváme naměřená data s údaji ze stanic Českého hydrometeorologického ústavu. Děláme také statistickou verifikaci dat, ve které jsme zjistili, že rozdíly mezi profesionálními senzory a těmi na lampách nejsou tak velké. Senzory jsou na lampách dobře umístěné, jsou dražší, kvalitnější a získaná data se chovají předvídatelně. Pokud tedy jako starosta městské části chcete měřit mikroklima, je to možné, výstupy jsou pozitivní. Zprávu budeme vydávat v nejbližší době.

WT100

Ale zase na rovinu musím říct, že data z Karlína od začátku zveřejňujeme a máme openAPI na všechno možné – jaké je znečištění, teplota, vlhkost, hluk, kolik projde lidí – a všichni tahle data chtěli. Teď tady jsou, ale žádné aplikace nad nimi nevznikly. A my bychom potřebovali, aby nad nimi vznikla nějaká interpretace. My je dokážeme změřit a říct, zda jsou kvalitní, ale už neumíme říct, co ta data dokazují – jak v daném místě proudí vzduch, jak tam jezdí auta nebo tam svítí slunce. S tím by už měly pracovat městské části, vzít si například nějakého experta na městské plánování, který by řekl, ano, to je třeba tím, že tady stojí tento konkrétní dům nebo tady chybí stromy, pojďme tady něco zbourat, nebo naopak postavit, vysadit zeleň – prostě výklad, co naměřená data znamenají a jejich začlenění do rozhodovacích procesů.

Takže nějaké výsledky tady jsou, ale není to tak, jak si to možná často někdo představuje: že se posbírají nějaká data a okamžitě je někdo začne používat.

Seriál: Rozhovory
ikonka

Zajímá vás toto téma? Chcete se o něm dozvědět víc?

Objednejte si upozornění na nově vydané články do vašeho mailu. Žádný článek vám tak neuteče.

Autor článku

Šéfredaktor Lupa.cz a externí spolupracovník Českého rozhlasu Plus. Dříve editor IHNED.cz, předtím Aktuálně.cz a Českého rozhlasu. Najdete mě na Twitteru nebo na LinkedIn

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).