Ve světě datové analytiky často zaznívá jméno české firmy Keboola. Lze objasnit i pro širší odbornou veřejnost, proč? Zkusili jsme to. Rozhovor pro Lupu poskytl spoluzakladatel Kebooly Petr Šimeček a také Pavel Doležal (někdejší zakladatel agentury Ataxo), jenž se letos stal třetím podílníkem Kebooly.
Proč Keboola nedávno uspořádala Enterprise Data Hackathon?
PŠ: Jednak nás to baví, a jednak tím ukazujeme, že jde dostat se k datům, která jsou zavřená někde v korporaci. Poměrně běžně se nám totiž stává, že v nějaké firmě narazíme na extrémní zpátečnictví, na zaštiťování se jakýmisi absurdními nařízeními ‚nemůžeme, nesmíme‘. V 99 % případů jsou to jen snahy lidí někde ve spodních patrech managementu opevňovat si pozice — typicky šéf IT nechce cloudové technologie, protože má pocit, že by mu snížily moc v organizaci. Začne se vymlouvat, že data do cloudu dát nemůže, a my poukážeme na to, že například banka mohla, že CCS mohla, a díky tomu dosáhly něčeho dobrého. Snažíme se posouvat věci dopředu skrze příklady.
PD: Na trhu už je připravena skupina lidí, kteří se o data opravdu aktivně zajímají a kteří vidí, že v řízení podnikání pomocí dat je budoucnost. Že to už nepůjde myšlením a postupy z let osmdesátých. O hackathon se zajímali nejen technologové, ale i lidé na pomezí technologií a podnikání, nebo vyloženě jen čistí obchodníci.
Měla by korporace zpřístupnit svá data i obecně, mimo například hackathon?
PD: Jestliže zpřístupňuje hrozně moc svých dat i ta korporace, která má nejvíce nejlepších inženýrů na světě, aby se v jejích datech stejně mohli hrabat i ostatní, proč by to neměly dělat jiné společnosti? Proč to Google dělá? Nebo proč Netflix vypisuje nad svými daty veřejné soutěže? Protože vědí, že všichni lidé uvnitř jsou v zajetí jakéhosi „boxu“. Jestliže jste bíle nabarvený uvnitř bílé krabice, pak váš svět vypadá bíle, ale venku je barevný.
To se stává nám všem: postihuje nás slepota na prostředí, na děje uvnitř a na jejich řešení. Proto se spousta velkých firem, včetně internetových gigantů s těmi nejlepšími lidmi, stejně otevírá a nechává ostatní dívat se na svá data jinak.
Před několika lety například jakási těžební společnost koupila obrovské pláně s důlními právy, udělala geologický průzkum, ale nic jim z toho nevyšlo. Tak ta data zveřejnili. A lidé zvenčí našli zlatou žílu nedaleko zavřeného dolu.
A dobrým příkladem je právě Netflix. Žijí z toho, nakolik dobře doporučují filmy. Před několika lety otevřeli svůj algoritmus a vypsali cenu za jeho zlepšení o deset procent. Protože zevnitř to už nedokázali. Do roka ho měli vylepšený.
Crowdsourcing je hrozně důležitý pro získání jiného pohledu, pro zapojení jiné zkušenosti lidí zvenčí, a v českém prostředí zejména proto, že místní firmy sice mohou mít super lidi, ale třeba v počtu deseti, dvaceti. Pak těžko konkurovat Googlu s deseti tisíci nejlepších. Lze to jedině tak, že změníte pravidla hry: nebudete sice zaměstnávat tisíc nejlepších inženýrů a datových analytiků uvnitř firmy, ale někde jsou, a jsou to hračičkové a rádi řeší zajímavé problémy.
K účasti na datovém hackathonu jsme firmy ani moc přesvědčovat nemuseli, chytly se samy, ale ne lidé v dolním a středním managementu, ale ti na vrcholu; slyšeli jsme od nich třeba: ‚To je super, já se tady snažím změnit kulturu, aby lidé byli otevření, ale oni se bojí těch procesů… Hele, co vám můžeme dát?‘
A dále jde o to, že společnosti by obecně měly dát data do cloudu, protože cloudové technologie umožňují úplně jiný způsob práce — jednak interně nad těmi daty, ale jednak i externí spolupráci nad nimi, jejich otevření jiným mozkům. K zajímavým objevům přece dochází na rozhraní více oborů.
Nemají se o data v cloudu bát? Nedostane se k nim někdo nepovolaný?
PŠ: Lehčeji než k nim do data warehousu? Měl jsem nějaký server u jednoho nejmenovaného českého server‑housingu; k tomu serveru oni v případě potřeby připojovali konzoli. Jednou jsem se na přihlašovací údaje, které mi dali, ocitl na desktopu nějakého úplně cizího windowsového serveru, protože oni to spletli. Tohle se v cloudu nestane. Ale lidských chyb se stávají tisíce.
PD: Cloud vás spíše ochraňuje před lidskou chybou.
Tedy je omyl domnívat se, že cloud je méně bezpečný než vlastní data warehouse?
PŠ: Určitě, jednoznačně.
PD: V Americe tohle už dnes nikdo neřeší. Dokazuje to i spolehlivost cloudů. Samozřejmě, že mají také výpadky, ale řádově menší, než jaké budete mít na vlastní infrastruktuře, a mají‑li přece výpadek, vy to nemusíte řešit, protože to naběhne řešit tisíc nejchytřejších lidí z oboru na světě.
Mimoto, útoky jsou častější zevnitř. Setkal jsem se s tím, že jedna vládní organizace hodně citlivá na bezpečnost dat šla do cloudu proto, že se více bála, že se jim do nich nabourá někdo zevnitř.
Ale narážíte pořád ještě na psychologickou bariéru?
PD: Osobně jsem na to narážel tak ještě před dvěma lety. Ale Keboola má většinu zákazníků na západě — v USA, v Kanadě, v Británii, a mně se zdá, že tohle téma už tam lehce vyčpělo. Ještě se sice vyhrotilo se Snowdenem, ale každý si to prostě musí vyřešit, a kdo si to nevyřeší, toho to semele. Cloud je jiný způsob myšlení i jiný způsob skladby nákladů; mimo cloud zůstanete uzavřeni ve svém starém světě.
PŠ: My ani nepotřebujeme někoho přesvědčovat. V cloudu jsou zajímavé technologie, je tam soustředěno množství potenciálních příležitostí.
Jedna nejmenovaná společnost nám na poslední chvíli odřekla poskytnutí dat pro hackathon, protože zjistila, že to nezvládne: když viděli svá data, nevěděli si rady s tím, kam je dát a co s nimi udělat, protože jsou prostě z devadesátých let. Dnes to brutálně válcují firmy, které přišly dostatečně pozdě na to, aby přeskočily předchozí vývojový stupeň a šly rovnou do cloudu.
Technologie dostupné v cloudu si nemohu nainstalovat k sobě. Jednak je k vlastní instalaci nikdo ani nedělá, jednak protože u sebe nemám další technologie, o které by se to opřelo. To mě vlastně nutí, abych se svými daty šel tam, kde ty technologie jsou, a tedy do cloudu.
K tomu dodejme, že gigabajt stojí reálně na trhu jeden cent měsíčně — na velmi bezpečném úložišti — zatímco za vlastní diskové pole od EMC² dáte třeba miliony, a vejde se vám do něj prd.
PD: Ale do cloudu se chodí nejen za technologiemi, ale také za dalšími daty. Protože data jsou zajímavější, jestliže je obohacujete jiným kontextem. V cloudu jsou dnes datová tržiště: vy tam dáte svoje data a jako v e‑shopu si k nim stáhnete tenhle dataset a tamten dataset, hotovo to máte za několik desítek minut, k tomu si nainstalujete nějakou technologii, která je na trhu možná teprve několik měsíců, třeba Wise.io, ta vám udělá nějaké předpovědi, a za den víte, jestli vám to funguje, nebo nefunguje. Fail fast.
Kdybyste stejnou analýzu chtěl provést ještě před několika lety, zavolal byste svému dodavateli serverových technologií, on by vám to přišel nacenit, objednal byste servery, ty by se musely vyrobit a dodat, něco v dodávce by bylo možná špatně, po třech, čtyřech měsících byste to měl nainstalované, propálil na tom miliony a možná za půl roku zjistil, že vaše hypotéza nefunguje. Co dál?
Svět nestojí a nečeká, až my se rozmyslíme. Proto to pořád ještě válcují americké technologie. Salesforce nedávno spustila nový analytický cloud, a už v něm má zabudovanou technologii Wise.io, starou asi půl roku, a tisíce zákazníků to mají hned k dispozici. Do podnikového cyklu v dobách Microsoftu by se to dostalo po pěti letech.
Za další data v datových tržištích se, předpokládám, platí…
PD: Jasně, každý business‑intelligence nástroj v té horní vrstvě má nějakou cenovou politiku; nějakou licenční politiku má GoodData, nějakou Tableau, nějakou Chartio. Keboola nabízí dva modely: zákazník si to může řešit sám a nakupuje si licence přímo a my ho jen podporujeme technologicky, ale čím dál tím spíše si klienti kupují jeden celek od nás, protože pro ně je to jednodušší, dostanou jednu fakturu a neřeší, kolik zaplatí za SQLdep, kolik za Trifactu, kolik za Chartio, kolik za GoodData. My to nakupujeme ve velkém. Pak je pro zákazníka o to jednodušší vyzkoušet si různé technologie a vybrat si, z čeho projekt nakonec postaví.
Dá se říci, nakolik jsou v datech české firmy pozadu?
PD: Jak které. V Česku je to hodně bipolární. Některé firmy cloud a data naprosto chápou a obchodní stránka věci je pro ně důležitá. Příkladem je skupina kolem Tomáše Čupra. Nebo také Seznam. Ale i firmy jako KKCG. Uvědomily si, že se potřebují posunout dál — skokově — a že to prostě nepůjde bez toho, aby začaly uvažovat jinak.
A pak jsou tu prostě dinosauři, kteří to budou dělat jak za Husáka, protože proč by to dělali jinak. Je to v lidech. Ale kdo dělal v mládí něco se zahraničím a šel ven, ať osobně, nebo aspoň myšlenkově, ten už to dnes neřeší.
Kam až lze jít ve využívání dat oproti současnosti?
PD: V tom jsme asi trochu úchylní, ale my vidíme data všude. Otázka je, kolik jich je relevantních a v jakém kontextu jsou relevantní. My máme dva koncepty. Jednomu říkáme „demokratizace dat“ — aby se na data mohl podívat každý, vznést na ně nějaké dotazy. Ať je dělník, nebo třeba nákupčí pro e‑shop, měl by mít přístup k nějaké podmnožině dat relevantní pro něj.
Ne jako doposud, že když máte nějakou datovou otázku, napíšete zadání analytikovi, on si ho přečte, odejde a za týden vám dá odpověď na něco jiného, protože dotazům z vašeho oboru nerozumí, a musíte pak udělat dvě iterace a stojí to statisíce. Mělo by to stát pár korun vašeho času.
Druhá naše teze je „be true“ — buďte upřímní sami k sobě. Data vám nastaví zrcadlo. Cenu mají jen tehdy, jestliže se nějak srovnáte podle toho, co v něm uvidíte. Pokud se však měnit nechcete, pak pro vás ovšem žádnou cenu nemají. Ale data jsou všude. (Krásně o tom mluví Roman Nováček na Petrově blogu.)
Jaká je v tom všem úloha Kebooly?
PD: Snažíme se vytvořit prostředí, ve kterém budou moci lidé z oboru ,business intelligence‘ — analytici, agentury nebo tvůrci nějakého oborově zaměřeného softwaru — snadno stavět vlastní datové projekty. Keboola má být takový svorník, příjemné prostředí, ve kterém data přirozeně tečou od začátku do konce, tedy od jejich vytahování z úložišť, přes to, že se s nimi hezky pracuje, že se dají čistit a obohacovat, až po to, že se to na konci vezme a pro jednu skupinu lidí se to pošle třeba do hodinek Pebble, pro jiné lidi se to pošle do dashboardů GoodData a zase pro jiné se to může vizualizovat v Tableau.
Snažíme se lidem ulehčit práci s daty, jejich přípravu k analýze. Dnes je už dobře vyřešená ta vrstva nahoře — „objevování dat“. Působí v ní firmy jako GoodData, Tableau, Chartio, Anaplan, pouští se do toho Salesforce a další. Problémem je všechno pod tím, a to je naše úloha. My děláme cosi jako data management and collaboration framework — aby se dalo s daty hezky pracovat od začátku do konce.
A že děláme framework, nemáme ambici řešit vše sami. Horní vrstvu objevování dat řeší ty firmy už zmíněné, transformační vrstvu pod tím — třeba máte‑li problém s opravdu složitými SQL dotazy — to zase řeší například česká firma SQLdep, kterou také napojujeme, a vespod jsou extraktory z datových zdrojů. Máme sice 35 vlastních extraktorů, ale to není důležité — udělali jsme framework, popsali jsme jej, je to REST API, kdo chce, naučí se ho za pět minut, a za tři člověkodny si napíše vlastní extraktor, z čehokoli chce.
Jak mála firma stačí být, aby mohla nastoupit do tohoto vlaku?
PD: Máme dnes mezi partnery i jednomužné firmičky. Třeba se ten člověk setkal s nějakými datovými řešeními ve své minulé práci a pak odešel, ale chtěl dále pracovat s daty, ale nemohl by si to dovolit stejným způsobem. Někde slyšel o Keboole, my jsme mu to prostředí ukázali, on si přinesl prvního klienta, my jsme mu ho pomohli udělat, a dnes si švihá svoje klienty sám.
Ale cílový klient? Jak stačí, aby byl malý nebo velký?
PD: Jde jen o to, jakou hodnotu přisuzuje svým datovým otázkám. Má‑li dnes někdo dotazy v hodnotě, řekněme, pět až deset tisíců dolarů ročně, pak pro něj má velký smysl mít vlastní datový projekt.
A pak jsou ti, kteří nemají otázky tak drahé, ale řádově levnější, řekněme například prodejny s oblečením. Ty mohou využít připravených řešení, která nad Keboolou vyrobili naši partneři, například Ascoria. Ta měla oborovou znalost, jak dobře řídit obchody s oblečením. Zkoušeli to nějak naškálovat, ale nešlo jim to. Až se náhodou potkali v letadle s Milanem Veverkou (třetím společníkem v Keboole; žije trvale v Kanadě) a během půl roku si pak postavili vlastní produkt nad technologickým stackem Kebooly.
Kam směrujete Keboolu jako firmu ve výhledu několika let?
PD: Poslední dva roky rostl technologický stack Kebooly a Petr a kluci do toho dali neskutečné množství úsilí. Přínos Kebooly už potvrdili a prověřili velcí američtí klienti s pobočkami po celém světě, například CSC (jeden z největších světových poskytovatelů IT služeb).
Teď nás čeká škálování. Budeme systém rozšiřovat o další partnery, o další způsoby využití. V poslední době jsme si uvědomili, že Keboola je především firma technologická. Vždy byla. Ještě pořád děláme i vlastní implementace od a do z, ale dnes už jen proto, abychom to nezapomněli a neztratili spojení s praxí. Vesměs se snažíme vše přehodit na partnery.
Kolik lidí dnes pracuje v Keboole?
PD: V Česku zhruba dvanáct lidí, a plus minus stejný počet v Kanadě. Nemáme ambici znásobovat se do stovek lidí, škálovat chceme přes partnery. Máme k tomu jeden podstatný důvod: abyste mohl úspěšně udělat pro klienta datový projekt, nestačí vám umět pracovat s daty, musíte mít vertikální, tedy oborovou znalost. Ale my nemůžeme rozumět všem oborům podnikání, to by nás musely být tisíce. Naší hlavní prací je dávat dohromady různé technologie tak, aby spolu hladce fungovaly.
Keboolu tedy nebudujete proto, aby narostla jako firma?
PD: Nebudujeme „startup“, budujeme firmu. Nechceme něco nafouknout a pak to prodat. Pro nás je hlavní, aby firma měla dobré příjmy z dobrých zákazníků; a samozřejmě aby rostla, a hodně, ale obratem. Nepotřebujeme stovky lidí.
Petr s Milanem nikdy nehledali investora, a dohromady jsme se dali, protože to vidíme stejně: budujeme normální firmu, která odsud do světa dodává poctivé věci za dobrou cenu. Důležitý je pro nás ekosystém lidí uvnitř i vně firmy, aby se posouvali dále, aby rostli a aby mohli zakládat další firmy.
Proč jste v severní Americe právě ve Vancouveru?
PŠ: Nebyl v tom žádný strategický výběr. Milan tam už prostě žil, když jsme spolu začínali. Každopádně je tam tisíckrát menší nepořádek a špína než v San Franciscu a lidi tam seženete za třetinu peněz.
PD: Nedá se přímo odtamtud sice řešit všechno, ale jsou tam chytří, vzdělaní lidé, a mluví perfektní angličtinou — kanadská je pro Američany libozvučná.
Důležité pro nás je i to, že Vancouver je stejně jako San Francisco v tichomořském časovém pásmu. Když tady končíme, oni začínají, a je‑li potřeba, můžeme si něco předávat. Pitomé je to jen pro Petra, protože v podstatě má dvě šichty a většinou chodí spát ve dvě a vstává už zase v šest.
Otázkou pro nás je, ve kterých dalších časových pásmech ještě rozvíjet partnerská centra.
Uvažujete třeba o Číně?
PD: Uvažujeme pořád o spoustě věcí. Kdybychom neuvažovali o rozvoji, tak mě kluci k ničemu nepotřebujou; nebo kdyby nedospěli k pocitu, že technologický stack Kebooly je už dostatečně vyspělý na to, aby se dal škálovat.
Co myslíte pod škálováním stacku?
PD: Chceme znásobit počet partnerů a skrz ně přinést nové možnosti, a tedy i znásobit počet zákazníků. Třeba na nedávném výletě do San Francisca jsme si vytipovali technologické firmy, které bychom rádi přidali. Se všemi jsme se dohodli přinejmenším na tom, že to vyzkoušíme, a tři už opravdu implementujeme. Už jsme doimplementovali Tableau, implementujeme Chartio, to jsou ty koncové destinace pro data ve vrstvě „objevování dat“; a implementujeme Trifactu, která vznikla původně na Stanfordu jako Data Wrangler.
Představíte‑li si náš stack jako šuplíčky, pořád k němu přidáváme z různých stran, abychom ho rozšiřovali.
Tím, že Keboola už dokázala technologickým partnerům, že má dostatečně zajímavé klienty, kteří její stack opravdu rádi používají, je dnes pro nás snadné přijít za jakoukoli technologickou firmou na světě a nabídnout jí, že bychom ji rádi integrovali. Většinou s tím nemíváme problém.
Kolik pracovního času zabírá Keboola vám osobně, Pavle?
PD: Posledních několik měsíců už sto procent, a doufám, že po další léta až desítky let to bude sto procent.
Proč právě Keboola?
PD: Vždy mě bavilo hledat, co se dá vyčíst z dat. Už v Atlasu jsme zkoumali, co lidé vyhledávají, a později v Ataxu jsme měli tisíce klientů a tisíce kampaní a potřebovali jsme rozumět tomu, co jak působí, jak se co mění, jak si co vykládat, a tak podobně.
Pak jsem společně s Pavlem Sodomkou investoval do Netmailu. Pro zákazníky Netmailu jsem potom řešil nějaké datové záležitosti a potkal jsem se při tom tady s Padákem (Petrem Šimečkem). Něco jsem mu nasdílel, a on mi za tři hodiny vrátil hotový projekt. Z toho jsem byl úplně vedle, kdykoli předtím jsem něco takového chtěl udělat, vždy to trvalo týdny a měsíce.
Tak jsem se začal hrozně zajímat o to, co cloud vlastně umožňuje datově. A kolegové v Netmailu se mě po určité době začali ptát, jestli si uvědomuju, že na každé schůzce začnu po deseti minutách mluvit jen o datech a o tom, co s daty umí cloud. Začali mě navádět, že bych si možná měl hledat něco s daty.
S Padákem jsme se v tu dobu začali častěji potkávat nad určitými projekty, až se mě jednou zeptal: Hele, jak dlouho ještě budeš dělat v tom Netmailu? A já na to, že už tam jen dojíždím jeden projekt a zajímají mě data a cloud, a tak jsme se dohodli, že to zkusíme pár měsíců spolu a uvidíme. Sedlo nám to a zhruba začátkem léta jsme se domluvili na společném pokračování i s Milanem Veverkou, druhým původním společníkem.
Do Kebooly jste tedy přinesl další peníze?
PD: Do Kebooly nevstupuji proto, abych držel podíl dva, tři roky a pak prodal. Pro nás to má být projekt natrvalo. Vstupuji do něj proto, že se mi líbí ta firma jako taková a lidé v ní — jak přemýšlejí a pracují, jaké mají hodnoty a kam směřuje celý trh.
Domluvili jsme se, že část podílu si koupím a ty peníze půjdou na rozvoj Kebooly — právě třeba na zahraniční expanzi a na škálování — ale že druhou část svého podílu si odpracuji. Všechen svůj podíl dostanu až za tři roky. Mně to přijde fér a líbí se mi to.
Chcete říci, kolik jste přinesl peněz?
PŠ: Tři sta pětašedesát bambiliónů… (smích)
PD: Nechceme to říci a není to důležité. To je zajímavé zveřejňovat, jestliže hodláte firmu nějak veřejně ohodnotit, ale naše vzájemná valuace není daná především finančně. Je daná přínosově — tím, že jsme si řekli, že spolu chceme pracovat.
Co jste si vzal v Keboole na starosti?
PD: Rozdělili jsme si to, myslím, docela dobře podle dovedností a povahy. Já mám „drive“ a rád tlačím věci dopředu, hrozně se mi nelíbí, když se něco zastaví, to mě nebaví. Baví mě jednat s klienty, takže mám na starosti rozvoj partnerské sítě, rozvoj obchodních příležitostí, marketing, nové věci.
Padák odpovídá za technologii a chodíme spolu k zákazníkům, aby měl pořád ověřování na skutečnosti. Také se mi hrozně líbí, že si dodnes bere tikety z helpdesku, protože i tím se udržuje ve styku se skutečností.
Milan se stará hlavně o severní Ameriku. A zatímco já jsem vůči klientům taková jakoby předsunutá jednotka, Milan je perfektní logistik, který to tlačí zezadu a dokáže věnovat pozornost detailům, které mou silnou stránkou nejsou.