František Vrabel: Newstin šel od vojenských technologií ke zpravodajství

20. 2. 2009
Doba čtení: 17 minut

Sdílet

Autor: 21971
Projekt Newstin.cz se vynořil na přelomu roku v NetMonitoru a výsledky jeho návštěvnosti musely zaujmout každého. Ačkoliv jeho provozovatel vyhrál prestižní cenu Red Herring, v Česku jde o web známý jen málo. Přinášíme rozhovor se zakladatelem a většinovým majitelem Newstinu nejenom o obchodním či produktovém pozadí, ale třeba i o tom, jaká je momentální nálada investorů.

Jak vznikl Newstin ať už jako jméno nebo jako firma?

Původně jsme se jmenovali I2S, Information Integrity Services. Tu jsem založil v roce 1998 a můj původní plán byla IT security, aplikování nejvyšších bezpečnostních standardů do tehdy vznikajícího e-commerce. Byli jsme ale příliš daleko od Ameriky a na českém trhu jsme přicházeli odnikud, bez správných vazeb, takže jsme tu nepronikli. Naštěstí si nás všimli američtí vojáci a od roku 2000 jsme začali pracovat jako asi jediná česká firma v rámci americké zahraniční vojenské pomoci.

Čím jste armádě pomáhali?

Pomáhali jsme tím, že jsme znali legacy systémy z minula, jako tým jsme znali i to poslední, co technologiemi hýbe. Takže jsme fungovali jako interface mezi americkým týmem a prostředím tady. V rámci projektů modernizace ozbrojených sil v souvislosti s rozšiřováním NATO. Ne snad jaká stíhačka se má koupit, ale z pohledu procesního, aby ozbrojené síly a ministerstva byly řízeny co nejeefektivněji. Tedy například jaká má být co neefektivnější organizační struktura, jaké parametry je důležité sledovat uvnitř procesů a podobně. Podíleli jsme se rovněž na zajišťování tzv. interoperability, propojování informačně komunikačních systémů.

V Česku se nám nikdy nepodařilo pořádně prosadit. Dlužno dodat, že my jsme byli subdodavatelem pro významnou americkou firmu zvanou Cubic Defense Applications, která se specializuje na armádní zakázky a drží schopnost americké armády v počítačových simulacích, takže nedělá zbraně, ale věnuje se špičce IT. V Česku se nám nikdy nepodařilo získat takovou pozici jako jinde, třeba na Slovensku a v jiných zemích.

Zpět k tomu názvu. I2S bylo zjevně nevhodné jméno pro portál, tak jsme přemýšleli o něčem, co bude krátké a budou v tom zahrnuté zprávy, ale ne česky. Přemýšleli jsme globálně, takže z toho nakonec vypadl „newstin“. To bylo někdy v roce 2005. Původně to měla být „plechovka na zprávy“, dneska říkáme, že je to „news technology inovations“.

František Vrabel, Newstin
František Vrabel (* 1959):
  • Vystudoval Pedagogickou fakultu Masarykovy univerzity v Brně.
  • CEO Newstin a.s.
  • Je ženatý a má dvě děti.
  • Zájmy: horolezectví, lyžování, umění.
  • Profily: Newstin, Xing, LinkdedIn.
  • Služby: www.newstin.cz.

Vy sám jste byl v armádě?

Byl, v Československé lidové armádě jako záklaďák po absolvování vysoké školy. Protože jsem sloužil ještě v komunistické armádě, moje hodnocení byla velmi negativní, můj vojenský posudek zněl, že jsem neschopen samostatné práce. To byla tehdy moje pasivní resistence, mě to nebavilo, neměl jsem to rád.

Jak se od dodávek pro americkou armádu dostanete ke zprávám? Co jste museli prodělat za „mind twist“? To jste se dívali na svoji technologii a říkali jste si, že je z jejího pohledu jedno, zda sleduje počet mrtvých na bojišti, nebo vyhodnocuje zprávy?

My jsme se ke zprávám dostali přes informační stránku věci. V ozbrojených silách mají zkratku C4I, Command, Control, Communications, Computers, and Intelligence což jsou všechny počítačové a komunikační systémy používané pro velení v boji a také pro řízení armády a ministerstva obrany jako celku. My jsme se na návrhu C4I podíleli. To I je Inteligence, takže jsme věděli, jaké technologie se používají v této oblasti, kde se snaží získávat informace zvenčí. A jedné té součásti se říká OSINT, čili Open Source Inteligence a Newstin je vlastně systémem OSINT, aplikací vojenských poznatků do civilní sféry.

Dostatečně dopředu jsme věděli, že naše angažmá ve vojenských projektech končí, protože jsme byli placeni z peněz amerického kongresu, kde je taková investice rozpočtová a dopředu známá věc. A protože jsme znali některé špičkové technologie na automatické zpracování jazyka, tak jsme si řekli, že vzhledem k tomu, že většina myšlení je v jazyce, zkusíme udělat aplikaci, která by využila tehdy v civilním sektoru velmi málo používané lingvistické technologie. To byl start Newstinu.

Původně jsme chtěli vytvořit místo, kde by člověk našel všechny zprávy světa na jednom místě, aby nemusel přeskakovat z jednoho zdroje na druhý. Takový obrovský agregátor. A současně, nejenom, že zpravodajství budeme agregovat v největších jazycích, které na světě existují, ale současně to bude detailně třídit a organizovat zprávy. Vycházíme z toho, že informační potřeby lidí jsou velmi podobné. Každý z nás se zajímá o hlavní zprávy, ale současně máme svých tři, pět, sedm témat, který odráží naše profesní nebo osobní zájmy. Považujeme za velkou výhodu, když umožníme lidem přístup ke zprávám přes zvolená témata. Na hlavních zpravodajských portálech se dozvídáme velmi málo o vyhraněných zájmech, proto musíme sledovat více zdrojů. A zde je hlavní výhoda systému Newstin, velkou většinu svých vyhraněných potřeb naleznete na jednom místě.

Hned od začátku to měl být globální projekt?

Ano, hned počátku jsme k tomu tak přistoupili, češtinu jsme dodělávali později, takže Newstin se nevyvíjel z Česka ven, ale naopak hned jsme jej vytvářeli jako globální aplikaci.

Mně přijde zajímavé, že v české internetové komunitě příliš známí nejste. Vyhráli jste „nějakou cenu“, která je prestižní v cizině, u nás ji nikdo nezná, což je samozřejmě specifikum českého trhu. Máte většinu aktivit zaměřených do zahraničí, na českém trhu jsem ani nezaznamenal marketingové aktivity nebo spolupráce. Pletu se?

Máte pravdu. Chtěli jsme hned jít s globální aplikací, protože naše přidaná hodnota je až v nasazení ve velikém měřítku. V českém prostředí je zdrojů velmi málo.

A co jste teď? Co je váš produkt a kdo je váš typický klient?

Používání jazyků na internetu v roce 2008

Provozujeme portál, jak ho dnes můžete vidět. Portál jede na patnácti doménách paralelně, globální newstin.com a čtrnáct národních domén v jedenácti jazycích. Pro některé jazyky máme regionální varianty, takže španělštinu máme pro španělskou a mexickou edici, portugalštinu pro Portugalsko a Brazílii atd. Kromě západoevropských jazyků jedeme dva slovanské jazyky (češtinu a ruštinu), potom jedeme v arabštině, čínštině a korejštině. Kromě japonštiny máme všechny nejdůležitější světové jazyky a pokrýváme nejdůležitější ekonomiky světa.

Tyto stránky jsou pro nás výkladní skříní naší technologie. Snažíme se naše produkty prodávat velkým mediálním firmám. Jeden z našich speciálních produktů je, že umíme detekovat právě vznikající zprávy a události. Když se rodí nějaká událost, my to zjistíme s předstihem před tiskovými agenturami, protože ty to beztak získávají od někoho. A my pokrýváme téměř všechno, co se na Zemi publikuje.

Naším typickým zákazníkem jsou velké mediální společnosti.

Trvalo nám téměř čtyři roky, než jsme naši technologii vytvořili, jde o velmi masivní a silnou technologii, mnohem obsáhlejší, než to vypadá na první pohled na webu pro běžného uživatele. Máme patenty v oblasti mezijazykového zpracování dat, to naše řešení je unikátní. Teprve posledního půl roku jsme začali vytvářet produkty nad touto technologií.

Máme fungující partnerství se SAPem v oblasti business inteligence, takže část našich inteligentních výstupů dodáváme SAPu, který je dále prodává podnikům. Podnikovou sféru jsme nechali na tomto partnerství, kde je revenue sharing model, my se soustředíme na veliké mediální domy a jednáme se CNN. Odtud se bude rekrutovat budoucí investor, popřípadě kupec. To bude někdo, kdo se stará o podniková data ve velikém jako třeba SAP, nebo někdo, jehož misí je podávat informace v globálním měřítku, jako je CNN.

V čem je jiný váš systém oproti zdarma agregátorům, jako jsou Google News nebo Google Reader? Co zákazníkovi přinese, když si ho zaplatí?

Tak především jste schopen vidět, co se stane. A jsme schopni tomu kterému zdroji ukázat, které zprávy ještě nemá pokryté. Nejsme jen další zdroj pro newsroom, ale také zdroj informace o tom, jakou další důležitou zprávu nemá médium pokrytou. Jsme schopni selektivně ukazovat, jak která konkurence zprávy pokrývá a zda je pokryla. To je naše základní nabídka směrem k velkému médiu.

Současně s tím jsme schopni ukázat, jak se zpráva vyvíjí v čase, například kdo s ní přišel první.

Umíte také sledovat, jak se kdo ke zprávě staví, zda ji hodnotí kladně či záporně?

Ano, takovou funkcionalitu máme, říkáme jí Sentiment Analysis. Na ní jsou postavené produkty dostupné v SAPu, je to důležité pro Brand Management či PR. Můžete si zadat nějakou značku, jméno a ukáže se, jak se který zdroj k tomuto subjektu staví, zda pozitivně, negativně či neutrálně. A to jak z pohledu lokálního, tak z pohledu globálního. Svět PR je organizován kolem zemí či podle regionů, ale nikdo pořádně nemá přehled o tom, co se děje celkově. Když jste nějaká nadnárodní firma jako Boeing nebo Microsoft, tak vám vyhodnocení událostí provádí lokální PR agentura, jenže nejsou žádná pravidla, jak taková vyhodnocení provádět, takže výsledky je těžké srovnávat. Nikdo na světě neposkytuje celkový pohled. Nemůžete Boeingu ukázat, jak se vyvíjí jeho brand nejenom třeba v USA, kde to podchycené mají velmi dobře, ale třeba i v Německu, Číně či Rusku. To je niche, kterou jsme schopni obsloužit.

Newstin Sentiment Analysis: Google versus Microsoft

Náhled sentiment analýzy v živém výstupu dat pro Google v porovnání s Microsoftem.

Na to byste ale museli sledovat obrovské množství zdrojů, aby taková data dávala smysl. Kolik jich sledujete?

Náš systém zdroje automaticky identifikuje nové zdroje, máme crawler, který prochází Internet a když na něco nového narazí, tak to oklasifikuje. Máme přes 5 milionů zdrojů, ale teď jich používáme přes 160 000, které kontinuálně stahujeme. To je 80 % zpravodajských portálů, 20 % blogů a 1–2 % (proměnlivě na úkor těch předchozích) jsou firemní či vládní stránky. Jedeme přes RSS, z něho si stahujeme i zbytek článku.

Jsou firmy, které tvrdí o svých systémech, že stahují větší množství zdrojů. My bychom to dokázali také, ale nakonec jsme u tohoto počtu, protože kvalitního obsahu na světě zase tolik není a časté jsou duplicity agenturních zpráv atd. Dramaticky bychom mohli růst na úrovni blogů, ale nakonec jsme zjistili, že tolik kvalitního obsahu není. I tak to číslo je výrazně vyšší, než má Google News.

V oblasti PR jsme schopni automaticky vyzobávat v reálném čase negativní věty a zákazníkovi je posílat. Když je v situaci, když bojuje s negativní kampaní, tak mu můžeme v reálném čase ukazovat, jaký je vývoj názorů. Nemusí se čekat na manuální zpracování.

Obecně: vytvořili jsme největší databázi článků na světě a k nim obrovské množsví metadat, které můžeme analyzovat. Máme za posledních 14 měsíců přes 70 milionů článků a čtyři miliardy metadat, se kterými si můžeme hrát.

Váš web byl jedním z překvapení auditu návštěvnosti NetMonitoru. Do toho jste se podle výsledků zapojili koncem loňského roku a hned jste se vyšvihli na sumy kolem půl milionu návštěvníků za měsíc. To je slušné i na zavedené servery. Kde jste takovou návštěvnost vzali, to se počítají všechny jazykové mutace, nebo jak je to s vaší návštěvností?

Upřímně řečeno, my už jsme zase z NetMonitoru vystoupili, protože naším zaměřením není prodávat reklamu, byť na našem webu nějaká reklama je, ale my se nechceme rozpolcovat v zaměření a chceme se soustředit na B2B klientelu. Upřímně řečeno ta čísla z NetMonitoru jsou zavádějící, a ani nevím proč. Skutečnost je taková, že máme celosvětově přes 1,9 milionu unikátních uživatelů měsíčně, v Česku je to něco pod 100 000 měsíčně.

Co je Newstinu občas vytýkáno, je způsob jeho přítomnosti v indexu Google, takže to připomíná SEO spam. Jak vnímáte takovéto názory?

Jsme rádi, že z Google vyjíždíme nahoře. Snad nám ti, co nás kritizují, nezávidí, že se nám to podařilo. Samozřejmě jsme systém optimalizovali pro vyhledávače, poměrně intenzivně jsme se SEO věnovali. Problémem při vyhledávání zpráv je, že vlastně nevíte, co hledáte. Něco se stalo, ale definovat to dotazem je těžké. Podle mého názoru je tedy přístup přes témata efektivní. Když si zadáte Bezpečnost IT, tak nechcete odpovědi, kde jsou tato klíčová slova, protože to nejsou výsledky, které pro vás jako pro uživatele mají smysl. V takovém případě jsou navedeni do naší kategorie a tam najdou poslední snímek toho, co se k té věci píše. A to je to, o co jim šlo, dostali, co hledali. Je to směr, kterému věříme a který se snažíme zrealizovat.

Přijde mi odvaha, že čtyři roky investujete do technologie, aniž byste viděli frontu zákazníků domáhajících se vašeho produktu…?

Odvahu to určitě chtělo, však taky lezu po horách, takže je odkud ji brát. Takže jsme na to šli z druhé strany – neviděli jsme díru na trhu, ale vytvořili jsme technologii, která je unikátní a myslíme si, že si ji někdo z největších hráčů na trhu koupí. Naše technologie není jen v tom, že umíme stahovat, organizovat a třídit v reálném čase hromady dokumentů a dělá to napříč jazyky. Ona to není hračka ani filosoficky. V současnosti jsou informační světy odděleny. V podnicích se například hovoří o informačních silech, něco máte v CRM, něco v CMS a dalších databázích, které nejsou schopné se domluvit. A jak to teprve vypadá na Internetu v celosvětovém měřítku. My nemáme vůbec představu, co se děje v čínském nebo ruském Internetu. Informace jsou ukládány do paralelních informačních sil. Bylo by samozřejmě lepší, kdyby byly propojeny, kdyby to nebyla izolovaná sila, a tohle je naše vize – k tomu jsme vytvořili technologii, která je schopna Internet posunout dál. Uživatelé by těžili z toho, že obsah na Internetu by byl organizován a prostupný napříč jazyky.

Některé takové vztahové a závislostní analýzy jsou velmi zajímavé. Například jeden z analytických nástrojů, které používáme, nám říká, o jaká témata mají čtenáři z té které domény či regionu Internetu zájem. Britové, Němci či Češi se zajímají o přírodní vědy, politiku nebo nějaká náročnější témata, která ukazují na jejich vzdělanost a vyspělost. Třeba v jiných doménách jako španělsky či portugalsky mluvících (mexiko, brazílie) vidíte úplně jiný profil, že je zajímá třeba hazard.

Jak tohle měříte?

K tomu používáme analytický nástroj Quantcast, který ukazuje afinitu k jiným informačním zdrojům. Také zjišťujeme, jaká témata jsou častější v té které jazykové edici, ale to s tím nespojujeme.

Důvodem může být věk: ve vyspělých zemích je na Internetu už hlavně střední generace, v zemích třetího světa je to spíše mladší věk. Interpretace podle mne je taková, že střední a starší generace v zemích třetího světa není počítačově tolik gramotná a mladší generace má zájem spíše o social networking, než o vědu.

Váš web je něco, co by bylo principiálně v mém zájmu používat, ale nějak nejsem schopen se přesvědčit, že by mi usnadnil práci. Je na mne příliš hutný, na Newstin.cz jsem se ztratil. Na jednu stranu máte úžasnou technologii, ale na druhou stranu je velmi důležitá vizualizace dat. Vizuální sdělení by mělo být totálně triviální, ne?

To máte pravdu, to jsme si už také uvědomili. Abych byl upřímný, už jsme měli několik iterací, při nichž jsme náš web zjednodušovali, a pořád je to málo. Pro uživatele je to stále příliš složité a děláme v tom další kroky, nový design spustíme tak do dvou měsíců. Složitější funkce dáme do Settings, vizuální stránka se bude blížit tomu, na co jsou zvyklí a snad to bude v jejich prospěch. Ale naším primárním cílem jsou business zákaznici.

Newstin homepage

Homepage Newstin.cz v únoru 2009.

Investice do Newstin a nálada mezi investory

Když říkáte investor, tak firma je teď na prodej, hledáte investora, jaká je situace? Chtěli byste to prodat české firmě či zahraniční?

Firma se neprodává, hledáme investora, několik velkých firem to nyní posuzuje. Raději bychom to prodali spíše zahraniční než české firmě, protože systém jsme vytvářeli jako globální a není žádná česká firma, která by byla globální. Obecně se investoři v Česku hledají velmi špatně. Za normální situace v Americe funguje sektor zvaný venture capital, který v Česku neexistuje, a tak se snažíme hledat investory v cizině. Tady je nutné říci, že investory ve firmě už máme, společnost už nepatří jenom mně. Máme jednoho institucionálního investora a to je Česká spořitelna prostřednictvím jednoho ze svých fondů a pak máme několik angel investors, osob, které do toho daly své peníze.

A jak se shánějí zahraniční investoři nyní v době, kdy z každých novin křičí slovo krize? Cítíte nějaký odstup investorů? A co říkají na to, že jste česká firma, která sídlí někde v Západní Asii a nedá se do ní volat ani na normální americké telefonní číslo?

Máte pravdu, přesně jste pojmenoval ty dvě výzvy, jestli to tak mohu nazvat, když už ne problémy. Tak za prvé je nejhorší doba pro shánění investorů a průmysl je úplně zdecimován tím, co se děje na finančních trzích. Minulý měsíc jsem byl v Americe když jsme přebírali globální cenu od Red Herringu, měl jsem příležitost mluvit s celou řadou velikých investorů ze Silicon Valley, kteří mne znají z dřívějška, a ti žádné nové investice neotevírají.

Říkáte, znají z dřívějška? Už jste sháněli investice dříve?

Ano, před nějakou dobou jsem byl na půlročním turné po investorech v USA. Z něj jsme si přivezli Intel, a to byl takový smutný příběh. Věnovali jsme jednání půl roku, šli jsme po všech těch krocích jako term sheet, due diligence, obrovský účet za právníky. A několik dní před closing date Intel řekl, že ne, v předtuše toho, co se na finančních trzích bude dít. Intel vycouval ze všech investic, které mohl odmítnout, ořezal, co se dalo bez sankcí ořezat. Tomu jsme věnovali půl roku, Intel tu už téměř byl, chybělo nám pět dní. To se událo v červenci. A tak jsme museli začít nanovo. A tak jsme spadli do krize, která mezi tím vypukla na plno. Nálada v USA je ještě horší než u evropských investorů. Je to mimořádně špatné. Venture capital fondy fungují většinou tak, že jejich vlastní peníze v tom hrají daleko menší váhu a investují, spravují prostředky někoho jiného. A ti velcí investoři se z investic začali stahovat a nové fondy, které se průběžně otevírají u jednotlivých Venture Capital firem, jsou bez přílivu nových peněz. A peníze, které zbyly v ještě otevřených, aktivních fondech, už neinvestují dále, protože peníze potřebují na záchranu a udržení běžících firem. Očekává se totiž, že break event point, bod návratnosti prostředků, se posune nejméně o dva roky v čase. Takže investiční aktivita v Americe prakticky ustala. Jsou veliké firmy jako Sequoia Capital, které preventivně zavírají firmy, do kterých investovaly v Round A (prvním kole investic) třeba 5 milionů dolarů, aby ve firmách, kde investovaly více, mohly ušetřené prostředky použít.

Takže v Evropě ta nálada ještě není tak špatná a já jen doufám, že to sem ani nedolehne. Nálada se tu zhoršuje, ale snad to nedosáhne rozměrů jako v Americe. Zatím má situace za následek to, že valuace pro později přišlé investory se snižují, nákup podílu se pro ně stává výhodnější. Je to prémie za jejich kuráž, že do toho ještě pořád jdou. Nevidím to zdaleka černě, venture capital v Evropě je aktivní a pro nás připadají v úvahu strategičtí investoři či jejich investiční společnosti.

Kolik měl Intel Capital investovat?

Měl investovat 5 milionů dolarů. Mimo jiné Intel Capital vykázal za poslední čtvrtletí ztrátu jedné miliardy dolarů.

Jak se na vás investoři dívají jako na Čechy? Proč se netváříte jako typicky americká firma se sídlem v Sillicon Valley, kteří jen v té Indii nebo Praze mají programátory?

My jsme přes půl roku měli v Silicon Valley kancelář a tak jsme se tam prezentovali. Musím říct, že se na nás skutečně dívají přes prsty, že jsme taková periferie, exoti. Nikoho z Česka neznají. Když jsme tam měli kancelář, tak to akceptovali. Brali to, jako že máme kuráž do toho jít a brali pozitivně, že tomu věříme.

Oni jsou hodně sebestřední a o Sillicon Valley to platí obzvláště, řada skvělých firem tam vznikala, takže důvodů k sebestřednosti je tam objektivně poměrně hodně. Celá řada investorů se spálila a byli podvedeni v našich oblastech. Sice ne z Česka, ale my jim splýváme, celá východní Evropa jim splývá. Spíš to byla východní Evropa než my, ale jejich rozlišení to nepojme.

Nezkoušeli jste najmout rodilého Američana jako CEO, abyste vypadali jako firma dostatečně americky?

My jsme měli v naší pobočce rodilého Kanaďana, ale ti jsou také na periferii, ty taky nemají moc rádi. Ale abychom si z toho nedělali úplně legraci – jejich obava byla taková, že by stálo příliš mnoho peněz, abychom dokázali přenést vedení firmy do Silicon Valley. Tahle obava byla velmi silná. Jeden z těch, kterým to nevadilo, byl veliký Intel, který je všude na světě a jeho pohled je velmi odlišný.

Komunita tamějších investorů je velmi malá, je to asi dva tisíce lidí, kteří se všichni znají, je to téměř genetická louže. A oni velmi rádi dávají k dobru, že investují jen do firem, do kterých mohou dojet do třiceti minut autem a dále ne. V Česku je několik firem, kteří o sobě říkají, že jsou Venture Capital, ale podle mne nejsou, jsou jen Private Equity. VC fond podle amerických měřítek a zkušeností musí splňovat čtyři kritéria: za prvé musí rozumět příslušné technologii, příslušnému trhu, musí mít zkušenost s budováním firmy v oboru a za čtvrté musí mít peníze. A to je teprve to čtvrté. Většina českých investorů splňuje jen to čtvrté kritérium, kdy mají peníze.

Marketing meeting Ai a tvorba obsahu

Pár lidí tu samozřejmě existuje, jsou to ale spíše business angels, ale nejsou to instituce …

Děkuji za rozhovor.

Jak dlouho znáte projekt Newstin.cz?

Autor článku

Autor byl v letech 2008 – 2012 šéfredaktorem serveru Lupa.cz. Stál u zrodu řady projektů. Je spoluzakladatelem Energomonitoru, v CZ.NIC vedl projekt Turris. Je předsedou místní organizace Pirátské strany v Brandýse – Staré Boleslav.

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).