Osobne mi na novem OS X a iOS 9 nejvice vyhovuje to, ze tam nejsou zadne velke novinky, takze konecne ma Apple cas zapracovat na stabilite, jak slibil.
Uz nekolik let kazdym rokem Apple pridaval stale novou funkcionalitu za cenu horsi performance a celkove stability softwaru. Ono vydavat kazdy rok novy system nemohlo byt pro vyvojare moc dobre. Dat si rok dovolenou na vychytani problemu je rozumny a hlavne potrebny krok.
To jsem si myslel taky do té doby, než jsem se viděl se svým známým (američanem). On tu asistentku skutečně aktivně používá a na kde co, na navigaci, vytvoření událostí do kalendáře, připomínek apod.
To jsem si uvědomil, že pokud asistenka člověku skutečně dobře rozumí, tak je to geniální nástroj. Jednak jde používat ve specifických situacích jako to řízení apod. a hlavně není třeba pamatovat si, kde je potřeba kliknout a co kde vyplnit, ale přirozeným lidským hlasem jí řeknete, co má udělat a ona to udělá.
My v ČR to moc docenit nedovedeme. Jednak málokdo mluví anglicky tak, aby mu asistentky dobře rozuměly (což je IMHO základ, málo kdo má tu chuť třikrát něco opakovat, to pak ztrácí i tu výhodu úspory času), druhak možnosti využití jsou v ČR výrazně menší (např. Siri neumí hledat zdejší zájmové body a navigovat na ně apod.).
A že je to nepohodlné a nepřirozené? Naopak, přirozené je to velmi. S ostatními lidmi komunikujete svým jazykem, nikoliv tlačítky či dotyky. A pohodlné to je zejména kvůli tomu, že pro řadu úkolů nemusíte telefon odemykat, spouštět aplikaci a v ní nic hledat a mačkat, ale prostě jen řeknete "hey, siri, show me japanese restaurants in Miami downtown" a v USA to máte jak na dlani. Srovnejte s klasickým postupem: odemčením telefonu, spuštěním aplikace mapy, napsáním "Miami", klikem na hledat, potom "Hledat v okolí" a napsat "japanese restaurant" a opět hledat.
Opakuji, aby tohle člověk dobře pochopil, měl by vidět někoho, kdo hlasovou asistentku skutečně a efektivně používá.
Mate pravdu. Jeste bych k tomu doplnil, ze dojizdeni v USA se velmi vyrazne lisi od dojizdeni v Cechach. USA jsou velke, opravdu velke. Vsude jsou velka parkoviste, skvele silnice, v mnoha oblastech nejsou chodniky. Vetsina rodin ma jedno auto na clena rodiny. Pokud si deti vydelavaji penize, vetsinou si vydelavaji na svoje prvni auto v 15 letech.
Americane jsou proste zvykli ridit a neni nezvykle, ze rano dojizdeji 2 hodiny do prace a na veceri jedou do restaurace, ktera je vzdalena hodinu autem od jejich domu.
Pokud stravite denne nekolik hodin v aute, ovladani hlasem ziska podstatne odlisny smysl.
Pár poznámek:
"S ostatními lidmi komunikujete svým jazykem, nikoliv tlačítky či dotyky."
Ano. A zdůraznil bych slovo LIDMI. Mluvím běžně s lidmi, občas i se svým psem, ale s elektronickou škatulkou? To je skutečně nepřirozené a z pohledu okolí i značně legrační. Až bude okolní realita podobná jako ve filmu "Já, robot", možná to přehodnotím. :-)
A jinak jsme opět u svobody volby. Když si chci vybrat restauraci, tak si ji pečlivě vybírám podle svých subjektivních potřeb a třeba dojmu s fotografií na webu. Nebudu se podřizovat tomu, co na na mě vyštěkne nějaká plechová hlava Siri. A velmi bych se divil, kdyby Siri neupřednostnila tu restauraci, která zaplatí nějaký poplatek, aby se posunula na seznamu vzhůru. To je tak lákavá možnost monetizace služby, že k ní určitě dříve či později dojde. Lidi jako dokonalé stádo.
"Mluvím běžně s lidmi, občas i se svým psem, ale s elektronickou škatulkou?"
Jsem přesvědčen, že hlavní důvod, proč se většina věcí ovládá vesměs mechanicky (tlačítka, páčky, šoupátka a samozřejmě jejich ekvivalenty na obrazovkách), je ten, že hlasové ovládání není příliš spolehlivé. V situaci, kdy začne být (a pro určité jazyky již je), se začne rozšiřovat čím dál, tím víc.
Mimochodem, možná to někde funguje i u nás, ale např. v USA se mi stalo, že jsem volal na plechovou hubu a namísto "chcete-li účet, stiskněte jedničku, chcete-li úvěr, stiskněte dvojku apod." jsem přirozeným hlasem řekl, co potřebuju, *automat* to zpracoval a správně mě přepojil.
Ad svoboda volby - nikdo ji nikomu nebere. Vy jste vyjádřil údiv nad tím, jak jsou tito asistenti populární a že se budou málo využívat a jak jsou nepřirození, tak jsem oponoval vlastní zkušeností, že minimálně v některém prostředí mohou být velice užiteční, není to jen "fíčura do seznamu", jak jste se snažil naznačit a naopak komunikace s nimi je velice přirozená. Mluvíme na ně a oni mluví na nás.
Viděl jste vůbec někdy Siri v akci nebo se jen s podobně laděnými kamarády utvrzujete v tom, že jde o satanovo dílo plné tendenční placené reklamy, které stvořil plechový velký bratr?
Teď jsem ten můj původně teoreticky myšlený příklad udělal v praxi a nabídlo mi to restaurace s klientským hodnocením 3,5-4,5 na Yelpu (kde těch uživatelských recenzí u restaurací je často i několik set). Tyto recenze navíc mám navíc na dva kliky dostupné (první klik na vybranou restauraci, druhý klik na "xxx Reviews".
A teď se ptám - uznáte nyní, že plácáte nesmysly o něčem, co vůbec neznáte, nebo přijdete s další spikleneckou teorií, jako že recenze na Yelpu jsou placené nebo že si Siri recenze náhodně generuje a vydává je za recenze na Yelpu (kde ve skutečnosti vůbec nejsou) nebo další paranoidní teorii o velkých bratrech a podplacených zmetcích?
Mimochodem, co takhle vyhledávací služby jako Google nebo Seznam? Nepoužíváte, že? Mohou být tendenční v rámci placené reklamy. Co Lupu? Nečtete, že, protože může obsahovat tendenční prvky v rámci PR. Uff, to je teda síla.
Moje výchozí sdělení je, že mluvit nahlas se smartphonem je nepřirozené a např. na tramvajové zastávce vyloženě legrační.
Ano, na recenze se můžete na dva kliky prokliknout, ale tím jaksi eliminujete tu výhodu, kterou jste propagoval v minulém příspěvku, tedy že není nutno odemykat mobil a někde něco vyhledávat. To mohu i bez Siri.
Očekávám, že minimálně v Evropě zůstane hlasové ovládání okrajově používanou funkcionalitou. Je to podobný "hype" jako byly 3D televize (kdo se dnes dívá doma na TV ve 3D brýlích?).
A ano. Najít dnes hdonocení nějakého produktu, které není přímo či nepřímo ovlivněno marketingem výrobce není lehké, ale zatím to stále ještě jde.
On tu je ještě jeden aspekt, který bude též kulturně podmíněný, problém hlasového ovládání je, že je slyšet... Což znamená, že příkaz neslyší jen Siri, ale též kdokoliv kolem( ať už ho to zajímá či ne).
No a teď záleží na tom, jaká je v které kultuře poměrná váha mezi "zvyšuji své pohodlí" a "zvažuji míru nepohodlí, které způsobuju okolí". Přičemž je to samozřejmě provázáno i s tou ekonomickou otázkou, v tomto ohledu je zásadní rozdíl mezi "většina cestuje hromadnou dopravou" a "většina sedí ve svých autech".
Ale jakmile člověk vystoupí ať z toho či z toho a nachází se ve veřejném prostoru, přichází ke slovu "veřejné = to, co není ničí, a z čeho si zkusím urvat co nejvíc" versus "veřejné = to, co sdílím s jinými, kde nejsem sám".
Čekal jsem, že nepřiznáte, že akorát vaříte z vody. Už naposledy, protože si začínám připadat jak ve zvláštní škole.
Postup bez Siri:
1) Odemku telefon. Už to samo osobě znamená zadat dlouhé heslo. Pokud byste se chtěl šťourat v tom, proč ho používám, nic vám po tom není, prostě je moje svobodná volba ho používat a já ho používám. Takže to máme swipe a naťukat heslo
2) Jsem v naposledy použité aplikaci. Stisk Home pro návrat na domácí obrazovku
3) Výběr složky s mapovými aplikacemi
4) Klik na Mapy
5) Klik do vyhledávacího políčka a vepsání "Miami downtown". Klik na hledat
6) Klik do vyhledávacího políčka a tam klik na vymazání stávajícího textu.
7) Napsat "Japanese restaurant" a klik na Hledat
8) Vylistují se mi - kýho ďasa, jaký div - ty samé restaurace, co mi normálně nabízí Siri. Kliknu na první z nich (Zuma). Označí se mi na mapě.
9) Kliknu podruhé, zobrazí se mi její detaily.
10) Kliknu potřetí a konečně mám ty zpropadené recenze
Postup se Siri:
1) Podržím tlačítko Home a řeknu "Show me japanese restaurants in Miami downtown". Během tuším dvou vteřin mám seznam patnácti restaurací.
2) Kliknu na první (Zuma). Objeví se její detaily.
3) Kliknu na 472 Revews
A pak přijde nějaký trouba a bude mi tvrdit, že prokliknutím eliminuju výhodu, že není nutno odemykat mobil a někde něco vyhledávat. Ten trouba by si mohl všimnout, že v postupu se Siri žádné odemykání a vyhledávání není. Pouhé přidržení Home a pak dva kliky. Nic víc.
Malá rada na závěr: když už o něčem chcete diskutovat, měl byste více naslouchat, pokud předmět diskuze neznáte. Když si budete neustále vymýšlet, jak je to špatné a co to dělá blbě a co to neumí, protože jste to v životě neviděl, vypadáte pak jako opravdový trouba. Můžete samozřejmě diskutovat o tom, zda je něco udělané dobře nebo zda je to více či méně užitečné, ale nesnažte se prosím vymýšlet umělé důvody pro to či ono.
Zopakuji můj první příspěvek:
"Osobně mě fascinuje zaujatost velkých firem hlasovým ovládáním (Siri, Cortana). Ano, působí to atraktivně, přiláká to pozornost BFU, každý si to bude chtít vyzkoušet a bude nadšen. Ale v širším měřítku to bude systematicky využívat málokdo. Najde to uplatnění ve specifických situacích (například při řízení v autě), ale při běžné situaci většinový uživatel nebude mluvit se svým mobilem, notebookem ani TV. Je to totiž nepohodlné a nepřirozené."
Nic z toho co píšete se netýká toho, co ve svém příspěvku píšu. Tedy, že mluvit se strojem je nepřirozené a proto to lidi budou používat zřídka. Minimálně v našem prostoru.
To, že je to technicky skvěle zvládnuté nepochybuji a klidně vám i přiznám, že konkrétně Siri jsem nezkoušel. Ale na Androidu můžete vyhledávat hlasem a ČESKY již déle než rok. Funguje to dobře, ale platí výše uvedené. Mluvit se strojem na veřejnosti je nepřirozené a proto to málokdo bude v Evropě využívat. A to bez ohledu na to, jak je to podle vás v případě Siri technicky dokonalé, což nezpochybňuji.
Smíchal jste dohromady tři věci.
První je "extrémně pomalé" ovládání. Zcela nepochybně existuje řada situací, kdy ano. Aspoň já tedy rychleji klikám než mluvím :-). Nicméně zcela nepochybně existuje i řada jiných situací, kdy to hlasové ovládání bude rychlejší. Ať už v situaci, kdy nemůžu ruce použít (a než bych si je uvolnil, budu mít příkaz dávno vyřčen) nebo v situaci, kdy je úkol komplexnější a vyžadoval by vícero manuálních kroků. Jsem přesvědčen, že můj příklad s japonskými restauracemi v Miami je vhodným představitelem této kategorie.
Druhá věc, kterou umiňujete, je neschopnost hlasem zadat komplexnější zadání. Zde si nejsem zcela jist, že jste nestranný. Jakým způsobem zadáte hledání "scifi mladší deseti let, aby v něm hrál herec XXX" klasicky? Nevím, jaké nástroje máte k dispozici, ale pokud máte sbírku filmů čítající stovky položek (tzn. skutečně potřebujete hledat, nevíte, jak se jmenuje), tak se obávám, že s podobným dotazem, byť zadaným klávesnicí a ne hlasem, budete mít problém. Samozřejmě se nyní nebavíme o češtině, ale v angličtině jsou už nyní zadávat poměrně složité obraty a jsem přesvědčen, že do budoucna se to zhoršovat nebude, ba naopak.
Třetí věc, neschopnost splnit neurčité zadání. Možná je to varianta na první bod - pokud jste takové zadání schopen "naklikat", pak musí existovat způsob, jak podobné zadání formulovat hlasem a pak už je jen na asistentce, aby takové formulace rozpoznala a zpracovala.
Potíž této argumentace je, že hájíte "tvrdý individualismus" a zároveň předpokládáte, že to tak má většina. Jenže to není samozřejmé.
Zkusím to převést na něco, s čím máme delší zkušenost. Lze vymyslet řadu scénářů, při nichž je nutné navštívit banku či se aspoň telefonicky spojit s bankéřem, protože jsou tak složité, že je do elektronického bankovnictví buďto nemáte šanci dostat, nebo se je alespoň bance nevyplatí implementovat.
Jenže kolik lidí si dnes s elektronickým bankovnictvím vystačí a alternativy volí jen tehdy, když musí (vyzvednutí nové karty)? Pokud byste argumentoval "Elektronické bankovnictví nestačí, protože si představte tuto situaci.", tak se na to říct akorát "Ano, v této situaci skutečně nestačí, jenže tato situace se skoro nikoho netýká." A co víc, soubor všech takových situací se mnoha lidí prostě netýká.
Když to převedeme na hlasové versus klikací ovládání, tak zřejmě máte pro vyhledávání filmů k dispozici nějaký sofistikovaný nástroj umožňující rychle vytvořit "jakýkoliv" filtr. Výborně, potom Vám gratuluju, máte složitou potřebu a cestu k jejímu řešení.
Jenže kolik lidí má potřebu pustit si film "sci-fi mladší deseti let, v níž hraje můj oblíbenec"? A jak častá tato potřeba je ve srovnání s "chci si pustit film s názvem X"?
A pak je tu ještě ta "drobnost", že "sci-fi mladší deseti let, v níž hraje XY" je něco, co už dnes v angličtině automat zvládne levou zadní, takže abyste ilustroval své stanovisko, bylo by potřeba přijít s něčím řádově složitějším... Jenže pak by hrozilo právě to riziko, že by bylo moc vidět, jak zřídka je něco takového potřeba, než aby to obstálo jako argument plošného srovnání technologií.
No a pak je taky třeba vzít v úvahu obecně báječnou schopnost člověka adaptovat se na dané podmínky, což v tomto případě znamená, že objeví-li se technologie schopná pohodlně uspokojovat některé jeho potřeby (či přesněji nějak formulované potřeby), tak se v rámci maximalizace zisku z ní přizpůsobí a začne své potřeby formulovat tak, aby zvýšil šanci na úspěch.
Nebo vulgárně řečeno, nejen, že se stroje přizpůsobují člověku, ale člověk se též přizpůsobuje strojům (což je jen zúžení obecné teze o vzájemném vztahu organismu a okolí). Můžeme se bavit o tom, za je to správně či špatně, ale v obou případech to tak prostě je.
Ukazte jediny pripad, kdy je hlasove ovladani efektivnejsi, nez ovladani manualni.
A ne, automat to nezvladne, vysledek hledani bude 0 - treba proto, ze dotycny sice hral ve scifi, ale pred 11 lety. Coz pri maualnim hledani clovek snadno a rychle objevi, kdezto pri hlasovem musi nekolikrat dokola opakovat cim dal komplexnejsi zadani, aby vyzkousel ruzne varianty, kdezto pri rucnim jen upravuje to, co jiz napsal.
Zkuste pisarce rici, ze bude text diktovat. Podotykam, ze existuji systemy, kterej maji uspesnost velmi blizkou chybovosti profesionalni pisarky. Presne do okamziku, kdy dojde k chybe - at uz v diktatu nebo prepisu. Pak pada efektivita doslova nahubu.
Ostatne, sednete si za volant, nechte si zavazat oci, a pozadejte svou partnerku at vas naviguje hlasem. A to kupodivu predpokladam, ze nemate problem porozumet tomu, co vam rika.
A proč by to automat nezvládl? Rozšířit rozmezí vyhledávání, když se v zadaném nic nenajde, přece není neřešitelná úloha (když zadám do google "ofecis for leeze", tak mi vrátí výsledky pro "offices for lease", což je o něco sofistikovanější než změnit rozmezí z deseti let na jedenáct). Takže ten jediný případ může být stále ten Váš, protože odpovědí bude "V uplynulých deseti letech nic nemám, ale před jedenácti hrál tady, nemyslels tohle?" a není třeba další iterace.
Ale je tu závažnější argument. Aby bylo manuální hledání včetně řešení případných problémů efektivní, musí být splněno několik předpokladů: musíte mít k dispozici dostatečně silný nástroj, musíte ho umět dostatečně dobře používat (přičemž tyto dva body jsou do jisté míry vzájemně zástupné) a musíte být v případě problému schopen poznat, v čem asi tak spočívá, abyste správně modifikoval svůj postup.
To jsou ale velmi nesamozřejmé předpoklady, když se ptáte "Kdy je hlasové ovládání efektivnější než manuální?", nejspíše je to otázka "Kdy je efektivnější pro mě?". Na to je dost možná odpověď "Nikdy.".
Pokud to ale necháme v obecnější rovině "Kdy je efektivnější pro běžného Frantu?", pak vcelku kdykoliv, kdy chce Franta něco, co Siri zvládne, protože kdyby neměl Siri, tak by to sám nezvládl buďto vůbec, nebo by jeho postup byl pravděpodobně dost neefektivní.
A navíc zatímco to, "co se skrývá za Siri", se může vyvíjet (lze třeba napojit na další databázi a rázem má určité schopnosti v nové oblasti, lze implementovat nejmodernější algoritmy v analýze přirozeného jazyka a dolování dat), u Franty s vývojem moc nepočítejte.
Osobně mě fascinuje zaujatost velkých firem hlasovým ovládáním (Siri, Cortana). Ano, působí to atraktivně, přiláká to pozornost BFU, každý si to bude chtít vyzkoušet a bude nadšen. Ale v širším měřítku to bude systematicky využívat málokdo. Najde to uplatnění ve specifických situacích (například při řízení v autě), ale při běžné situaci většinový uživatel nebude mluvit se svým mobilem, notebookem ani TV. Je to totiž nepohodlné a nepřirozené.
Svoboda volby byla myšlena jinak. Že informace podané hlasovým automatem mohou být tendenční v rámci placené reklamy. Při tomto způsobu komunikace je navíc uživatel odstřižen od možné kontroly (názor třetí strany). Jistě, pokud se budu ptát v kolik jede autobus do Kolína, tak OK. Ale nechat si doporučit restauraci, lékaře ... To už zavání plechovým velkým bratrem, který ví nejlépe, co je pro vás dobré.
Hlasove ovladani je nejen nespolehlive, ale predevsim extremne pomale.
Primitivni uloha - mate rekneme v obyvaku 5 ruznych svetel, a jedno konkretni chcete rozsvitit. Nez hlasove rekneme jake, tak jej 10x zapnete vypinacem.
Prevedte to na jakekoli slozitejsi ovladani. Rekneme ze chcete pustit film, ma to byt scifi, ma byt mladsi deseti let, ma v tom hrat vas oblibenec. Vysvetlete to hlasem tak, aby to ta hloupa krabka pochopila. Asi tak 100x rychleji ten film vyberete tlacitky.
Ktomu si prictete neurcite zadani na tema "neco hledam, nejsem si uplne jisty co, ale az to uvidim, budu vedet ze je to ono".