Troufnu si tvrdit, že rozdíl poznám. Předpokládám totiž, že strojově generované články budou gramaticky v pořádku, což se o těch psaných lidmi říct nedá (tím spíše právě u těch nudných, které je ale třeba chrlit rychle a ve velkém množství). Leda byste s tím počítali a sem tam schválně vygenerovali nějaký ten překlep či hrubku.
Žeryku, mýlíte se! Je to lingvistická hříčka.
Místo urážek, příště raději použijte Google ;)).
https://en.m.wikipedia.org/wiki/Time_flies_like_an_arrow;_fruit_flies_like_a_banana
Nemyslim si, ze "zenu holi stroj" nebo "Time flies like an arrow" jsou vety, ktere by komplikovali *praktickou* textovou analytiku.
Jde o to, na co ty vysledky NLP chcete pouzit. Roztridit texty do 3 kategorii umi dneska pocitac asi lepe nez clovek. Na prekladani basni si budeme muset jeste pockat (ale potrebujeme to opravdu delat strojem?)
Tato věta je nepřekonatelná i pro "průměrného člověka" (jak ukazuje i předchozí reakce). Ostatně když takovou větu uslyšíte samu o sobě, jak ji interpretujete? Maximálně jako výčet možných významů, což ale stroj zvládne též.
Správná interpretace bude záviset na kontextu, což zvládnou někteří lidé a automaty se k tomu pomalu blíží, zatím zvládají porozumět trapným větám typu "Kde je nejbližší lékárna?", na bezchybnou interpretaci důležité věty "Holý/í ženu stroj." si ale opravdu ještě nějaký ten pátek počkáme.
Sport, pocasi, burza jsou bezna "spolecenska" nevinna konverzacni temata. Tam to aspon nejak funguje prave proto, ze nejsou zaplevelena informacemi, ktere musi umet stroj rozpoznat a spolehlive eliminovat. Mnozstvi dat o politice a zpravodajstvi je vetsi nez o sportu, jenze to jsou prave mnohdy tzv. spinava data.
Je vyborne, pokud v textu napriklad rozeznate osoby od zemepisnych pojmu, prip. podrobnejsi kontextove/semanticke obarveni. Ja bych tohle bral za nadstandardne slusny vykon, i kdyz to asi bezne ctenare neohromi tak jako kdyz stroj pise o sportu.
To nebude tak daleko, uz ted jsou roboti, kteri za vas vyridi nudnou domluvu schuzky - https://x.ai/.
No však v tom je přeci ten obchodní model:
- firma si najme Geneea na automatické vyřizování neodbytných zákazníků
- a ti zákazníci si najmou Geneea na dovolání se do těch nepoužitelných linek pro péči o zákazníka
Pane Hana, už to umí generovat nekrology? To je taky přeci nuda je psát, ne?
Páni ostatní: vzhledem k úrovni českého novinářstva, vystudovaného zvětšiny pod učitely komunisty (nebo tolerovanými) očekávám zvýšení kvality článků alespoň o jeden level. Oproti bulvárům typu Novinky
ky a i/dnes tak o tři úrovně ;-)
Už se nemůžu dočkat robotického telemarketingu a automatické podpory. Už teď je problém operátory u některých firem donutit opustit schéma vypnout/zapnout, zresetovat do továrního nastavení, zkontrolovat kabely. Až budou všude roboti tak to abych si taky napsal nějakého robota co za mě absolvuje těch prvních 20 minut komunikace s automatem a pípne na mě až v okamžiku kdy v hovoru dosáhne přepojení na někoho relevantního.
Lituju lidi, kteri budou cist clanky od stroju. Zejmena pokud stroj nerozumi obsahu. Pri kvalite dnesnich redaktoru novinky.cz, idnes.cz apod to mozna nebude tak velky kvalitativni pokles, ale prece jenom clovek je clovek.
Mimochodem, proc je tematickou oblasti prave sport? Autori neveri kvalite vystupu a maji obavy z naslednych zalob jmenovanych osob a instituci, pokud by zpracovavali i jina temata? :-)
Proc sport? Protoze
(1) pro sportovni utkani jsou detailni strukturovana data (kdo kdy co na hristi delal). Podobne pocasi a burza.
(2) sportovnich utkani je spousta a novinari ty clanky nestihaji psat. Navic je to docela nuda. Psat analyzy je zajimavejsi.
(3) S necim je treba zacit.
Myslim si, ze rozdil nepoznate.