Tento článek mohl napsat AI chatbot a je možné, že byste to nepoznali. Tak by se dal shrnout vývoj, kterým tzv. AI technologie prošly v roce 2023. Od představení chatbota ChatGPT, který svou schopností konverzovat v přirozeném jazyce pobláznil svět, uplynulo pouhých 13 měsíců.
Rok 2023 se ale dá bez přehánění překřtít na Rok generativní AI. A to i s ohledem na přehnaná očekávání a nesmyslné předpovědi týkající se umělé inteligence, kterých jsme se během něj dočkali. Obecná umělá inteligence je pořád vzdálenou budoucností, AI zdaleka nenahradila tolik lidských zaměstnanců, jak někteří „experti“ předpovídali, a firmy mohou bez potíží fungovat i bez jejího využívání.
O AI novinkách v roce 2023 by se daly psát tlusté knihy, my nabízíme výběr hlavních událostí, které podle nás uplynulý rok přinesl:
TIP: Co umí generátor obrázků DALL-E 3 s ChatGPT? Podívejte se:
Stíhání ChatGPT
Obavy ze zaostávání za konkurencí, které vypuštění ChatGPT na veřejnost vyvolaly v Googlu, vyústily v únoru 2023 v oznámení chatbota Bard. Google zároveň přislíbil jeho integraci do vyhledávání. ChatGPT se dočkal první konkurence od velké digitální firmy. Koncem února se přidala Meta Marka Zuckerberga, která vydala svůj model Llama jako opensource.
V březnu 2023 firma OpenAI představila nový velký jazykový model GPT-4, který přinesl vyšší výkon i přesnost. V červenci přišel konkurenční Anthropic s modelem Claude 2, který dokázal pracovat s až 100 tisíci jazykovými tokeny – tedy přibližně 65 tisíci slovy v angličtině. Vylepšený model Llama 2 vydala také Meta, opět jako opensource.
Ve stejném měsíci se do AI závodu zapojil Elon Musk, který oznámil rozjezd firmy xAI. Už v listopadu pak vypustil do veřejného testu chatbota Grok. V září oznámil vývoj svého AI asistenta Joule evropský digitální obr SAP, koncem roku pak Amazon ohlásil svého chatbota Q.
Multimodální modely
Původně čistě textoví chatboti v průběhu roku začali „dostávat oči a uši“. Začalo být možné do nich například zadávat obrázky a požadovat, aby chatbot popsal, co na snímku je. Tzv. multimodální schopnosti jsou do budoucna klíčové a postupně se dočkávají vylepšení.
ChatGPT získal schopnost „chápat“ zadání ve formě fotografie v říjnu. Uživateli to umožňuje například vyfotit obsah ledničky a dostat od chatbota tipy na recepty, které by se daly z vyfocených ingrediencí uvařit. Uživatelé navíc mohou zadávat své požadavky hlasovými povely a výsledky si nechat přednést jedním ze syntetických hlasů. Funkce jsou ale dostupné jen platícím uživatelům.
Pokročilejší schopnost analyzovat obrázky slibuje také Bard od Googlu, který v prosinci uvedl novou verzi založenou na modelu Gemini. Na rozdíl od ChatGPT je jednodušší verze Gemini Pro dostupná zdarma, v EU ale zatím kvůli nesouladu s regulacemi nefunguje. Pokročilou multimodalitu má stejně přinést až vyšší verze Ultra, kterou Google chystá na začátek roku 2024.
Copilot ve Windows
Jednou z firem, které rychlý veřejný nástup generativní AI překvapil, byl kromě Googlu také Microsoft. Společnost zareagovala uzavřením strategického spojenectví s OpenAI a do amerického startupu směřuje miliardové investice jak v podobě financí, tak technologické podpory: OpenAI využívá k trénování svých modelů i jejich provozu cloudovou infrastrukturu Microsoftu.
ChatGPT se stal základem chatbota Bing Chat integrovaného do prohlížeče Edge. Firma ale šla ještě dál a v září začlenila AI chatbota do operačního systému Windows 11. Služba Copilot má postupně změnit způsob, jak uživatelé systém používají. V Česku (a zbytku EU) ale máme zatím smůlu – kvůli nesouladu s regulacemi Copilot zatím není v EU ve Windows dostupný. Možná se dočkáme na jaře 2024.
Agent jménem GPT
OpenAI před koncem roku stihla uvést další verzi svého jazykového modelu GPT-4. Je opět jen pro platící uživatele, jmenuje se GPT-4 Turbo, rozšiřuje tzv. kontextové okno na 128 tisíc jazykových tokenů (asi 300 stran textu v angličtině), a především přinesla zajímavou možnost vytvářet si „vlastní GPT“.
Jde o speciální persony/agenty, které mají předem definované chování (svým způsobem jde o vylepšené používání tzv. custom instructions). Můžete tak například stvořit skript, který na základě textového zadání vygeneruje k článku s určitým titulkem ilustrační fotografii s předem definovanými parametry (není tedy nutné tyto parametry definovat u každé konverzace vždy znovu).
Agent také dokáže čerpat data z webů, může pracovat na základě informací v nahraných dokumentech a má řadu dalších možností. To vše bez nutnosti umět programovat – stačí zadat slovní popis toho, co má váš agent umět.
Tyto persony se dají sdílet (využívat je ale mohou opět jen platící uživatelé) a mohou je využívat i další uživatelé (s předplatným). OpenAI slibuje, že v roce 2024 spustí obchod s vytvořenými GPTs. Firma zatím z obav před následky schopnosti agentů omezuje a nedává jim příliš velkou samostatnost, to se ale v budoucnu může změnit. Potenciál je obrovský.
Regulace AI a nařízení AI Act
Praktické snahy o vytvoření regulačního rámce pro AI technologie odstartovaly v Evropě v roce 2021, kdy Evropská komise navrhla nové nařízení AI Act. Na Lupě se tématu podrobně věnujeme. Kritici návrhu od začátku varovali před tím, že by přílišná regulace mohla ohrozit vývoj AI v EU.
Schvalování návrhu v roce 2023 ovlivnil nečekaný boom generativní AI, s kterým se evropští zákonodárci pokusili vyrovnat návrh na regulaci tzv. základnových modelů (foundation models), tedy především velkých jazykových modelů typu GPT, Llama a podobně.
Teprve v roce 2023 se k lobbingu přidaly výrazné evropské firmy vyvíjející AI technologie, které prostřednictvím svých vlád tlačily na zmírnění regulace. Zprávy ze zákulisí v závěru roku naznačovaly, že by celé nařízení mohlo kvůli sporům o jeho podobu spadnout pod stůl, po maratonu jednání se ale nakonec vyjednavači Evropského parlamentu, Rady EU a Komise shodli na kompromisním znění. To teď čeká už jen formální schválení.
Spory o obsah
Dokud byla generativní AI nedokonalou hračkou v laboratořích, nikdo příliš neřešil, odkud se berou data pro její trénink, a vše se krylo výjimkami pro vědu a výzkum. Jakmile se ukázalo, že jde a půjde o miliardový byznys, začalo růst napětí mezi vývojáři a tvůrci obsahu, na kterém byly modely natrénovány.
Fotobanka Getty Images už v lednu 2023 zažalovala v USA a ve Velké Británii firmu Stability AI, která provozuje generátor obrázků Stable Diffusion, a obvinila ji z neoprávněného zkopírování milionů autorsky chráněných fotek použitých pro trénování modelu. Výsledek řízení byl i na konci roku teprve ve hvězdách.
V prosinci nicméně po měsících vyjednávání došla trpělivost i prvnímu velkému mediálnímu vydavatelství: americký deník New York Times (NYT) zažaloval firmy OpenAI a Microsoft. Žaloba tvrdí, že firmy nelegálně použily k natrénování svých služeb a modelů texty New York Times, včetně těch, které měly být dostupné jen předplatitelům. Jde o zásadní spor, který by mohl v americkém právu určit hranice mezi tzv. řádným užitím (fair use) internetového obsahu a jeho nezákonným zneužitím.
Odlišný přístup ukázalo německé vydavatelství Axel Springer, které v prosinci naopak oznámilo dohodu s OpenAI. Týká se využívání obsahu jeho titulů (např. Politico nebo Bild) pro trénink AI modelů a pro jejich citace v rámci ChatGPT. Vydavatel za to má získat licenční poplatky v řádu desítek milionů eur ročně. Který přístup nakonec bude úspěšnější? Tohle téma bude v roce 2024 velmi zajímavé.
Interní drama v OpenAI
OpenAI se v roce 2023 postarala o vlnu vzrušení nejen svými technologickými pokroky. Nečekané odvolání spoluzakladatele a výkonného ředitele Sama Altmana v listopadu spustilo pětidenní interní bitku plnou zvratů, které se odehrávaly na veřejnosti i na sociálních sítích.
Altman se nakonec do čela firmy vrátil, dodnes ale není úplně jasné, o co vlastně šlo, kdo byl kladným a kdo záporným hrdinou a zda vůbec šlo bojující strany takto černobíle rozlišovat. Zůstalo zejména překvapení, že se hlavní představitelé firmy odpovědné za technologii, která má změnit svět, dokáží chovat jako nezodpovědná děcka.
Zajímavé články, které jsme na téma AI v roce 2023 napsali:
- Umělá inteligence po česku: Tady je osm tuzemských AI startupů, které stojí za to sledovat
- Senta Čermáková (Czechitas): Díky generativní AI vtáhneme do digitálního světa více chytrých žen
- ChatGPT umí obrázky aneb Dorazil DALL-E 3. Co umí, co ne a navrch praktické tipy
- Jak naučit ChatGPT počítat, pracovat s dokumenty, dát mu zrak nebo přístup k internetu?
- AI rozevře nůžky mezi dobrými a špatnými vývojáři. V Netclubu debatovali Michal Pěchouček, Honza Sládek a Jan Macek
- Největší riziko AI? Evropa si technologii nechala utéct a teď na ní vydělají Google a Microsoft, říká Tomáš Mikolov
- Nástup AI připomíná první fázi průmyslové revoluce. Jak generátory změní novinařinu? Debatovali Petr Koubský a Pavel Kasík
- Umělá inteligence a smrt fotografie? Na pohřbívání jen tak nedojde
- Jak z generativních AI dostat to nejlepší? Persony, funkce v Excelu i prompty pro obrázkové AI
- Jan Cibulka (iRozhlas): AI už v redakci testujeme. Články psát neumí, ale pomáhá s rutinou
- Není všechno zlato, co se AI. Jak mohou konverzační modely změnit média?
- Dušan Janovský: Vyhledávače bude do budoucna nejvíc používat AI
- Jak si pokecat (a programovat) s neuronkou ChatGPT, aby to stálo za ten čas