Nová verze AI modelu od Googlu Gemini 1.5 podle firmy přináší vyšší výkon při nižších nárocích na výpočetní výkon. K testování zatím firma uvolnila středně výkonný model Gemini 1.5 Pro, který má dosahovat obdobných výsledků jako dosud nejvýkonnější model Gemini Ultra 1.0.
Model standardně využívá kontextové okno o velikosti 128 tisíc tokenů, uzavřená skupina testerů jej ale testuje také s oknem o rozsahu až 1 milion tokenů, což je dosud nejrozsáhlejší kontextové okno představené v AI modelech. Model tak může pracovat s texty o rozsahu až 700 tisíc slov (v angličtině).
Testeři mohou do modelu nahrávat více souborů, s jejichž daty pak model může pracovat, nebo analyzovat obsah videa o délce až 1 hodina (rozebírá ale zatím jen obrázky bez audia). Zvládá také zpracovat zvukové nahrávky o délce až 11 hodin. Google experimentálně dokázal kontextové okno zvýšit až na 10 milionů tokenů, říká firma.
Gemini 1.5 funguje na architektuře Mixture-of-Experts (MoE). Jde vlastně o soustavu menších neuronových sítí, které řeší jednotlivé úlohy. Google si od přístupu slibuje zvýšení efektivity modelu.
K testování Gemini 1.5 se mohou zájemci z řady vývojářů hlásit přes Google AI Studio. Datum veřejného uvedení ani ceny, za které bude Gemini 1.5 poskytovat, Google zatím neoznámil.