Poslechněte si, jak Seznam technicky pracuje na vývoji vlastní umělé inteligence

28. 1. 2024

Sdílet

Pavel Zima - Seznam.cz Autor: Seznam.cz

V Seznamu (na úvodním snímku je Pavel Zima, člen představenstva firmy) pracují na vlastním jazykovém modelu a tuní jiné modely typu Llama pro své účely a co nejlepší práci s češtinou. Několik detailů jsme nedávno přinesli na Lupě. Pokud vás téma zajímá více, dáváme k dispozici zvukový záznam přednášky Marka Šimůnka, který se v LLM týmu Seznamu věnuje technické části.

Zhruba dvacetiminutová přednáška z konference AI Days 2024 společnosti M Computers je k dispozici zde (omluvte zvukovou kvalitu). K tomu je také k dispozici prezentace v PDF.

Šimůnek mimo jiné popisuje, jak Seznam pracuje s OpenAI proxy a jak by se do budoucna měla změnit na LLM proxy. V přednášce je rovněž nastíněn výkon nebo použití TensorRT a vLLM.

Seznam na práci s modely používá akcelerátory Nvidia H100 (80 GB). Firma veřejně nekomentuje, kolik jich má. Podle informací Lupy by to ale mělo být kolem stovky takových karet. Jedna dnes na trhu vyjde na zhruba tři čtvrtě milionu korun. Dále pak jde o stovky modelů L4 (24 GB).

Seznam.cz chystá vlastní umělou inteligenci. V češtině už je o něco lepší než GPT-3.5 Přečtěte si také:

Seznam.cz chystá vlastní umělou inteligenci. V češtině už je o něco lepší než GPT-3.5

Našli jste v článku chybu?

Autor aktuality

Reportér Lupa.cz a E15. O technologiích píše také do zahraničních médií.

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).