Opravdu se mi líbil tento článek od OpenAI o tom, jak lidé používají ChatGPT. Poptávka po inferenci bude v příštích 1-2 letech nadále explodovat. Je jasné, že jeho smysluplná část bude vyžadovat přístup k webu v reálném čase. Dnes mají společnosti zabývající se umělou inteligencí následující možnosti: Scrape Google, Scrape Bing (který zabil jejich API) nebo přeřazení výsledků vyhledávání uložených do mezipaměti pomocí neuronových sítí (některé startupy to dělají). Žádný z nich se ve skutečnosti neškáluje. dnes Grass využívají firmy k doručování neuvěřitelného množství trénovacích dat (2-3 petabajty denně), z nichž většina je multimodální. Vzhledem k tomu, že výpočetní nároky na odvozování převracejí trénování, očekáváme, že stejná infrastruktura, která se používá pro shromažďování trénovacích dat, se použije pro načítání kontextu v reálném čase.