5 úrovní evoluce AI agentů. Během posledních několika let jsme se posunuli od jednoduchých LLM → k plnohodnotným agentním systémům s uvažováním, pamětí a využitím nástrojů. Zde je podrobný rozpis. 1) Malé kontextové okno LLM - Vstup: Text → LLM → Výstup: Text - První chatboti na bázi transformátorů. - Mohl zpracovat pouze malé části vstupu (krátké konverzace). - Když ChatGPT vyšel, měl kontextové okno s pouhými 4 tisíci tokeny. 2) LLM s velkým kontextovým oknem - Vstup: Velký text/Dokumenty → LLM → Výstup: Text -Modely jako Claude/ChatGPT byly upgradovány tak, aby zvládly tisíce tokenů. -Povoleno parsování větších dokumentů a delších konverzací. 3) LLM + použití nástroje (éra RAG) -Vstup: Text → LLM + načítání / nástroj → výstup: Text -Retrieval-Augmented Generation poskytl přístup k čerstvým + externím datům. -Nástroje, jako jsou vyhledávací rozhraní API, kalkulačky a databáze, posílily výstupy LLM. 4) Multimodální LLM + použití nástroje + paměť - Vstup: Text + obrázky + další modality → LLM + nástroj + paměť → Výstup: Multimodální - Agenti mohou zpracovávat více typů dat (text, obrázky, zvuk). - Paměť zavedla perzistenci napříč interakcemi. 5) Agenti s uvažováním a pamětí - Vstup: Multimodální → LLM → Rozhodovací → Výstup: Multimodální -Vybaveny: → Krátkodobá, dlouhodobá a epizodická paměť Volání nástrojů → (vyhledávání, API, akce) → Uvažování a rozhodování založené na React-based - V podstatě se jedná o éru AI Agentů, ve které dnes žijeme. 👉 K vám: Jak si myslíte, že bude odsud vypadat další úroveň?
14,9K