5 nivåer av utvikling av AI-agenter. I løpet av de siste årene har vi gått fra enkle LLM-er → til fullverdige agentiske systemer med resonnement, minne og verktøybruk. Her er en trinn-for-trinn-oversikt. 1) LLM-er med liten kontekst - Inndata: Tekst → LLM → Utdata: Tekst - Tidlige transformatorbaserte chatbots. - Kunne bare behandle små biter av innspill (korte samtaler). - Da ChatGPT kom ut, hadde den et kontekstvindu på bare 4k tokens. 2) LLM-er med stort kontekstvindu - Inndata: Stor tekst / dokumenter → LLM → Utdata: Tekst -Modeller som Claude/ChatGPT oppgradert til å håndtere tusenvis av tokens. -Tillatt å analysere større dokumenter og lengre samtaler. 3) LLM + verktøybruk (RAG-æraen) -Inndata: Tekst → LLM + Gjenfinning/Verktøy → Utdata: Tekst -Retrieval-Augmented Generation ga tilgang til ferske + eksterne data. -Verktøy som søke-APIer, kalkulatorer og databaser økte LLM-utgangene. 4) Multimodal LLM + verktøybruk + minne - Inndata: Tekst + Bilder + andre modaliteter → LLM + Verktøy + Minne → Utgang: Multimodal - Agenter kan behandle flere datatyper (tekst, bilder, lyd). - Hukommelse introduserte utholdenhet på tvers av interaksjoner. 5) Agenter med resonnement og hukommelse - Inngang: Multimodal → LLM → Beslutning → utgang: Multimodal - Utstyrt med: → Kortsiktig, langsiktig og episodisk hukommelse → Verktøykall (søk, APIer, handlinger) → Resonnement og ReAct-basert beslutningstaking - I hovedsak er dette AI Agent-æraen vi lever i i dag. 👉 Over til deg: Hvordan tror du neste nivå vil se ut herfra?
18,51K