Tekoälyagenttien 5 kehitystasoa. Muutaman viime vuoden aikana olemme siirtyneet yksinkertaisista LLM-→ täysimittaisiin agenttijärjestelmiin, joissa on päättely, muisti ja työkalujen käyttö. Tässä on vaiheittainen erittely. 1) Pienen kontekstiikkunan LLM:t - Syöte: Teksti → LLM → Tulostus: Teksti - Varhaiset muuntajapohjaiset chatbotit. - Pystyi käsittelemään vain pieniä palaa syötteestä (lyhyitä keskusteluja). - Kun ChatGPT ilmestyi, sen kontekstiikkuna oli vain 4k tokenia. 2) Suuret kontekstiikkunan LLM:t - Syöte: Suuri teksti/asiakirjat → LLM → Tuloste: Teksti -Mallit, kuten Claude/ChatGPT, päivitetty käsittelemään tuhansia tokeneita. -Sallittu suurempien asiakirjojen ja pidempien keskustelujen jäsentäminen. 3) LLM + työkalujen käyttö (RAG-aikakausi) -Syöttö: Teksti → LLM + haku/työkalu → tulostus: Teksti -Haku-Augmented Generation antoi pääsyn tuoreeseen + ulkoiseen dataan. -Työkalut, kuten hakusovellusliittymät, laskimet ja tietokannat, paransivat LLM-tuloksia. 4) Multimodaalinen LLM + työkalujen käyttö + muisti - Syöttö: Teksti + kuvat + muut modaliteetit → LLM + työkalu + muisti → lähtö: Multimodaalinen - Agentit pystyivät käsittelemään useita tietotyyppejä (tekstiä, kuvia, ääntä). - Muisti toi pysyvyyttä vuorovaikutuksessa. 5) Agentit, joilla on päättely ja muisti - Tulo: Multimodaalinen → LLM → Päätös → Lähtö: Multimodaalinen -Varustettu: → Lyhytaikainen, pitkäaikainen ja episodinen muisti → Työkalukutsu (haku, API:t, toiminnot) → Päättely ja ReReact-pohjainen päätöksenteko - Pohjimmiltaan tämä on AI Agent -aikakautta, jota elämme nykyään. 👉 Sinulle: Miltä luulet seuraavan tason näyttävän tästä eteenpäin?
24,23K