Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Toată lumea presupune că memoria ChatGPT este un sistem sofisticat RAG cu baze de date vectoriale și căutare semantică.
Manthan a făcut inginerie inversă. Arhitectura propriu-zisă este aproape dezamăgitor de simplă: metadate de sesiune care expiră, fapte explicite stocate sub formă de text, rezumate ușoare de chat și o fereastră glisantă.
Niciun embedding. Fără căutare de similaritate. Nu există recoltare la scară largă.
Partea interesantă? Asta explică de ce pare atât de rapid. Sistemele tradiționale RAG încorporează fiecare mesaj, rulează căutări de similaritate pentru fiecare interogare, extrag contexte complete. ChatGPT injectează direct rezumate pre-calculate. Ei fac schimb de context istoric detaliat pentru latență.
Aceasta este aceeași lecție care continuă să apară în infrastructura AI: când controlezi întregul stack, simplitatea selectată depășește adesea complexitatea sofisticată. OpenAI nu are nevoie să construiască un sistem general de recuperare. Au nevoie doar de unul care să funcționeze pentru ChatGPT.
Arhitectura pe patru straturi (metadate de sesiune → fapte stocate → rezumate de conversații → fereastră glisantă) este practic o ierarhie de memorie realizată manual. Fiecare strat are o persistență diferită și scopuri diferite. Metadatele de sesiune se adaptează în timp real. Faptele persistă la nesfârșit. Rezumatele oferă continuitate. Fereastra menține coerența.
Sistemul de memorie al lui Anthropic folosește un tipar similar. Modelele care par cele mai personale nu sunt cele cu cea mai sofisticată recuperare. Ei sunt cei care depozitează lucrurile potrivite și le injectează la momentul potrivit.
Limită superioară
Clasament
Favorite
