Kaikki olettavat, että ChatGPT:n muisti on jokin kehittynyt RAG-järjestelmä, jossa on vektoritietokantoja ja semanttista hakua. Manthan käänteisesti suunnitteli sen. Itse arkkitehtuuri on lähes pettymykseksi yksinkertainen: istunnon metatiedot, jotka vanhenevat, eksplisiittiset faktat tallennettuna tekstiksi, kevyet keskusteluyhteenvedot ja liukuva ikkuna. Ei upotuksia. Ei yhtäläisyyshakua. Ei keräystä suuressa mittakaavassa. Mielenkiintoinen osa? Tämä selittää, miksi se tuntuu niin nopealta. Perinteiset RAG-järjestelmät upottavat jokaisen viestin, suorittavat samankaltaisuushakuja jokaiselle kyselylle, hakevat täydelliset kontekstit. ChatGPT vain syöttää valmiiksi laskettuja yhteenvetoja suoraan. He vaihtavat yksityiskohtaista historiallista kontekstia viiveeseen. Tämä on sama oppi, joka toistuu tekoälyn infrastruktuurissa: kun hallitset koko pinoa, kuratoitu yksinkertaisuus usein ylittää monimutkaisuuden. OpenAI:n ei tarvitse rakentaa yleistä hakujärjestelmää. He tarvitsevat vain sellaisen, joka toimii ChatGPT:lle. Nelikerroksinen arkkitehtuuri (istunnon metatiedot → tallennetut faktat → keskustelun yhteenvedot → liukuva ikkuna) on käytännössä käsin tehty muistihierarkia. Jokaisella kerroksella on erilainen pysyvyys ja erilaiset tarkoitukset. Istuntojen metatiedot mukautuvat reaaliajassa. Faktat säilyvät ikuisesti. Yhteenvedot tarjoavat jatkuvuutta. Ikkuna säilyttää johdonmukaisuuden. Anthropicin muistijärjestelmä käyttää samanlaista kaavaa. Ne mallit, jotka tuntuvat henkilökohtaisimmilta, eivät ole niitä, joissa on kaikkein kehittynein palautus. He ovat niitä, jotka säilyttävät oikeat aineet ja ruiskuttavat ne oikeaan aikaan.