Herkes ChatGPT'nin hafızasının vektör veritabanları ve anlamsal arama içeren gelişmiş bir RAG sistemi olduğunu varsayıyor. Manthan bunu tersine mühendislik yaptı. Gerçek mimari neredeyse hayal kırıklığı yaratacak kadar basit: süresi dolan oturum meta verileri, metin olarak saklanan açık gerçekler, hafif sohbet özetleri ve kaydıran bir pencere. Gömülü yok. Benzerlik araması yok. Büyük ölçekte geri alma yok. İlginç kısmı mı? Bu yüzden bu kadar hızlı hissettiriyor. Geleneksel RAG sistemleri her mesajı gömüyor, her sorguda benzerlik aramaları yapıyor, tam bağlamları çekiyor. ChatGPT doğrudan önceden hesaplanmış özetleri enjekte ediyor. Gecikme karşılığında ayrıntılı tarihsel bağlamı takas ediyorlar. Bu, yapay zeka altyapısında sürekli ortaya çıkan aynı derstir: tüm yığını kontrol ettiğinizde, kürenle hazırlanmış sadelik genellikle karmaşık karmaşıklığın önüne geçer. OpenAI'nin genel bir geri alma sistemi kurmasına gerek yok. Sadece ChatGPT için çalışan bir tane ihtiyaçları var. Dört katmanlı mimari (oturum meta verileri → saklanan gerçekler → konuşma özetleri → kaydıran pencere) temelde el yapımı bir bellek hiyerarşisidir. Her katmanın farklı sürekliliği ve farklı amaçları vardır. Oturum meta verileri gerçek zamanlı olarak uyarlanır. Gerçekler sonsuza dek devam eder. Özetler süreklilik sağlar. Pencere tutarlılığını koruyor. Anthropic'in hafıza sistemi de benzer bir desen kullanıyor. En kişisel hissettiren modeller, en sofistike geri alma yöntemine sahip olanlar değildir. Doğru şeyleri saklayan ve doğru zamanda enjekte edenler onlardır.