الجميع يفترض أن ذاكرة ChatGPT هي نظام RAG متقدم مع قواعد بيانات متجهة وبحث دلالي. قام مانثان بعكس هندستها. البنية الفعلية بسيطة بشكل مخيب للآمال تقريبا: بيانات وصفية للجلسة تنتهي صلاحيتها، حقائق صريحة مخزنة كنص نصي، ملخصات دردشة خفيفة، ونافذة منزلقة. لا توجد تضمينات. لا يوجد بحث عن التشابه. لا يوجد استرجاع على نطاق واسع. الجزء المثير للاهتمام؟ وهذا يفسر لماذا تشعر أن الأمر سريع جدا. أنظمة RAG التقليدية تدمج كل رسالة، وتجري عمليات بحث التشابه على كل استفسار، وتسحب السياقات الكاملة. ChatGPT فقط يحقن ملخصات محسوبة مسبقا مباشرة. هم يتبادلون السياق التاريخي التفصيلي مقابل التأخير. وهذا هو نفس الدرس الذي يستمر في الظهور عبر بنية الذكاء الاصطناعي التحتية: عندما تتحكم في الحزمة بأكملها، غالبا ما تتفوق البساطة المنسقة على التعقيد المتطور. OpenAI لا يحتاج إلى بناء نظام استرجاع عام. هم فقط بحاجة إلى واحدة تعمل مع ChatGPT. البنية ذات الطبقات الأربع (بيانات الجلسة → الحقائق المخزنة → ملخصات المحادثات → نافذة منزلقة) هي في الأساس تسلسل هرمي للذاكرة يدويا. كل طبقة لها استمرارية مختلفة وأغراض مختلفة. تتكيف بيانات الجلسة الوصفية في الوقت الحقيقي. الحقائق تبقى إلى الأبد. الملخصات توفر استمرارية. تحافظ النافذة على التماسك. نظام ذاكرة Anthropic يستخدم نمطا مشابها. العارضات اللاتي يشعرن بأنها شخصية أكثر ليسوا الأكثر تعقيدا في الاسترجاع. هم من يخزنون الأشياء الصحيحة ويحقنونها في الوقت المناسب.