هذه نقطة مهمة جدا ، لقد اعتمدنا على أن تكون جميع LLMs متشابهة إلى حد كبير مع بعضها البعض (حتى إلى الحد الذي يكون فيه المطالبة متوافقة عبر النماذج). قد يبدأ ذلك في التغيير مع التعلم المعزز.
roon
roon‏28 أغسطس 2025
كانت جميع الشركات النموذجية تتدرب مسبقا على ~ نفس الإنترنت. بالطبع ، يمكن ل Grok الوصول إلى مجموعة بيانات Twitter ويمكن ل Gemini التدريب المسبق على YouTube وما إلى ذلك. لكنها في الغالب نفس الإنترنت OTOH ، ستكون RL Envs عندما يختار المختبر تحديد الأولويات. لذلك يجب أن تتوقع المزيد من الانتواع
‏‎22.54‏K