معيار مثل cline-bench يعمل فقط إذا كان مفتوحا بالكامل. كل مهمة تأتي من مستودع مفتوح المصدر بحيث يمكن لأي شخص فحص المشكلة، وإعادة إنتاج البيئة، ومقارنة النماذج والوكلاء على نفس العمل الهندسي الحقيقي. هذا بالضبط ما يهم أشخاصا مثل @b_roziere، عالم أبحاث في @MistralAI، الذين يريدون بنية تحتية مفتوحة تساعد في دفع حدود قدرات البرمجة للجميع.