Un benchmark comme cline-bench ne fonctionne que s'il est entièrement ouvert. Chaque tâche provient d'un dépôt open source, donc tout le monde peut inspecter le problème, reproduire l'environnement et comparer les modèles et les agents sur le même travail d'ingénierie réel. C'est exactement ce qui importe aux personnes comme @b_roziere, chercheur scientifique chez @MistralAI, qui souhaitent une infrastructure ouverte qui aide à faire progresser les capacités de codage pour tout le monde.