Un benchmark como cline-bench solo funciona si es completamente abierto. Cada tarea proviene de un repositorio de código abierto, por lo que cualquiera puede inspeccionar el problema, reproducir el entorno y comparar modelos y agentes en el mismo trabajo de ingeniería real. Esto es exactamente lo que importa a personas como @b_roziere, Científico de Investigación en @MistralAI, que quieren una infraestructura abierta que ayude a impulsar la frontera de las capacidades de codificación para todos.