Un benchmark como el cline-bench solo funciona si está completamente abierto. Cada tarea proviene de un repositorio de código abierto, así que cualquiera puede inspeccionar el problema, reproducir el entorno y comparar modelos y agentes en el mismo trabajo real de ingeniería. Esto es exactamente lo que importa a personas como @b_roziere, investigador en @MistralAI, que quieren una infraestructura abierta que ayude a empujar la frontera de las capacidades de programación para todos.