Um benchmark como o cline-bench só funciona se for totalmente aberto. Cada tarefa vem de um repositório de código aberto, para que qualquer pessoa possa inspecionar o problema, reproduzir o ambiente e comparar modelos e agentes no mesmo trabalho de engenharia real. Isto é exatamente o que importa para pessoas como @b_roziere, Cientista de Pesquisa na @MistralAI, que desejam uma infraestrutura aberta que ajude a impulsionar a fronteira das capacidades de codificação para todos.