Um benchmark como o cline-bench só funciona se estiver totalmente aberto. Cada tarefa vem de um repositório open source, então qualquer pessoa pode inspecionar o problema, reproduzir o ambiente e comparar modelos e agentes no mesmo trabalho real de engenharia. Isso é exatamente o que importa para pessoas como @b_roziere, cientista pesquisadora na @MistralAI, que querem uma infraestrutura aberta que ajude a expandir a fronteira das capacidades de programação para todos.