Un benchmark precum cline-bench funcționează doar dacă este complet deschis. Fiecare sarcină vine dintr-un depozit open source, astfel încât oricine poate inspecta problema, reproduce mediul și compara modele și agenți pe aceeași muncă reală de inginerie. Exact asta contează pentru oameni ca @b_roziere, cercetător la @MistralAI, care vor infrastructură deschisă ce să ajute la împingerea frontierei capabilităților de programare pentru toată lumea.