Een benchmark zoals cline-bench werkt alleen als deze volledig open is. Elke taak komt uit een open source repo, zodat iedereen het probleem kan inspecteren, de omgeving kan reproduceren en modellen en agenten kan vergelijken op hetzelfde echte engineeringwerk. Dit is precies wat belangrijk is voor mensen zoals @b_roziere, Research Scientist bij @MistralAI, die open infrastructuur willen die helpt de grenzen van programmeermogelijkheden voor iedereen te verleggen.