Бенчмарк, такой как cline-bench, работает только если он полностью открыт. Каждая задача поступает из открытого репозитория, так что любой может проверить проблему, воспроизвести среду и сравнить модели и агентов на одной и той же реальной инженерной работе. Это именно то, что важно для таких людей, как @b_roziere, научный сотрудник в @MistralAI, которые хотят открытой инфраструктуры, помогающей продвигать границы возможностей программирования для всех.