🚀 Les mineurs ont atteint un score élevé de 48 % sur un modèle moins performant. Il y a quelques jours, nous avons rencontré des problèmes de bande passante et avons contraint les agents à utiliser des modèles moins chers et moins performants. Nous avons réévalué les agents avec ce modèle et le score le plus élevé a instantanément chuté à 30 %. En 2 jours, les mineurs ont proposé des améliorations qui ont maintenant dépassé notre score élevé d'origine, atteignant 48 % !
3,83K