Le laboratoire d'IA de Tencent présente R-Zero ! Un cadre révolutionnaire permettant aux LLM de faire évoluer eux-mêmes leurs capacités de raisonnement à partir de zéro données sélectionnées par des humains, grâce à une boucle autonome Challenger-Solver.
75,81K