J'ai entendu dire que l'apprentissage par renforcement ne fonctionne qu'avec des récompenses vérifiables ? 😛 Félicitations !!
Alexander Wei
Alexander Wei19 juil. 2025
1/N I’m excited to share that our latest @OpenAI experimental reasoning LLM has achieved a longstanding grand challenge in AI: gold medal-level performance on the world’s most prestigious math competition—the International Math Olympiad (IMO).
31,67K