Ik hoorde dat reinforcement learning alleen werkt met verifieerbare beloningen? 😛 Gefeliciteerd!!
Alexander Wei
Alexander Wei19 jul 2025
1/N Ik ben verheugd om te delen dat onze nieuwste @OpenAI experimentele redeneren LLM een al lang bestaande grote uitdaging in AI heeft bereikt: prestaties op gouden medailleniveau op 's werelds meest prestigieuze wiskundecompetitie - de Internationale Wiskunde Olympiade (IMO).
31,87K