Als ik het goed begrijp, heeft iemand entropix aan de praat gekregen en het gepubliceerd!...
Jiawei Zhao
Jiawei Zhao23 aug, 04:00
Introductie van DeepConf: Diep Denken met Vertrouwen 🚀 De eerste methode om 99,9% te behalen op AIME 2025 met open-source modellen! Met GPT-OSS-120B, zelfs zonder tools, hebben we deze bijna perfecte nauwkeurigheid bereikt terwijl we tot 85% gegenereerde tokens bespaarden. Het biedt ook veel sterke voordelen voor parallel denken: 🔥 Prestatieverbetering: ~10% nauwkeurigheid over modellen & datasets ⚡ Ultra-efficiënt: Tot 85% minder gegenereerde tokens 🔧 Plug & play: Werkt met ELK bestaand model - geen training nodig (geen hyperparameter tuning ook!) ⭐ Gemakkelijk te implementeren: Slechts ~50 regels code in vLLM (zie PR hieronder) 📚 Paper: 🌐 Project: gezamenlijk werk met: @FuYichao123 , xuewei_wang, @tydsh (zie details in de opmerkingen hieronder)
50,18K