IIUC, někdo prostě dostal entropix do práce a publikoval ho...
Jiawei Zhao
Jiawei Zhao23. 8. 04:00
Představujeme DeepConf: Hluboké myšlení s jistotou 🚀 První metoda, jak dosáhnout 99,9 % na AIME 2025 s open-source modely! Pomocí GPT-OSS-120B i bez nástrojů jsme dosáhli této téměř dokonalé přesnosti a zároveň jsme ušetřili až 85 % vygenerovaných tokenů. Přináší také mnoho silných výhod pro paralelní myšlení: 🔥 Zvýšení výkonu: ~10% přesnost napříč modely a datovými sadami ⚡ Mimořádně efektivní: Až o 85 % méně vygenerovaných tokenů 🔧 Plug & play: Funguje s JAKÝMKOLI existujícím modelem - není potřeba žádné školení (také žádné ladění hyperparametrů!) ⭐ Snadné nasazení: Pouze ~50 řádků kódu ve vLLM (viz PR níže) 📚 Papír: 🌐 Projekt: Společná práce s: @FuYichao123 , xuewei_wang, @tydsh (podrobnosti viz v komentářích níže)
50,18K