Soweit ich das verstehe, hat jemand gerade entropix zum Laufen gebracht und veröffentlicht!...
Jiawei Zhao
Jiawei Zhao23. Aug., 04:00
Einführung von DeepConf: Tiefes Denken mit Vertrauen 🚀 Erste Methode, um 99,9 % bei AIME 2025 mit Open-Source-Modellen zu erreichen! Mit GPT-OSS-120B haben wir sogar ohne Werkzeuge diese nahezu perfekte Genauigkeit erreicht und dabei bis zu 85 % der generierten Tokens eingespart. Es bietet auch viele starke Vorteile für paralleles Denken: 🔥 Leistungssteigerung: ~10 % Genauigkeit über Modelle & Datensätze ⚡ Ultra-effizient: Bis zu 85 % weniger generierte Tokens 🔧 Plug & Play: Funktioniert mit JEDEM bestehenden Modell - keine Schulung erforderlich (auch kein Hyperparameter-Tuning!) ⭐ Einfach zu implementieren: Nur ~50 Zeilen Code in vLLM (siehe PR unten) 📚 Papier: 🌐 Projekt: gemeinsame Arbeit mit: @FuYichao123 , xuewei_wang, @tydsh (siehe Details in den Kommentaren unten)
50,18K