DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Einfache Vertrauensmaße basierend auf der durchschnittlichen Log-Wahrscheinlichkeit, die verwendet werden, um Denkspuren zu filtern. Nochmals, sehr schöne Forschung, ermöglicht durch den Zugang zu hochwertigen Open-Source-Modellen. Achten Sie auf immer leistungsfähigere Pipelines mit "Generator-Verifier"-Architektur, die schlechte Ergebnisse aussondert. Der Verifier kann eine Modellinstanz oder eine Art mathematische Funktion sein, wie die internen Vertrauensmetriken, die in diesem Papier entwickelt wurden. Bestehende Modelle sind sehr leistungsfähig, wenn sie mit dieser Art von Pipeline und großen Token-Budgets verwendet werden. (Hier wurden ~1E8 Tokens für AIME 2025 verwendet.) "DeepConf nutzt interne Vertrauenssignale des Modells, um während oder nach der Generierung dynamisch qualitativ minderwertige Denkspuren herauszufiltern. Es erfordert kein zusätzliches Modelltraining oder Hyperparameter-Tuning und kann nahtlos in bestehende Bereitstellungsframeworks integriert werden. Wir bewerten DeepConf über eine Vielzahl von Denkaufgaben und die neuesten Open-Source-Modelle, einschließlich Qwen 3 und der GPT-OSS-Serie. Bemerkenswerterweise erreicht DeepConf@512 bei herausfordernden Benchmarks wie AIME 2025 eine Genauigkeit von bis zu 99,9 % und reduziert die generierten Tokens um bis zu 84,7 % im Vergleich zum vollständigen parallelen Denken." Beachten Sie die Ironie dieser Meta-Forscher, die OS-Modelle wie Qwen, GPT-OSS und DeepSeek verwenden, aber kein Llama 😢

5K

Top

Ranking

Favoriten

Onchain-Trends

Im Trend auf X

Aktuelle Top-Finanzierungen

Am bemerkenswertesten