DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Eenvoudige vertrouwensmaatregelen gebaseerd op gemiddelde logkans die worden gebruikt om redeneertraces te filteren. Nogmaals, zeer mooi onderzoek mogelijk gemaakt door toegang tot hoogwaardige open source modellen. Zoek naar steeds krachtigere pipelines met een "generator-verifier" architectuur die slechte resultaten wegfiltert. De verifier kan een modelinstantie zijn, of een soort wiskundige functie zoals de interne vertrouwensmetrics die in dit artikel zijn ontwikkeld. Bestaande modellen zijn zeer krachtig wanneer ze worden gebruikt met dit soort pipelines en grote tokenbudgetten. (Hier, ~1E8 tokens gebruikt voor AIME 2025.) "DeepConf maakt gebruik van interne vertrouwenssignalen van het model om dynamisch laagwaardige redeneertraces tijdens of na generatie te filteren. Het vereist geen extra modeltraining of hyperparameterafstemming en kan naadloos worden geïntegreerd in bestaande serveerframeworks. We evalueren DeepConf over een verscheidenheid aan redeneertaken en de nieuwste open-source modellen, waaronder Qwen 3 en de GPT-OSS serie. Opmerkelijk is dat DeepConf@512 op uitdagende benchmarks zoals AIME 2025 tot 99,9% nauwkeurigheid bereikt en het aantal gegenereerde tokens met tot 84,7% vermindert in vergelijking met volledige parallelle denkwijzen." Let op de ironie van deze Meta-onderzoekers die OS-modellen Qwen, GPT-OSS en DeepSeek gebruiken, maar geen Llama 😢

5K

Boven

Positie

Favorieten

Populair op onchain

Populair op X

Recente topfinanciering

Belangrijkste