Насколько я понимаю, кто-то только что заставил Entropix работать и опубликовал это!...
Jiawei Zhao
Jiawei Zhao23 авг., 04:00
Представляем DeepConf: Глубокое мышление с уверенностью 🚀 Первый метод для достижения 99.9% на AIME 2025 с использованием открытых моделей! Используя GPT-OSS-120B даже без инструментов, мы достигли этой почти идеальной точности, сэкономив до 85% сгенерированных токенов. Это также предоставляет множество сильных преимуществ для параллельного мышления: 🔥 Увеличение производительности: ~10% точности по моделям и наборам данных ⚡ Ультраэффективность: до 85% меньше сгенерированных токенов 🔧 Подключи и работай: Работает с ЛЮБОЙ существующей моделью - нулевое обучение не требуется (также без настройки гиперпараметров!) ⭐ Легкость развертывания: всего ~50 строк кода в vLLM (см. PR ниже) 📚 Статья: 🌐 Проект: совместная работа с: @FuYichao123 , xuewei_wang, @tydsh (см. детали в комментариях ниже)
50,18K