Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Измерение эффективности мышления в моделях рассуждения: недостающий эталон
Мы измерили использование токенов в моделях рассуждения: открытые модели выдают на 1,5-4 раза больше токенов, чем закрытые модели при выполнении одинаковых задач, но с огромной вариацией в зависимости от типа задачи (до 10 раз на простых вопросах).
Эта скрытая стоимость часто нивелирует преимущества ценообразования за токены. Эффективность токенов должна стать основной целью наряду с эталонами точности, особенно учитывая случаи использования, не связанные с рассуждением.
Читать подробный обзор эффективности рассуждений в открытых и закрытых моделях в нашем последнем блоге в сотрудничестве с нашим исследователем на месте, Тимом.
Смотрите больше их работ здесь:

22,51K
Топ
Рейтинг
Избранное