Я тестировал sonnet 4.6 в openclaw в течение дня, и это значительно улучшило агентов. Вот несколько мыслей, которые я заметил: Самое главное, что он точно выполняет инструкции, и все инструкции. Похоже, он поглощает каждый markdown файл в рабочем пространстве перед тем, как действовать. Я попросил о новом формате, и он ответил: "Я проверил память и не нашел ваших предпочтений..." Opus никогда так не делал, он выбирает, что взять в качестве контекста, прежде чем что-то сделать. И вдруг появилось несколько cron задач, о которых он начал меня информировать, и я не знал, что они существуют. Opus выполнял их тихо в фоновом режиме, хотя я многократно просил не работать молча в фоновом режиме. Он более эмпатичный. Не знаю, это ощущение, я не могу точно сказать. Но то, как он отвечает, менее подхалимски. Он признает, когда не уверен в чем-то. Что заставляет меня хотеть вести с ним настоящий диалог, а не использовать обычные одно- или двухсловные подсказки, чтобы подтолкнуть его к действию. И я думаю, что это отчасти причина, почему он является лучшим помощником по написанию. Любые черновики, которые он создает для нового контента, на самом деле пригодны для использования. В то время как любая помощь в создании контента от opus и других моделей была мертва при прибытии, независимо от того, как сильно я с ними спорил. Циклы саморефлексии, похоже, стали более эффективными. Два примера: 1. "Напиши контент, а затем после публикации используй браузер для отслеживания аналитики, подумай о том, что сработало/не сработало, и применяй свои выводы в следующем черновике." Впервые он это сделал. 2. "Забронируй мне столик в [трудно доступный ресторан]. Обнови свой подход после каждой неудачной попытки." Впервые он перестал опрашивать о отменах и сам исследовал, когда новые столики появятся. У меня также есть журнал питания, все мои тренировки и дева скан, который отправляет мой ИМТ/жировую массу на вебхук. Opus редко смотрел на все это перед тем, как рекомендовать блюда или изменения в тренировках. Sonnet ссылался на все три, всякий раз, когда он проактивно напоминал мне о фитнесе. "Сократи потребление фруктов и добавь больше крахмалистых углеводов сегодня, потому что у тебя скоро большая тренировка" или "попробуй пить больше воды сегодня, потому что упакованный обед, который ты ел ранее, содержит много натрия" В конечном итоге, я думаю, что все сводится к большему контекстному окну и большему акценту на выполнении инструкций. Он может не быть лучшей общей моделью, но кажется, что он был специально создан для openclaw.
только что получил это сообщение. в первый раз это действительно ощущается как компетентный тренер по здоровью/фитнесу
76