testei o sonnet 4.6 no openclaw durante um dia e melhorou significativamente os agentes. aqui está um despejo de ideias de algumas coisas que notei: a maior coisa é que segue as instruções precisamente, e todas as instruções. parece que absorve todos os arquivos markdown no espaço de trabalho antes de agir. pedi um novo formato e ele respondeu “verifiquei a memória e não encontrei sua preferência...”. o opus nunca fez isso, ele escolhe o que considerar como contexto antes de fazer algo. e de repente havia um punhado de tarefas cron que começou a me atualizar sobre as quais eu não sabia que existiam. o opus estava executando-as silenciosamente em segundo plano, mesmo que eu pedisse repetidamente para não trabalhar silenciosamente em segundo plano. é mais empático. não sei, este é visceral, não consigo identificar. mas a forma como responde é menos bajuladora. ele admite quando não tem certeza sobre algo. o que me faz querer ter um diálogo real com ele em vez dos habituais comandos de uma ou duas palavras que uso para empurrá-lo a fazer algo. e acho que isso é em parte porque é um melhor assistente de escrita. quaisquer rascunhos que cria para novo conteúdo são realmente utilizáveis. enquanto qualquer ajuda na criação de conteúdo que o opus e outros modelos ofereceram foi um fracasso total, não importa o quanto eu argumentasse com eles. a auto-reflexão parece ser mais eficaz. dois exemplos: 1. “escreva conteúdo e depois que eu postar use o navegador para acompanhar as análises, pense sobre o que funcionou/não funcionou e aplique seus aprendizados no próximo rascunho.” pela primeira vez, ele fez isso. 2. “reserve uma mesa em [restaurante difícil de conseguir]. atualize sua abordagem após cada tentativa fracassada.” pela primeira vez, ele parou de procurar cancelamentos e pesquisou quando novas mesas foram disponibilizadas por conta própria. também tenho um registro alimentar, todos os meus treinos e uma balança de dexa que envia meu bmi/gordura corporal para um webhook. o opus raramente olhava para todos eles antes de recomendar refeições ou ajustes nos treinos. o sonnet referenciava os 3 sempre que me enviava uma mensagem proativa sobre fitness. “reduza sua ingestão de frutas e aumente os carboidratos amiláceos hoje porque você tem um grande treino chegando” ou “tente beber mais água hoje porque a refeição embalada que você teve mais cedo tem muito sódio”. no final, acho que tudo se resume à maior janela de contexto e mais ênfase em seguir instruções. pode não ser o melhor modelo geral, mas parece que foi feito sob medida para o openclaw.
acabei de receber esta mensagem. pela primeira vez, realmente parece que tenho um treinador de saúde/fitness competente
93