Testei o Soneto 4.6 no OpenClaw por um dia e ele melhorou significativamente os agentes. Aqui está um despejo mental de algumas coisas que notei: O mais importante é que ele segue as instruções com precisão, e todas as instruções. Parece que ele consome todos os arquivos markdown no espaço de trabalho antes de agir. Pedi uma nova formatação e ele respondeu: "Verifiquei a memória e não encontrei sua preferência..." Opus nunca fez isso, ele seleciona cuidadosamente o que considerar como contexto antes de fazer algo. E de repente surgiram alguns trabalhos cron que ele começou a me atualizar e que eu nem sabia que existiam. A Opus estava rodando silenciosamente ao fundo, mesmo eu pedindo repetidamente para não trabalhar silenciosamente em segundo plano. É mais empático. Não sei, essa é visceral, não consigo identificar o motivo. Mas a forma como responde é menos bajuladora. Ele admite quando não tem certeza sobre algo. Isso me faz querer ter um diálogo real com ele, em vez dos típicos prompts de uma ou duas palavras que uso para incentivá-lo a fazer algo. E acho que isso é em parte o motivo pelo qual é um assistente de roteiro melhor. Qualquer rascunho criado para conteúdo novo é realmente utilizável. Enquanto qualquer ajuda na criação de conteúdo, opus e outros modelos estavam mortos desde o injeito, não importa o quanto eu discuta com eles. Os ciclos de autorreflexão parecem ser mais eficazes. Dois exemplos: 1. "Escreva conteúdo e, depois que eu postar, use o navegador para acompanhar análises, pense no que funcionou ou não funcionou e aplique seus aprendizados no próximo rascunho." Pela primeira vez, funcionou. 2. "reserve uma mesa para mim no [restaurante difícil de conseguir]. atualize sua abordagem após cada tentativa fracassada." pela primeira vez, parou de pesquisar cancelamentos e pesquisou quando novas tabelas surgiam sozinhas. Também tenho um registro alimentar, todos os meus treinos e uma balança DEXA que direciona meu IMC/gordura corporal para um webhook. A Opus raramente analisava todos antes de recomendar refeições ou ajustes nos treinos. Sonnet mencionava os três sempre que me fazia um ping proativo sobre fitness. "reduza sua ingestão de frutas e consuma mais carboidratos ricos em amido hoje porque você tem um grande treino chegando" ou "tente beber mais água hoje porque o almoço de refeição embalada que você comeu antes tem muito sódio" No fim das contas, acho que tudo se resume à janela de contexto maior e à ênfase em seguir a instrução. Pode não ser o melhor modelo geral, mas parece que foi feito sob medida para o OpenClaw.
Acabei de receber essa mensagem. Na primeira vez, realmente parece um coach de saúde/fitness competente
70