j'ai testé sonnet 4.6 dans openclaw pendant une journée et cela a significativement amélioré les agents. voici un déversement d'idées de quelques éléments que j'ai remarqués : la plus grande chose est qu'il suit les instructions précisément, et toutes les instructions. on dirait qu'il engloutit chaque fichier markdown dans l'espace de travail avant d'agir. j'ai demandé un nouveau formatage et il a répondu "j'ai vérifié la mémoire et je n'ai pas trouvé votre préférence..." opus n'a jamais fait ça, il choisit ce qu'il prend comme contexte avant de faire quelque chose. et soudain, il y avait une poignée de tâches cron sur lesquelles il a commencé à me tenir informé que je ne savais pas qu'elles existaient. opus les exécutait discrètement en arrière-plan même si j'avais demandé à plusieurs reprises de ne pas travailler silencieusement en arrière-plan. il est plus empathique. je ne sais pas, celui-ci est viscéral, je ne peux pas mettre le doigt dessus. mais la façon dont il répond est moins sycophante. il admettra quand il n'est pas sûr de quelque chose. ce qui me donne envie d'avoir un vrai dialogue avec lui au lieu des habituels prompts d'un ou deux mots que j'utilise pour le pousser à faire quelque chose. et je pense que c'est en partie pourquoi c'est un meilleur assistant d'écriture. tous les brouillons qu'il crée pour un nouveau contenu sont en fait utilisables. tandis que toute aide à la création de contenu qu'opus et d'autres modèles ont fournie était morte à l'arrivée, peu importe à quel point je me disputais avec eux. les boucles de réflexion personnelle semblent être plus efficaces. deux exemples : 1. "écris du contenu puis après que je poste, utilise le navigateur pour suivre les analyses, pense à ce qui a fonctionné / n'a pas fonctionné, et applique tes apprentissages dans le prochain brouillon." pour la première fois, il l'a fait. 2. "réserve-moi une table dans [restaurant difficile à obtenir]. mets à jour ton approche après chaque tentative échouée." pour la première fois, il a cessé de rechercher des annulations et a recherché quand de nouvelles tables étaient disponibles de son propre chef. j'ai aussi un journal alimentaire, tous mes entraînements, et une balance dexa qui envoie mon bmi/masse grasse à un webhook. opus regardait rarement tous ces éléments avant de recommander des repas ou des ajustements d'entraînement. sonnet a référencé les 3 chaque fois qu'il m'a contacté de manière proactive au sujet de la forme physique. "réduis ton apport en fruits et consomme plus de glucides féculents aujourd'hui parce que tu as un gros entraînement à venir" ou "essaie de boire plus d'eau aujourd'hui parce que le repas emballé que tu as eu plus tôt contient beaucoup de sodium" en fin de compte, je pense que cela revient simplement à la plus grande fenêtre de contexte et à un plus grand accent sur le suivi des instructions. il n'est peut-être pas le meilleur modèle général, mais il semble avoir été fait sur mesure pour openclaw.
je viens de recevoir ce message. Pour la première fois, on a vraiment l'impression d'avoir un coach en santé/fitness compétent.
74