probé sonnet 4.6 en openclaw durante un día y mejoró significativamente los agentes. aquí hay un volcado de ideas de un puñado de cosas que noté: lo más importante es que sigue las instrucciones con precisión, y todas las instrucciones. parece que se traga todos los archivos markdown en el espacio de trabajo antes de actuar. pedí un nuevo formato y respondió “verifiqué la memoria y no encontré tu preferencia...”. opus nunca hizo eso, selecciona lo que tomar como contexto antes de hacer algo. y de repente había un puñado de trabajos cron de los que comenzó a actualizarme que no sabía que existían. opus los estaba ejecutando en silencio en segundo plano a pesar de que pedí repetidamente que no trabajara en silencio en segundo plano. es más empático. no sé, este es visceral, no puedo poner el dedo en ello. pero la forma en que responde es menos servil. admitirá cuando no está seguro de algo. lo que me hace querer tener un diálogo real con él en lugar de los habituales comandos de una o dos palabras que uso para empujarlo a hacer algo. y creo que esto es en parte por qué es un mejor asistente de escritura. cualquier borrador que crea para nuevo contenido es realmente utilizable. mientras que cualquier ayuda en la creación de contenido que opus y otros modelos han ofrecido ha estado muerta al llegar, sin importar cuán duro discuta con ellos. los bucles de autorreflexión parecen ser más efectivos. dos ejemplos: 1. “escribe contenido y luego, después de que publique, usa el navegador para rastrear analíticas, piensa en lo que funcionó/no funcionó y aplica tus aprendizajes en el siguiente borrador.” por primera vez, lo hizo. 2. “reserva una mesa en [restaurante difícil de conseguir]. actualiza tu enfoque después de cada intento fallido.” por primera vez, dejó de buscar cancelaciones e investigó cuándo se liberaban nuevas mesas por su cuenta. también tengo un registro de alimentos, todos mis entrenamientos y una escala de dexa que envía mi bmi/porcentaje de grasa corporal a un webhook. opus rara vez miraba todos ellos antes de recomendar comidas o ajustes de entrenamiento. sonnet hizo referencia a los 3 cada vez que me contactó proactivamente sobre fitness. “reduce tu ingesta de frutas y aumenta los carbohidratos almidonados hoy porque tienes un gran entrenamiento por venir” o “intenta beber más agua hoy porque la comida empaquetada que tuviste para el almuerzo tiene mucha sodio”. en última instancia, creo que todo se reduce a la ventana de contexto más grande y a un mayor énfasis en seguir instrucciones. puede que no sea el mejor modelo general, pero se siente como si estuviera hecho a medida para openclaw.
acabo de recibir este mensaje. la primera vez que realmente se siente como un entrenador de salud/fitness competente
68