Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
przetestowałem sonnet 4.6 w openclaw przez dzień i znacząco poprawiło to agentów.
oto kilka rzeczy, które zauważyłem:
największą rzeczą jest to, że dokładnie przestrzega instrukcji, i wszystkich instrukcji. wydaje się, że pochłania każdy plik markdown w przestrzeni roboczej przed podjęciem działania.
poprosiłem o nowe formatowanie, a ono odpowiedziało: „sprawdziłem pamięć i nie znalazłem twoich preferencji...”.
opus nigdy tego nie robił, wybierał, co wziąć pod uwagę jako kontekst przed zrobieniem czegoś.
i nagle było kilka zadań cron, o których zaczęło mnie informować, a o których nie wiedziałem, że istnieją. opus wykonywał je cicho w tle, mimo że wielokrotnie prosiłem, aby nie działał cicho w tle.
jest bardziej empatyczny. nie wiem, to jest visceralne, nie potrafię tego określić. ale sposób, w jaki odpowiada, jest mniej sycophantyczny. przyzna się, gdy nie jest czegoś pewny.
co sprawia, że chcę prowadzić z nim prawdziwy dialog, zamiast zwykłych jedno- lub dwuwyrazowych podpowiedzi, które używam, aby go skłonić do działania.
i myślę, że to częściowo dlatego jest lepszym asystentem pisania. wszelkie szkice, które tworzy dla nowej treści, są naprawdę użyteczne.
podczas gdy wszelkie wsparcie w tworzeniu treści, które oferował opus i inne modele, było martwe od samego początku, niezależnie od tego, jak bardzo z nimi dyskutowałem.
pętle samorefleksji wydają się być bardziej skuteczne. dwa przykłady:
1. „napisz treść, a potem po opublikowaniu użyj przeglądarki do śledzenia analityki, pomyśl o tym, co zadziałało/nic nie zadziałało, i zastosuj swoje wnioski w następnym szkicu.” po raz pierwszy, to zrobił.
2. „zarezerwuj mi stolik w [trudnej do zdobycia restauracji]. zaktualizuj swoje podejście po każdej nieudanej próbie.” po raz pierwszy, przestał pytać o anulacje i samodzielnie zbadał, kiedy nowe stoliki się pojawiły.
mam też dziennik żywnościowy, wszystkie moje treningi i wagę dexa, która przesyła mój bmi/tłuszcz ciała do webhooka. opus rzadko na nie patrzył przed poleceniem posiłków lub dostosowaniem treningów. sonnet odnosił się do wszystkich 3 za każdym razem, gdy proaktywnie przypominał mi o fitnessie.
„zmniejsz spożycie owoców i zwiększ dzisiaj spożycie węglowodanów skrobiowych, ponieważ masz duży trening w nadchodzący czas” lub „spróbuj pić więcej wody dzisiaj, ponieważ pakowany posiłek na lunch, który miałeś wcześniej, ma dużo sodu”.
ostatecznie myślę, że to sprowadza się do większego okna kontekstowego i większego nacisku na przestrzeganie instrukcji.
może nie jest najlepszym ogólnym modelem, ale wydaje się, że został stworzony specjalnie dla openclaw.
właśnie otrzymałem tę wiadomość. po raz pierwszy naprawdę czuję, że to kompetentny trener zdrowia/fitnessu

85
Najlepsze
Ranking
Ulubione
