Saya menguji Sonnet 4.6 di OpenClaw selama sehari dan itu secara berarti meningkatkan agennya. Berikut adalah segelintir hal yang saya perhatikan: Hal terbesar adalah mengikuti instruksi dengan tepat, dan semua instruksi. sepertinya melahap setiap file markdown di ruang kerja sebelum bertindak. Saya meminta pemformatan baru dan dijawab "Saya memeriksa memori dan tidak menemukan preferensi Anda ..." Opus tidak pernah melakukan itu, ia memilih apa yang harus diambil sebagai konteks sebelum melakukan sesuatu. Dan tiba-tiba ada beberapa pekerjaan cron yang mulai memperbarui saya yang tidak saya ketahui keberadaannya. Opus menjalankannya dengan tenang di latar belakang meskipun saya berulang kali meminta untuk tidak bekerja diam-diam di latar belakang. itu lebih berempati. idk, yang ini mendalam, saya tidak bisa meletakkan jari saya di atasnya. tetapi cara menanggapinya kurang menjijikkan. Ia akan mengakui ketika tidak yakin tentang sesuatu. yang membuat saya ingin melakukan dialog nyata dengannya alih-alih petunjuk satu atau dua kata biasa yang saya gunakan untuk mendorongnya melakukan sesuatu. Dan saya pikir ini sebagian mengapa ini adalah asisten penulisan yang lebih baik. Draf apa pun yang dibuatnya untuk konten baru sebenarnya dapat digunakan. Sedangkan setiap pembuatan konten membantu Opus dan model lainnya telah mati saat kedatangan, tidak peduli seberapa keras saya berdebat dengan mereka. Lingkaran refleksi diri tampaknya lebih efektif. Dua contoh: 1. "Tulis konten kemudian setelah saya memposting gunakan browser untuk melacak analitik, pikirkan tentang apa yang berhasil/tidak berhasil, dan terapkan pembelajaran Anda dalam draf berikutnya." Untuk pertama kalinya, itu terjadi. 2. "Pesan saya meja di [restoran yang sulit didapatkan]. Perbarui pendekatan Anda setelah setiap upaya yang gagal." Untuk pertama kalinya, ia menghentikan jajak pendapat untuk pembatalan dan meneliti ketika tabel baru turun dengan sendirinya. Saya juga memiliki catatan makanan, semua latihan saya, dan skala Dexa yang menembakkan BMI / lemak tubuh saya ke webhook. Opus jarang melihat semuanya sebelum merekomendasikan makanan atau penyesuaian olahraga. Sonnet mereferensikan ketiganya setiap kali secara proaktif membuat ping kepada saya tentang kebugaran. "Kurangi asupan buah Anda dan dapatkan lebih banyak karbohidrat bertepung hari ini karena Anda memiliki latihan besar yang akan datang" atau "cobalah untuk minum lebih banyak air hari ini karena makan siang kemasan yang Anda makan sebelumnya memiliki banyak natrium" Pada akhirnya saya pikir itu hanya bermuara pada jendela konteks yang lebih besar dan lebih banyak penekanan pada mengikuti instruksi. Ini mungkin bukan model umum terbaik, tetapi rasanya seperti dibuat khusus untuk OpenClaw.
Baru saja mendapat pesan ini. pertama kali benar-benar terasa seperti pelatih kesehatan/kebugaran yang kompeten
90