OpenClawでSonnet 4.6を1日テストしたところ、エージェントの性能が大幅に改善されました。 私が気づいたいくつかのことをまとめてまとめます。 一番大事なのは、指示を正確に、そしてすべての指示に従うことです。作業スペース内のすべてのマークダウンファイルを処理する前に消費してしまうようです。 新しいフォーマットをお願いしたら「メモリを確認しましたが、あなたの好みが見つかりませんでした...」と返答しました。 Opusはそういうことをしておらず、何かをする前に文脈として選りすぐりました。 そして突然、私が知らなかったいくつかのクローンの求人が更新され始めました。Opusは私が何度も静かに作業しないでほしいと頼んでいたにもかかわらず、静かにバックグラウンドで動かしていました。 より共感的です。わからないけど、これは本能的に感じるもので、はっきり言えない。しかし、その反応はおべっかりではありません。何かに確信が持てないことがあれば認めます。 だから、いつも使う一語か二語の促しではなく、本物の対話をしたいと思うのです。 そして、これがより良いライティングアシスタントである理由の一つだと思います。新しいコンテンツのために作成されたドラフトは実際に使えます。 一方で、Opusや他のコンテンツ制作支援モデルは、どんなに反論しても一気に失敗しています。 自己反省ループの方が効果的だと思います。例を二つ挙げます。 1. 「コンテンツを書き、投稿後にブラウザを使って分析を追跡し、うまくいったこと・うまくいかなかったことを考え、次のドラフトに学んだことを活かす」と言っていました。初めてそれが実現しました。 2. 「[手に入りにくいレストラン]の席を予約してください。失敗するたびにアプローチを更新しろ」と言ったのは、初めてキャンセルのポーリングをやめ、新しいテーブルが自動的にドロップした時を調べるようになった。 食事記録、すべてのワークアウト、そしてBMIや体脂肪をウェブフックに送るデクサスケールも持っています。Opusは食事や運動の調整を勧める前に、ほとんどすべてのプログラムを見た。Sonnetはフィットネスについて積極的に連絡が来たとき、その3つすべてを参照していました。 「今日は果物の摂取を控えて、でんぷん質の多い炭水化物をもっと摂ってください。大変なトレーニングがあるから」や「さっき食べたパッケージミールの昼食に塩分が多いので、今日はもっと水を飲むようにしましょう」 最終的には、より広い文脈の窓と指示に従うことへの重点が大きいと思います。 一般的なモデルとしては最適とは言えないかもしれませんが、OpenClaw向けに特別に作られたように感じます。
今、このメッセージを受け取りました。初めて、実際に有能な健康・フィットネスコーチに実感しました
91