なんてこと。。。Airbnb はカスタマー サポートを自己改善型 AI ラボ🤯に変えました 彼らの新しい論文「Agent-in-the-Loop (AITL)」は、人間のフィードバックをライブサポートワークフローに直接埋め込むことで、数か月ではなく数週間ごとにモデルを再トレーニングするデータフライホイールを作成する方法を示しています。 オフラインのアノテーションマラソンの代わりに、AITLは人間のエージェントから4つのリアルタイムフィードバック信号を収集します。 • どの AI 応答を好んだか • 彼らがそれを選んだ理由 • 取得した情報が関連していたかどうか • 欠けていた知識 これらのシグナルは、検索、ランク付け、生成モデルを継続的に再トレーニングし、反復時間を短縮し、パフォーマンスを向上させます。 +11.7%の回収再現率 +14.8%の精度 +8.4%の有用性 +4.5%のエージェント採用率 その結果は?働きながら学習するシステム。 静的なモデルはもう必要ありません。数か月にわたる再トレーニングサイクルはもう必要ありません。 このようにして、AI はループ内の真に適応力のある人間になり、ループ内のエージェント→無限の改善→行われます。 論文全文を読む: arxiv.org/abs/2510.06674