単一のLLMが金融を支配しているわけではありません。 Hebbia の金融サービス ベンチマークは、600+ のワークフローにわたって主要な LLM をテストします。 📊 o3 と GPT-5 は、モデリングなどのコンテキスト重視の戦略的なタスクをリードします。 📚 GPT-4.1 & Claude Opusは、ドキュメントからのデータ抽出に優れています。 Hebbia では、選択する必要はありません。それらをすべて並べて実行できます。