大規模言語モデルの進歩において、機知に富んだ戦略的適応が総当たりのスケーリングを上回ることができることが明らかになりつつあります。どういう意味ですか? 大規模なコンピューティング能力とチップだけに依存するのではなく、非常に効率的なモデルアーキテクチャ(AIは広範なトレーニングではなく、個々のクエリの推論により多くの時間を費やす)に焦点を当てることで、パフォーマンスを大幅に向上させることができます。
10.36K