では、これをはっきりさせてください。 推論には次のものがあります。 1. 電気代でLLM推論を提供する分散型ネットワーク 2. モデルのトレーニングとサービングは、特に特殊なタスクのために、モデルを超安価にするためのチョップを提供します 3. データセンターと取引し、十分に活用されていない容量を大幅に割引価格でレンタルします 4. 数十億のリクエストにスケーリングするように設計されたバッチ推論 API そして、@paulgまだ私たちをフォローしていませんか? これはいくつかのb.s.
3.05K