豆知識:アルパーは日曜日でフルタイムでモデルをトレーニングしている唯一の人物です。私たちがH100を16ノード試して、あなたが見たすべての結果を出すのに3ヶ月かかりました。 2026年はとんでもない年になるでしょう。
Alper Canberk
Alper Canberk18時間前
ACT-1の訓練において、私たちは多様な長期課題のデータを一級市民として扱いました。これにより一般化がデフォルトとなり、例外ではありません。 能力の範囲は拡大します。続報をお届けします。
データのボトルネックが解決されると、スタックの他の部分は非常に効率的になります。
116.28K