有趣的事实:Alper 是唯一一位全职在 Sunday 训练模型的人。我们花了 3 个月和 16 个 H100 节点来产生你所看到的所有结果。 2026 年将会非常疯狂。
Alper Canberk
Alper Canberk15 小时前
在训练 ACT-1 时,我们将来自多样化、长期任务的数据视为一等公民。这使得泛化成为默认,而不是例外。 能力范围在扩大。更多内容敬请期待。
一旦数据瓶颈得到解决,其余的技术栈可以变得极其高效。
116.28K