すべてのモデル企業は、~同じインターネット上で事前トレーニングを行っていました。もちろん、GrokはTwitterデータセットにアクセスでき、GeminiはYouTubeなどで事前トレーニングできます。しかし、それはほとんど同じインターネットです OTOH、RL 環境は、研究室が優先順位を付けることを選択します。したがって、より多くの種分化を期待する必要があります
273.58K