これは非常に重要な点であり、私たちはすべてのLLMが互いにほぼ類似していることに依存してきました(プロンプトがモデル間で互換性がある範囲でも)。それは強化学習によって変わり始めるかもしれません。
roon
roon2025年8月28日
すべてのモデル企業は、~同じインターネット上で事前トレーニングを行っていました。もちろん、GrokはTwitterデータセットにアクセスでき、GeminiはYouTubeなどで事前トレーニングできます。しかし、それはほとんど同じインターネットです OTOH、RL 環境は、研究室が優先順位を付けることを選択します。したがって、より多くの種分化を期待する必要があります
22.55K