Dies ist ein ziemlich wichtiger Punkt. Wir haben uns darauf verlassen, dass alle LLMs einander im Großen und Ganzen ähnlich sind (sogar in dem Maße, dass das Prompting zwischen den Modellen kompatibel ist). Das könnte sich mit dem Reinforcement Learning ändern.
roon
roon28. Aug. 2025
Alle Modellunternehmen wurden auf dem ~gleichen Internet vortrainiert. Natürlich hat Grok Zugang zum Twitter-Datensatz und Gemini kann auf YouTube vortrainieren usw. Aber es ist größtenteils dasselbe Internet. Oh, RL-Umgebungen werden das sein, was das Labor priorisieren möchte. Daher sollten Sie mit mehr Spezialisierung rechnen.
22,54K