這是一個相當重要的觀點,我們一直依賴於所有的LLM在廣泛上彼此相似(甚至在提示方面也兼容於不同模型)。這種情況可能會隨著強化學習的出現而開始改變。
roon
roon2025年8月28日
所有模型公司都是在~相同的互聯網環境下進行預訓練的。當然,grok可以訪問Twitter數據集,而gemini可以在YouTube等平台上進行預訓練。但大多數情況下,都是相同的互聯網。 哦,強化學習環境將取決於實驗室選擇優先考慮的內容。因此,你應該期待更多的物種分化。
22.54K