熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
啟動一個開放源碼的強化學習生態系統的前景,確實吸引了我關注驗證者和@PrimeIntellect。

8月24日 15:40
我會坦白,我確實對這個項目有一個非常具體的使命。半模糊的私有測試版推出是其中的一部分。我們正在尋找的任務集是其中的一部分。GPU懸賞是其中的一部分。惡搞帖子是其中的一部分。播客是其中的一部分。思想共享在這裡至關重要。讓我解釋一下。
目前,關於RL環境的討論主要集中在這一波新興創業公司上,它們的商業模式是向少數大型實驗室獨家構建和銷售環境。Mechanize是其中最響亮的,但還有很多其他公司。實驗室不再花費在指令調優樣本和註釋上,而是渴望購買私有環境,作為模型訓練的下一個重要消耗資源。
這一現象既是開源模型保持競爭力的嚴重風險,也是如果我們能夠改變重心的重大機會。如果好的環境都很昂貴且隱藏,開源模型將會進一步落後。這基本上就是預訓練數據所發生的情況。但如果能夠出現一個足夠強大的開源工具生態系統,用於環境和訓練,那麼開源選項也可以成為最先進的。這在某種程度上就是PyTorch所發生的。
改變這一局面的目標是我的目標,也是我們的目標。我加入Prime Intellect是因為每個人都極其有才華,對人人都能獲得的開源AGI的使命非常認真,並且不怕說出來,因為團隊有一個獨特的結構優勢,這意味著我們可以真正採取一些實質性的行動。我們出售計算能力。我們構建基礎設施以改善您可以用這些計算能力做的事情。我們研究如何使這些計算能力以新的方式互操作。我們正在訓練更大更好的模型。我們有正確的激勵去做艱難而必要的工作。這些部分都是相互關聯的。
我們不能單獨完成這項工作。沒有人可以。需要全球的初創公司、企業、學生和教授。開放研究目前沒有工具來研究大型實驗室認為對未來進展至關重要的問題。我們必須找到一種方法來構建這些工具。我們正在努力使這變得更容易。我們都必須在合作上變得更好,不要重新發明輪子,將單個部分組裝成更大的拼圖。讓我們把迄今為止共同完成的工作整理好,使其協同工作,吸引更多人加入,並開始進行更多的正和遊戲。如果我們找不到更好的合作方式,我們將走向一個AI未來,在這個未來中,我們集體根本不知道這些模型是什麼,因為帷幕從未被揭開,我們能看到的一切只是玩具。
在這個領域,您可以建立一種不同類型的公司;一種仍然允許您向大型實驗室銷售,但不是獨家的;一種仍然允許您擁有商業秘密的護城河並獲得可觀的年收入,但不會讓我們對正在構建的未來知之甚少。
browserbase。cursor。exa。modal。morph。還有無數其他公司。讓我們做更多這樣的事情。您可以通過製作強大的工具和代理的工具來建立一家偉大的公司,這些工具反映了人們希望模型實際執行的高價值任務。讓其中一些元素可以自由嘗試,另一些元素則通過API托管。按使用量收費,並提供一些高級企業功能。構建最佳的LLM形狀的Excel克隆,或Figma克隆,或TurboTax克隆。稍微改變一下以避免訴訟,然後讓私人客戶看到更具訴訟韌性的版本。在這個領域享受一些健康的競爭,並找到在關鍵地方合作的方法。找到您的角度,並做到如此出色,以至於您可以向每個人銷售,無論是用於RL還是實際使用。達到臨界質量,並做到如此實惠,以至於沒有人值得嘗試重建您已經製作的東西。
這是我希望我們最終能達到的時間線。這是一個大實驗室仍然可以做得很好的世界,可能會提供最簡單的方法來花費更多以獲得更好的整體性能。但這也是一個開源模型並不落後太多的世界,所有關心的人基本上都可以看到發生了什麼,並理解我們使用的模型實際上是如何訓練的。如果您正在考慮創辦或加入一家專注於RL環境的公司,我敦促您思考您隱含地押注於哪個時間線,並反思您對此的感受。
7.4K
熱門
排行
收藏