Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
RL-miljöer med öppen källkod kan vara den viktigaste delen för att säkerställa AGI med öppen källkod

19 timmar sedan
Jag ska erkänna att jag har ett mycket specifikt uppdrag i åtanke med det här projektet. Den halvvaga privata beta-lanseringen är en del av det. Den uppsättning uppgifter som vi lägger fram är en del av det. GPU-belöningarna är en del av det. Skitposterna är en del av det. Poddarna är en del av det. Mindshare är avgörande här. Låt mig förklara.
För närvarande är mycket av diskussionen kring RL-miljöer fokuserad på denna nya våg av startups vars affärsmodell bygger och säljer miljöer till ett mycket litet antal stora laboratorier på exklusiv basis. Mechanize är den mest högljudda, men det finns ett antal av dem. I stället för att spendera pengar på instruktionsjusterande prover och anteckningar är laboratorierna angelägna om att köpa privata miljöer som nästa stora förbrukningsresurs för modellträning.
Detta fenomen är både en allvarlig risk för utsikterna för modeller med öppen källkod att förbli konkurrenskraftiga, samt en stor möjlighet att tippa vågskålen om vi kan flytta tyngdpunkten. Om alla bra miljöer är dyra och dolda kommer modeller med öppen källkod att hamna ännu mer på efterkälken. Detta är i princip vad som har hänt med förträningsdata. Men om ett tillräckligt robust ekosystem av verktyg med öppen källkod för miljöer och utbildning kan växa fram, kan alternativet med öppen källkod också vara det mest moderna. Detta är mer eller mindre vad som har hänt med Pytorch.
Att få vågskålen att tippa över här är mitt mål. Vårt mål. Jag gick med i Prime Intellect för att alla var vansinnigt begåvade, var helt jävla seriösa med uppdraget med öppen källkod AGI för alla och inte var rädd för att säga det, och för att teamet hade en unik strukturell fördel som innebar att vi faktiskt kunde ta några riktiga svängar. Vi säljer databehandling. Vi bygger Infra för att förbättra vad du kan göra med den beräkningen. Vi forskar om hur man kan få den beräkningen att samverka på nya sätt. Vi tränar större och bättre modeller. Vi har de rätta incitamenten för att göra det hårda och nödvändiga arbetet. Dessa delar är alla sammankopplade.
Vi kan inte göra det ensamma. Det kan ingen. Det kommer att ta startups och företag och studenter och professorer runt om i världen. Öppen forskning har idag inte verktygen för att studera de frågor som Big Labs har bedömt som mest avgörande för framtida framsteg. Vi måste hitta ett sätt att bygga dessa verktyg. Vi försöker göra det lättare. Vi måste alla bli bättre på att samarbeta, på att inte uppfinna hjulet på nytt, på att sätta ihop enskilda bitar till större pussel. Låt oss ta vad vi gemensamt har gjort hittills, städa upp det, få det att fungera tillsammans, få fler människor att komma in i tältet och börja spela fler spel med positiva summor. Om vi inte kan hitta bättre sätt att arbeta tillsammans är vi på väg mot en AI-framtid där vi kollektivt bara inte vet vad dessa modeller ens är, eftersom ridån aldrig lyfts och allt vi faktiskt kan se är bara en leksak.
Det finns en annan typ av företag du kan bygga i det här utrymmet; en som fortfarande låter dig sälja till de stora laboratorierna, men inte uteslutande; en som fortfarande låter dig ha dina affärshemliga vallgravar och skriva ut söt ARR, men som inte gör oss kollektivt mindre informerade om den framtid vi bygger.
webbläsare. markör. exa. Modala. och oräkneliga andra. Låt oss göra fler av dessa. du kan bygga ett fantastiskt företag genom att göra kraftfulla verktyg och selar för agenter som återspeglar de värdefulla uppgifter som människor vill att modeller faktiskt ska göra. ha delar av det som är öppna för att prova fritt, och element som är värd bakom ett API. Ladda efter användning med vissa premiumfunktioner för företag. bygg den bästa LLM-formade excel-klonen, eller figma-klonen eller turbotax-klonen. Ändra det bara tillräckligt för att undvika en stämning, och låt sedan privata kunder se den mer stämningsrobusta versionen. Njut av en hälsosam konkurrens på arenan och hitta sätt att samarbeta där det räknas. hitta din vinkel och var så bra att du kan sälja till alla, oavsett om det är för RL eller för faktisk användning. Nå en kritisk massa och vara så prisvärd att det inte är värt det för någon att försöka bygga om det du redan har gjort.
Det här är den tidslinje jag hoppas att vi hamnar i. Det är en värld där de stora laboratorierna fortfarande kan göra bra ifrån sig och sannolikt kommer att erbjuda de enklaste sätten att spendera lite mer för att få förbättrad allmän prestanda. Men det är också en där modeller med öppen källkod inte ligger långt efter, och alla som bryr sig tillräckligt kan i princip se vad som händer och förstå hur de modeller vi använder faktiskt tränas. Om du funderar på att starta eller gå med i ett företag med fokus på RL-miljöer, uppmanar jag dig att tänka på vilken tidslinje du implicit satsar på och reflektera över hur du känner för det.
65,39K
Topp
Rankning
Favoriter