Open-source prostředí RL mohou být nejdůležitější částí pro zajištění open source AGI
will brown
will brownPřed 9 h
Přiznám se, že mám v tomto projektu na mysli velmi specifické poslání. Polovágní spuštění soukromé beta verze je toho součástí. Sada úkolů, které získáváme, je jeho součástí. součástí toho jsou i odměny GPU. shitposty jsou toho součástí. Podcasty jsou jeho součástí. Sdílení myšlenek je zde zásadní. Dovolte mi to vysvětlit. V současné době se velká část diskusí o prostředí RL zaměřuje na tuto novou vlnu startupů, jejichž obchodní model spočívá v budování a prodeji prostředí velmi malému počtu velkých laboratoří na exkluzivní bázi. Mechanize je nejhlasitější, ale je jich celá řada. Místo toho, aby laboratoře utrácely za vzorky a anotace pro ladění instrukcí, touží si koupit soukromé prostředí jako svůj další velký spotřební zdroj pro trénování modelů. Tento jev je jak vážným rizikem pro vyhlídky na to, že open-source modely zůstanou konkurenceschopné, tak velkou příležitostí vychýlit misky vah, pokud se nám podaří posunout těžiště. Pokud jsou dobrá prostředí drahá a skrytá, open-source modely budou ještě více zaostávat. To je v podstatě to, co se stalo s předtrénovacími daty. Pokud se však podaří vytvořit dostatečně robustní ekosystém open-source nástrojů pro prostředí a školení, pak může být open-source varianta také nejmodernější. To je víceméně to, co se stalo s Pytorchem. Mým cílem je zde naklonit misky vah. Náš cíl. Připojil jsem se k Prime Intelekt, protože všichni byli šíleně talentovaní, brali to zatraceně vážně s posláním open-source AGI pro každého a nebáli se to říct, a protože tým měl jedinečnou strukturální výhodu, což znamenalo, že jsme mohli skutečně udělat nějaké skutečné výkyvy. Prodáváme výpočetní techniku. Vytváříme infrastrukturu, abychom zlepšili, co s těmito výpočty můžete dělat. Provádíme výzkum toho, jak zajistit, aby tyto výpočty spolupracovaly novými způsoby. Trénujeme větší a lepší modely. Máme správné podněty k tomu, abychom odvedli těžkou a nezbytnou práci. všechny tyto části jsou propojené. Nemůžeme to udělat sami. Nikdo to nedokáže. Bude to vyžadovat startupy a podniky, studenty a profesory po celém světě. Otevřený výzkum v současné době nemá nástroje ke studiu otázek, které velké laboratoře považují za nejdůležitější pro budoucí pokrok. Musíme najít způsob, jak tyto nástroje vytvořit. Snažíme se to usnadnit. Všichni se musíme zlepšit ve spolupráci, v tom, abychom znovu nevynalézali kolo, abychom poskládali jednotlivé kousky do větších skládaček. Vezměme to, co jsme dosud společně udělali, vyčistěme to, aby to fungovalo společně, přiveďme více lidí do stanu a začněme hrát více her s pozitivním součtem. pokud nenajdeme lepší způsoby spolupráce, směřujeme k budoucnosti umělé inteligence, kde kolektivně prostě *nevíme, co tyto modely vůbec jsou*, protože opona se nikdy nezvedne a vše, co skutečně vidíme, je jen hračka. V tomto prostoru můžete vybudovat jiný typ společnosti; takový, který vám stále umožňuje prodávat velkým laboratořím, ale ne výhradně; takový, který vám stále umožňuje mít vaše obchodní tajemství a tisknout sladké ARR, ale nečiní nás kolektivně méně informovanými o budoucnosti, kterou budujeme. browserbase. kurzor. exa. modální. morph. a nespočet dalších. Udělejme jich více. můžete vybudovat skvělou společnost tím, že vytvoříte výkonné nástroje a harnessy pro agenty, které odrážejí úkoly s vysokou hodnotou, které lidé chtějí, aby modelky skutečně dělaly. Mají prvky, které lze volně vyzkoušet, a prvky, které jsou hostovány za API. Účtujte podle využití s některými prémiovými funkcemi pro podniky. Sestavte nejlepší klon Excelu ve tvaru LLM, klon figma nebo klon Turbotax. změňte ji jen natolik, abyste se vyhnuli soudnímu sporu, a pak nechte soukromé zákazníky vidět verzi, která je pro soudní spory robustnější. Užijte si zdravou soutěživost v aréně a najděte způsoby, jak se stát partnerem tam, kde je to důležité. Najděte si svůj úhel a buďte tak dobří, že můžete prodávat každému, ať už pro RL nebo pro skutečné použití. Dosáhněte kritického množství a buďte tak cenově dostupní, že nikomu nestojí za to pokoušet se znovu sestavit to, co jste již vytvořili. Doufám, že toto je časová osa, ve které skončíme. Je to svět, kde velké laboratoře mohou stále fungovat skvěle a pravděpodobně nabídnou nejjednodušší způsoby, jak utratit o něco více za zlepšení celkového výkonu. Ale je to také oblast, kde open-source modely nezůstávají pozadu a každý, kdo se dostatečně zajímá, může v podstatě vidět, co se děje, a pochopit, jak jsou modely, které používáme, ve skutečnosti trénovány. Pokud uvažujete o založení nebo nástupu do společnosti zaměřené na prostředí RL, vyzývám vás, abyste se zamysleli nad tím, na kterou časovou osu implicitně sázíte, a zamysleli se nad tím, co si o tom myslíte.
6,66K