DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Confesserò che ho in mente una missione molto specifica con questo progetto. Il lancio della beta privata semi-vaga ne fa parte. Il set di compiti che stiamo cercando è parte di esso. I bounty per GPU ne fanno parte. I shitpost ne fanno parte. I podcast ne fanno parte. La condivisione di idee è cruciale qui. Lasciami spiegare. Attualmente, gran parte della discussione sugli ambienti RL è focalizzata su questa nuova ondata di startup il cui modello di business consiste nel costruire e vendere ambienti a un numero molto ristretto di grandi laboratori su base esclusiva. Mechanize è la più rumorosa, ma ce ne sono diverse. Invece di spendere per campioni di istruzione e annotazioni, i laboratori sono ansiosi di acquistare ambienti privati come la loro prossima grande risorsa consumabile per l'addestramento dei modelli. Questo fenomeno rappresenta sia un serio rischio per la prospettiva dei modelli open-source di rimanere competitivi, sia una grande opportunità per inclinare le sorti se riusciamo a spostare il centro di gravità. Se i buoni ambienti sono tutti costosi e nascosti, i modelli open-source rimarranno ancora più indietro. Questo è essenzialmente ciò che è successo con i dati di pre-addestramento. Ma se può emergere un ecosistema sufficientemente robusto di strumenti open-source per ambienti e addestramento, allora l'opzione open-source può anche essere all'avanguardia. Questo è più o meno ciò che è successo con PyTorch. Inclinare le sorti qui è il mio obiettivo. Il nostro obiettivo. Sono entrato in Prime Intellect perché tutti erano incredibilmente talentuosi, erano dannatamente seri riguardo alla missione di AGI open-source per tutti e non avevano paura di dirlo, e perché il team aveva un vantaggio strutturale unico che significava che potevamo davvero fare delle vere scommesse. Vendiamo capacità di calcolo. Costruiamo infrastrutture per migliorare ciò che puoi fare con quel calcolo. Facciamo ricerca su come far interagire quel calcolo in modi nuovi. Stiamo addestrando modelli più grandi e migliori. Abbiamo gli incentivi giusti per fare il lavoro duro e necessario. Questi pezzi sono tutti connessi. Non possiamo farlo da soli. Nessuno può. Ci vorranno startup, imprese, studenti e professori di tutto il mondo. La ricerca aperta attualmente non ha gli strumenti per studiare le domande che i grandi laboratori hanno ritenuto più cruciali per il progresso futuro. Dobbiamo trovare un modo per costruire quegli strumenti. Stiamo cercando di rendere tutto ciò più facile. Dobbiamo tutti migliorare nel lavorare insieme, nel non reinventare la ruota, nell'assemblare pezzi individuali in puzzle più grandi. Prendiamo ciò che abbiamo collettivamente fatto finora, sistemiamolo, facciamolo funzionare insieme, portiamo più persone sotto il nostro tendone e iniziamo a giocare a giochi più positivi. Se non riusciamo a trovare modi migliori per lavorare insieme, ci stiamo dirigendo verso un futuro AI in cui collettivamente *non sappiamo nemmeno cosa siano questi modelli*, perché il sipario non viene mai sollevato, e tutto ciò che possiamo effettivamente vedere è solo un giocattolo. Esiste un altro tipo di azienda che potresti costruire in questo spazio; una che ti consente comunque di vendere ai grandi laboratori, ma non in modo esclusivo; una che ti consente comunque di avere i tuoi segreti commerciali e di stampare un bel ARR, ma che non ci rende collettivamente meno informati sul futuro che stiamo costruendo. Browserbase. Cursor. Exa. Modal. Morph. E innumerevoli altri. Facciamo di più di questi. Puoi costruire una grande azienda creando strumenti potenti e imbracature per agenti che riflettono i compiti ad alto valore che le persone vogliono che i modelli facciano realmente. Avere elementi di esso che sono aperti da provare liberamente, e elementi che sono ospitati dietro un'API. Addebitare in base all'uso con alcune funzionalità premium per le imprese. Costruire il miglior clone di Excel a forma di LLM, o clone di Figma, o clone di TurboTax. Cambialo giusto abbastanza per evitare una causa, e poi lascia che i clienti privati vedano la versione più robusta contro le cause. Goditi una sana competizione nell'arena e trova modi per collaborare dove conta. Trova il tuo angolo e sii così bravo da poter vendere a tutti, sia per RL che per un uso effettivo. Raggiungi una massa critica e sii così conveniente che non valga la pena per nessuno cercare di ricostruire ciò che hai già creato. Questa è la timeline in cui spero di finire. È un mondo in cui i grandi laboratori possono comunque fare bene, e probabilmente offriranno i modi più facili per spendere un po' di più per ottenere prestazioni generali migliorate. Ma è anche un mondo in cui i modelli open-source non sono lontani, e tutti coloro che si prendono cura abbastanza possono sostanzialmente vedere cosa sta succedendo e capire come i modelli che usiamo sono effettivamente addestrati. Se stai pensando di avviare o unirti a un'azienda focalizzata sugli ambienti RL, ti esorto a riflettere su quale timeline stai implicitamente scommettendo e a riflettere su come ti senti riguardo a ciò.

91,33K

Principali

Ranking

Preferiti

On-chain di tendenza

Di tendenza su X

Principali fondi recenti

Più popolari