Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

samsja
Condurre la ricerca presso @PrimeIntellect
samsja ha ripubblicato
14 Giorni di Distribuzione, Giorno 7!
Incontra Sami Jaghouar (@samsja19) di @PrimeIntellect:
Sami guida la loro ricerca e si concentra sul pre-addestramento decentralizzato e sull'apprendimento per rinforzo distribuito come parte del suo lavoro.
Sami terrà una lezione su come appare l'implementazione dell'addestramento decentralizzato presso Prime.

7,86K
L'ultimo hackathon in modalità GPU è stato il miglior hackathon a cui abbia mai partecipato di persona, non vedo l'ora di partecipare al prossimo.

Mark Saroufim23 ago, 05:09
È di nuovo tempo per la nostra ultima (ora annuale) straordinaria celebrazione dell'anno. GPU MODE si incontra di persona di nuovo nel centro di San Francisco venerdì 24 ottobre dalle 10:00 alle 22:00 per hackare tutto il giorno.

3,55K
Sembra che altre persone convergano nell'utilizzare vllm v1 logprob per il rapporto di importanza per risolvere il problema di stabilità.
Penso di avere il PTSD da questo tipo di crash di RL.

Zichen Liu22 ago, 23:35
Con poche righe di codice, la soluzione suggerita da Feng (@fengyao1909)—applicare il campionamento di importanza sulla politica di comportamento—ha risolto l'instabilità dell'addestramento nel mio caso (oat). Credo che il risultato possa generalizzarsi anche ad altri framework di RL. Ottimo lavoro, Feng!

6,64K
Sto assumendo un ingegnere di ricerca presso @PrimeIntellect
Stiamo costruendo laboratori AGI open source e stiamo cercando talenti grezzi. Non ci interessa il tuo precedente titolo di lavoro.
Tutti nel team di ricerca sono full stack, costruiamo infrastrutture e ci occupiamo anche di dati. Se hai una passione per i sistemi, l'apprendimento per rinforzo, i dati o le leggi di scaling, ti verrà presentata una tonnellata di sfide da risolvere.
83,18K
il sistema dichiarativo basato su testo vincerà, è tempo di reinventare il computer

samsja17 ago, 08:09
Forse llm + nixos salveranno linux rendendo i loro utenti 10 volte più potenti grazie a un'agi del computer collegata al sistema operativo. Immagina di poter semplicemente chiedere "puoi installare il cursore e spostare tutte le mie impostazioni di vscode su di esso"
Nel frattempo, gli utenti macos continueranno a usare il mouse per scaricare e configurare tutto manualmente.
Una visione così a breve termine voler addestrare un modello di visione per fare clic al posto mio, è necessario riprogettare tutto per l'agi.
2,22K
Forse llm + nixos salveranno linux rendendo i loro utenti 10 volte più potenti grazie a un'agi del computer collegata al sistema operativo. Immagina di poter semplicemente chiedere "puoi installare il cursore e spostare tutte le mie impostazioni di vscode su di esso"
Nel frattempo, gli utenti macos continueranno a usare il mouse per scaricare e configurare tutto manualmente.
Una visione così a breve termine voler addestrare un modello di visione per fare clic al posto mio, è necessario riprogettare tutto per l'agi.

samsja17 ago, 07:46
non è NixOS il gioco finale di sandbox per LLM?
10,65K
Principali
Ranking
Preferiti
On-chain di tendenza
Di tendenza su X
Principali fondi recenti
Più popolari