Curiosità: Alper è l'unica persona che si dedica a tempo pieno all'addestramento dei modelli di domenica. Ci sono voluti 3 mesi e 16 nodi di H100 per produrre tutti i risultati che vedi. Il 2026 sarà pazzesco.
Alper Canberk
Alper Canberk7 ore fa
Durante l'addestramento di ACT-1, abbiamo trattato i dati provenienti da compiti diversi e a lungo termine nel mondo reale come un cittadino di prima classe. Questo rende la generalizzazione la norma, non un'eccezione. L'involucro delle capacità si espande. Altro in arrivo.
una volta risolto il collo di bottiglia dei dati, il resto dello stack può essere incredibilmente efficiente.
78,6K