Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Un model masiv de fundație open source deblocat de @_xjdr
XJDR este un om de știință nebun, așa că mi-au trebuit câteva treceri să înțeleg cu adevărat și tot s-ar putea să nu apreciez pe deplin întregul rezultat.
De obicei, dacă vrei să antrenezi un model de bază nou-nouț de la zero, ai nevoie de o mulțime de plăci video doar ca să pornești serios de antrenament. Este scump.
Unul dintre cele mai greu de învățat este modelul DeepSeek Mix of Experts. Este puternic, dar sistemul de rutare și configurația de antrenament sunt atât de capricioase încât testele la scară mică adesea se destramă. Așa că ajungi să ai nevoie de un cluster mare doar ca să înveți ceva, iar când o rundă eșuează nu poți spune dacă ideea ta a fost greșită sau dacă setup-ul s-a stricat, astfel încât cercetarea moare și nu afli nimic
XJDR este open source NMOE, o fabrică de antrenament gata de rulare, cablată așa cum ar face-o un expert, special pentru ca această clasă de modele să poată fi antrenată și cercetată pe o singură mașină fără întreruperi constante. Experimentele mici se comportă ca un antrenament real, așa că poți obține un răspuns clar cu da sau nu înainte să cheltuiești opt cifre și luni de timp.
În realitate, oamenii pot rula teste ieftine și rapide în care schimbi un lucru pe rând, cum ar fi cum funcționează rutele modelului între specialiști, cum învață (rețeta de antrenament), ce date îi furnizezi și cum obții mai multă calitate pe dolar. Practic, testezi idei noi pentru modele de bază mai bune, la fel cum ai testa A/B un produs, dar poți face asta în afara unui laborator mare.
Impactul net este o iterație mai rapidă și economii majore de costuri, plus că mai multe echipe pot construi realist noi modele de bază. Asta poate însemna un model mai bun de clasă DeepSeek, modele noi de tip specialist și mai multă concurență și cercetare deschisă, deoarece taxa de înscriere scade brusc și mai multe dintre descoperiri au loc public
Rămâneți pe aproape, el face open source pentru majoritatea lucrurilor!
Felicitări @_xjdr. Suntem foarte bucuroși să te susținem și să fim o mică parte din povestea ta
Limită superioară
Clasament
Favorite
