DApp Store | Hub Web3 pentru evenimente și jocuri

Subiecte populare

Un alt model 👍 open source SOTA La 355B parametri (32B MoE activ) este puțin mai mic decât unele dintre modelele ~1T pe care le-am văzut. AFAIK nu spun ce hardware a fost folosit pentru a antrena acest model, dar au folosit jetoane de antrenament 23T. IIUC atât Alibaba, cât și Tencent sunt investitori în care este un startup din Beijing.

7K

Limită superioară

Clasament

Favorite