DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Een ander SOTA open source model 👍 Met 355B parameters (32B actieve MoE) is het iets kleiner dan sommige van de ~1T modellen die we hebben gezien. Voor zover ik weet zeggen ze niet welke hardware is gebruikt om dit model te trainen, maar ze hebben 23T training tokens gebruikt. Als ik het goed heb, zijn zowel Alibaba als Tencent investeerders in een startup in Beijing.

7K

Boven

Positie

Favorieten