Loja DApp | Hub Web3 para eventos e jogos

Tópicos populares

Outro modelo open source SOTA 👍 Com 355B parâmetros (32B MoE ativos), é um pouco menor do que alguns dos modelos de ~1T que vimos. Até onde sei, eles não dizem qual hardware foi usado para treinar este modelo, mas usaram 23T de tokens de treinamento. Se entendi corretamente, tanto a Alibaba quanto a Tencent são investidores em uma startup em Pequim.

7K

Top

Classificação

Favoritos