DApp Store | Hub da Web3 para eventos e jogos

Tópicos em alta

Outro modelo 👍 de código aberto SOTA Nos parâmetros 355B (32B MoE ativo), é um pouco menor do que alguns dos modelos ~ 1T que vimos. AFAIK, eles não dizem qual hardware foi usado para treinar este modelo, mas usaram tokens de treinamento 23T. IIUC, Alibaba e Tencent são investidores em que é uma startup em Pequim.

7K

Melhores

Classificação

Favoritos