DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

Otro modelo de código abierto SOTA 👍 Con 355B de parámetros (32B de MoE activos) es un poco más pequeño que algunos de los modelos de ~1T que hemos visto. Hasta donde sé, no dicen qué hardware se utilizó para entrenar este modelo, pero usaron 23T de tokens de entrenamiento. Si no entiendo mal, tanto Alibaba como Tencent son inversores en esta startup en Pekín.

7K

Parte superior

Clasificación

Favoritos