Un enorme modelo de fundación de código abierto desbloqueado por @_xjdr XJDR es un científico loco, así que me costó varias veces entenderlo bien, y aún así puede que no aprecie del todo el resultado. Normalmente, si quieres entrenar un modelo base nuevo desde cero, necesitas un montón de GPUs solo para arrancar un entrenamiento serio. Es caro. Uno de los tipos más difíciles de entrenar es el diseño DeepSeek Mix of Experts. Es potente, pero el sistema de enrutamiento y la configuración de entrenamiento son tan delicados que las pruebas a pequeña escala a menudo se descontrolan. Así que acabas necesitando un gran clúster solo para aprender algo, y cuando una partida falla no puedes saber si tu idea estaba equivocada o si la configuración simplemente se estropeó, así que la investigación muere y no aprendes nada XJDR es un nmoe de código abierto, una fábrica de entrenamiento lista para funcionar conectada a la manera en que lo haría un experto, específicamente para que esta clase de modelos pueda entrenarse e investigarse en una sola máquina sin roturas constantes. Los experimentos pequeños se comportan como un entrenamiento real, así que puedes obtener un sí o un no limpio antes de gastar ocho cifras y meses de tiempo. En realidad, la gente puede hacer ensayos rápidos y baratos donde cambias una cosa a la vez, como cómo funcionan las rutas del modelo entre especialistas, cómo aprende (receta de entrenamiento), qué datos le das y cómo exprimes más calidad por dólar. Básicamente estás poniendo a prueba nuevas ideas para mejores modelos base igual que harías pruebas A/B de un producto, pero puedes hacerlo fuera de un gran laboratorio. El impacto neto es una iteración más rápida y un gran ahorro de costes, además de que más equipos pueden construir de forma realista nuevos modelos de base. Eso puede significar un mejor modelo de clase DeepSeek, nuevos modelos de estilo especializado, y mucha más competencia e investigación abierta, porque la cuota de inscripción baja mucho y más avances se producen en público ¡Estad atentos, está abriendo el código de la mayor parte! Enhorabuena @_xjdr. Estamos muy contentos de apoyarte y ser una pequeña parte de tu historia