Estive a desenvolver ambientes durante esta última semana. Acredito que isto pode resolver as necessidades do ambiente RL para as massas. Tem havido muitas coisas interessantes e legais para testar, incluindo um ambiente de prova multi-turn Lean4 inspirado no StepRunProver que criei.
Prime Intellect
Prime Intellect28/08, 03:16
Apresentando o Hub de Ambientes Os ambientes RL são o principal gargalo para a próxima onda de progresso em IA, mas grandes laboratórios estão restringindo-os Criámos uma plataforma comunitária para crowdsourcing de ambientes abertos, para que qualquer pessoa possa contribuir para a AGI de código aberto
8,32K