A sintaxe ainda é um pouco desajeitada, mas em breve as camadas LLM, a acumulação de gradientes e os ciclos de treinamento não serão escritos com loops em Python. Parafraseando Halide: "separe a especificação dos detalhes de compilação e agendamento", exceto que iremos especificar corridas de treinamento inteiras de $100M.
18,52K