É notável que, em todos os casos, o Soneto tenha ganhos muito maiores com o raciocínio alto, mas o GLM tem um benefício modesto ou zero (e o não raciocínio é frequentemente ≈ raciocínio de Claude). Por um lado, isso significa que você pode economizar *ainda mais* com o GLM. Por outro lado, otimista para a pilha de RL de Ant.