Es ist bemerkenswert, dass Sonnet in jedem einzelnen Fall viel größere Gewinne aus reasoning-high erzielt, während GLM bescheidene oder null Vorteile hat (und non-reasoning oft ≈ Claude-reasoning entspricht). Einerseits bedeutet das, dass Sie *noch mehr* mit GLM sparen können. Andererseits ist es bullisch für Ants RL-Stack.