Het is opmerkelijk dat Sonnet in elk geval veel grotere winsten behaalt met reasoning-high, maar GLM heeft bescheiden of geen voordeel (en non-reasoning is vaak ≈ Claude-reasoning). Aan de ene kant betekent dit dat je *nog meer* kunt besparen met GLM. Aan de andere kant is het bullish voor Ant's RL-stack.