la risposta è che il GPT-5 Smart Router è stata una svolta nell'economia dell'inferenza LLM. OpenAI ha probabilmente raddoppiato il proprio rapporto profitto/costo con esso, rispetto a semplicemente servire un mix controllato dall'utente di o3 e o4-mini. Più puoi passare a modelli stupidi, più risparmi.
Teknium (e/λ)
Teknium (e/λ)10 ago, 20:23
Perché è la mossa giusta? Sul serio? 1. I modelli già pensano di più per problemi più difficili in modalità ragionamento. 2. Potresti sempre farlo provare a ragionare, così non ti deluderà mai nel caso ne avesse bisogno. 3. Ogni volta che una risposta non è soddisfacente se non avevi attivato il ragionamento, puoi semplicemente attivarlo. Perché ne vale così tanto la pena? Quali sono i veri vantaggi nel togliere il controllo agli utenti? Perché sono così fermi su questo?
29,2K