svaret är att GPT-5 Smart Router har varit ett genombrott i LLM-inferensekonomin. OpenAI har förmodligen fördubblat sitt vinst/kostnadsförhållande med det, jämfört med att bara servera en användarkontrollerad blandning av o3 och o4-mini. Ju mer du kan skicka till dumma modeller, desto mer sparar du.
Teknium (e/λ)
Teknium (e/λ)10 aug. 20:23
Varför är det rätt drag? Allvarligt? 1. Modeller tänker redan mer på svårare problem i resonemangsläge. 2. Du kan bara alltid få det att försöka resonera, då kommer det aldrig att svika dig om det behövs. 3. Varje gång ett svar inte är tillfredsställande om du inte hade resonemang kan du bara slå på det. Varför är det värt så mycket besvär? Vilka är de verkliga fördelarna med att ta kontrollen från användarna? Varför är de så orubbliga när det gäller det?
29,23K