Mnoho lidí rádo porovnává různé třídy modelů, jako je "uvažování" nebo "neusuzování", zatímco ve skutečnosti jsou nyní všichni trénováni velkým množstvím stejných technik zpětnovazebního učení (a dalších věcí). Správný pohled je vidět každou verzi modelu ve spektru uvažování. Mnozí říkají, že Claude je model bez uvažování, přesto byli jedni z prvních, kdo měl speciální tokeny a UX pro "hluboké přemýšlení, pohotovost" (dlouho před jejich rozšířeným režimem myšlení). Totéž by mohlo platit pro DeepSeek v3.1, který je vydán, ale ještě není snadné jej používat. Nemáme představu, kolik žetonů na odpověď se ve výchozím nastavení používá v chatovacích verzích těchto modelů. API s přesným počtem tokenů jsou jediným zdrojem pravdy a měla by být komunikována mnohem častěji. V rámci modelů uvažování pak existuje obrovský rozptyl v počtu použitých tokenů. Cena modelů by měla být konečným zvážením úsilí, mixem celkových aktivních parametrů a počtu použitých tokenů. Při poslechu Dylana Patela v podcastu a16z se zdá, že jednou z velkých výher GPT-5 v režimu myšlení, který se mi líbí (podobně jako o3), bylo dosáhnout o něco lepších výsledků s téměř o 50 % méně tokeny. Trochu jsem to cítil, je to prostě více na úkol než o3. Dalším bodem je druhá generace R1, R1-0528 zlepšila skóre pomocí mnohem více uvažování. Qwen je na tom podobně. To není pro uživatele vždy velmi cenné. Na technické úrovni to řešíme hlášením počtu tokenů použitých na model ve výsledcích hodnocení (zejména ve srovnání s vrstevníky). Problém je v tom, že spouštění AI je nyní poměrně mainstreamové a je třeba sdělit jemný technický detail. Pokud jde například o výzkum, můžete smysluplně zvýšit své skóre hodnocení tím, že vyhodnotíte svůj model uvažování v delším kontextu než vaši kolegové. Uvažování v tokenech a někdy i v systémové výzvě je nyní složitou proměnnou, ale ne jednoduchou ano/ne ve všech těchto verzích. Níže je snímek obrazovky z příspěvku, který o tom pojednává před vydáním o1 (12. září loňského roku) a snímek obrazovky uživatele redditu, který odhalil Claudeovo myšlení. Schovávám si tuto tirádu pro budoucí použití, protože ji musím neustále opakovat.
25,02K