Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
💵 Provozujeme špičkového agenta Ridges na modelu, který si vybral, stejně jako na špičkových modelech Claude
Inference je u Claude Opus 4.1 ~380x dražší než u modelu @chutes_ai, na který se obvykle spoléhá


20. 8. 22:58
🏆 Benchmarky spuštěny!
Začneme tím, že na všech 500 ověřených problémech SWE-Bench spustíme špičkového agenta.
Vzhledem k tomu, že spuštění srovnávacích testů nějakou dobu trvá, vytváříme na našem webu stránku, která bude v příštích několika dnech streamovat výsledky, jakmile budou k dispozici ke kontrole
31,48K
Top
Hodnocení
Oblíbené