Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Dokážou AI agenti spolehlivě procházet web? Má výběr kostru agenta vliv na schopnost procházení webu? Abychom na tyto otázky odpověděli, přidali jsme Online Mind2Web, benchmark pro procházení webu, do žebříčku Holistic Agent Leaderboard (HAL).
Vyhodnotili jsme 9 modelů (včetně GPT-5 a Sonnet 4) se dvěma kostrami agentů (Browser-Use a SeeAct) na Online Mind2Web 🧵

21,37K
Top
Hodnocení
Oblíbené