ehi @hud_evals sarebbe fantastico se potessi aggiungere @ManusAI_HQ al tuo benchmark Autonomy-10 sono curioso di vedere come si confronta con Operator/Claude dato che sembra piuttosto buono
571