Realizamos um teste empírico cego na maioria dos agentes de auditoria de IA no espaço web3, usando concursos reais. Os resultados? A maioria das ferramentas perdeu falhas críticas, afogou os usuários em falsos positivos ou não conseguiu ser executada. Fio 👇