Realizámos um teste cego e empírico na maioria dos agentes de auditoria de IA no espaço web3, utilizando concursos reais. Os resultados? A maioria das ferramentas perdeu falhas críticas, afogou os utilizadores em falsos positivos ou não conseguiu funcionar de todo. Thread 👇