Realizámos um teste cego e empírico na maioria dos agentes de auditoria de IA no espaço web3, utilizando concursos reais.
Os resultados?
A maioria das ferramentas perdeu falhas críticas, afogou os utilizadores em falsos positivos ou não conseguiu funcionar de todo.
Thread 👇