Vi kjørte en blind, empirisk test på de fleste AI-revisjonsagenter i web3-området, ved hjelp av ekte konkurranser.
Resultatene?
De fleste verktøy gikk glipp av kritiske feil, druknet brukere i falske positiver eller klarer ikke å kjøre i det hele tatt.
Tråd 👇