Kami menjalankan tes empiris buta pada sebagian besar agen audit AI di ruang web3, menggunakan kontes nyata. Hasilnya? Sebagian besar alat melewatkan kekurangan kritis, menenggelamkan pengguna dalam positif palsu atau gagal berjalan sama sekali. Benang 👇