Jadi kami menganalisis jutaan suntingan diff dari pengguna cline dan tampaknya GLM-4.6 mencapai tingkat keberhasilan 94.9% vs 96.2% dari Claude 4.5. Untuk lebih jelasnya, pengeditan diff bukanlah metrik akhir untuk agen pengkodean. Tapi yang menarik adalah tiga bulan lalu selisih ini adalah 5-10 poin. Model open source meningkat dengan cepat, dan pengguna Cline segera menyadarinya - perselisihan kami menyala dengan orang-orang yang beralih ke GLM untuk pekerjaan sehari-hari karena biayanya 10% minggu ini AMD juga menulis blog tentang bagaimana mereka menjalankan qwen3 coder dan glm-4.5-air pada perangkat keras konsumen. Kesenjangan tidak hanya menutup di cloud - itu juga menutup di laptop Anda