Vibe Coding tidak begitu bagus akhir-akhir ini. Pengkodean Getaran imajiner seharusnya Anda memberikan tugas, AI berpikir dan mengajukan beberapa pertanyaan kunci, dan kemudian mulai bekerja untuk waktu yang lama, di mana Anda dapat memperlambat, minum segelas soda bersoda, menonton video pendek, dan menikmati hidup. Dan sekarang, setelah Anda memberikan tugas, karena Anda tidak menjelaskannya secara rinci kepadanya di tempat tertentu, jadi dia berpikir selama 30 menit dan menghasilkan sesuatu yang 108.000 mil berbeda dari apa yang Anda inginkan, Anda marah dan mundur, dan kemudian Anda menahan kemarahan Anda dan menjelaskan kepadanya dalam prompt bahwa Anda perlu memperhatikan bagian ini, apa yang harus dilakukan, dan kemudian membiarkannya terus menghasilkan selama 30 menit, tetapi dia hanya mendengarkan sebagian dari apa yang dia katakan kepada Anda, dan kemudian terus menghasilkan menara stroberi. Pada saat yang sama, karena Anda hanya menambahkan sebagian dari prompt, dia terus menghasilkan banyak menara stroberi di tempat lain, saat ini Anda dengan marah menunjukkan kesalahannya, dan kemudian dia berkata: Saya akhirnya mengerti, dan kemudian terus menghasilkan baba. Setelah perjuangan yang panjang, Anda akhirnya menyerah dan mulai mencari masalah kode sendiri, dan menghabiskan 30 menit menonton kode yang dia hasilkan, semakin marah dia, dan rasanya seperti magang menyalin sedikit dari Internet dan mengumpulkan sampah. Akhirnya Anda dengan marah memfaktorkan ulang kode. Ini lebih jelas dalam proyek yang lebih kompleks (misalnya, melibatkan beberapa layanan mikro, interaksi front-end dan back-end, komunikasi middleware, dll.). Jadi Anda mulai bertanya-tanya mengapa orang lain dapat menggunakan AI untuk menyelesaikan begitu banyak proyek menarik sementara Anda membiarkan AI menulis kode dalam keadaan berantakan. Setelah banyak perjuangan, dia tidak berani menanyakan berbagai informasi, berharap menemukan cara yang benar untuk berinteraksi dengan AI, dan kemudian terus berkomunikasi dengan AI setelah berpikir dia telah menemukannya, tetapi hal yang dia hasilkan masih gumpalan kotoran. Waktu terbuang-untuk ini. Dahulu kala, Claude Code memelopori era baru sebagai raja Vibe Coding, benar-benar meningkatkan efeknya dengan meningkatkan tingkat akurasi dengan beberapa eksekusi. Dengan asumsi bahwa konten yang dihasilkan AI hanya 80% benar, maka Claude Code dapat menghasilkan kode yang sangat baik dengan meningkatkan tingkat akurasi menjadi 99 melalui beberapa pengujian mandiri, analisis, dan modifikasi berulang. Tetapi Claude Code belajar sama dengan Cursor, semua jenis pengurangan kecerajen, pembatasan, menghasilkan penurunan cepat dalam tingkat akurasi yang awalnya rendah, 4 koreksi asli dapat mencapai akurasi 99%, jika tingkat yang benar setelah pengurangan kebijaksanaan hanya 70%, jika yang sama ingin mencapai efek dari 4 kali sebelumnya, maka dia harus melakukan 6 koreksi. Selain itu, Claude telah memberlakukan batasan penggunaan, sehingga sekarang tidak mungkin untuk menghasilkan kode yang valid dalam jumlah waktu yang sama, bahkan jika batasnya tercapai. Dan mengapa Codex begitu sering dipuji sekarang? Alasan utamanya adalah dia suka menanyakan pendapat pengguna, apakah dia akan bertanya apakah ada masalah dengan solusi saya? Bisakah Anda melakukan ini, saya akan memberi Anda beberapa set rencana tentang cara meningkatkan dan bagaimana mencapainya. Ini bagus karena AI pada dasarnya salah, dan pada kenyataannya, jawaban Anda membantu mereka mengisi masalah tingkat akurasi yang tidak mencukupi, sehingga dapat mencapai tingkat akurasi hampir 99% dalam satu generasi. Claude Code adalah produk yang bagus, tetapi semakin buruk karena tingkat akurasi tidak pada ketinggian yang diinginkan orang, AI awalnya adalah output probabilitas pencocokan reguler yang besar, kunci untuk menentukan kinerjanya adalah apakah output probabilitas bisa sedekat mungkin dengan 1, dan tekniknya hanya menggunakan berbagai skema untuk membiarkannya memperbaiki hampir 1 berkali-kali. Tetapi pengurangan kebijaksanaan + batas membuatnya semakin sulit untuk mendekati 1. Di sisi lain, Codex tahu bahwa AI murni tidak dapat diandalkan, jadi dia menyerahkan tugas koreksi kesalahan kepada pengguna, mengubah dari alat Pengkodean Getaran menjadi asisten AI, dan hasilnya sangat bagus. Alat-alat AI ini juga perlu memikirkan bagaimana memecahkan masalah ini ketika tingkat akurasi tidak mencukupi, dan jawaban yang diberikan oleh Codex sangat bagus, tetapi apakah ini solusi yang optimal? Belum tentu, tetapi saya pribadi berpikir bahwa kolaborasi multi-agen masih efektif, karena setiap AI memiliki metode pencocokannya sendiri, menghasilkan hasil, verifikasi silang antara beberapa agen, dan pemikiran paralel adalah persamaan terbaik. Namun, ini pasti tidak akan terjadi pada perusahaan model AI ini, karena mereka pasti akan memaksa model mereka sendiri untuk diikat, jadi pihak ketiga adalah pilihan terbaik untuk melakukan ini. (Saya tidak punya apa-apa untuk dikatakan, apa yang saya pikirkan dan apa yang harus saya katakan)