Ngày nay, Vibe Coding không còn đẹp như tưởng tượng. Vibe Coding mà bạn hình dung nên là, bạn giao một nhiệm vụ, AI suy nghĩ và hỏi bạn một vài câu hỏi quan trọng, sau đó bắt đầu làm việc trong một thời gian dài, lúc này bạn có thể từ từ thưởng thức một ly nước soda có ga, xem video ngắn và tận hưởng cuộc sống. Còn bây giờ là, sau khi bạn giao một nhiệm vụ, vì bạn không giải thích chi tiết một phần nào đó, nên nó đã suy nghĩ trong suốt 30 phút và tạo ra một thứ hoàn toàn khác xa với những gì bạn muốn, bạn tức giận rollback, rồi kiềm chế cơn giận và giải thích cho nó phần mà bạn cần chú ý, nên làm như thế nào, rồi để nó tiếp tục tạo ra trong 30 phút, kết quả là nó chỉ nghe một phần những gì bạn nói, rồi tiếp tục tạo ra một chiếc bánh dâu tây, trong khi bạn chỉ bổ sung một phần gợi ý, dẫn đến việc ở một nơi khác nó tiếp tục tạo ra rất nhiều bánh dâu tây, lúc này bạn không thể kiềm chế nổi và chỉ ra lỗi của nó, rồi nó nói: Tôi cuối cùng đã hiểu, rồi tiếp tục tạo ra phân. Sau một thời gian dài vật lộn, bạn cuối cùng từ bỏ và bắt đầu tự tìm kiếm vấn đề trong mã, đã mất 30 phút để xem mã mà nó tạo ra, càng xem càng tức giận, cảm giác như một thực tập sinh đã sao chép từ mạng và ghép lại thành một đống rác. Cuối cùng bạn tức giận tái cấu trúc mã. Tình huống này càng rõ ràng hơn trong các dự án phức tạp (ví dụ như liên quan đến nhiều microservices, tương tác giữa frontend và backend, giao tiếp middleware, v.v.). Vì vậy, bạn bắt đầu nghi ngờ bản thân, tại sao người khác có thể sử dụng AI để hoàn thành nhiều dự án thú vị trong khi mã mà bạn để AI viết lại là một đống phân. Sau nhiều lần vật lộn, bạn không dám tìm kiếm các tài liệu khác nhau, hy vọng có thể tìm ra cách tương tác đúng với AI, rồi tự cho rằng đã tìm ra và tiếp tục giao tiếp với AI, kết quả là những gì nó tạo ra vẫn là một đống phân. Thời gian lãng phí vào việc này. Đã có một thời Claude Code như một vị vua của Vibe Coding đã mở ra một kỷ nguyên mới, thực tế là thông qua việc thực hiện nhiều lần để nâng cao độ chính xác. Giả sử nội dung do AI tạo ra chỉ có độ chính xác 80%, thì Claude Code thông qua nhiều lần tự kiểm tra, phân tích, sửa đổi liên tục, đã nâng cao độ chính xác lên 99, và có thể tạo ra mã rất tốt. Nhưng Claude Code học giống như Cursor, bị giảm trí tuệ và hạn chế, dẫn đến độ chính xác ban đầu không cao giảm nhanh chóng, ban đầu 4 lần sửa đổi có thể đạt 99% độ chính xác, nếu giảm trí tuệ thì độ chính xác chỉ còn 70%, nếu muốn đạt được hiệu quả như trước với 4 lần sửa đổi, thì nó phải thực hiện 6 lần sửa đổi mới được. Thêm vào đó, Claude đã hạn chế mức sử dụng, dẫn đến việc bây giờ trong cùng một khoảng thời gian hoàn toàn không thể tạo ra mã hiệu quả, ngay cả khi đạt được giới hạn cũng không được. Và bây giờ tại sao Codex lại thường xuyên được khen ngợi? Nguyên nhân chính là nó thích hỏi ý kiến người dùng, nó sẽ hỏi liệu kế hoạch của tôi có vấn đề không? Có thể làm như vậy không? Nó sẽ đưa ra cho bạn vài phương án để cải thiện, để thực hiện. Điều này rất tốt, vì AI vốn dĩ đã có lỗi, thực tế câu trả lời của bạn đang giúp họ lấp đầy vấn đề thiếu độ chính xác, để nó có thể tạo ra gần 99% độ chính xác trong một lần. Claude Code là một sản phẩm rất tốt, nhưng nó ngày càng kém đi vì độ chính xác hoàn toàn không đạt được mức độ mà mọi người mong muốn, AI vốn dĩ là một bộ máy xuất ra xác suất dựa trên quy tắc lớn, quyết định hiệu suất của nó chủ yếu phụ thuộc vào việc đầu ra xác suất có thể gần 1 nhất có thể hay không, trong kỹ thuật chỉ là sử dụng nhiều phương án để sửa chữa nó gần 1 mà thôi. Nhưng giảm trí tuệ + hạn chế, khiến nó ngày càng khó gần 1. Ngược lại, Codex, nó biết AI thuần túy không đáng tin cậy, vì vậy đã giao nhiệm vụ sửa lỗi cho người dùng, từ một công cụ Vibe Coding trở thành một trợ lý AI, kết quả thu được lại rất tốt. Những công cụ AI này cũng cần suy nghĩ về cách giải quyết những vấn đề khi độ chính xác không đủ, Codex đưa ra câu trả lời rất tốt, nhưng đây có phải là giải pháp tối ưu không? Cũng không chắc, nhưng tôi cá nhân cho rằng, hợp tác nhiều Agent vẫn hiệu quả, vì mỗi AI đều có cách khớp riêng, kết quả tạo ra, việc xác thực chéo giữa nhiều Agent, suy nghĩ song song mới là phương trình tốt nhất. Nhưng chuyện này chắc chắn không thể xảy ra trong các công ty mô hình AI này, vì họ chắc chắn sẽ buộc phải gắn bó với mô hình của mình, vì vậy, bên thứ ba mới là lựa chọn tốt nhất cho việc này. (Không có gì để nói, nghĩ gì nói nấy)