lý do mà cursor và windsurf phát hành các mô hình tối ưu hóa cho tốc độ là vì điều đó dễ thực hiện hơn nhiều so với việc xây dựng một mô hình nền tảng thúc đẩy trí tuệ 1. lấy qwen3 và tinh chỉnh nó qua RL trên dây đai của bạn 2. gắn nó vào phần cứng Cerebras (hoặc GPU tối ưu hóa) 3. để cho mô hình trung bình thông minh, siêu nhanh đó hoạt động đối với các công ty đại lý lập trình, nếu bạn muốn mang lại giá trị cho thị trường, việc xây dựng một mô hình nền tảng mới khó hơn rất nhiều so với việc tinh chỉnh một mô hình mở và tối ưu hóa suy diễn. thực tế, đó là cách hiệu quả để phát hành một cái gì đó gần với biên Pareto và tôi thích rằng các công ty đại lý lập trình đang bắt đầu tham gia. nhưng đừng nhầm lẫn điều này với việc các công ty đại lý lập trình tuyên bố "trung bình thông minh nhưng nhanh > rất thông minh nhưng chậm"