Tôi vừa nghe một phân tích về sự nhảy vọt của Gemini từ 2.0 lên 2.5, và đây là nội dung chính. Nhóm không chỉ dựa vào các bài kiểm tra trong phòng thí nghiệm. Họ đã thu thập phản hồi thực tế từ người dùng trên X, biến những khoảnh khắc "cái này bị hỏng" thành các đánh giá sống động, và tiếp tục bổ sung các trường hợp mới với mỗi lần phát hành. Đây là một vòng lặp QA do cộng đồng điều khiển: những thất bại của chúng tôi trở thành tiêu chuẩn của họ, và những tiêu chuẩn đó trở thành kết quả tốt hơn của chúng tôi. Nếu bạn là một nhà sáng tạo hoặc PM, đây là một mẫu: phản hồi công khai → đánh giá → phát hành → lặp lại. Công việc tuyệt vời @OfficialLoganK @nbrichtova và toàn bộ đội ngũ.
59,95K