Công việc tuyệt vời của @JamesTamplin để vượt ra ngoài các đánh giá tiêu chuẩn nhằm đánh giá các mô hình AI. Thật bất ngờ khi thấy Gemini 2.5 Flash vượt trội trong mô phỏng minecraft này.
Kradleai
Kradleai02:53 9 thg 9
Xin chào thế giới, chúng tôi đang Chúng tôi đánh giá các mô hình biên bằng cách đưa chúng vào các mô phỏng. Vậy điều gì xảy ra khi 6 mô hình biên cạnh tranh trong #Minecraft để giành GPU? Video và 🧵
1,93K