Велика робота @JamesTamplin, щоб вийти за рамки стандартних евалів для оцінки моделей штучного інтелекту. Дивно бачити, що Gemini 2.5 Flash знищується в цій симуляції minecraft.
Kradleai
Kradleai9 вер., 02:53
Привіт, світе, ми Ми використовуємо фронтирні моделі, розміщуючи їх у симуляціях. Отже, що відбувається, коли 6 Frontier моделей змагаються в #Minecraft за графічні процесори? Відео та 🧵
1,92K