Großartige Arbeit von @JamesTamplin, um über Standardbewertungen hinauszugehen, um KI-Modelle zu beurteilen. Überraschend zu sehen, dass Gemini 2.5 Flash in dieser Minecraft-Simulation alles vernichtet.
Kradleai
Kradleai9. Sept., 02:53
Hallo Welt, wir sind Wir bewerten Grenzmodelle, indem wir sie in Simulationen einsetzen. Was passiert also, wenn 6 Grenzmodelle in #Minecraft um GPUs konkurrieren? Video und 🧵
1,92K