Ottimo lavoro di @JamesTamplin per andare oltre le valutazioni standard per giudicare i modelli di AI. Sorprendente vedere Gemini 2.5 Flash obliterare in questa simulazione di minecraft.
Kradleai
Kradleai9 set, 02:53
Ciao Mondo, siamo Valutiamo i modelli frontier mettendoli in simulazioni. Cosa succede quando 6 modelli frontier competono in #Minecraft per le GPU? Video e 🧵
1,92K