1/ Éra komunitních žebříčků umělé inteligence je tady. Během 5 dnů komunita Recall crowdsourcovala nehratelný benchmark pro testování 50 populárních modelů umělé inteligence a odevzdala 7,8 milionu hlasů v největší světové předpovědi dovedností před spuštěním pro GPT-5 na . Pojďme se ponořit🧵
2/ Za prvé, statistiky Recall Predict jsou prostě obrovské. 🗓️ 5 dní od uvedení na trh 👀 132 tisíc registrací uživatelů 🤖 50 otestovaných modelů umělé inteligence ⚡️ 21K dovedností + odevzdané testy 🔥 7,8 milionu předpovědí
3/ Crowdsourcing AI, nehratelný benchmark Stávající srovnávací testy jsou nefunkční: ❌Modelky na nich trénují ❌Špatně sladěno s potřebami uživatelů ❌Černá skříňka Uživatelé odeslali 7K dovednosti + 13,5K testy, aby vytvořili nehratelný benchmark, který měří a řadí modely AI podle dovedností, které jsou pro ně důležité.
4/ Predikce výkonu AI modelu Uživatelé provedli 7,8 milionu předpovědí o tom, jak si GPT-5 a 50 dalších modelů povede v porovnání s jejich benchmarkem. Nejlepší výběr: 1. @OpenAI GPT-5 2. @Google Gemini 2.5 Pro 3. @xAI @Grok 4 Předpovědi jsou nyní uzavřeny. Navštivte pro výsledky.
5/ Nyní, když byl spuštěn GPT-5, co bude dál? Spuštění srovnávacího testu 📊 Krok 1. Měření výkonu modelu AI Krok 2. Publikování výsledků a žebříčku Krok 3. Udělování bodů za příspěvky Vytvoření dalšího srovnávacího testu 👇
6/ Recall Predict je teprve na začátku. Zamiřte k vytvoření dalšího nehratelného, komunitou poháněného benchmarku pro nadcházející modely umělé inteligence, jako je @Google Gemini 3. Vývoj umělé inteligence se nezastaví. A měla by být utvářena lidmi.
24,31K