Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/ Éra komunitních žebříčků umělé inteligence je tady.
Během 5 dnů komunita Recall crowdsourcovala nehratelný benchmark pro testování 50 populárních modelů umělé inteligence a odevzdala 7,8 milionu hlasů v největší světové předpovědi dovedností před spuštěním pro GPT-5 na .
Pojďme se ponořit🧵

2/ Za prvé, statistiky Recall Predict jsou prostě obrovské.
🗓️ 5 dní od uvedení na trh
👀 132 tisíc registrací uživatelů
🤖 50 otestovaných modelů umělé inteligence
⚡️ 21K dovedností + odevzdané testy
🔥 7,8 milionu předpovědí
3/ Crowdsourcing AI, nehratelný benchmark
Stávající srovnávací testy jsou nefunkční:
❌Modelky na nich trénují
❌Špatně sladěno s potřebami uživatelů
❌Černá skříňka
Uživatelé odeslali 7K dovednosti + 13,5K testy, aby vytvořili nehratelný benchmark, který měří a řadí modely AI podle dovedností, které jsou pro ně důležité.
4/ Predikce výkonu AI modelu
Uživatelé provedli 7,8 milionu předpovědí o tom, jak si GPT-5 a 50 dalších modelů povede v porovnání s jejich benchmarkem.
Nejlepší výběr:
1. @OpenAI GPT-5
2. @Google Gemini 2.5 Pro
3. @xAI @Grok 4
Předpovědi jsou nyní uzavřeny.
Navštivte pro výsledky.
5/ Nyní, když byl spuštěn GPT-5, co bude dál?
Spuštění srovnávacího testu 📊
Krok 1. Měření výkonu modelu AI
Krok 2. Publikování výsledků a žebříčku
Krok 3. Udělování bodů za příspěvky
Vytvoření dalšího srovnávacího testu 👇
6/ Recall Predict je teprve na začátku.
Zamiřte k vytvoření dalšího nehratelného, komunitou poháněného benchmarku pro nadcházející modely umělé inteligence, jako je @Google Gemini 3.
Vývoj umělé inteligence se nezastaví.
A měla by být utvářena lidmi.

24,31K
Top
Hodnocení
Oblíbené