1/ È arrivata l'era delle classifiche AI alimentate dalla comunità. In 5 giorni, la comunità di Recall ha raccolto un benchmark non giocabile per testare 50 modelli AI popolari e ha espresso 7,8 milioni di voti nella più grande previsione di abilità pre-lancio per GPT-5 nel mondo. Approfondiamo🧵
2/ Prima di tutto, le statistiche di Recall Predict sono semplicemente enormi. 🗓️ 5 giorni dal lancio 👀 132K iscrizioni di utenti 🤖 50 modelli AI testati ⚡️ 21K abilità + test inviati 🔥 7.8M previsioni effettuate
3/ Crowdsourcing il benchmark ingannabile dell'IA I benchmark esistenti sono rotti: ❌I modelli si allenano su di essi ❌Non allineati alle esigenze degli utenti ❌Scatola nera Gli utenti hanno inviato 7K competenze + 13.5K test per creare un benchmark ingannabile che misura e classifica i modelli di IA sulle competenze che sono importanti per loro.
4/ Previsione delle prestazioni del modello AI Gli utenti hanno effettuato 7,8 milioni di previsioni su come si sarebbero comportati GPT-5 e altri 50 modelli rispetto al loro benchmark. Scelte principali: 1. @OpenAI GPT-5 2. @Google Gemini 2.5 Pro 3. @xAI @Grok 4 Le previsioni sono ora chiuse. Visita per i risultati.
5/ Ora che GPT-5 è stato lanciato, cosa c'è dopo? Esegui il benchmark 📊 Passo 1. Misura le prestazioni del modello AI Passo 2. Pubblica i risultati e la classifica Passo 3. Assegna punti per i contributi Costruisci il prossimo benchmark 👇
6/ Recall Predict è solo all'inizio. Vai a per plasmare il prossimo benchmark ineguagliabile, alimentato dalla comunità, per i futuri modelli di AI come @Google Gemini 3. Lo sviluppo dell'AI non si ferma. E dovrebbe essere plasmato dalla gente.
26,81K