1/ L'ère des classements d'IA alimentés par la communauté est arrivée. En 5 jours, la communauté Recall a collecté des données pour établir un benchmark inégalable afin de tester 50 modèles d'IA populaires et a émis 7,8 millions de votes dans la plus grande prédiction de compétence avant le lancement pour GPT-5. Plongeons-y🧵
2/ Tout d'abord, les statistiques de Recall Predict sont tout simplement énormes. 🗓️ 5 jours depuis le lancement 👀 132K inscriptions d'utilisateurs 🤖 50 modèles d'IA testés ⚡️ 21K compétences + tests soumis 🔥 7,8M de prédictions effectuées
3/ Le benchmark inébranlable de l'IA par crowdsourcing Les benchmarks existants sont défaillants : ❌ Les modèles s'entraînent dessus ❌ Mal alignés sur les besoins des utilisateurs ❌ Boîte noire Les utilisateurs ont soumis 7K compétences + 13,5K tests pour créer un benchmark inébranlable qui mesure et classe les modèles d'IA sur les compétences qui leur importent.
4/ Prédiction des performances des modèles d'IA Les utilisateurs ont fait 7,8 millions de prédictions sur la façon dont GPT-5 et 50 autres modèles se comporteraient par rapport à leur référence. Choix principaux : 1. @OpenAI GPT-5 2. @Google Gemini 2.5 Pro 3. @xAI @Grok 4 Les prédictions sont maintenant closes. Visitez pour les résultats.
5/ Maintenant que GPT-5 a été lancé, quelle est la suite ? Exécutez le benchmark 📊 Étape 1. Mesurer la performance du modèle d'IA Étape 2. Publier les résultats et le classement Étape 3. Attribuer des points pour les contributions Construisez le prochain benchmark 👇
6/ Recall Predict ne fait que commencer. Rendez-vous sur pour façonner le prochain benchmark inégalable, propulsé par la communauté, pour les futurs modèles d'IA comme @Google Gemini 3. Le développement de l'IA ne s'arrête pas. Et il devrait être façonné par les gens.
24,32K