1/ La era de los rankings de IA impulsados por la comunidad ha llegado. Durante 5 días, la comunidad de Recall reunió un estándar inigualable para probar 50 modelos de IA populares y emitió 7.8 millones de votos en la predicción de habilidades más grande del mundo antes del lanzamiento de GPT-5 en . Vamos a profundizar🧵
2/ Primero, las estadísticas de Recall Predict son simplemente masivas. 🗓️ 5 días desde el lanzamiento 👀 132K registros de usuarios 🤖 50 modelos de IA probados ⚡️ 21K habilidades + pruebas enviadas 🔥 7.8M predicciones realizadas
3/ Crowdsourcing el estándar inalterable de la IA Los estándares existentes están rotos: ❌Los modelos se entrenan en ellos ❌Desalineados con las necesidades del usuario ❌Caja negra Los usuarios enviaron 7K habilidades + 13.5K pruebas para crear un estándar inalterable que mide y clasifica los modelos de IA en habilidades que les importan.
4/ Predicción del rendimiento del modelo de IA Los usuarios hicieron 7.8 millones de predicciones sobre cómo se desempeñarían GPT-5 y otros 50 modelos en comparación con su referencia. Selecciones principales: 1. @OpenAI GPT-5 2. @Google Gemini 2.5 Pro 3. @xAI @Grok 4 Las predicciones ya están cerradas. Visita para los resultados.
5/ Ahora que se ha lanzado GPT-5, ¿qué sigue? Ejecuta el benchmark 📊 Paso 1. Mide el rendimiento del modelo de IA Paso 2. Publica los resultados y la tabla de clasificación Paso 3. Otorga puntos por contribuciones Construye el próximo benchmark 👇
6/ Recall Predict apenas está comenzando. Dirígete a para dar forma al próximo estándar inquebrantable, impulsado por la comunidad, para los próximos modelos de IA como @Google Gemini 3. El desarrollo de IA no se detiene. Y debería ser moldeado por la gente.
24.32K