1/ Die Ära der von der Community betriebenen KI-Rankings ist da. Über 5 Tage hat die Recall-Community einen unspielbaren Benchmark crowdsourced, um 50 beliebte KI-Modelle zu testen und 7,8 Millionen Stimmen bei der weltweit größten Vorab-Fähigkeitsvorhersage für GPT-5 abzugeben. Lass uns eintauchen🧵
2/ Zuerst sind die Recall Predict Statistiken einfach riesig. 🗓️ 5 Tage seit dem Start 👀 132K Benutzeranmeldungen 🤖 50 getestete KI-Modelle ⚡️ 21K Fähigkeiten + Tests eingereicht 🔥 7,8M Vorhersagen gemacht
3/ Crowdsourcing AIs unspielbaren Benchmark Bestehende Benchmarks sind kaputt: ❌Modelle trainieren darauf ❌Nicht auf die Bedürfnisse der Nutzer abgestimmt ❌Black-Box Nutzer haben 7K Fähigkeiten + 13,5K Tests eingereicht, um einen unspielbaren Benchmark zu erstellen, der KI-Modelle anhand von Fähigkeiten misst und bewertet, die für sie wichtig sind.
4/ Vorhersage der Leistung von KI-Modellen Die Nutzer haben 7,8 Millionen Vorhersagen darüber getroffen, wie GPT-5 und 50 andere Modelle im Vergleich zu ihrem Benchmark abschneiden würden. Top-Auswahlen: 1. @OpenAI GPT-5 2. @Google Gemini 2.5 Pro 3. @xAI @Grok 4 Die Vorhersagen sind jetzt geschlossen. Besuchen Sie für die Ergebnisse.
5/ Jetzt, da GPT-5 gestartet ist, was kommt als Nächstes? Führe den Benchmark durch 📊 Schritt 1. Messen der Leistung des KI-Modells Schritt 2. Ergebnisse und Rangliste veröffentlichen Schritt 3. Punkte für Beiträge vergeben Baue den nächsten Benchmark 👇
6/ Recall Predict steht erst am Anfang. Gehe zu , um den nächsten unspielbaren, gemeinschaftlich betriebenen Maßstab für kommende KI-Modelle wie @Google Gemini 3 zu gestalten. Die Entwicklung von KI stoppt nicht. Und sie sollte von den Menschen gestaltet werden.
26,81K