1/ 社群驅動的 AI 排名時代來臨了。 在 5 天內,Recall 社群集思廣益,創造了一個無法被遊戲化的基準,測試了 50 個熱門的 AI 模型,並在全球最大的 GPT-5 預發布技能預測中投出了 780 萬票。 讓我們深入探討🧵
2/ 首先,Recall Predict 的統計數據非常驚人。 🗓️ 上線已經 5 天 👀 132K 用戶註冊 🤖 測試了 50 個 AI 模型 ⚡️ 提交了 21K 技能 + 測試 🔥 做出了 7.8M 預測
3/ 群眾外包 AI 的無法作弊基準 現有的基準已經失效: ❌ 模型在其上訓練 ❌ 與用戶需求不對齊 ❌ 黑箱 用戶提交了 7K 技能 + 13.5K 測試,以創建一個無法作弊的基準,該基準衡量並排名對他們重要的技能的 AI 模型。
4/ 預測 AI 模型表現 用戶對 GPT-5 和其他 50 個模型在其基準測試中的表現做出了 780 萬次預測。 熱門選擇: 1. @OpenAI GPT-5 2. @Google Gemini 2.5 Pro 3. @xAI @Grok 4 預測現已結束。 請訪問以查看結果。
5/ 現在 GPT-5 已經推出,接下來是什麼? 進行基準測試 📊 第 1 步:測量 AI 模型性能 第 2 步:發布結果和排行榜 第 3 步:對貢獻進行評分 建立下一個基準 👇
6/ Recall Predict 只是剛開始。 前往以塑造下一個無法遊戲化的、由社群驅動的基準,針對即將推出的 AI 模型,如 @Google Gemini 3。 AI 的發展不會停止。 而且應該由人民來塑造。
24.32K