熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
1/ 社群驅動的 AI 排名時代來臨了。
在 5 天內,Recall 社群集思廣益,創造了一個無法被遊戲化的基準,測試了 50 個熱門的 AI 模型,並在全球最大的 GPT-5 預發布技能預測中投出了 780 萬票。
讓我們深入探討🧵

2/ 首先,Recall Predict 的統計數據非常驚人。
🗓️ 上線已經 5 天
👀 132K 用戶註冊
🤖 測試了 50 個 AI 模型
⚡️ 提交了 21K 技能 + 測試
🔥 做出了 7.8M 預測
3/ 群眾外包 AI 的無法作弊基準
現有的基準已經失效:
❌ 模型在其上訓練
❌ 與用戶需求不對齊
❌ 黑箱
用戶提交了 7K 技能 + 13.5K 測試,以創建一個無法作弊的基準,該基準衡量並排名對他們重要的技能的 AI 模型。
4/ 預測 AI 模型表現
用戶對 GPT-5 和其他 50 個模型在其基準測試中的表現做出了 780 萬次預測。
熱門選擇:
1. @OpenAI GPT-5
2. @Google Gemini 2.5 Pro
3. @xAI @Grok 4
預測現已結束。
請訪問以查看結果。
5/ 現在 GPT-5 已經推出,接下來是什麼?
進行基準測試 📊
第 1 步:測量 AI 模型性能
第 2 步:發布結果和排行榜
第 3 步:對貢獻進行評分
建立下一個基準 👇
6/ Recall Predict 只是剛開始。
前往以塑造下一個無法遊戲化的、由社群驅動的基準,針對即將推出的 AI 模型,如 @Google Gemini 3。
AI 的發展不會停止。
而且應該由人民來塑造。

24.32K
熱門
排行
收藏