熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
我嘗試了5個不同的數學問題,但它在所有5個問題上都失敗了。其中一個問題甚至在訓練集中,但它仍然失敗了。
它盡力尋找「歸納模式」,但推理得並不好。

8月19日 12:13
我對Gemini Deep Think寄予厚望。今天我給它出了一道奧林匹克風格的數學題,但它表現得很糟糕。
它在過程早期做出了錯誤的假設,並且繼續沿著錯誤的方向前進。
1.88K
熱門
排行
收藏