熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

echo.hive
持續吸引子網絡和邊界向量細胞(鬚鬚)結合三個運動神經元學會導航障礙物並朝向食物
不使用反向傳播。獎勵調節學習與資格跡象
源代碼鏈接在評論中。

echo.hive11 小時前
我建立了一個持續吸引子網絡,包含3個運動神經元,這些神經元學會使用獎勵調節的Hebbian可塑性來引導老鼠朝向食物。
不使用反向傳播和隨機梯度下降。
在這種情況下,最開始時,網絡學會了圍繞食物轉圈 😯
源代碼是開源的,鏈接在評論中。
在這個CAN中有36個神經元可以檢測食物的位置,這個網絡中的每個神經元都連接到每個運動神經元。
最開始時,這些連接是隨機且微弱的,隨著老鼠接近並到達食物,它們變得更強。網絡通過跟蹤哪些神經元一起發火來實現這一點,並加強這些連接。
如果你覺得這有趣,可以看看我的脈衝神經網絡項目。我也會在評論中放一個鏈接。
5.82K
我建立了一個持續吸引子網絡,包含3個運動神經元,這些神經元學會使用獎勵調節的Hebbian可塑性來引導老鼠朝向食物。
不使用反向傳播和隨機梯度下降。
在這種情況下,最開始時,網絡學會了圍繞食物轉圈 😯
源代碼是開源的,鏈接在評論中。
在這個CAN中有36個神經元可以檢測食物的位置,這個網絡中的每個神經元都連接到每個運動神經元。
最開始時,這些連接是隨機且微弱的,隨著老鼠接近並到達食物,它們變得更強。網絡通過跟蹤哪些神經元一起發火來實現這一點,並加強這些連接。
如果你覺得這有趣,可以看看我的脈衝神經網絡項目。我也會在評論中放一個鏈接。

echo.hive16 小時前
從零開始的尖峰神經網絡達到8%的準確率。沒有反向傳播或隨機梯度下降
我創建了一個基因超參數優化器,現在平均可以達到8%的準確率,這大約比隨機機率高出3%
源代碼的鏈接,附有詳細的視頻和註解中的Markdown解釋
它通常從低於5%開始,然後慢慢改善,最終可能會開始低於5%,這一切都讓我相信有學習的跡象。有時它會在7-8-9%之間穩定很長一段時間
沒有反向傳播或隨機梯度下降。它通過STDP(尖峰時序依賴性可塑性)和獎勵機制進行學習
每個例子會被呈現多次(在這個案例中是500次),這會產生尖峰序列,進而導致合格名單,在每一回合結束時,根據答案是否正確,我們使用獎勵作為乘數來調整權重
尖峰時序跟蹤神經元發火的序列,以及哪些神經元更有可能導致正確答案
讓我知道你的想法
37.36K
從零開始的尖峰神經網絡達到8%的準確率。沒有反向傳播或隨機梯度下降
我創建了一個基因超參數優化器,現在平均可以達到8%的準確率,這大約比隨機機率高出3%
源代碼的鏈接,附有詳細的視頻和註解中的Markdown解釋
它通常從低於5%開始,然後慢慢改善,最終可能會開始低於5%,這一切都讓我相信有學習的跡象。有時它會在7-8-9%之間穩定很長一段時間
沒有反向傳播或隨機梯度下降。它通過STDP(尖峰時序依賴性可塑性)和獎勵機制進行學習
每個例子會被呈現多次(在這個案例中是500次),這會產生尖峰序列,進而導致合格名單,在每一回合結束時,根據答案是否正確,我們使用獎勵作為乘數來調整權重
尖峰時序跟蹤神經元發火的序列,以及哪些神經元更有可能導致正確答案
讓我知道你的想法

echo.hive10月24日 14:57
我從零開始建立了一個生物啟發的脈衝神經網絡,它以 5% 的準確率學會了加法 :)
這裡沒有反向傳播,沒有人工損失函數 - 只有脈衝、突觸和類多巴胺的獎勵信號。
它使用 STDP -> "脈衝時序依賴性可塑性",並帶有調節獎勵
這非常有趣,我會嘗試讓它學會更好的準確率。我還需要更好地理解所有運作部分是如何協同工作的
源代碼的鏈接在評論中,裡面有詳細的自述文件和帶有動畫的 HTML,解釋了它是如何運作的
83.58K
熱門
排行
收藏
