我从零开始构建了一个生物启发的脉冲神经网络,它以5%的准确率学习了加法 :) 没有反向传播,没有人工损失函数——只有脉冲、突触和类似多巴胺的奖励信号。 它使用STDP -> "脉冲时序依赖性可塑性",并带有调制奖励。 这非常有趣,我会尝试让它以更好的准确率学习。我还需要更好地理解所有运动部件是如何结合在一起的。 源代码链接在评论中,其中有详细的自述文件和带有动画的HTML,解释了它是如何工作的。