借了两本书,公式推到极其敷衍,根本看不懂,折腾了几天,最后上网找了几篇文章,终于有一篇详细的看懂了,因此要多查资料,尤其是遇到瓶颈时。
BP神经网络,原理主要是用E来推出δk,用所有带权δk推出δi。仍然没有想明白的问题:1、全局误差,2、改变了wij,那么隐藏层既然是中间变量,应该wjk会自动改变吧?
普通BP神经网络容易陷入局部最优的曲面,这个时候加入一个动量因子有助于其反馈的误差信号使神经元的权值重新振荡起来。
要调整参数,避免无用的训练。
借了两本书,公式推到极其敷衍,根本看不懂,折腾了几天,最后上网找了几篇文章,终于有一篇详细的看懂了,因此要多查资料,尤其是遇到瓶颈时。
BP神经网络,原理主要是用E来推出δk,用所有带权δk推出δi。仍然没有想明白的问题:1、全局误差,2、改变了wij,那么隐藏层既然是中间变量,应该wjk会自动改变吧?
普通BP神经网络容易陷入局部最优的曲面,这个时候加入一个动量因子有助于其反馈的误差信号使神经元的权值重新振荡起来。
要调整参数,避免无用的训练。