博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
反向传播算法推导
阅读量:4568 次
发布时间:2019-06-08

本文共 677 字,大约阅读时间需要 2 分钟。

 

一、MSE 损失函数推导

前向传播过程:

 

梯度反向传播公式推导:

定义残差:

 

残差推导如下:

对于最后一层:

 

广义上,左边项(-(···))是定义的损失函数对其输入(即最后一层神经元值)的导数,右项是sigmoind求导,这两项都是根据实际使用可以替换的。

 

对于隐藏层:

 

 

若去掉下标i,则有

其中\odot的操作是把两个向量对应元素相乘组成新的元素。

 

 参考:

https://www.cnblogs.com/nowgood/p/backprop2.html

https://zhuanlan.zhihu.com/p/25416673

 

 二、交叉熵损失函数推导

只放出最后一层残差:

参考:https://blog.csdn.net/Charel_CHEN/article/details/81266838

 

 三、二元交叉熵损失梯度推导

参考:https://blog.csdn.net/chansonzhang/article/details/84674144

 

四、L2正则化以及反向传播

参考:https://blog.csdn.net/obrightlamp/article/details/85290929

 

五、CNN反向传播算法总结

 

 注释:CNN反向传播主要解决四个问题

一二问对应步骤d-3,三问对应步骤d-2,四问对应步骤2-2-2.

具体推导细节请移步:https://www.cnblogs.com/pinard/p/6494810.html

转载于:https://www.cnblogs.com/CJT-blog/p/10419523.html

你可能感兴趣的文章
解决方案是什么
查看>>
Spring Bean引用例子
查看>>
您访问的URL地址不被允许。
查看>>
docker 初探之简单安装 ----Windows10
查看>>
UI基础篇之UIScrollView
查看>>
vc 网络编程(socket)
查看>>
tex中把参考文献标题删除
查看>>
Linux下NFS服务器的搭建与配置
查看>>
1501 二叉树最大宽度和高度
查看>>
Linux学习总结(七)-磁盘管理 du df fdisk
查看>>
Oracle卸载
查看>>
知识总结
查看>>
xml解析中的sax解析
查看>>
《秋季学期学习总结》
查看>>
PHP手册总结《预定义变量》
查看>>
addEventListener和on的区别
查看>>
hust 1570 Lazy. Lazy. Laaaaaaaaaaaazy!
查看>>
曹政解密中国互联网
查看>>
一个JS的面试题及其解析
查看>>
python小白-day5 time&datetime模块
查看>>