反向传播算法推导-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

反向传播算法推导

阅读量：4568 次

发布时间：2019-06-08

本文共 677 字，大约阅读时间需要 2 分钟。

一、MSE 损失函数推导

前向传播过程：

梯度反向传播公式推导：

定义残差：

则

残差推导如下：

对于最后一层：

广义上，左边项（-（···））是定义的损失函数对其输入（即最后一层神经元值）的导数，右项是sigmoind求导，这两项都是根据实际使用可以替换的。

对于隐藏层：

若去掉下标i，则有

其中 $\odot$ 的操作是把两个向量对应元素相乘组成新的元素。

参考：

https://www.cnblogs.com/nowgood/p/backprop2.html

https://zhuanlan.zhihu.com/p/25416673

二、交叉熵损失函数推导

只放出最后一层残差：

参考：https://blog.csdn.net/Charel_CHEN/article/details/81266838

三、二元交叉熵损失梯度推导

参考：https://blog.csdn.net/chansonzhang/article/details/84674144

四、L2正则化以及反向传播

参考：https://blog.csdn.net/obrightlamp/article/details/85290929

五、CNN反向传播算法总结

注释：CNN反向传播主要解决四个问题

一二问对应步骤d-3，三问对应步骤d-2，四问对应步骤2-2-2.

具体推导细节请移步：https://www.cnblogs.com/pinard/p/6494810.html

转载于:https://www.cnblogs.com/CJT-blog/p/10419523.html

你可能感兴趣的文章

解决方案是什么

Spring Bean引用例子

您访问的URL地址不被允许。

docker 初探之简单安装 ----Windows10

UI基础篇之UIScrollView

vc 网络编程（socket）

tex中把参考文献标题删除

Linux下NFS服务器的搭建与配置

1501 二叉树最大宽度和高度

Linux学习总结（七）-磁盘管理 du df fdisk

xml解析中的sax解析

《秋季学期学习总结》

PHP手册总结《预定义变量》

addEventListener和on的区别

hust 1570 Lazy. Lazy. Laaaaaaaaaaaazy!

曹政解密中国互联网

一个JS的面试题及其解析

python小白-day5 time&datetime模块

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-10-18 01:40:58 当前IP: 18.188.199.12 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我