梯度更新的流程
梯度更新是通过计算损失函数,而传统机器学习损失函数更新方式是通过数学推导和通过维度验证来做出来的。
传统的梯度更新是首先利用机器学习的模型去计算,然后计算损失函数,然后损失函数对参数求导,然后利用随机梯度下降更新。
所谓的随机梯度下降的随机代表,不是拿所有数据每次更新,而是按照batch去取。
python语法的知识
1.对于对应的一行求和
np.sum(*,axis=1,keepdims=True)
我第一次写的时候不记得python的true怎么写了,也丢了s
2.矩阵乘法使用@
3.最后梯度更新的时候lr是一个常数
4.for的用法是for i in range(0,nums,batch)