“stochastic-gradient”的相关标签问题

0 投票

0 回答

16 浏览

python - 覆盖 TF2 优化器类，应用渐变有问题？

我正在尝试实现我自己的优化器（SGD + 动量），它会覆盖原始的 keras SGD + 动量类。我正在尝试传入一些预训练的初始化参数和超参数（速度、动量和学习率），并将它们用作我的 SGD + 动量的超参数。在对 TF2 优化器类进行了一些修改之后，我推断用我自己的速度权重覆盖创建槽，然后将它们乘以动量常数应该可以解决问题，但是，当我尝试 optim.apply_gradients( ）。关于我是否在正确的方向上的任何输入？这是我编辑的课程：

然后使用 iris 数据集初始化和使用来自 TF2 的简单训练循环，会引发一些错误：

抛出此错误：

/usr/local/lib/python3.7/dist-packages/six.py in raise_from(value, from_value)

InvalidArgumentError: var 和 accum 的形状不同[4,10] [10] [Op:ResourceApplyKerasMomentum]

这是我用来初始化权重的玩具问题：

2021-05-31T18:04:42.260

0 投票

0 回答

17 浏览

python - 随机梯度体面算法的值误差

我无法运行我的 SGD 代码，也不知道问题出在哪里。如果你能帮助我，那就太好了。这是我的代码：

我称这个函数为：

但是出现值错误：

ValueError：发现样本数量不一致的输入变量：[1151, 2]

f1尺寸问题ceo在def stochastic_gradient_descent(self). 但我不知道如何解决这个问题。你能给我一些提示吗？

python jupyter-notebook gradient-descent sgd stochastic-gradient

2021-06-27T20:43:33.740

0 投票

1 回答

46 浏览

python - 这个 SGD 损失图有什么问题？

我一直在尝试训练音频分类模型。当我使用 learning_rate=0.01、momentum=0.0 和 nesterov=False 的 SGD 时，我得到以下损失和准确度图：

我无法弄清楚是什么原因导致损失在 750 轮左右立即减少。我尝试了不同的学习率、动量值及其组合、不同的批量大小、初始层权重等以获得更合适的图表，但完全没有运气. 因此，如果您对导致此问题的原因有任何了解，请告诉我。

我用于此培训的代码如下：

python tensorflow keras deep-learning stochastic-gradient

2021-07-29T21:05:43.710

0 投票

1 回答

124 浏览

python - 我怎样才能让我的神经网络正确地进行线性回归？

我使用 Michael Nielsen 的《神经网络和深度学习》一书中的第一个神经网络代码，用于识别手写数字。它使用带有小批量和 sigmoid 激活函数的随机梯度下降。我给了它一个输入神经元、两个隐藏神经元和一个输出神经元。然后我给它一堆数据，它代表一条直线，所以基本上是零到 1 之间的许多点，其中输入与输出相同。无论我如何调整学习率和使用的 epoch 数，网络永远无法进行线性回归。这是因为我使用的是 sigmoid 激活函数吗？如果是这样，我还可以使用什么其他功能？

基于新输入的网络预测