0

训练期间 Nvidia Digits UI 中的基本学习率与 caffe .prototxt 文件中定义的每一层的学习率参数(lr_pm)之间有什么区别。最后使用哪个学习率?

4

1 回答 1

0

特定层的学习率是全局学习率乘以该特定层的lr_mult

于 2018-03-26T09:13:50.910 回答