4

我看过很多网站和博客解释 ANN(人工神经网络),但没有一个考虑到为不太了解 ANN 的人逐步开发基础的过程,而是投入了大量的数学,这不幸的是,对我来说看起来非常难以捉摸。是否有任何网站/博客可以教授一个简单的 ANN 程序来识别计算机生成的数字或比数字更简单的东西?

4

1 回答 1

7

这是我在ANN(又名MLP )上最好的介绍性(但完整)资源的注释列表。

课程笔记本,威拉米特大学该资源总共大约 25-30 页(使用本页右上角的侧边栏或单击给定页面底部的下一个上一个在各个部分之间导航)。我高度评价这个资源有两个原因(i)它包含大量图表并将它们与散文很好地结合在一起;(ii) 它是全面的——网络架构、作为反向传播基础的演算、选择/迭代训练参数(动量、学习率)等。关于反向传播的部分(ANN/MLP 的计算和编程关键)特别好——结合散文、网络图和实际方程,它细致地解释了包含训练阶段的单个 epoch 中的每个步骤。

IBM 开发人员关于神经网络的工作课程这门课程由 David Mertz 编写,包含工作代码 (python) 和一个重要的数据集。除前几段外,整个文档紧跟代码和数据。对我来说,这是至关重要的,因为除非我能编写代码,否则我认为我没有学会它(这是个人门槛,可能对其他人不起作用)。除此之外,关注代码以及该代码与提供的数据集的交互使讨论具有实际基础。最后,作者 David Mertz 和 Andrew Blais 显然对主题有着很强的掌控力。

第 5 代这是三者中最基本的,所以也许是第一个开始的。作者显然了解多层感知器的细节,但并不要求读者具备这种知识——即,他将反向传播解释为问题的常识性解决方案,而没有遵循数值求解技术(这在 MLP 的许多参考资料中很常见——“反向传播是通过梯度下降解决的”)。就像我提到的第一个资源一样,这个资源在很大程度上依赖于图表。作者不是使用数据(0 和 1),而是在简单的预测分析场景中讨论 MLP 的结构和功能,使用散文而不是将问题简化为数字数据。

于 2011-08-25T18:08:17.533 回答