algorithm - 朴素贝叶斯垃圾邮件过滤问题

Question

我计划使用朴素贝叶斯分类模型来实现垃圾邮件过滤器。

在网上我看到很多关于朴素贝叶斯分类的信息，但问题是它有很多数学内容，而不是清楚地说明它是如何完成的。问题是我更像是一个程序员而不是数学家（是的，我在学校学过概率和贝叶斯定理，但很长一段时间都没有接触过，而且我现在没有学习它的奢侈（几乎3 周的时间来制作一个工作原型））。

因此，如果有人可以解释或指出我为程序员而不是数学家解释的位置，那将是一个很大的帮助。

PS：顺便说一句，如果你想知道的话，我必须用 C 来实现它。:(

问候，微内核

score 5 · Accepted Answer

Programming Collective Intelligence一书的章节涵盖了这种方法和其他方法。本章（#6）无需参考前面的章节即可理解，写得很清楚，并且只讨论了完成工作所必需的最小数学。

score 2 · Accepted Answer

2

我强烈推荐Andrew Moore 的教程，我认为你应该从这个开始。

于 2010-04-23T15:10:14.963 回答

score 2 · Accepted Answer

2

你可以试试这个网站。它有一些源代码。

于 2010-04-11T17:52:18.757 回答

score 1 · Accepted Answer

1

你看过dspam吗？

于 2010-07-23T19:51:58.203 回答

score 1 · Accepted Answer

1

您还可以查看POPFile，一个开源垃圾邮件过滤引擎。

于 2010-04-11T19:42:02.187 回答

5 回答 5