我计划使用朴素贝叶斯分类模型来实现垃圾邮件过滤器。
在网上我看到很多关于朴素贝叶斯分类的信息,但问题是它有很多数学内容,而不是清楚地说明它是如何完成的。问题是我更像是一个程序员而不是数学家(是的,我在学校学过概率和贝叶斯定理,但很长一段时间都没有接触过,而且我现在没有学习它的奢侈(几乎3 周的时间来制作一个工作原型))。
因此,如果有人可以解释或指出我为程序员而不是数学家解释的位置,那将是一个很大的帮助。
PS:顺便说一句,如果你想知道的话,我必须用 C 来实现它。:(
问候,微内核
我计划使用朴素贝叶斯分类模型来实现垃圾邮件过滤器。
在网上我看到很多关于朴素贝叶斯分类的信息,但问题是它有很多数学内容,而不是清楚地说明它是如何完成的。问题是我更像是一个程序员而不是数学家(是的,我在学校学过概率和贝叶斯定理,但很长一段时间都没有接触过,而且我现在没有学习它的奢侈(几乎3 周的时间来制作一个工作原型))。
因此,如果有人可以解释或指出我为程序员而不是数学家解释的位置,那将是一个很大的帮助。
PS:顺便说一句,如果你想知道的话,我必须用 C 来实现它。:(
问候,微内核
Programming Collective Intelligence一书的章节涵盖了这种方法和其他方法。本章(#6)无需参考前面的章节即可理解,写得很清楚,并且只讨论了完成工作所必需的最小数学。
我强烈推荐Andrew Moore 的教程,我认为你应该从这个开始。
你可以试试这个网站。它有一些源代码。
您还可以查看POPFile,一个开源垃圾邮件过滤引擎。