朴素贝叶斯
先大致过一遍最近看的朴素贝叶斯内容,李航的书先讲什么是先验概率、条件概率和后验概率;朴素贝叶斯的朴素是因为假设了特征条件独立,这样减少了大量的参数计算;而后介绍了如何由贝叶斯公式推出朴素贝叶斯的分类原理,主要在计算参数时候运用了极大似然估计,通过后验概率最大化得到正确的类别;这个后验概率最大化可以证明等价于期望风险最小化。随后介绍了平滑方法,防止条件概率为0的情况出现。
下面列一些博客作为参考,方便遗忘时翻阅。
这三篇博客主要从工程应用方面较为总览的介绍朴素贝叶斯模型,提到了混合模型和一些工程上的tricks,包含了大量的实例,第三篇提到了朴素贝叶斯模型的优缺点和注意点。
这篇就是一个简洁的朴素贝叶斯模型原理小结,也提到了朴素贝叶斯模型的伯努利和高斯形式。
这篇数学推导了一下李航书中的拉普拉斯平滑公式的缘来;同时也证明了在二项分布的情况下为何用频率估计概率是一个极大似然估计。
一个小例子完美解释Naive Bayes(朴素贝叶斯)分类器
非常直白的一个小例子
这篇文章简单实现了一个完整的自然语言分类器,可以参考流程。
与上面一篇类似,更详细的实现了基于朴素贝叶斯的分类器,有代码。
简单介绍了三个模型和sklearn中的调用方法
Python · 朴素贝叶斯(二)· MultinomialNB
完整介绍了朴素贝叶斯的理论和实现
拓展介绍了贝叶斯方法