数据挖掘复习笔记---04.3分类问题之 Naive Bayes

分类问题之 Naive Bayes

简介

  • 条件概率

    P(A|B)*P(B) = P(A, B) = P(B|A)*P(A)

  • 全概率公式

    《数据挖掘复习笔记---04.3分类问题之 Naive Bayes》

  • 分类步骤

    朴素贝叶斯假设特征之间相互独立
    1.计算 P(A|C0) = P(A1, A2, A3|C0) = P(A1|C0) * P(A2|C0) * P(A3|C0)
    2.计算 P(A|C1) = P(A1, A2, A3|C1) = P(A1|C1) * P(A2|C1) * P(A3|C1)
    3.计算 P(A, C0) = P(A|C0) * P(C0)
    4.计算 P(A, C1) = P(A|C1) * P(C1)
    5.不需要计算分母的 P(A)
    6.如果 P(A, C0) > P(A, C1), 那么可以得出 P(C0|A) > P(C1|A), 即样例属于 C0 类

    《数据挖掘复习笔记---04.3分类问题之 Naive Bayes》

优缺点

  • 抗噪,对孤立噪点噪声鲁棒
  • 对不相关的属性有较强的鲁棒性
  • 如果某条记录存在缺失值, 之间忽略即可
  • 朴素贝叶斯假设特征之间相互独立,但实际情况并不一定如此
    原文作者:FrozenMap
    原文地址: https://segmentfault.com/a/1190000018990571
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞