k近邻算法——笔记

基本分类与回归方法
输入:实例的特征向量(x1,x2,…,xn),对应于特征空间的点
输出:实例的类别,可以取多类

  1. 数据集中的实例类别已定
  2. 分类时,对的实例,根据前k个最近邻的训练实例的类别,通过多数表决等方式进行预测。
  3. k近邻法不具有显示的学习过程
对于第2点,我的理解是:当需要多一个新的实例进行分类时,在训练集中选择前k个与新的实例最近的点,这k个实例中(比如k=10),有5个实例属于A类,3个实例属于B类,2个实例属于C类,则新的实例就被分为A类。

对于第3点,我的理解是:k值确定,距离度量和分类决策规则确定,则训练集的划分就被确定,并没有学习的过程。
点赞