出处:http://www.cnblogs.com/hhyypp/archive/2011/12/05/2276984.html 0.前言 最近不断遇到类似的几何位置问题,一直没有花时间去总结,本文总结了我常用点跟多边形…
分类:算法
聚类算法(基础及核心概念)
聚类分析简介 将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。在许多应用中,一个簇中的数据对象可以被…
聚类算法--K-Medoids(基于R的应用示例)
K-Medoids算法描述 一个有极大值的对象可能相当程度上扭曲数据的分布,所以k-means算法对于孤立点是敏感的。 不采用簇中对象的平均值作为参照点,可以选用簇中位置中心的对象,即medo…
EM算法(基础及核心概念)
Jensen不等式 其实在运筹学以及基础的优化理论中,便有涉及。设f是定义域为实数的函数,如果对于所有的实数x,,那么f是凸函数。拓展到多元的情形,x是向量时,如果其对应的Hessian矩阵H是半正定的(),那么f是凸函…
聚类算法--K-Means(基于R的应用示例)
K-Means算法描述 前文http://blog.csdn.net/buracag_mc/article/details/74025510已经定义好了对象之间距离的测度。在确定了距离定义下,K-Means聚类算法要求事…
聚类算法--K值估计及效果评估
上周实习工作中用到了聚类分析的相关内容,故又对聚类分析算法重温一遍,中间发现我前面所写博客有两个比较关键的步骤是缺失的: 利用肘部法则估计参数数目 利用轮廓系数评估聚类算法的优劣 Python有现成的轮子,只需更改传入的…
Apriori算法(基于R的应用示例)
这里我们采用上文的数据集,利用R来做一个简单的应用示例: TID 项集 T1 I1, I2, I5 T2 I2, I4 T3 I2, I3 T4 I1, I2, I4 T5 I1, I3 T6 I2, I3 …
近邻分析 -- KNN
数据预测是基于对历史数据的分析,通过学习器归纳和提炼其中包含的规律,并将这种规律体现在预测模型中。参与建模的变量主要分为两种: 输入变量(解释变量、特征变量,一般记为x,可以有多个) 输出变量(被解释变量,记为y,通常只…
LR算法(基础及核心概念)
前言 首先需要清楚的是,LR(Logistic Regression)虽然是回归模型,但却是经典的分类方法。 为什么分类不用SVM呢?我们对比一下SVM,在二分类问题中,如果你问SVM,它只会回答你该样本是正类还是负类;…
【Python】聚类算法应用 -- 广告投放效果的离线评估
简要说明 同样是在实习期间做的,由于公司去年在广告的投放上高达10亿!!(黑脸=_=!),其中SEM的投放占比不小,投了四个:baidu、360、搜狗和神马,其中前三个是WAP和PC端都有投,神马只投了WAP端。所以我想…
SVM推导过程注解(一)
前言 支持向量机(Support Vector Machine)的原理其实比较简单,它是基于结构风险最小化理论之上在特征空间中建构最优分割超平面。在二维中就是线,在三维中就是面,但我们统称为超平面。 就我所看到的相关书本…
《算法导论》第二章第一节练习题——同位二进制数相加
需求: 用两个同长度为n的int数组描述两个同位二进制数。 用一个长度为n+1的数组表示这两个数组以二进制相加 #include<stdio.h> #define N 8 int main(void) { i…