分类:数据挖掘

文本聚类

背景介绍 由于项目需要,需要对旅游游记文本进行聚类,为打标签做指导,所以调研了主流的短文本聚类方法,文本聚类主要还是分成两个方面。 1. 提取文本特征 在《数学之美》前几章中,详细讲了为何要将文本这个自然语言领域的事物,…

Scala

  大数据Scala系列之特质, 特质的定义除了使用关键字trait之外,与类定义无异。   特质用来在类之间进行接口或者属性的共享。类和对象都可以继承特质,特质不能被实例化,因此也没有参数。    一旦特质被定义了,就…