2018 年的文章, Using deep neural networks to hunt malicious TLS certificates from:https://techxplore.com…
标签:机器学习
机器学习之支持向量机(三):核函数和KKT条件的理解,支持向量机(三)核函数,机器学习---核函数
注:关于支持向量机系列文章是借鉴大神的神作,加以自己的理解写成的;若对原作者有损请告知,我会及时处理。转载请标明来源。 序: 我在支持向量机系列中主要讲支持向量机的公式推导,第一部分讲到推出拉格朗日对偶函数的对偶因子α;…
机器学习算法总结
前言: 最近一段时间一直在忙秋招,在参加秋招的过程中顺便总结了一下机器学习中常用的一些算法。 1.降维(SVD,PCA) 降维是机器学习中很重要的一种思想。在机器学习中会遇到一些高维的数据集,而在高维数据集的其情形下会出…
机器学习笔记(六)机器学习算法的选择与优化
1、当预测结果与实际偏差很大时的处理方法: (1)增加训练样本; (2)减少特征集防止过拟合; (3)增加特征集或者多项式特征(如 x1², x2³ 等); (4)减小 / 增大 lambda . 2、评估…
机器学习的应用实例
摘自范明等译的(原著Ethem Alpaydin)《机器学习导论》第一章,参杂部分个人见解,不对之处欢迎指点 学习机器学习,应首先知道它在实际生活中的应用具体有哪些,这样有利于进一步的原理学习。 1 学习关联性 购物篮分…
Python机器学习:6.4 通过网格搜索调参
机器学习算法中有两类参数:从训练集中学习到的参数,比如逻辑斯蒂回归中的权重参数,另一类是模型的超参数,也就是需要人工设定的参数,比如正则项系数或者决策树的深度。 前一节,我们使用验证曲线来提高模型的性能,实际上就是找最优…
Spark 机器学习
将Mahout on Spark 中的机器学习算法和MLlib中支持的算法统计如下: 主要针对MLlib进行总结 分类与回归 分类和回归是监督式学习; 监督式学习是指使用有标签的数据(LabeledPoin…
【原】Spark之机器学习(Python版)(二)——分类
写这个系列是因为最近公司在搞技术分享,学习Spark,我的任务是讲PySpark的应用,因为我主要用Python,结合Spark,就讲PySpark了。然而我在学习的过程中发现,PySpark很鸡肋(至少现在我觉得我…
机器学习算法总结(四)——GBDT与XGBOOST
Boosting方法实际上是采用加法模型与前向分布算法。在上一篇提到的Adaboost算法也可以用加法模型和前向分布算法来表示。以决策树为基学习器的提升方法称为提升树(Boosting Tree)。对分类问题决策树是…
C++(七)— 进程、线程及区别
1、进程(process) 狭义定义:进程就是一段程序的执行过程。 广义定义:进程是一个具有一定独立功能的程序关于某个数据集合的一次运行活动。它是操作系统动态执行的基本单元,在传统的操作系统中,进程既是基本的分配…
机器学习之类别不平衡问题 (1) —— 各种评估指标
机器学习之类别不平衡问题 (1) —— 各种评估指标 机器学习之类别不平衡问题 (2) —— ROC和PR曲线 机器学习之类别不平衡问题 (3) —— 采样方法 完整代码 在二分类问题中,通常假设正负类别相对均衡,然而实…
机器学习基础及案例
下面是部分机器学习的案例,合适入门的朋友学习,有numpy、pandas、matplotlib、scipy、skearn、TensorFlow等库的基本案例教程。