如何提高机器学习模型准确率？

2020年12月25日 113次阅读来源: 我叫沐叔

在公司日常的开发机器学习模型工作流程中，我经常发现大家在拿到数据后就迫不及待要开始调用接口，用TensorFlow或pyTorch写代码，洋洋洒洒写了几百行代码执行后才发现正确率还没达到预期一半的目标。

这种事情真的非常常见，研发工程师就经常会有这种问题，觉得自己模型实现只要写好代码逻辑就行，管什么数据逻辑，怼上去就完事。
《如何提高机器学习模型准确率？》

往往有时候居然还怼对了，这无疑给他们自信，有时我还真说不过他们，反正下次继续这样搞还快准狠。然而却对数据本身的挖掘和分析基本没有，所以模型的开发大多后面形成了一种玄学。（虽然也有部分玄学在里面，但大多数还是有逻辑可以参照的）
《如何提高机器学习模型准确率？》

如果我们想提高模型的准确率，一般有以下几种方法：

一、加大模型规模

这种做法在弱模型通过集成学习后成为强模型的效果非常明显。例如决策树和随机森林，通过准确率低的分类器集成在一起进行加权投票得到更精确的结果，犹如三个臭皮匠赛过诸葛亮。神经网络模型也是这种体现，因为深度学习近乎是个可以拟合任何数据集的函数，如果神经元的数量加大，那么它能更好地拟合数据集，当然如果存在方差变大的情况，那么通过正则化可以抵消方差的增加。