在日常的数据分析工作中,经常会遇到的一个问题就是:重复数据。重复数据在进行数据分析或数据挖掘的过程中,对其输出结果有重要的影响。
比如在逻辑回归分析中,重复数据会影响模型的拟合优度;数据分析中,重复数据会影响预测内容准确性。有些相关分析中还会有共线性的问题,因此重复数据需要进行一定的处理,以达到消除异常,纠正错误和弥补丢失的目的。
在日常的数据分析工作中,经常会遇到的一个问题就是:重复数据。重复数据在进行数据分析或数据挖掘的过程中,对其输出结果有重要的影响。
比如在逻辑回归分析中,重复数据会影响模型的拟合优度;数据分析中,重复数据会影响预测内容准确性。有些相关分析中还会有共线性的问题,因此重复数据需要进行一定的处理,以达到消除异常,纠正错误和弥补丢失的目的。