介绍 首先假定一种场景,我相信这种场景你们都会很熟悉。假如你下载了一个相对较大的数据集,很高兴的开始分析它并建立你的机器学习模型。当你急不可耐的尝试加载数据集时,你的计算机突然丢给你了一行“内存不足”错误,这个时候你会想…
分类:数据分析
基本数据统计方法
背景: 12月份有的同学参加了新工联盟一级的测评考试,一级的内容主要是包括一些计算机基础、大数据基本知识、数据操作和处理、数据分析方法和数据可视化方法,今天就简单分享其中一部分内容(持续更新)。 一、中心位置 1.众数:…
元数据是什么?举例告诉你什么是元数据
元数据,一个简单的定义是描述数据的数据。在企业中,无论哪里有数据,都有相应的元数据。只有存在完整而准确的元数据,我们才能更好地理解数据并充分利用数据的价值。为了让大家更好地了解什么是元数据,亿信华辰小编针对元数据的类型,…
京东数据化运营(三)- 复购率
随着电商“人口红利”时代的逝去,用户拉新的成本越来越高,各个商家更加关注复购率的各项数据: 根据财报测算,2018年,京东获…
WPS EXCEL 处理字符串转换为日期格式
【背景】 有项目需要处理从系统导出的数据,要筛选一定时间段数据,但是发现时间字段的格式不对,无法筛选,可以排序 反反复复查了半天,数据格式也设置了多次就是没有效果,偶然发现,当你双击点击任意单元格的时候,就有效果了,直接…
Pandas根据字段(列)查看具体有哪些重复的数据
1.场景描述 近日,在进行数据整理时,需要根据某些列来找出具体重复的数据有哪些,废话不多说,先把图放上先。 import pandas as pd test_df=pd.DataFrame({ 'name':['张三',…
单表数据记录查询
一、学习任务1:简单数据记录查询 在MySQL软件中关于数据的操作,包括插入数据记录操作(CREATE,INSERT)、查询数据记录操作(SELECT),更新数据记录棟作(UPDATE)和删除数据记录操作(DELETE)…
利用pandas提取某个列中不重复项目
假设存在以下数据: user_id age gender occupation zip_code 1 24 M technician 85711 2 53 F other 94043 3 23 M writer 3206…
数据分析之数据预处理、分析建模、可视化
大纲 思维导图 1. 数据分析概述 1.1 简介 1.2 发展历程 1.3 应用领域 1.4 开发流程 2. 数据类型 2.1 结构化与非结构化数据 2.2 定性与定量数据 2.3 截面数据与时间序列数据 3. 数据来源…
Excel2019选择数据后,指定数据作为x轴
1、选择数据后,在制作图表过程中,出现了两条曲线 2、右键点击图表,点击选择数据,可以发现有两个系列而实际上只需要一类数据 3、系列一为第一行数据,系列二为第二行数据,删除系列一,可以发现系列一的数据消失了,而图表的横坐…
数据治理管理平台功能模块与特性
数据治理中的元数据就是数据的数据,讲究从数据的全生命周期:产生/采集、存储、加工和展现等环节进行描述与分析。元数据体现数据的各类关系和属性,可从技术、业务、管理3个维度对元数据进行划分,从而帮助用户对整个系统内数据资…
如何在工作中提高pandas运行速率?【超实用方法整理】
大家早上好,本人姓吴,如果觉得文章写得还行的话也可以叫我吴老师。欢迎大家跟我一起走进数据分析的世界,一起学习! 感兴趣的朋友可以关注我的数据分析专栏,里面有许多优质的文章跟大家分享哦。 大家都知道pandas计算功能非常…