这是趣味统计的第 1 期分享 作者 l 萝卜 正式开始建模与处理数据前,对数据进行探索并有一个初步的认识非常重要,本文将围绕变量探索,展示分类、连续变量,以及两种类型变量结合的探索方法,并展示 Python Pand…
标签:数据处理
pd.DataFrame()快速筛选数据
快速数据筛选 问题场景 实现方法 问题场景 当需要对excel数据根据不同的条件进行筛选,可以利用pandas快速实现。例如筛选出一张表格里来自不同网站的数据,每个网站的数据不超过20条。示例如下: 实现方法 impor…
Excel根据两个表中相同的列将其它列的数据合并在同一个表
表一: 表二: 目标:把表二的日期根据账号合并到表一账号相同的行里面 操作: 使用Excel的=VLOOKUP()函数:=VLOOKUP(A1,Sheet2!A:B,2,FALSE) A1:表一中需要匹配的列名 Shee…
python数据处理之两个一维数组合成2维数组
两个一维数组合成2维数组 1、使用zip函数 zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的对象,这样做的好处是节约了不少的内存。 我们可以使用 list() 转…
将Excel表格中的数字文本格式转化为数字格式
近期做电网数据处理,获得的Excel表格数据是数字文本格式,对数据进行绘图、公式编辑困难,需要将数字文本格式转化为数字格式。 数字文本格式的特点:收据左上角有一个绿…
Python Pandas 选出指定类型的所有列,统计列的各个类型的数量并用于探索性数据分析(附数据与源码)
更多包含丰富源数据源代码的 Pandas 高阶操作,数据可视化,以及商业数据分析实战案例,尽在公众号 “ 数据分析与商业实践 ” 通过本文,你将知晓如何利用 Pandas 选出指定类型的所有列用于后续的探索性数据分析,这…
分享一个用python实现将pdf转txt的代码
问题背景: 有时候需要用到pdf文件中的信息,但是pdf不易编辑,格式有局限性,需要转成txt这样的格式。 目标: 将给定pdf文件中的文本信息(暂时不考虑表格、图片等)抽取出来,写入txt文件中。 主要工具: pyth…
将excel中的多个sheet合并为一个sheet
比较简单,直接看代码。 import pandas as pd # 获取所有的sheet reader = pd.ExcelFile(r'path') sheet_names = reader.sheet_names #…
Excel根据两个表中相同的列将其它列的数据合并在同一个表
表一: 表二: 目标:把表二的日期根据账号合并到表一账号相同的行里面 操作: 使用Excel的=VLOOKUP()函数:=VLOOKUP(A1,Sheet2!A:B,2,FALSE) A1:表一中需要匹配的列名 Shee…
使用Python提取txt文件中的数据到excel中
详情 最近在做服务组合的一些研究,从作者那获取到了QWS数据集,因此需要对数据集进行处理,获取到数据集的数据,保存在excel文件中。QWS数据集包含2000多条数据,每条数据之间的数值采用“,”隔开,因此可以使用spi…
使用Excel自定义单元格,隐藏、替换、增加前后缀等格式设置
今天说的自定义单元格格式,入口很好找,功能也是经常用到的,只不过可能没有深入使用它,入口:右键-设置单元格格式-自定义。这个功能改变单元格内容显示效果,并不会改变本身的内容,可供我们观察、筛选等功能使用。 1…
上海城市坐标系转换的空间校正方法(附控制点文件)
空间校正转坐标系是在无七参数时,简单粗暴的一种转换方法,有效快速但存在一定的误差,误差取决于控制点的个数 空间校正方法(ArcGIS) 1、去除原数据坐标系 2、编辑器 > 开始编辑 3、空间校正 > 设置校…