由于许多潜在的Pandas用户对SQL有一定的了解,因此本文章旨在提供一些如何使用Pandas执行各种SQL操作的示例。 import pandas as pd url = 'tips.csv' tips=pd.read…
分类:Pandas教程
Pandas索引和选择数据
在本章中,我们将讨论如何切割和丢弃日期,并获取Pandas中大对象的子集。 Python和NumPy索引运算符"[]"和属性运算符"."。 可以在广泛的用例中快速轻松地访问Pandas数据结构。然而,由于要访问的数据类型…
Pandas统计函数
统计方法有助于理解和分析数据的行为。现在我们将学习一些统计函数,可以将这些函数应用到Pandas的对象上。 pct_change()函数 系列,DatFrames和Panel都有pct_change()函数。此函数将每个…
Pandas字符串和文本数据
在本章中,我们将使用基本系列/索引来讨论字符串操作。在随后的章节中,将学习如何将这些字符串函数应用于数据帧(DataFrame)。 Pandas提供了一组字符串函数,可以方便地对字符串数据进行操作。 最重要的是,这些函数…
Pandas时间差(Timedelta)
时间差(Timedelta)是时间上的差异,以不同的单位来表示。例如:日,小时,分钟,秒。它们可以是正值,也可以是负值。可以使用各种参数创建Timedelta对象,如下所示 – 字符串 通过传递字符串,可以创…
Pandas日期功能
日期功能扩展了时间序列,在财务数据分析中起主要作用。在处理日期数据的同时,我们经常会遇到以下情况 – 生成日期序列 将日期序列转换为不同的频率 创建一个日期范围 通过指定周期和频率,使用date.range(…
Pandas面板(Panel)
面板(Panel)是3D容器的数据。面板数据一词来源于计量经济学,部分源于名称:Pandas – pan(el)-da(ta)-s。 3轴(axis)这个名称旨在给出描述涉及面板数据的操作的一些语义。它们是 …
Pandas描述性统计
有很多方法用来集体计算DataFrame的描述性统计信息和其他相关操作。 其中大多数是sum(),mean()等聚合函数,但其中一些,如sumsum(),产生一个相同大小的对象。 一般来说,这些方法采用轴参数,就像nda…
Pandas稀疏数据
当任何匹配特定值的数据(NaN/缺失值,尽管可以选择任何值)被省略时,稀疏对象被“压缩”。 一个特殊的SparseIndex对象跟踪数据被“稀疏”的地方。 这将在一个例子中更有意义。 所有的标准Pandas数据结构都应用…
Pandas函数应用
要将自定义或其他库的函数应用于Pandas对象,有三个重要的方法,下面来讨论如何使用这些方法。使用适当的方法取决于函数是否期望在整个DataFrame,行或列或元素上进行操作。 表合理函数应用:pipe() 行或列函数应…
Pandas IO工具
Pandas I/O API是一套像pd.read_csv()一样返回Pandas对象的顶级读取器函数。 读取文本文件(或平面文件)的两个主要功能是read_csv()和read_table()。它们都使用相同的解析代码…
Pandas排序
Pandas有两种排序方式,它们分别是 – 按标签 按实际值 下面来看看一个输出的例子。 import pandas as pd import numpy as np unsorted_df=pd.DataF…