我有一个熊猫数据框,我从中计算出学生的平均分数.学生分数存储在数据中,如下所示: name score 0 John 90 1 Mary 87 2 John 100 3 Suzie 90 4 Mary 88 使用mean…
标签:python pandas
python – Pandas pd.isnull()函数
我需要将数据框中的非空值替换为1,将null值替换为0. 这是我的数据帧: my_list= [['a','b','c'],['test1','test2',None],[None,'101','000']] mydf=…
python – 按行随机连接数据帧
如何逐行随机合并,连接或连接pandas数据帧?假设我有四个这样的数据框(有更多的行): df1 = pd.DataFrame({'col1':["1_1", "1_1"], 'col2':["1_2", "1_2"],…
python – MySQL的pandas可以支持文本索引吗?
如果我尝试在 MySQL数据库中存储带有文本索引的数据帧,我会收到错误“在没有密钥长度的密钥规范中使用BLOB / TEXT列”,例如: import pandas as pd import sqlalchemy as …
在python中从long转换为wide
我认为这是一个非常简单的问题.我是 python的新手,我无法找到完美的答案. 我有一个数据帧: A B C D E 203704 WkDay 00:00 0.247 2015 203704 WkDay 00:30 0.…
python – Pickle dump Pandas DataFrame
这是一个懒惰的人的问题. 我有400万行pandas DataFrame,并希望将它们保存到较小的pickle文件块中. 为什么小块?更快地保存/加载它们. 我的问题是:1)有没有更好的方法(内置功能)将它们保存在较小的…
python – 获取pandas中每个标识符的最新非NaN时间序列值
我坚持如何获取DataFrame的最新非NaN值以获取唯一标识符.所以我有一个Pandas DataFrame,其中包含一列ID,值和年份,类似于: | ID | Values | Year --------------…
python – 在DataFrame中堆叠两列,重复其他列
我有一个像这样的结构的pandas DataFrame: df = pd.DataFrame( [ [ 'foo1', 'a', 'z', 'bar1', 1, 4 ], [ 'foo2', 'b', 'y', 'bar…
python – 如何将两列pandas dataframe的元素绘制为直方图?
我有以下pandas数据帧: A B 1 3 0 2 1 4 0 1 0 3 我想绘制给定A的B实例的频率,如下所示: | | | __ B | | | | ___ | | | | | | | | | | | | |__…
python – Pandas在这里做的是什么,我的索引[0]和[1]引用了相同的值?
我有一个包含这些索引和值的数据框: df[df.columns[0]] 1 example 2 example1 3 example2 当我访问df [df.columns [0]] [2]时,我得到“example1”…
python – 使用pandas数据帧的.loc函数
我有一个pandas数据框,其中一列是: a = [1,0,1,0,1,3,4,6,4,6] 现在我想创建另一个列,这样任何大于0且小于5的值都被赋值为1而rest被赋值为0,即: a = [1,0,1,0,1,3,4,…
python – 具有相同列和索引的多个数据帧的平均值
我有几个数据帧.它们中的每一个都具有相同的列和相同的索引.对于每个索引,我想平均每列中的值(如果这些是矩阵,我只是将它们相加并除以矩阵的数量). 这是一个例子. v1 = pd.DataFrame([['ind1', 1…