我有pandas.DataFrame,列数太多. 我打电话: In [2]: X.dtypes Out[2]: VAR_0001 object VAR_0002 int64 ... VAR_5000 int64 VAR_…
标签:python pandas
python – 使用pandas数据帧的.loc函数
我有一个pandas数据框,其中一列是: a = [1,0,1,0,1,3,4,6,4,6] 现在我想创建另一个列,这样任何大于0且小于5的值都被赋值为1而rest被赋值为0,即: a = [1,0,1,0,1,3,4,…
python – 设置pandas Dataframe Boxplot()的y轴刻度,3个偏差?
我正在尝试每月制作一个箱线图表区域,不同的箱形图按行业分组(并标记),然后让Y轴使用我指定的比例. 在一个完美的世界中,这将是动态的,我可以将轴设置为与整体平均值的一定数量的标准偏差.我可以使用其他类型的动态设置y轴,但…
python – Pandas过滤数据基于开始时出现的内容
我有一个如下所示的数据框: df4 = pd.DataFrame({'Q':['chair', 'desk', '-----monitor', 'chair'], 'R':['red', '-- use blue or …
python – Pandas根据行中其他单元格的值为单元格赋值
给出以下数据框: import pandas as pd import numpy as np DF = pd.DataFrame({'COL1': ['a','b','b'], 'COL2' : [0,np.nan,1…
python – 列创建时的SettingWithCopyWarning
我正在尝试为我的数据创建一个名为’mv_avg’的移动平均列.我得到了一个我无法修复的SettingWithCopyWarning.我可以抑制警告,但我无法弄清楚我的代码在哪里创建副本,我想利用最佳实践.我在下面创建了一…
python – Pandas – 在索引中使用merge_asof函数
代码是: import numpy as np import pandas as pd dateparse = lambda x: pd.datetime.strptime(x,'%d %m %Y %H %M') ven…
python – 熊猫:在最大距离内找到点
我试图在彼此的最大距离内找到成对的(x,y)点.我认为最简单的方法是生成一个DataFrame并逐个遍历每个点,计算在给定点(x_0,y_0)的距离r内是否存在坐标(x,y)的点.然后,将发现的对的总数除以2. %pyl…
python – 将多个字符串值合并到一个df列中
道歉我多次尝试透过SO一直都是徒劳的.我需要以下方面的帮助: 我的df如下: import pandas as pd df = pd.DataFrame({'subject' : ['Eng' ,'Math', 'Sci…
python pandas总结名义变量(计数)
我有以下数据框: KEY PROD PARAMETER Y/N 1 AAA PARAM1 Y 1 AAA PARAM2 N 1 AAA PARAM3 N 2 AAA PARAM1 N 2 AAA PARAM2 Y 2 A…
python – dataframe使列代表向量
我有流派的数据框 df = pd.DataFrame({'genres': [['Drama'], ['Music', 'Drama', 'Romance'], ['Action', 'Adventure', 'Come…
python – 如何使用pandas isin用于多个列
我想找到col1和col2的值,其中第一个数据帧的col1和col2都在第二个数据帧中. 这些行应该在结果数据框中: >披萨,男孩>披萨,女孩>冰淇淋,男孩 因为所有三行都在第一个和第二个数据帧中. 我…