我在分组数据框架上计算了滚动总和,但是它加起来的方式错误,它是未来的总和,当我需要过去的总和时. 我在这做错了什么? 我导入数据并按维度和日期排序(我已尝试删除日期排序) df = pd.read_csv('Input.…
标签:python pandas
python – DataFrame.drop没有丢弃Pandas中的预期行
我有一个Pandas DataFrame,其中包含我想根据“population”列中的值删除的行: data['population'].value_counts() general population 21 dev…
python – 用groupby滚动max的pandas
我有一个问题,让Pandas的滚动功能做我想做的事.我希望每个人都能计算到目前为止的最大值.这是一个例子: df = pd.DataFrame([[1,3], [1,6], [1,3], [2,2], [2,1]], c…
python – Pandas DataFrame合并选择更高的值
我有两个这样的DataFrame: 1 2 3 0 61.579 0.000000 47.279861 1 0.000 0.000000 0.000000 2 62.700 9.180000 48.479861 3 56…
python astype(str)给出了SettingWithCopyWarning和请求我使用loc
使用这个简单的代码行,我继续得到一个SettingWithCopyWarning错误,而不是通过我的整个代码. #make email a string df['Email Address'] = df['Email A…
python – Pandas根据条件过滤行,但始终保留第一行
我想删除一些符合特定条件的行,但即使第一行符合该条件,我也不想删除第一行. 我尝试使用df.drop函数删除行,但如果第一行符合该条件,它将擦除第一行.我不要那个. 数据看起来像这样: Column1 Column2 C…
python – 更改数据框中多个loc的最快方法
我有一个包含100万行的pandas数据帧.我想用另一组值替换列中900,000行的值.有没有for循环(我需要两天才能完成)的快速方法吗? 例如,查看此示例数据框,其中我已将100万行压缩为8行 import nump…
如何在数据帧中为python中的特定行值选择列数据?
正如问题所说,我有一个非常大的数据框,但看起来像: ID Count ValueX Value 2 Value 3 RowX 1 234. 255. yes. yes RowY 1 123. 135. 543. 342 …
python – 在列名称中循环
我有一个数据框,其中包含car_x和car1_y,van2_x和van2_y,以及bus3_x和bus3_y.我需要一个car1_x * car1_y van2_x * van2_y bus3_x * bus3_y的列 …
python – 计算pandas数据帧的选定列的加权和的推荐方法是什么?
例如,我想计算下面矩阵的列’a’和’c’的加权和,并在字典w中定义权重. df = pd.DataFrame({'a': [1,2,3], 'b': [10,20,30], 'c': [100,200,300], 'd'…
基于python中的列中的索引值或值进行查询
我有一个熊猫数据框,我从中计算出学生的平均分数.学生分数存储在数据中,如下所示: name score 0 John 90 1 Mary 87 2 John 100 3 Suzie 90 4 Mary 88 使用mean…
python – 将数据帧中的NaN转换为零
我有字典并使用创建了Pandas cars = pd.DataFrame.from_dict(cars_dict,orient =’index’) 和 对索引进行排序(按字母顺序排列 cars = cars.sort_i…