我尝试将数据帧保存为羽毛格式,但在加载时我得到了错误 os.makedirs('tmp', exist_ok=True) df_hist.to_feather('tmp/historical-raw') 这是加载回数据集…
标签:python pandas
python – Pandas根据条件为每一行创建一个唯一的id
我有一个数据集,其中一列如下.我想根据以下条件创建一个新列. 对于column_name中的值,如果存在1,则创建一个新ID.如果存在0,则还会创建新ID.但是如果在1个以上的连续行中重复1,那么对于所有行,id应该相同…
python – 计算pandas数据帧的选定列的加权和的推荐方法是什么?
例如,我想计算下面矩阵的列’a’和’c’的加权和,并在字典w中定义权重. df = pd.DataFrame({'a': [1,2,3], 'b': [10,20,30], 'c': [100,200,300], 'd'…
python – 为什么pd.to_numeric不能用大数字?
假设我在字符串中有一个大数字,例如’555555555555555555555′.可以选择将其转换为int,float或甚至是numpy浮点数: int('555555555555555555555') float('5…
python – 在Pandas DataFrame中查找第一列匹配条件的矢量化方法
假设我有以下pandas DataFrame: A B C 0 0.548814 0.791725 0.978618 1 0.715189 0.528895 0.799159 2 0.602763 0.568045 0.…
python – 如何重新排序数据帧的顺序以匹配第二个数据帧的顺序?
如果我有两个数据帧作为示例: DF1: x y 0 1.1. 2.1 1 3.1 5.1 DF2: x y 0 0.0 2.2 1 1.1 2.1 2 3.0. 6.6 3 3.1 5.1 4 0.2 8.8 并且我希望…
python – pandas ValueError:pattern不包含任何捕获组
使用正则表达式时,我得到: import re string = r'http://www.example.com/abc.html' result = re.search('^.*com', string).group…
python – 删除时间不重复的行
我有一个df,每个公司有4个观察结果(4季度).但是,对于几家公司,我的观察结果不到4次.当我没有公司的四分之三时,我想删除所有与公司相关的观察结果.任何想法如何做到这一点? 这就是df的样子: Quarter Year…
如何匹配和合并两个具有完全不同的值的数据帧,除了一个单词?
有一个有价值的数据框ABC 0 1 2 0 sun is rising | UNKNOWN | 1465465 1 micheal has arrived | UNKNOWN | 324654 2 goal has be…
如何添加具有固定值的多个新列?
我需要向DataFrame df添加列.应该沿着df的所有行修复所有新列的值: df = { "NUM":[1,2], "WAKE":["M","H"], "DISTANCE":[780,500] } new_df = …
python – Unpivot Dataframe w / Partial String
我有一个数据帧(totaldf),这样: ... Hom ... March Plans March Ships April Plans April Ships ... 0 CAD ... 12 5 4 13 1 USA…
如何使用没有索引的两列来转动数据框
我正在尝试调整当前的两列数据框,目前看起来像这样: one two a 12 b 32 c 12 我想透视它,导致两列都不成为索引.我的预期结果是: a b c 12 32 12 a,b和c是新列. 12,32,12是行…