我有一个数据集,其中一列如下.我想根据以下条件创建一个新列.
对于column_name中的值,如果存在1,则创建一个新ID.如果存在0,则还会创建新ID.但是如果在1个以上的连续行中重复1,那么对于所有行,id应该相同.样本输出结果如下所示.
column_name
1
0
0
1
1
1
1
0
0
1
column_name -- ID
1 -- 1
0 -- 2
0 -- 3
1 -- 4
1 -- 4
1 -- 4
1 -- 4
0 -- 5
0 -- 6
1 -- 7
最佳答案 说你的系列是
s = pd.Series([1, 0, 0, 1, 1, 1, 1, 0, 0, 1])
然后你可以使用:
>>> ((s != 1) | (s.shift(1) != 1)).cumsum()
0 1
1 2
2 3
3 4
4 4
5 4
6 4
7 5
8 6
9 7
dtype: int64
这将检查当前条目是否为1,或者前一个条目不是1,然后对结果执行累积求和.