python – 删除pandas中包含空元组列表的行

我有一个如下的数据框

name     foo_list
'foo'    [('bleh'), ('blah')]
'bar'    [(), 'boo']
'foobar'  [(), (), ()]

我想删除所有空元组,并列出列表中的所有val都是空元组,只需完全删除该行.
另外,我想将这个元组列表转换为列表.
所以,输出将是

name     foo_list
'foo'    ['bleh', 'blah']
'bar'    [ 'boo']

我怎么在熊猫里这样做?

最佳答案 试试这个 ?

数据输入:

df=pd.DataFrame({'name':['A','B','C'],'foo_list':[[('bleh'),('blah')], [(), 'boo'],[(), (), ()]]})

解:

df['foo_list']=df['foo_list'].apply(lambda x : [t for t in x if t != ()])
df.loc[df['foo_list'].apply(len)>0,:]

Out[20]: 
       foo_list name
0  [bleh, blah]    A
1         [boo]    B

时间(小尺寸)

%timeit df['foo_list'].apply(lambda x : [t for t in x if t != ()])#Wen
10000 loops, best of 3: 117 µs per loop

%timeit df.foo_list.apply(lambda x: filter(None, x)) # John
10000 loops, best of 3: 121 µs per loop

大尺寸将推荐John的解决方案

df=pd.concat([df]*10000,0)

%timeit df.foo_list.apply(lambda x: filter(None, x))
100 loops, best of 3: 10.2 ms per loop
%timeit df['foo_list'].apply(lambda x : [t for t in x if t != ()])
100 loops, best of 3: 17.1 ms per loop
点赞