这可能是一个微不足道的查询,但我无法解决.
从本质上讲,我希望能够从下面的数据帧中滤除嘈杂的推文
<class 'pandas.core.frame.DataFrame'>
Int64Index: 140381 entries, 0 to 140380
Data columns:
text 140381 non-null values
created_at 140381 non-null values
id 140381 non-null values
from_user 140381 non-null values
geo 5493 non-null values
dtypes: float64(1), object(4)
我可以根据不需要的关键字创建数据框:
junk = df[df.text.str.contains("Swans")]
但是用这个来看看剩下的最好的方法是什么?
最佳答案
df[~df.text.str.contains("Swans")]