1、使用itertools.dropwhile(),只要提供一个函数和一个可迭代对象即可(该函数起到过滤作用,满足条件的值都会丢弃直到有元素不满足为止)
示例:文件开头有一些注释行,想跳过所有的初始注释行
with open('/etc/passwd') as f:
for line in f:
print(line, end='') # 返回所有行
import itertools
with open('/etc/passwd') as f:
# 丢弃f中以#开头的行,直到找到一个非#开头的行为止,然后全部输出
for line in itertools.dropwhile(lambda line: line.startswith('#'), f):
print(line, end='')
2、如果恰好知道要跳过多少个元素,那么可以使用itertools.islice()
items = [1, 3, 3, 4, 5]
for x in itertools.islice(items, 3, None): # 筛选出前三个元素之外的所有元素
print(x)
总结:
1、只丢弃可迭代对象中前一部分元素和对全部元素可进行过滤是有所区别的:
with open('/etc/passwd') as f: # 丢失文件中所有的以'#'开头的行
lines = (line for line in f if not line.startswith('#'))
for line in lines:
print(line)
2、本文所展示的技术可适用于所有的可迭代对象(包括序列、生成器、文件等)。