python – 在列表中查找最小的唯一元素

我在
Python中有一个包含字符串的列表:

["foo/bar","foo/bar/baz","foo/bar/qux"]

我试图将该列表中未包含在任何其他更长元素中的最小元素分开.在这种情况下,我想返回一个列表[“foo / bar / baz”,“foo / bar / qux”],因为它们不包含在任何更长的元素中.我不想要“foo / bar”,因为它包含在“foo / bar / baz”和“foo / bar / qux”中.我一直在尝试嵌套for和if语句,但我似乎无法做到正确.任何人都能指出我正确的方向吗?

最佳答案 假设你真的在寻找叶子目录(即“包含在”真的意思是“前缀为”,斜杠是特殊的),这里有一个简单的算法:

def leaf_dirs(dirlist):
    """Given a list of directories, find leaf directories"""
    parents = {}
    for path in dirlist:
        parts = path.split('/')
        if parts[0] == '':
            raise ValueError("can't handle rooted directory %s" % path)
        parent = '/'.join(parts[:-1])
        parents[parent] = True
    return [path for path in dirlist if path not in parents]

基本上,所有“父目录”名称都放入字典中,然后我们过滤掉这些名称.在“foo / bar / baz”和“foo / bar / quux”的情况下,父路径(foo / bar)输入两次,但我们并不在意.

编辑:修复Omri Barel注意到的点,而不仅仅是使用[: – 1]部分:

        while parts:
            parts.pop() # strip last path component
            parent = '/'.join(parts)
            parents[parent] = True

这将剥离最后一个组件并进入父组件. (我故意在这里输入空字符串,这样做有点简单.)

点赞