python-2.7 – Python:如何修改Microsoft Office文件的元数据?

如何修改Microsoft Office Document的元数据?我找到了Jpg,PNG和PDF文件的结果数.任何人都可以建议Office文件元数据的库? 最佳答案 对于较新的格式,它们通常只是压缩xml,因此您可以使用标准库来解压缩和解析xml.抓住文档创建者的一些代码以前是
posted as an answer on stackoverflow.

import zipfile, lxml.etree

# open zipfile
zf = zipfile.ZipFile('my_doc.docx')
# use lxml to parse the xml file we are interested in
doc = lxml.etree.fromstring(zf.read('docProps/core.xml'))
# retrieve creator
ns={'dc': 'http://purl.org/dc/elements/1.1/'}
creator = doc.xpath('//dc:creator', namespaces=ns)[0].text

对于较旧的格式,您可能需要查看hachoir-metadata library

点赞