快速Python PDF元数据阅读器

我正在寻找一个非常快速,轻量级的
Python库来阅读PDF元数据.我不需要任何写入功能.如果只加载元数据信息而不是整个文件会更好.

我意识到像Python这样的解释语言不是速度的最佳选择,但是由于这个解决方案需要跨平台并且与现有的Python应用程序一起工作,所以似乎没有多少选择.

我检查了pyPdf和其他一些库,但理想的是寻找更轻,更快的东西,适合一次处理成千上万的文件.

最佳答案
Here’s something I just put together,构建在Python PDFMiner库之上.您可以使用它提取“Info”和XMP类型元数据.

点赞