python-2.7 – 如何计算python中具有空白pdf页面的pdf页面的数量

我试图使用pypdf模块打印包含一些空白白色pdf页面的pdf文档的计数.但它避免了空白页面并打印其余页面的计数.下面是代码.

import sys

import pyPdf

from pyPdf import PdfFileReader, PdfFileWriter

pdf_document = PdfFileReader(file(normalpdfpath,"r"))

normal = pdf_document.getNumPages()
print normal

最佳答案 你可以尝试这个,这对我有用:

import re
import os

rxcountpages = re.compile(r"/Type\s*/Page([^s]|$)", re.MULTILINE|re.DOTALL)

def count_pages(filename):
    data = file(filename,"rb").read()
    return len(rxcountpages.findall(data))

if __name__=="__main__":
    parent = "/Users/username/"
    os.chdir(parent)
    filename = 'LaTeX20120726.pdf'
    print count_pages(filename)

问候

点赞