我使用
python 3.4和
python-docx库来处理.docx文件.我已经能够从文档中提取文本.但我的目标是仅提取具有特定字体的文本(并修改它们).
过去两天我一直在library documentation搜索这个,没有结果.
这里有没有人有这个图书馆的经验,如果是这样,他们可以指出我正确的方向.
最佳答案 目前,python-docx只能使用样式应用字体字体.您可以检测具有如下特定样式的运行:
document = Document('having-fonts.docx')
for paragraph in document.paragraphs:
for run in paragraph.runs:
if run.style == style_I_want:
print run.text
如果使用段落样式应用特殊字体,您可以使用:
document = Document('having-fonts.docx')
for paragraph in document.paragraphs:
if paragraph.style == style_I_want:
print paragraph.text
如果您可以更详细地说明细节,我可能会更具体.