如何使用pdfbox提取文本内容的字体样式？

Z时代
2024-01-10
分类：问答

我正在使用pdfbox库从pdf文件中提取文本内容。我可以提取所有文本，但找不到提取字体样式的方法。

回答：

这不是提取字体的正确方法。要读取字体，必须遍历pdf页面并提取字体，如下所示：

PDDocument  doc = PDDocument.load("C:/mydoc3.pdf");
List<PDPage> pages = doc.getDocumentCatalog().getAllPages();
for(PDPage page:pages){
    Map<String,PDFont> pageFonts=page.getResources().getFonts();
}

以上是如何使用pdfbox提取文本内容的字体样式？的全部内容，来源链接： utcz.com/qa/413746.html

回到顶部