如何使用pdfbox提取文本内容的字体样式?

我正在使用pdfbox库从pdf文件中提取文本内容。我可以提取所有文本,但找不到提取字体样式的方法。

回答:

这不是提取字体的正确方法。要读取字体,必须遍历pdf页面并提取字体,如下所示:

PDDocument  doc = PDDocument.load("C:/mydoc3.pdf");

List<PDPage> pages = doc.getDocumentCatalog().getAllPages();

for(PDPage page:pages){

Map<String,PDFont> pageFonts=page.getResources().getFonts();

}

以上是 如何使用pdfbox提取文本内容的字体样式? 的全部内容, 来源链接: utcz.com/qa/413746.html

回到顶部