如何使用pdfbox提取文本内容的字体样式?
我正在使用pdfbox库从pdf文件中提取文本内容。我可以提取所有文本,但找不到提取字体样式的方法。
回答:
这不是提取字体的正确方法。要读取字体,必须遍历pdf页面并提取字体,如下所示:
PDDocument doc = PDDocument.load("C:/mydoc3.pdf");List<PDPage> pages = doc.getDocumentCatalog().getAllPages();
for(PDPage page:pages){
Map<String,PDFont> pageFonts=page.getResources().getFonts();
}
以上是 如何使用pdfbox提取文本内容的字体样式? 的全部内容, 来源链接: utcz.com/qa/413746.html