检查PDF文件是否已扫描
以编程方式检查PDF文件是否被完全扫描的最佳方法是什么?我确实可以使用iText和PDFBox。我可以检查pdf文件是否包含文本,并根据结果确定该文件是否为OCRed,但是此解决方案并非100%准确。我想知道是否还有另一种方法来解决这个问题。
如您所知,解决方案必须基于Java。
回答:
最好的选择是检查它是否包含文本,还查看它是否包含大的页面化图像或覆盖页面的大量平铺图像。如果您还检查元数据,则这应涵盖大多数选项。
以上是 检查PDF文件是否已扫描 的全部内容, 来源链接: utcz.com/qa/404428.html