如何搜索多个pdf文件的内容?
如何在目录/子目录中搜索PDF文件的内容?我正在寻找一些命令行工具。似乎grep无法搜索PDF文件。
回答:
您的发行版应提供一个名为的实用程序pdftotext:
find /path -name '*.pdf' -exec sh -c 'pdftotext "{}" - | grep --with-filename --label="{}" --color "your pattern"' \;要使pdftotext输出到stdout,而不是文件,必须使用“-”。在--with-
filename和--label=选项将在grep的输出把文件名。可选--color标志不错,它告诉grep使用终端上的颜色进行输出。
(在Ubuntu中,pdftotext由xpdf-utils或提供poppler-utils。)
这种方法,使用pdftotext和grep,拥有一个优势pdfgrep,如果你想使用GNU的特点grep是pdfgrep不支持。
:pdfgrep-1.3.x支持-C打印上下文行的选项。
以上是 如何搜索多个pdf文件的内容? 的全部内容, 来源链接: utcz.com/qa/424409.html

