如何搜索多个pdf文件的内容?
如何在目录/子目录中搜索PDF文件的内容?我正在寻找一些命令行工具。似乎grep
无法搜索PDF文件。
回答:
您的发行版应提供一个名为的实用程序pdftotext
:
find /path -name '*.pdf' -exec sh -c 'pdftotext "{}" - | grep --with-filename --label="{}" --color "your pattern"' \;
要使pdftotext输出到stdout,而不是文件,必须使用“-”。在--with-
filename和--label=
选项将在grep的输出把文件名。可选--color
标志不错,它告诉grep使用终端上的颜色进行输出。
(在Ubuntu中,pdftotext
由xpdf-utils
或提供poppler-utils
。)
这种方法,使用pdftotext
和grep
,拥有一个优势pdfgrep
,如果你想使用GNU的特点grep
是pdfgrep
不支持。
:pdfgrep-1.3.x支持-C
打印上下文行的选项。
以上是 如何搜索多个pdf文件的内容? 的全部内容, 来源链接: utcz.com/qa/424409.html