以编程方式提取Adobe PDF包文件

我们在组织中有一堆文件被无意中另存为Adobe PDF packages(也称为PDF 1.7“集合”)。 我们希望将这些文件转换为普通PDF文件(这些“包”中的大多数包含一个bog标准pdf文件),但是考虑到文件的数量,这是不可能手动的。以编程方式提取Adobe PDF包文件

任何Adobe专家知道:

  1. 有一个开源或免费的库来处理,我可以围绕编写一个脚本PDF包格式?
  2. Adob​​e Pro 9是否有相关的脚本界面,可以让我从每个软件包中提取相关文件?

另外,我正在寻找一种基于宏观的方法,但我宁愿不去这条路线,直到调查其他选项。

谢谢!

回答:

经过一堆挖掘,我发现pdftk,它在许多平台上作为源代码和二进制文件分发。

它几乎完成了我们需要做的全部工作,现在我们可以迭代我们的文档并递归调用每个pdftk(一些是多级附件链)。

回答:

注意pdftk只会将可见文档的页面分割成单个文档。隐藏的文档仍然隐藏。

您需要使用的选项是unpack_files。

阻碍互操作性的另一种不需要的混淆格式因此被归类为恶意软件。

回答:

使用Adobe Acrobat Professional中结合所有成一个PDF,然后通过书签级别划分

回答:

我明白这个线程是几年的历史,但如果有人正在寻找免费的实用工具从PDF包文件(尤其是从大集合),然后检查免费的实用程序ByteScout PDF Multitool:它是针对500多个MB包文件进行测试以提取数百个多级链接附件。

免责声明:我与ByteScout

以上是 以编程方式提取Adobe PDF包文件 的全部内容, 来源链接: utcz.com/qa/262476.html

回到顶部