以编程方式提取Adobe PDF包文件

我们在组织中有一堆文件被无意中另存为Adobe PDF packages（也称为PDF 1.7“集合”）。我们希望将这些文件转换为普通PDF文件（这些“包”中的大多数包含一个bog标准pdf文件），但是考虑到文件的数量，这是不可能手动的。以编程方式提取Adobe PDF包文件

任何Adobe专家知道：

另外，我正在寻找一种基于宏观的方法，但我宁愿不去这条路线，直到调查其他选项。

谢谢！

经过一堆挖掘，我发现pdftk，它在许多平台上作为源代码和二进制文件分发。

它几乎完成了我们需要做的全部工作，现在我们可以迭代我们的文档并递归调用每个pdftk（一些是多级附件链）。

注意pdftk只会将可见文档的页面分割成单个文档。隐藏的文档仍然隐藏。

您需要使用的选项是unpack_files。

阻碍互操作性的另一种不需要的混淆格式因此被归类为恶意软件。

使用Adobe Acrobat Professional中结合所有成一个PDF，然后通过书签级别划分

我明白这个线程是几年的历史，但如果有人正在寻找免费的实用工具从PDF包文件（尤其是从大集合），然后检查免费的实用程序ByteScout PDF Multitool：它是针对500多个MB包文件进行测试以提取数百个多级链接附件。

免责声明：我与ByteScout