PDFx：把多个文档打包进一个PDF文件的创新工具

📅 2026年06月29日 · 技术

什么是 PDFx？

在日常工作中，你是否经常需要将多份 PDF 文档合并在一起？传统的做法是用 PDF 合并工具把所有页面拼接成一个大文件，但这样做的结果是：你失去了文档之间的边界——所有页面混在一起，分不清哪页属于哪份文档。

PDFx 是一个开源项目，它用一种巧妙的方式解决了这个问题。它提出了一种向后兼容的 PDF 扩展格式（.pdfx），可以将多份独立的文档打包进同一个文件中。最关键的是：这个文件本身仍然是一个完全合法的 PDF——用任何标准 PDF 阅读器打开，所有页面都能正常按顺序显示。但如果用 PDFx 自带的桌面查看器打开，它又能把文件"拆"回原来的独立文档。

工作原理

PDFx 的核心技术并不复杂。整个"魔法"藏在一个嵌入文件的 JSON 清单（manifest）中。这个清单记录了每份子文档的元信息：文档边界、页码范围、原始文件名等。普通 PDF 阅读器会忽略这个 JSON——它们只看到一连串的页面，正常渲染即可。而 PDFx 查看器读取这个清单后，就能把合并后的页面重新分组，还原出每份独立文档。

这种设计有几个显著的优点：

零兼容性风险：.pdfx 文件在任何 PDF 工具中都表现为普通 PDF，不会出现"打不开"的情况
无损还原：在 PDFx 中打开后，可以完整提取出原始的各个子文档
单 PDF 也能用：普通的单个 PDF 文件直接拖进去就能用，不需要做任何转换

桌面查看器

PDFx 提供了一个跨平台的桌面应用，支持 macOS、Windows 和 Linux。界面设计非常直观：每份文档渲染为一条横向的页面带，多份文档纵向堆叠排列。你可以通过拖拽来重新排序、删除某份文档，然后一键导出为完整的 .pdfx 文件。

技术上，这个查看器基于 Electron + React + TypeScript 构建，PDF 渲染使用 Mozilla 的 pdf.js，文档组装使用 pdf-lib。整个技术栈非常现代化，对于想学习 Electron 桌面应用开发的开发者来说，这也是一个很好的参考项目。

使用场景

PDFx 在以下场景特别有用：

项目文档归档：把需求文档、设计稿、技术方案、测试报告打包成一份文件，方便传递和存档
合同文件管理：把主合同、附件、补充协议等整合在一起，同时保持各自独立
论文与资料收集：研究时收集的多篇论文可以打包，每篇论文仍然可以单独提取
电子书制作：把多份课件、笔记合并成一个文件，方便分享

技术亮点

PDFx 最值得关注的不是它的功能有多复杂，而是它的设计思路——在标准格式上做最小化的扩展。这种"向后兼容"的思路在软件设计中非常重要：你不需要用户安装新工具才能查看文件，同时又能在支持新格式的环境中获得额外能力。格式规范本身非常简洁，整个核心就是一个嵌入式 JSON 清单，任何开发者都可以基于这个规范实现自己的工具。

项目目前已经在 GitHub 上开源，采用 MIT 许可证，对于需要处理多文档合并场景的开发者和办公人员来说，值得一试。

参考来源

PDFx — GitHub