GPT 一键生成可编辑 PPT:GordenSuperPPTSkills 技能包拆解
📅 2026年06月14日 · 技术
用 AI 做 PPT 的工具不少,但大部分只能生成一张漂亮的图片,没法编辑。最近 GitHub 上一个叫 GordenSuperPPTSkills 的 Codex 技能包,号称是"AI PPT 赛道终结者"——它不仅能用 GPT 生成视觉效果拉满的图片格式 PPT,还能把这些图片反向还原成完全可编辑的 PPTX 文件。这第二步是真正的技术亮点。
三段式技能架构
作者把整个流程拆成了三个独立的 Codex 技能,可以单独使用,也可以串联执行:
- GordenImagePPTGen:根据主题生成"图片格式 PPT",每页一张 PNG 图片,合成图片型 PPTX
- GordenImage2PPTX:把图片 PPT 还原为可编辑的 PPTX,自动拆分为背景层、骨架层、图标层、文本层
- GordenSuperPPTSkill:编排前两者,先出图再转可编辑,一键完成全流程
这种模块化设计的好处是灵活:你只需要生成图片版 PPT 就用第一个,只需要把现成图片转可编辑就用第二个,全流程走一遍就用第三个。
图片转可编辑:四层还原技术
这是整个项目最有技术含量的部分。把一张设计精美的 PPT 图片还原成可编辑文件,本质上是一个"逆向工程"过程。GordenImage2PPTX 把每一页 PPT 拆解为四个独立图层:
- 背景层:提取渐变、纹理等背景元素
- 骨架层:识别版式结构、分区布局
- 图标层:分离装饰性图形和图标
- 文本层:提取所有文字内容并重新设为可编辑文本框
还原完成后,每一页 PPT 的文字、图形都可以像普通 PPTX 一样自由编辑——修改文字、调整颜色、替换图片,全部支持。这比传统的"AI 生成图片 PPT"方案实用太多了。
如何使用
这个技能包专为 Codex 设计,需要 GPT 5.5 模型配合。使用方式很简单:
第一步,把 GitHub 仓库地址发给 Codex,让它自动安装技能。第二步,根据需求使用提示词:
- 生成图片 PPT:
使用GordenImagePPTGen技能,生成一个N页的PPT,内容为XXX,要求PPT豪华、信息密度高、排版复杂 - 图片转可编辑:
把当前文件夹里的XXX.png,使用GordenImage2PPTX,还原成可编辑的PPT
需要注意的是,图片转可编辑 PPTX 比较消耗额度——转换一张图片大约耗费 Plus 订阅 5 小时限额的 10%。如果你只需要一个漂亮的展示,图片版就够用了;如果需要后续编辑和修改,才需要走转换流程。
核心原理是利用 GPT 的图像生成能力和视觉解析能力,先"画"出漂亮的 PPT,再"看懂"画出来的内容并分层重建。这种"生成再解析"的思路,在其他设计自动化场景中同样有参考价值。