Boogu-Image 0.1:开源图像生成与编辑模型,以十分之一数据逼近闭源性能
📅 2026年06月22日 · 技术
项目简介
Boogu-Image-0.1 是一个基于 Apache-2.0 协议开源的统一图像生成和编辑模型系列,包含 Base、Turbo、Edit 等多个变体。该项目最引人注目的成果是:在以闭源系统约十分之一的训练数据量下,通过系统性地提升模型的理解能力、数据质量和训练流程,实现了接近甚至是媲美闭源方案的图像生成和编辑效果。
核心技术亮点
- 高质量摄影生成:准确理解摄影提示词,在复杂场景中保持主体、背景和空间关系的一致性
- 双语文字渲染:支持中英文多种排版样式(海报、文档、界面、手写板等),文字结构清晰可读
- 多样化风格化:涵盖 3D 微缩场景、中式鎏金、奇幻视觉、动漫肖像等风格
- 多功能图像编辑:支持物体插入、替换、移除、属性修改、背景替换和风格迁移
- 精准文字编辑:对图片中的中英文字符进行增删改,灵活适配字体、颜色和布局
评测与表现
项目团队自建了 Boogu Arena 评测平台(类似 LM Arena 的偏好评估),通过 LLM 生成多样化的用户画像和测试提示词,构建了超过 1000 条评测用例。在排行榜上,Boogu-Image-0.1 系列位居开源模型前列,部分场景甚至超越了多个闭源系统。
开源生态意义
Boogu-Image 证明了在有限算力条件下,通过优化数据质量和训练策略同样可以产出高质量的生成模型。所有权重和推理代码均已开源,并提供了在线 Demo 供用户体验。这对于推动图像生成领域的开放研究和社区创新具有积极意义。
参考来源
🔧 在线开发者工具 — JSON格式化 · Base64 · UUID生成 · 正则测试 等80+免费工具
🔧 在线开发者工具 — JSON格式化 · Base64 · UUID生成 · 正则测试 等80+免费工具