Boogu-Image 0.1：开源图像生成与编辑模型，以十分之一数据逼近闭源性能

📅 2026年06月22日 · 技术

项目简介

Boogu-Image-0.1 是一个基于 Apache-2.0 协议开源的统一图像生成和编辑模型系列，包含 Base、Turbo、Edit 等多个变体。该项目最引人注目的成果是：在以闭源系统约十分之一的训练数据量下，通过系统性地提升模型的理解能力、数据质量和训练流程，实现了接近甚至是媲美闭源方案的图像生成和编辑效果。

核心技术亮点

高质量摄影生成：准确理解摄影提示词，在复杂场景中保持主体、背景和空间关系的一致性
双语文字渲染：支持中英文多种排版样式（海报、文档、界面、手写板等），文字结构清晰可读
多样化风格化：涵盖 3D 微缩场景、中式鎏金、奇幻视觉、动漫肖像等风格
多功能图像编辑：支持物体插入、替换、移除、属性修改、背景替换和风格迁移
精准文字编辑：对图片中的中英文字符进行增删改，灵活适配字体、颜色和布局

评测与表现

项目团队自建了 Boogu Arena 评测平台（类似 LM Arena 的偏好评估），通过 LLM 生成多样化的用户画像和测试提示词，构建了超过 1000 条评测用例。在排行榜上，Boogu-Image-0.1 系列位居开源模型前列，部分场景甚至超越了多个闭源系统。

开源生态意义

Boogu-Image 证明了在有限算力条件下，通过优化数据质量和训练策略同样可以产出高质量的生成模型。所有权重和推理代码均已开源，并提供了在线 Demo 供用户体验。这对于推动图像生成领域的开放研究和社区创新具有积极意义。

参考来源

boogu-project/Boogu-Image — GitHub