Black Forest Labs 宣布开源对标GPT 4o 的 FLUX.1 Kontext [dev]图像模型

📰 正文

Black Forest Labs 发布了 FLUX.1 Kontext [dev]，这是其图像编辑模型 FLUX.1 Kontext [pro] 的开源开发版本，拥有 12B参数，具备接近专有工具的图像编辑能力，并可在消费级硬件上运行。

其目标是提供一个性能接近闭源专有模型的免费工具。

模型规模：12B 参数（对比 Stable Diffusion 约为 1B-2B）

模型定位：仅用于图像编辑（非从零生成），强调局部精准控制与角色一致性。

🔓 开源与可用性

模型在 FLUX.1 非商业许可下开源，支持研究与非商业用途。

权重可通过 Hugging Face 获取，兼容 ComfyUI、HuggingFace Diffusers、TensorRT。

由多个合作方（如 FAL、Replicate、Runware、DataCrunch、TogetherAI）提供云端或本地推理支持。

主要能力

FLUX.1 Kontext [dev]专注于图像编辑任务：包括迭代编辑、角色保持、局部与全局精细控制。

可以非常准确地“重绘”图片中的局部或全图，比如：

把帽子加到人物头上

改变背景风景

把原图中的狗换成猫，人物保持原样

多次修改也不会“跑偏”或者失真

跟很多流行工具（如 ComfyUI）无缝结合，方便使用

性能评估与对比

评估基准：使用其自研的 KontextBench（一个新的图像编辑评测集）

评估维度：

编辑精度（是否能实现用户期望的修改）

角色保持（人物面部/姿态的一致性）

多场景迁移（是否能适应复杂背景与构图）

对比模型：

开源模型：

Bytedance Bagel（文生图+编辑混合模型）

HiDream-E1-Full（开源扩散图像编辑模型）

闭源模型：

Google’s Gemini-Flash Image

结果：Kontext [dev] 在多项任务中人类偏好得分优于上述所有模型，并由第三方机构 Artificial Analysis 独立验证。

技术细节与优化

与 NVIDIA 合作，构建了专门针对全新 NVIDIA Blackwell 架构优化的 TensorRT 权重，该架构大幅提升推理速度并降低内存使用，同时保持高质量的图像编辑性能。

推理优化：

与 NVIDIA 合作，为最新的 Blackwell 架构（B100 GPU）定制推理优化：

提供 FP16、BF16、FP8、FP4 等低精度权重

极大降低延迟与显存需求，适配边缘设备部署

商业许可机制

推出自助购买平台（Self-Serve Portal）

支持在线获取商业授权，包括：

FLUX.1 Kontext [dev]

FLUX.1 Tools [dev]（辅助图像处理）

FLUX.1 [dev]（文本生成图像模型）

模型下载：https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev

技术报告：https://arxiv.org/abs/2506.15742