📰 正文

Black Forest Labs 发布其最新模型 FLUX.2 [klein],这是一款兼具亚秒级速度与卓越画质的图像生成模型。

能够在 不到一秒的时间内生成高质量图像,同时保持令人惊叹的细节与美感表现。

FLUX.2 [klein] 专为快速创意开发、风格迁移与视觉编辑任务而设计。用户可以轻松完成从概念到成品的全流程创作(即“从 0 → 1”),无需牺牲质量或等待时间。

⚡ 非常快:0.5 秒内生成或编辑图像

💻 消费级显卡即可运行(13GB VRAM 起)

🖼️ 画质好:输出接近商业级成品;

🧩 灵活使用:网页试用、本地部署、API 接入全支持;

🧠 可训练:适合个性化微调;

🪪 部分版本开源(Apache 2.0),可自由商用。

这使得它特别适用于:

实时设计与原型制作

动态风格切换与艺术探索

AI 辅助内容生成与编辑

四种模型变体

image 1.

FLUX.2 [klein] 9B

核心旗舰版。

建立了“质量-延迟”最优平衡点。

在 <0.5 秒内生成结果,质量匹敌比其大 5 倍的模型。

使用 9B flow model + 8B Qwen3 text embedder。

支持多图像混合、复杂概念融合与高速迭代。

FLUX.2 [klein] 4B

轻量完全开源版(Apache 2.0)。

支持本地部署与边缘计算。

性能虽小但质量出众。

Base 模型(9B / 4B)

未蒸馏(undistilled)版本,保留完整训练信号。

输出多样性更高,适合科研与自定义控制场景。

硬件要求与适配性

4B 版本只需:

✅ RTX 3090 / 4070(13GB VRAM 即可)

✅ 本地运行,支持 Windows / Linux / macOS

✅ 开源权重(Apache 2.0)

9B 版本适合:

🔧 开发者与研究人员(需约 16GB+ VRAM)

🚀 支持 LoRA 微调与自定义训练

BFL 与 NVIDIA 合作推出 FP8 / NVFP4 量化方案后, 即便是 RTX 3060 / 4060 级别显卡 也能流畅运行。

主要功能与技术特点

1️⃣ 统一模型:生成 + 编辑 + 多参考

传统的图像生成模型通常分为独立的模块

FLUX.2 [klein] 并非仅仅做生成,而是将以下功能整合进一个模型:

T2I(Text-to-Image):从文本生成图像;

I2I(Image-to-Image):基于已有图像进行编辑;

Multi-Reference Generation:综合多张图片的视觉特征生成新图像。

FLUX.2 [klein] 采用统一架构,将这三者融合。

也就是说,一个模型就能:

从文字生成图像;

对已有图像进行修改;

融合多个图像的风格或内容生成新图像。

这种整合不仅减少了推理延迟,也使模型能更自然地处理复杂的视觉任务。

image


2️⃣ 亚秒级推理:真正的实时生成

FLUX.2 [klein] 实现了 低于 0.5 秒的推理时间。 这意味着用户几乎可以实时看到修改后的图像结果。 这种性能突破为:

交互式创作软件(例如 Photoshop 类产品的 AI 功能),

视觉对话系统,

AI 设计助手 提供了基础。

🔹 以往的扩散模型通常需要 20~50 步推理,而 FLUX.2 通过“step-distillation(步骤蒸馏)”技术,将其压缩至仅 4 步即可完成。


3️⃣ 高效与小型化

“klein”在德语中意为“小”,暗示了其设计理念: 小体积、低延迟、却保持高性能。

4B 模型:只需约 13GB VRAM 即可运行,适配 RTX 3090 / 4070 等消费级 GPU。

9B 模型:虽然更大,但提供旗舰级质量与功能。

性能对比: FLUX.2 [klein] 的输出质量可以匹敌甚至超过比其大五倍的模型,而延迟仅为对方的一半以下。


4️⃣ 高保真输出与多样性

在图像质量上,FLUX.2 [klein] 具备:

照片级真实感(Photorealism);

丰富的图像多样性(Diversity);

在复杂概念组合中的表现力,例如人物、光线、风格同时变化的场景。

其“Base”版本(未蒸馏)保留了完整训练信号,允许研究者在多样性与速度之间做权衡。

image


速度与性能

FLUX.2 [klein] 最大的亮点就是 —— 速度快得惊人。

根据 BFL.ai 的官方测试:

生成时间: 🔹 低于 0.5 秒(1024×1024 分辨率) 🔹 在 RTX 4090 或 4070 上几乎是“实时”的

推理步数: 仅需 4 步推理(step-distilled),而类似模型通常需要 20~30 步。

量化版 (FP8 / NVFP4)

FP8 模式:快 1.6×,显存节省 40%

NVFP4 模式:快 2.7×,显存节省 55%

➡️ 换句话说:

以前生成一张图需要 5~10 秒,现在只要不到 1 秒。 这让 AI 绘图第一次真正进入“交互式实时”时代。

图像质量

BFL 官方对比显示:

在照片真实感(Photorealism) 与 风格一致性(Style Coherence) 上, FLUX.2 [klein] ≈ SD3 ≈ Midjourney V6。

在多样性(Diversity) 上, Base 模型版本 > 蒸馏版(Distilled)> SDXL。

在一致性(Composition Control) 上, Multi-reference 模式远超 SDXL,可将多个图片/概念融合为一张高质量结果。

image

开放与许可政策

FLUX.2 [klein] 在开放性方面延续了 BFL 一贯的策略:

4B / 4B Base:采用 Apache 2.0 开源许可,允许商业使用;

9B / 9B Base:提供 开放权重 (Open Weights),但限于非商业用途;

支持在 Hugging Face 平台下载模型权重;

🧠 支持微调(Fine-tuning)

FLUX.2 [klein] 的设计充分考虑了二次开发需求。 用户可以在自己的硬件上对模型进行微调,定制特定风格或领域,例如品牌视觉、游戏角色、艺术风格迁移等。 这一功能特别适合企业和高端用户进行个性化 AI 模型训练。

📄 相关资源:

🤗 Hugging Face 模型页:black-forest-labs

🧩 GitHub 项目地址:black-forest-labs/flux

📜 许可政策详情:bfl.ai/licensing

官方介绍:https://bfl.ai/models/flux-2-klein

在线体验:https://bfl.ai/play


来源:Black Forest Labs 推出FLUX.2 [klein]模型:亚秒级速度图像生成 实现0.5秒出图改图