2025 年 11 月 26 日,由 Stable Diffusion 原班人马创立的黑森林实验室(Black Forest Lab)正式发布新一代 AI 生图模型 Flux.2,凭借多版本可选、生图质量媲美谷歌 Nano Banana Pro 且成本更低的优势,迅速引发行业关注。这款开源模型不仅支持多参考图像融合、精细文字渲染等高阶功能,更以高性价比成为闭源生图模型的强劲对手。
多版本精准定位,覆盖不同用户需求
Flux.2 此次推出 4 个版本,针对性解决生产、创作、开发等不同场景需求,用户可根据自身需求灵活选择:
-
Flux.2 [pro]:主打生产效率,生图质量对标 Nano Banana Pro,生成速度快(不到 10 秒 / 张),支持最多 10 张参考图融合(在线平台),文本生图单价低至 0.03 美元,图像编辑 0.045 美元起,适合需要稳定输出的商业场景;
-
Flux.2 [flex]:聚焦极致质量,允许调整生成步数与引导参数,代价是耗时更高,文本生图单价 0.06 美元起,图像编辑 0.12 美元起,适合对细节要求严苛的创意设计;
-
Flux.2 [dev]:面向开发者的 32B 开放权重模型,支持本地部署与全参数定制,非商业使用免费,最多推荐 6 张参考图,硬件配置直接影响生成速度,为研究与二次开发提供基础;
-
Flux.2 [klein](即将推出):基于基础模型蒸馏的轻量版本,采用 Apache 2.0 开源许可,进一步降低使用门槛。
普通用户可通过 Flux Playground 在线试玩,开发者则能在 Hugging Face 获取 [dev] 版本权重,或调用云服务商 API 快速集成,实现从 “即开即用” 到 “深度定制” 的全场景覆盖。
实测表现亮眼,精细控制能力逼近顶流闭源模型
为验证 Flux.2 的实际能力,以 Nano Banana Pro 的出圈玩法为参照展开实测,其在多维度表现可圈可点:
-
多参考融合与创意生成:支持同时参考 8-10 张图像,能精准还原参考人物风格并按指令调整姿势,例如基于参考人物与姿势草图生成 “女王风” 形象,人物特征与风格统一性强;可按色号生成渐变色花瓶(从 #02eb3c 到 #edfa3c),花朵颜色(#ff0088)精准匹配指令,细节还原度高。
-
实用场景落地:生成印度奶茶食谱图解时,Flux.2 [pro] 1 分钟内输出 4 张清晰图文,包含食材清单(2 杯水、1 杯牛奶、2 茶匙阿萨姆红茶等)、分步操作指南及小贴士,经 DeepSeek 验证无拼写与内容错误;为三星 Galaxy S25 Ultra 设计广告图时,能准确渲染 “Ultra-strong titanium” 标题与副标题,同时展现手机钛金属边框、深色渐变背景等产品细节,文字边缘清晰无模糊。
-
图像编辑与人物合成:在 “给马斯克添加黄色头盔” 的编辑任务中,模型精准识别人物主体,添加头盔后背景未发生畸变;尝试将马斯克、李飞飞、皮查伊、黄仁勋等人物合成在同一场景时,虽部分细节存在瑕疵,但人物特征与场景融合度较高,实现 “跨时空同框” 的创意效果。
不过需注意,Flux.2 目前对中文提示词的理解仍有不足,生成中文内容时易出现文字错误(如 “步骤” 误写为 “步败”),但可通过 “中文提示词 + 指定生成英文内容” 的方式规避这一问题。
性价比优势显著,开源生态再添活力
相较于 Nano Banana Pro 每日免费试用次数有限、付费成本较高的特点,Flux.2 的价格优势尤为突出:[pro] 版本文本生图单价仅为 Nano Banana Pro 的 1/3-1/2,[dev] 版本非商业使用免费,大幅降低生图门槛。Hugging Face 联创 Thomas Wolf 直言:“Flux.2 实现了媲美 Nano Banana 的质量,价格却便宜得多,令人印象深刻。”
网友实测也印证了其竞争力:修复老照片时,Flux.2 生成的图像质感优于 Nano Banana;合成 “威尔史密斯吃面” 场景,人物表情与动作自然度超过 Nano Banana 2;用 4 张肖像合成自拍照时,除个别细节(如 “戴珍珠耳环的女孩” 形象略有偏差)外,整体融合效果流畅。不少用户感叹:“Nano Banana Pro 刚出圈,Flux.2 就来了,简直是提前过圣诞节!”
传承 Stable Diffusion 基因,持续推动生图技术迭代
作为黑森林实验室的第二代旗舰模型,Flux.2 延续了前代 Flux.1 的开源基因与技术优势。2024 年 8 月 Flux.1 发布时,便因生图效果惊艳获 AI 大神 Andrej Karpathy 点赞;后续推出的 Flux.1.1 更被网友摸索出 “用单反文件格式(如 IMG_1018.CR2)作提示词,降低 AI 生成痕迹” 的实用技巧。
此次 Flux.2 在原有基础上进一步升级:多参考融合数量从 Flux.1 的最多 6 张提升至 10 张,图像细节与照片真实感显著增强,指令遵循度更高,同时支持 4MP(2560×1440 像素)高分辨率图像编辑。黑森林实验室表示,团队将持续优化模型,未来还将围绕中文支持、轻量化部署等方向迭代,推动开源生图生态发展。
从闭源模型垄断到开源势力崛起,Flux.2 的发布标志着 AI 生图领域进入 “质量与成本并重” 的新阶段。对于用户而言,无论是商业生产、创意设计还是技术研究,都多了一个高性价比选择;对于行业而言,开源模型的竞争将倒逼闭源产品优化体验、降低成本,最终推动整个生图技术生态的进步。