[文生图对比] Flux, Grok, 即梦，豆包

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

前几天我发帖感叹 Grok 生图很强，得到很多反馈，这几天试用了一下大家推荐的各种文生图模型，做了一个对比，没想到最让我满意的是“即梦”。

做了两个场景的对比，一个是大海沙滩，一个是楼顶。其中 Grok 和豆包勉强只有两张能看，Flux 更是一张满意的都找不到，即梦则是有一大堆满意的图，而且即梦最强的是，模特的动作多变，拍摄视角也多变，有很多意外惊喜。

我找了免费相册，大家可以去相册看图：
https://www.photo-pick.com/online/POY42GtC.link

打赏作者

20 50 100 200 500 1000

发送

即梦

文生图

对比

17 条回复 • 2025-09-11 22:42:09 +08:00

skydcnmana

3 天前

即梦可以较好地做人脸迁移么？

cmdOptionKana

3 天前

@skydcnmana 这个不太清楚，还没玩过这种，我目前还在玩最简单的文生图😂

skydcnmana

3 天前

@cmdOptionKana Google 那个人脸保持很强，就是生图分辨率太低了：‌⁢⁣⁤⁣⁢⁢‌‬‌‬⁣⁡⁢⁢‍‬⁣‌⁡⁣⁡⁣‍⁡‍⁢⁤⁢⁣⁣⁢‌‌‌Nano Banana 究极玩法+免费入口汇总 - 飞书云文档: https://ccnk05wgo092.feishu.cn/wiki/PTbMwKbPPiE3QZkkfoocuZ4Cnjg

Goooooos

3 天前

即梦生成的妹子更符合我个人审美

crocoBaby

3 天前

有没有能本地跑的?这个 app 要积分

cmdOptionKana

3 天前

@crocoBaby 我没有显卡所以没有研究本地模型，上次发帖大家提供了一些信息：

- Stable Difusion + civitai 模型
- 开源的模型效果挺好，之前比较出圈的应该是韩国 lora 模型
- 想快跟稳定还是搞专门的 gpu 服务器云端部署吧，也不咋贵，谷歌跟 Kaggle 应该挺多人用的
- comfyUI ，网上教程一大堆
- comfyUI 是一个 Stable Difusion 的 web 前端，需要自己选择模型配置节点去生成图像
- 语义化的本地可以使用 wan2.2 或者混元的模型，还能图生视频
- 开源且支持自部署： https://typix.art

crocoBaby

3 天前

@cmdOptionKana 感谢,我慢慢探索一下

narmgalaxy

3 天前

豆包和即梦都是字节出的，可能他俩偏向应用场景不一样吧，我也感觉即梦要好一点。

cmdOptionKana

3 天前

我这两个场景的提示词如下，大家可以自己试试各个模型的效果（国内用中文，国外用英文）：

真实生活摄影：一位年轻女子，穿着连衣裙，裙摆在风中飘动，站在金色海滩上，夕阳余晖洒下金色光芒，海浪拍打着海岸，脚穿罗马系带凉鞋，修长的腿线条
Real-life photography: a young woman in dress, pure white hem fluttering in wind, standing on golden beach, sunset glow casting golden light, waves lapping shoreline, strappy Roman sandals on feet, slender leg lines

全新创造，不要旧记忆，真人：25 歲日本女人，偏分茶棕色直卷发，白皙的皮肤，背景楼顶，细节丰富，淡彩，暗调，长腿，穿短裙、长筒袜和黑色鞋子，侧脸
A 25-year-old Japanese woman with side-parted, tea-brown straight-curly hair, fair skin, standing on a rooftop background, highly detailed, soft colors, dark tones, long legs, wearing a short skirt, thigh-high stockings, and black shoes, side profile.