V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
cmdOptionKana
3.15D
V2EX  ›  分享发现

[文生图对比] Flux, Grok, 即梦,豆包

  •  
  •   cmdOptionKana · 3 天前 · 1336 次点击
    前几天我发帖感叹 Grok 生图很强,得到很多反馈,这几天试用了一下大家推荐的各种文生图模型,做了一个对比,没想到最让我满意的是“即梦”。



    做了两个场景的对比,一个是大海沙滩,一个是楼顶。其中 Grok 和豆包勉强只有两张能看,Flux 更是一张满意的都找不到,即梦则是有一大堆满意的图,而且即梦最强的是,模特的动作多变,拍摄视角也多变,有很多意外惊喜。

    我找了免费相册,大家可以去相册看图:
    https://www.photo-pick.com/online/POY42GtC.link
    打赏作者
    17 条回复    2025-09-11 22:42:09 +08:00
    skydcnmana
        1
    skydcnmana  
       3 天前
    即梦可以较好地做人脸迁移么?
    cmdOptionKana
        2
    cmdOptionKana  
    OP
       3 天前
    @skydcnmana 这个不太清楚,还没玩过这种,我目前还在玩最简单的文生图😂
    skydcnmana
        3
    skydcnmana  
       3 天前   ❤️ 1
    @cmdOptionKana Google 那个人脸保持很强,就是生图分辨率太低了:‌⁢​⁣⁤⁣⁢⁢‌‬​​​​​‌‬⁣⁡⁢​⁢​‍‬⁣​‌⁡⁣⁡⁣‍⁡‍⁢⁤⁢⁣⁣​⁢​‌‌‌Nano Banana 究极玩法+免费入口汇总 - 飞书云文档: https://ccnk05wgo092.feishu.cn/wiki/PTbMwKbPPiE3QZkkfoocuZ4Cnjg
    Goooooos
        4
    Goooooos  
       3 天前
    即梦生成的妹子更符合我个人审美
    crocoBaby
        5
    crocoBaby  
       3 天前
    有没有能本地跑的?这个 app 要积分
    cmdOptionKana
        6
    cmdOptionKana  
    OP
       3 天前   ❤️ 1
    @crocoBaby 我没有显卡所以没有研究本地模型,上次发帖大家提供了一些信息:

    - Stable Difusion + civitai 模型
    - 开源的模型效果挺好,之前比较出圈的应该是韩国 lora 模型
    - 想快跟稳定还是搞专门的 gpu 服务器云端部署吧,也不咋贵,谷歌跟 Kaggle 应该挺多人用的
    - comfyUI ,网上教程一大堆
    - comfyUI 是一个 Stable Difusion 的 web 前端,需要自己选择模型配置节点去生成图像
    - 语义化的本地可以使用 wan2.2 或者混元的模型,还能图生视频
    - 开源且支持自部署: https://typix.art
    crocoBaby
        7
    crocoBaby  
       3 天前
    @cmdOptionKana 感谢,我慢慢探索一下
    narmgalaxy
        8
    narmgalaxy  
       3 天前
    豆包和即梦都是字节出的,可能他俩偏向应用场景不一样吧,我也感觉即梦要好一点。
    cmdOptionKana
        9
    cmdOptionKana  
    OP
       3 天前
    我这两个场景的提示词如下,大家可以自己试试各个模型的效果(国内用中文,国外用英文):

    真实生活摄影:一位年轻女子,穿着连衣裙,裙摆在风中飘动,站在金色海滩上,夕阳余晖洒下金色光芒,海浪拍打着海岸,脚穿罗马系带凉鞋,修长的腿线条
    Real-life photography: a young woman in dress, pure white hem fluttering in wind, standing on golden beach, sunset glow casting golden light, waves lapping shoreline, strappy Roman sandals on feet, slender leg lines


    全新创造,不要旧记忆,真人:25 歲日本女人,偏分茶棕色直卷发,白皙的皮肤,背景楼顶,细节丰富,淡彩,暗调,长腿,穿短裙、长筒袜和黑色鞋子,侧脸
    A 25-year-old Japanese woman with side-parted, tea-brown straight-curly hair, fair skin, standing on a rooftop background, highly detailed, soft colors, dark tones, long legs, wearing a short skirt, thigh-high stockings, and black shoes, side profile.
    dule
        10
    dule  
       3 天前
    这样看确实挺真实的,没有之前那个 Grok AI 感挺明显
    qingdian
        11
    qingdian  
       3 天前 via Android
    我记得豆包也用上了 Seedream 4.0 模型了
    HumbertHumbert
        12
    HumbertHumbert  
       3 天前
    我都是让 Grok 输出提示词,然后让即梦生图。
    但是 Grok 限制少,额度多,速度快。
    zsc8917zsc
        13
    zsc8917zsc  
       3 天前
    zsc8917zsc
        14
    zsc8917zsc  
       3 天前
    cmdOptionKana
        15
    cmdOptionKana  
    OP
       3 天前
    @zsc8917zsc 看着像 Flux 或者 Grok ,尤其是楼顶的场景,模特动作比较呆板,我试了好几次都是这个动作
    coderchen
        16
    coderchen  
       3 天前
    图片上加中文字哪个文生图最强
    cmdOptionKana
        17
    cmdOptionKana  
    OP
       2 天前
    @coderchen 可以试试即梦和豆包,反正外国的我试过都不行。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2775 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 14:37 · PVG 22:37 · LAX 07:37 · JFK 10:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.