V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Kelly00
V2EX  ›  视频技术

Update 最近折腾 AI 视频生成的一些心得(顺便分享下我做的小工具)

  •  
  •   Kelly00 · 2 天前 · 195 次点击

    最近这段时间因为在研究短视频营销,顺便也去试了不少 AI 视频生成工具,发现一个很有意思的现象: 绝大多数视频模型的“能力”其实不错,但真正能用于商业或者电商场景的,反而非常少。

    原因大概有几个: 1.生成时间太长,随便一次就是 2 ~ 5 分钟。 2.只能做 2 ~ 3 秒的单镜头,没办法做故事。 3.有水印不能商用。 4.很多地区直接打不开,要等邀请码。 5.电商相关的“产品手持、展示、生活场景”模型不太稳定。

    我和几个做 TikTok Shop 的朋友聊之后,他们最头疼的其实不是“模型效果多好”,而是:有没有 干净、可直接用 的视频?能不能一键生成 20 秒以上?产品能不能在不同镜头里保持一致?有没有简单的“产品展示模板”?结果这类需求反而是现有工具最薄弱的地方。因为好奇,我就尝试自己写了一个 demo ,想看看能不能做出一个至少能用的版本: 1.单镜头 10 秒视频 2.简单的多镜头( 25 秒) storyboard 3.图生视频:把商品图转成一个生活类短片 4.尽量不让人物、产品在不同镜头变来变去

    期间踩了很多坑,包括: 1.prompt 拆帧会乱跑 2.镜头切换会抖 3.人物肤色、衣服一致性难控制 4.模板难设计(电商场景比想象中复杂) 5.模型挑 prompt ,很“挑食” 不过折腾下来之后,至少能跑起来了。我把它放在 Saro2.ai 这个域名上,算是一个半实验性质的小工具。不是开源的,需要登录(为了防滥用 + 控制算力),不过已经能用。

    分享几个让我觉得“AI 视频比想象中更难”的点

    1. 视频最难的是“稳定”,不是画质 画质现在的模型都不差,但稳定性才决定能不能用来卖货。
    2. 多镜头比单镜头难一个次元 因为镜头之间的“连贯”完全是 pipeline 做出来的,而不是模型懂的。
    3. prompt 工程真的非常玄学 字多了不行,字少了也不行,有时候非常好的效果只是随机种子幸运。
    4. 做商家视频比做创意视频难太多

    因为必须要:真实、不跳帧、不变形、产品不能乱改、不能乱加奇怪东西、模型很容易“发挥创造力”,但商家要的是“不要发挥”。我觉得 AI 视频这个方向会越来越“工具化 / 场景化”,真正好用的工具未必是最强模型,而是最懂商业使用场景的。

    有在做 TikTok Shop 、Shopify 商品视频、UGC 、AI 生成视频、视频工具插件、欢迎留言交流下经验。

    如果想看看我上面说的那个 demo ,这里:Saro2.ai (一个我自己做的小的实验站)

    目前尚无回复
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1256 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 322ms · UTC 16:54 · PVG 00:54 · LAX 08:54 · JFK 11:54
    ♥ Do have faith in what you're doing.