最近这段时间因为在研究短视频营销,顺便也去试了不少 AI 视频生成工具,发现一个很有意思的现象: 绝大多数视频模型的“能力”其实不错,但真正能用于商业或者电商场景的,反而非常少。
原因大概有几个: 1.生成时间太长,随便一次就是 2 ~ 5 分钟。 2.只能做 2 ~ 3 秒的单镜头,没办法做故事。 3.有水印不能商用。 4.很多地区直接打不开,要等邀请码。 5.电商相关的“产品手持、展示、生活场景”模型不太稳定。
我和几个做 TikTok Shop 的朋友聊之后,他们最头疼的其实不是“模型效果多好”,而是:有没有 干净、可直接用 的视频?能不能一键生成 20 秒以上?产品能不能在不同镜头里保持一致?有没有简单的“产品展示模板”?结果这类需求反而是现有工具最薄弱的地方。因为好奇,我就尝试自己写了一个 demo ,想看看能不能做出一个至少能用的版本: 1.单镜头 10 秒视频 2.简单的多镜头( 25 秒) storyboard 3.图生视频:把商品图转成一个生活类短片 4.尽量不让人物、产品在不同镜头变来变去
期间踩了很多坑,包括: 1.prompt 拆帧会乱跑 2.镜头切换会抖 3.人物肤色、衣服一致性难控制 4.模板难设计(电商场景比想象中复杂) 5.模型挑 prompt ,很“挑食” 不过折腾下来之后,至少能跑起来了。我把它放在 Saro2.ai 这个域名上,算是一个半实验性质的小工具。不是开源的,需要登录(为了防滥用 + 控制算力),不过已经能用。
分享几个让我觉得“AI 视频比想象中更难”的点
因为必须要:真实、不跳帧、不变形、产品不能乱改、不能乱加奇怪东西、模型很容易“发挥创造力”,但商家要的是“不要发挥”。我觉得 AI 视频这个方向会越来越“工具化 / 场景化”,真正好用的工具未必是最强模型,而是最懂商业使用场景的。
有在做 TikTok Shop 、Shopify 商品视频、UGC 、AI 生成视频、视频工具插件、欢迎留言交流下经验。
如果想看看我上面说的那个 demo ,这里:Saro2.ai (一个我自己做的小的实验站)