最近折腾了一个 AI 生成 UGC 视频 的小工具。 目标很简单:输入一句话 / 一段语音 / 一张图片,就能生成类似 TikTok 、小红书那种“真人出镜讲解”的短视频。
工具地址 👉 https://aivideomaker.ai/ai-ugc
下面简单分享下实际效果和技术实现。
🎬 实际使用效果(简短说明)
30 秒内视频效果最好:口型、表情、动作都比较自然
语音驱动效果最真实:根据语速、情绪自动带动作
英文比中文更稳定(特别是口型同步)
最长支持 3 分钟:需要跑一小时,小细节的一致性还需要继续优化
🧩 简单技术细节(轻量版)
⚡ 性能表现(单卡 RTX 6000 Pro )
30 秒视频:8 分钟生成
60 秒视频:15 分钟
3 分钟视频:一个小时,暂时禁用了,等做完多卡并行优化再打开
🧪 为什么做这个?
身边做电商、跑广告的朋友经常说:
“写脚本很快,但拍视频太慢了。”
于是就试着用闲置 GPU ,把“拍视频”这件事自动化一下。
如果你对 AI 视频生成、数字人、口型同步、长视频渲染这类方向感兴趣,也欢迎讨论。我还在持续优化中 🙌
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.