我让 GLM 看了 3 分钟录屏,它直接生成了可运行的原型!

14 天前
 terryso
我在 Clude Code 下面使用 GLM 已经有一段时间了, 但有一个功能一直没用过, 就是视频分析功能。今天有一个群友告诉我说 GLM 模型有视频分析能力。突然来了灵感, 如果我打开一个 App, 然后录屏, 是不是就可以......

说干就干... 就拿 #小红书 练练手吧
这是小红书的录屏:

<amp-vimeo data-videoid="1134828102" layout="responsive" width="16" height="9"></amp-vimeo>
这是制作出来的原型, 虽说还原度还不算太高, 但布局基本准确:

<amp-vimeo data-videoid="1134828115" layout="responsive" width="16" height="9"></amp-vimeo>
这是在 Claude Code 下使用 GLM4.6 模型制作的过程:

<amp-vimeo data-videoid="1134828139" layout="responsive" width="16" height="9"></amp-vimeo>
补充说明: GLM4.6 的这个视频分析能力是需要订阅 GLM 的 PRO 帐号下才能使用, 目前订阅费用比较便宜, 一个季度只需 300 元.
使用我的邀请链接还能再便宜 10%: https://www.bigmodel.cn/claude-code?ic=TVUZHTWCW9
1836 次点击
所在节点    分享发现
10 条回复
evan9527
14 天前
大佬,金钻是什么东西?第一次见
duuu
14 天前
视频分析能力是 api 还是?
terryso
14 天前
@duuu 视频分析 MCP, 但要有订阅号才能用
terryso
14 天前
@evan9527 金钻是质押 V2EX 币才有的
sillydaddy
14 天前
这个用法很有意思,它让我想起之前的一个想法:

我用一个原型工具快速制作一个原型,手动演示一遍,录成视频,然后输入给编程 Agent ,是不是可以用来作为自动验证的条件!这种约束,比文字描述要更准确直观,而且更接近自己想要的东西,而且对 Agent 始终是一个非常准确的约束和反馈,Agent 每次修改代码后,都可以拿它来检查,就像它现在每次修改代码后,就进行语法检查一样。
terryso
14 天前
是的, 有时候视频是比较文字和截图描述更精准.
视频的演示能清晰指示页面之间的跳转关系, 甚至能包括一些动画效果.
不过目前它只能分析最大 8M 的视频, 需要做压缩或者提取关键帧做分析.
我试过将 64M 的视频有损压缩到 2M, 它还是能比较准确的识别
VoiceEXONE
14 天前
算是具像化的 POC 到 MVP 过程,传统常规的套路可变性会高一些,这种 one by one 也就是基本定型的一种范式
terryso
14 天前
@VoiceEXONE 可以先抄, 把基本功能交互定下来, 再让 agent 调, 不过这是没有设计师辅助的情况下, 个人可以省很多事.

如果有设计辅助, 可以设计师先出原型, 录视频再快速 demo. 比传一堆截图要快不少.
avenger
14 天前
本地用 GLM 配合 cc 试了下,改 Next.js 确实很快,感谢推荐
terryso
14 天前
@avenger 一天一个偷懒的技巧😎

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1171408

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX