求问各位大佬们, [AI 总结视频内容] 这方面发展到哪一步了?

52 天前
 realzzz

比如给一个旅游攻略视频/游戏讲解视频等,可以输出总结性的文字内容吗?

789 次点击
所在节点    问与答
4 条回复
lifei6671
52 天前
感觉应该是提取视频音轨,调用声音转文字工具,再把文字扔给大模型进行总结吧。
不知道现在有没有直接识别视频的大模型。
realzzz
52 天前
@lifei6671 这样的话,对于一些关键信的息帧(比如视频里也有一些总结的文字)是不是会容易忽略
lifei6671
52 天前
@realzzz 如果你说的是视频本身画面里的文字确实会丢掉。但是一帧一帧的解析画面的话,那 token 消耗的是天量呀。
realzzz
52 天前
@lifei6671 确实~

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1170259

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX