[只读]把去掉视觉信息也不影响其内容的视频转换为文字

5 天前
 hertzry

灵感

逆流 —— 在 AI 加持的信息过载时代进行自媒体探索

原本只需要瞥一眼就能获得的信息,现在要耗费大量时间与能量才能获得;彼此毫不相干的视觉、听觉与文字信息对感官的狂轰滥炸,在神经系统中引发了回荡不息的噪声。

单纯是为了获得观点,看一个 50 分钟长视频的时间,足够搜索并概览数万字论文或略读一本科普类的实体书了。

思考

B 站大学的确能学到知识,在看了一些科普类视频后,我又想起几个月前看的这篇文章。有一些视频,假如只听声音,也不影响其中的观点和数据,尽管他们真的花费很大力气做花哨的动画和图表。在此基础上,如果一直跟着他们声音走,就很难停下来思考,特别是口播几乎没有停顿和间歇,基本都是从开头说到结尾,“看完”了也忘完了。

还有谈话节目,就是两个人坐在那里聊天,似乎真的不需要用眼睛去看。由此想到了电影,大部分说台词的时间并不多,主要还是用眼睛去看,有一些停顿来营造情绪和气氛。如果一部电影从头说到尾,那大概就是几万字详解 xx 电影了。

做一个小玩具

我把赛博食录的视频链接用爬虫(稍作修改),然后用 yt-dlp 下载分离出音频,最后用 openai-whsiper 转写成文字。虽然有些错误和标点加不上,但是整体不影响阅读。 用 ai 写了一个简单的页面,暂时只放了几个,目前还很粗糙。

https://keiwo.github.io/readonly/

如果有大家想"读”视频,可以发他们的名字,我抽空会添加进来。

780 次点击
所在节点    分享创造
4 条回复
nah
5 天前
可以直接下载字幕吗?那不是更方便。
okzy520
4 天前
有用 收藏了 回去翻翻 b 站关注列表
hertzry
4 天前
@nah 下载字幕要登录,而且有的字幕也是 Ai 生成的。
kenanyah
4 天前
还有一个提议,可以把获取的对应的文字结合 ai 生成可读性更强的文本

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1179787

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX