批量剪藏的需求, 使用 Obsidian 或者直接爬虫?

41 天前
 SGL
楼主出于某种目的(先不论这个目的合理不...),想要把一个文档网站中的所有文档使用 Web Clipper 全部剪藏到 Obsidian 中去。保存下来的格式是 Markdown 。

至于什么文档网站,可以参考一些官方包,或者工具之类的文档那种网站形式。

但是,手动的一篇一篇点开,然后用 Web Clipper 插件逐个去点击,这个效率太低也太蠢了。

所以,两个问题:
1. Obsidian 使用 Web Clipper 剪藏有没有自动化的批量操作技巧或者方式?
2. 或者,有没有 python 或者其他的爬虫工具能够达成保存一个文档网站的文档为 markdown 的方式的目的。这样保存后直接导入 Obsidian 也是一样的。

python 爬虫我搞过一些比较简单的逻辑去爬取,根本爬不到,我感觉如果想用 python 解决,估计我得投入一部分经历先掌握一下中阶或者高阶爬虫技巧。目前不想投入,想找个无脑一点的方案。
939 次点击
所在节点    问与答
2 条回复
dsg001
41 天前
小量手工,大量爬虫

用 Python Selenium ,不用管渲染问题
VirSnorlax
41 天前
首先,没用过 ob 和 web clipper ;其次,对于批量操作我一般用 rpa 来解决

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1130956

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX