请问市场上有无博文快照的产品

17 天前
 hellodigua

最近没事干的时候会看一下自己网页收藏夹中收藏的历史文章,然后悲哀的发现好多文章都消失了:

  1. 有些博主不再续费域名,博文永久失踪了,即使靠 Google 也找不到原文
  2. 有些平台上的文章被博主设为了不可见了
  3. 有些文章被平台因为版权或其他原因删除了

简而言之,目前遇到的困境就是很多文章类的网址收藏是不受控的,因此希望询问有无大厂开发的,或者稳定运行的,能快照文章内容的产品,或者有类似的可以自建一套比较方便使用的收藏方案

请教一下万能的 V 友

805 次点击
所在节点    互联网
20 条回复
cat
17 天前
https://web.archive.org/
不确定收录规则是啥,但我那常年 1ip 的博客也收录了
早到 2006 年我做的论坛在上面还能看到
hellodigua
17 天前
@cat 这个确实是保底的方案,主要是国内好多大平台的不让 web archive 检索,就导致在互联网上基本失踪了

其实更希望是有可以自己直接收藏内容的方案的,这样感觉更稳妥一些
processzzp
17 天前
hellodigua
17 天前
@processzzp 谢谢兄弟,这个可以有,它看起来是把所有图片 base64 化了,也不失为一种粗暴的方案吧,但是真的能解决问题
MajestySolor
17 天前
好文章直接存到 obsidian 里面,配套的浏览器扩展可以方便的快照页面
dimlau
17 天前
如果常年使用同一个 RSS 阅读器,里面应该是有历史文章保存的。
hellodigua
17 天前
@dimlau RSS 只能解决部分支持 RSS 的系统的问题,但中文互联网现在大量的内容都比较割裂,都在各自的平台上,包含了帖子、文章、讨论等等,实际上是需要一个统一的方案
hellodigua
17 天前
@MajestySolor 这也是一个不错的方案,对文本类友好
MFWT
17 天前
我用的是浏览器扩展 SingleFile ,不过不是自动保存,相当于是点击触发后给当前页面拍快照,输出单个 HTML 文件
Livid
17 天前
huangshu
17 天前
自建 freshrss 抓去 rss 保存收录,但是对方如果不提供 feed ,那么你也没有办法,除非你强行解析采集,强采就违背 robots 和 feed 协议了。
Tink
17 天前
https://github.com/goxofy/web_clipper

推一下自己的项目,用过的都说好
Tink
17 天前
@Tink 借助于 singlefile ,能实现网页完美 1:1 保存
Tink
17 天前
bsder
17 天前
@Tink 有 docker image 吗?
Tink
17 天前
@bsder 我记得有个 fork 的哥们做了个 image ,你看一下
hellodigua
17 天前
@Livid 很不错!可以按照自己的需求高度自定义
hellodigua
17 天前
@Tink 适合用 notion 的配套使用,我打算自建一套本地化方案
Tink
17 天前
@hellodigua notion 这块可以自己 diy ,不一定非要用它
xljya
17 天前
@processzzp 好像不能快照 V2EX ,小图标格式都失效了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1152694

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX