(纯吐槽)微信读书网页版为啥要做加密啊

180 天前
 SingeeKing
我知道是为了防盗版,但是 epub / pdf 满天飞的情况下,真的会有人去费力不讨好爬微信读书网页版吗,退一步就算想从微信网页版去获得书籍源文件,也应该不至于去模拟人工一页页爬吧,JS 逆向或者从网络包分析应该更合理啊

但是这个加密就让想用/写个插件的我很难受了;各种划词工具用不了,最近想写个 AI Research 工具也无解……
3173 次点击
所在节点    阅读
16 条回复
Cheons
180 天前

我很疑惑
Kite6
180 天前
如果它不加密,马上就有人爬(正版肯定校对过,和满天飞的盗版质量还是不一样的)。对比一下番茄小说,一样加密。
SingeeKing
180 天前
@Kite6 可是电子书这东西和小说不一样哇,就算爬下来了真的有人会去看 txt 格式的电子书吗…
SingeeKing
180 天前
至少我觉得我肯定会在扫描版本 pdf 和盗版 txt 二者中选择前者
mooyo
180 天前
微信读书上还有很多连载网文。。。
ZztGqk
180 天前
换个思路,你也用 ocr ,这样有些没选中态的地方也可以用你的划词工具
cxtrinityy
180 天前
暴露年龄系列,起点纵横 17k 刚建站那会儿,大家不都看的 txt ?盗版网文站现在还留着 txt 下载按钮呢,虽然没啥用
passive
180 天前
小说除了红楼梦我一直都看 txt 。

专业书有数学公式和插图,才看 pdf 。
ysc3839
180 天前
有的。比如 Google Play 有些图书是不给下载 epub 的,从网页版中就能很容易地获取内容。
ysc3839
180 天前
@SingeeKing 大部分电子书又不需要排版,只需要拿到文本就行了。而且纯文本的 txt 也可以转成 epub ,epub 就是 zip 打包 html 。
Vegetables
180 天前
我和 5 楼的意见一致去,感觉还是主要为了连载网文防盗,现在看网文订阅太贵了
fpk5
180 天前
@SingeeKing #3 超过一定长度的小说还真是 txt 的适应性最好,epub 放在有的设备上打开就卡死。网络小说我一直都是 txt 。
shiji
180 天前
你太小瞧爬虫佬了。 他们连接近于垃圾的信息都要爬一爬,何况是书
lpe234
180 天前
京东阅读也有。之前研究过 web 版,解密相当简单,甚至 JS 文件里面还有注释...
macaodoll
180 天前
为什么要加密,肯定是为了反爬虫,另外为什么要反爬虫,不光是为了保护他的电子书,更多的是防止别的,比如拿微信读书当公众号文章抓取
yidev
179 天前
你不爬!=别人不爬

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1108785

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX