在抓取京东的评论的时候,会经常出现截断
比如http://
club.jd.com/review/851542-0-2-0.html用scrapy shell "
http://club.jd.com/review/851542-0-2-0.html"
查看response.body时发现被奇怪地截断了,而用wget网页下来是没问题的,应该不会是被反爬虫了
在此,求解。。。。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://ex.noerr.eu.org/t/67842
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.