自己有一个小爬虫网站 ( http://learnbyreading.herokuapp.com/)
但感觉 Amazon 的数据太难爬了,容易被封
所以,有没有可能把爬虫的一部分写到客户端,通过用户的浏览器去爬,然后返回一部分数据给我,这样我就不用去买 IP 了。。。。。
     1 
                    
                    chwhsen      2018-12-18 23:09:51 +08:00 
                    
                    木马爬虫? 
                 | 
            
     2 
                    
                    chengxiao      2018-12-18 23:12:55 +08:00 
                    
                    兄弟 你这个跟肉鸡有什么区别? 
                哪天 high 了 一波 DDOS 带走~  | 
            
     3 
                    
                    kruskal      2018-12-18 23:18:29 +08:00 
                    
                    醒醒,把用户当肉鸡是违法行为 
                 | 
            
     4 
                    
                    freed      2018-12-18 23:18:47 +08:00 
                    
                    你能做到这个肯定有比较大的控制权限了,还靠他来爬东西? 
                啥时候开始了告诉一声啊.我看看有没有达到量刑标准,要判几年  | 
            
     5 
                    
                    cqcn1991   OP  | 
            
     6 
                    
                    orangeade      2018-12-18 23:43:40 +08:00 
                    
                    不如先爬免费的 IP 代理池 
                 | 
            
     7 
                    
                    gamexg      2018-12-18 23:51:03 +08:00 
                    
                    感觉比价插件是一个很好的分布式爬虫。 
                用户打开商品页面显示价格历史时自动将商品当前价格上传。  | 
            
     8 
                    
                    t6attack      2018-12-18 23:52:37 +08:00 
                    
                    浏览器的 跨域限制 就是针对你的。 
                 | 
            
     9 
                    
                    Trim21      2018-12-18 23:56:39 +08:00 
                    
                    你想问的是无头浏览器吗, 还是真的像楼上说的那样想用某些正常用户的浏览器爬数据 
                 | 
            
     10 
                    
                    westoy      2018-12-18 23:57:07 +08:00 
                    
                    不可能, 但是可以让用户通过类似 yahoo YQL 的方法给你提供数据, 问题是验证数据真实性的成本可能比多搞一个 IP 池高...... 
                 | 
            
     11 
                    
                    freed      2018-12-19 00:08:11 +08:00 
                    
                    @gamexg 不一样,比价插件是用户自己打开某些网页读取到了数据的,楼主是想控制用户打开他指定的网页爬取数据再回传给服务器.. 
                 | 
            
     12 
                    
                    akafeng      2018-12-19 00:10:08 +08:00 via iPhone 
                    
                    楼主大概需要什么量级的代理池呢? 
                 | 
            
     13 
                    
                    agdhole      2018-12-19 01:03:00 +08:00 
                    
                    京价保插件不就是这个原理吗 
                 | 
            
     14 
                    
                    onedayoneapple      2018-12-19 07:02:52 +08:00 via iPhone 
                    
                    @orangeade 这个怎么爬 
                 | 
            
     16 
                    
                    wly19960911      2018-12-19 08:25:31 +08:00 via Android 
                    
                    js 的话浏览器跨域怎么解决 
                 | 
            
     17 
                    
                    woshipanghu      2018-12-19 09:03:04 +08:00 
                    
                    electron nightmare  你去看看 可能是你要的  
                没什么浏览器跨域的问题,直接往页面里面注入你的 js 都行  | 
            
     18 
                    
                    zhchyu999      2018-12-19 09:30:21 +08:00 
                    
                    有 refer 的 
                 | 
            
     20 
                    
                    boweixiaobang      2019-08-08 14:53:36 +08:00 
                    
                    小帮软件机器人,是做客户端软件数据的自动采集和写入的。 
                CS 的采集和写入小帮都有优势。  |