1 
                    
                    superrichman      2022-09-21 12:33:43 +08:00 via Android    首先考虑刑法 
                 | 
            
     2 
                    
                    azev   OP @superrichman 给你一个赞 
                 | 
            
     3 
                    
                    kera0a      2022-09-21 12:43:52 +08:00 
                    
                    不是海量数据+海量代理 IP ,没必要考虑并发问题。 
                我爬过的大站点都有频率限制,小站点扛不住并发,基本没条件去高并发爬。  | 
            
     4 
                    
                    herozzm      2022-09-21 12:56:31 +08:00 
                    
                    首先考虑的是 ip 库,爬虫很容易被封 ip 的 
                 | 
            
     5 
                    
                    picone      2022-09-21 13:05:26 +08:00 
                    
                    看瓶颈在哪。如果爬取的数据没有时效性,慢慢爬就行了 
                 | 
            
     6 
                    
                    xiao109      2022-09-21 13:26:11 +08:00 
                    
                    首先考虑可以爬,像 mvnrepository.com 这种站点你连第一步都展开不了 
                 | 
            
     7 
                    
                    gumupaier      2022-09-21 17:28:09 +08:00 
                    
                    首先考虑如何进去 
                 | 
            
     8 
                    
                    lyang      2022-09-21 17:30:08 +08:00 
                    
                    我看刑 
                 | 
            
     9 
                    
                    gezimonkey      2022-09-21 17:32:36 +08:00 
                    
                    首先考虑不被抓 
                 | 
            
     10 
                    
                    IvanLi127      2022-09-21 17:44:59 +08:00 
                    
                    首先考虑如何不影响对方业务,避免变成攻击行为。。。。 
                 | 
            
     11 
                    
                    abc0123xyz      2022-09-22 09:17:37 +08:00 
                    
                    考虑蹬缝纫机 
                 |