V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 外包信息请发到 /go/outsourcing 节点。
• 不要把相同的信息发到不同的节点
aoeiwy
V2EX  ›  酷工作

[招聘] [常德] 爬虫工程师

  •  
  •   aoeiwy · 8 天前 · 1859 次点击

    招聘爬虫工程师

    • 帮同学发个招聘信息,感兴趣的朋友可以联系我同学。wx:MzkwNTI0MDAy 。
    • 前期可以线上聊。公司有提供宿舍。

    职位描述:

    1. 根据产品需求,负责功能模块设计,编码及单元测试,按时保质保量完成任务;
    2. 系统开发基础资源框架的不断升级完善及组件积累;
    3. 系统日常维护,优化改进,确保已上线系统运行稳定可靠;
    4. 领导交办的其他工作。

    任职要求:

    1. 实际爬虫工作 2-3 年以上,熟悉 TCP/IP 、HTTP 、HTTPS 等网络协议,熟悉 web 前端,可读懂 is/css/html 等代码;
    2. 熟练使用 Python 语言,熟悉常用爬虫框架如 Scrapy 等。熟悉反爬虫技术及破解方法;
    3. 熟练使用 selenium ,lxml.bs4 。对 xml ,html 的文本进行抓取解析清理;
    4. 熟悉 MySql/PostgreSQL/MongoDB/Redis 等常用数据库或缓存的一种,掌握 Java 、scala 语言优先考虑;
    5. 熟悉高并发、高性能的分布式系统的设计及应用对管理网站的 cookie 实效性处理有经验;熟悉 hdfs 各种大数据技术优先。
    第 1 条附言  ·  8 天前
    抱歉。更新下原先的 JD 。

    职位描述
    1. 根据产品需求,负责功能模块设计,编码及单元测试,按时保质保量完成任务;
    2. 系统开发基础资源框架的不断升级完善及组件积累;
    3. 系统日常维护,优化改进,确保已上线系统运行稳定可靠;
    4. 领导交办的其他工作。

    任职要求:
    1. 实际爬虫工作 3 年以上,熟悉 TCP/IP 、HTTP 、HTTPS 等网络协议,熟悉 web 前端,可读懂 js/css/html 等代码;
    2. 熟练使用 Python 语言,熟悉常用爬虫框架如 Scrapy 等。熟悉反爬虫技术及破解方法;
    3. 熟练使用 selenium ,lxml.bs4 对 xml ,html 的文本进行抓取解析清理;
    4. 熟悉 MySql/PostgreSQL/MongoDB/Redis 等常用数据库或缓存的一种。
    6 条回复    2025-08-14 20:20:46 +08:00
    yangfan1999
        1
    yangfan1999  
       8 天前
    少见有常德的工作机会,薪资范围怎样?
    aoeiwy
        2
    aoeiwy  
    OP
       8 天前 via iPhone
    @yangfan1999 哈哈哈。是啊。薪资可以具体聊。感兴趣的话可以联系这个 wx:MzkwNTI0MDAy 聊下哈
    wuxidixi
        3
    wuxidixi  
       8 天前
    不是 js 么
    SanYuan
        4
    SanYuan  
       8 天前
    打错了个 is --> js
    是做灰的么?
    aoeiwy
        5
    aoeiwy  
    OP
       8 天前
    @wuxidixi 是的。抱歉。打错了。我更新下 JD 。
    aoeiwy
        6
    aoeiwy  
    OP
       8 天前
    @SanYuan 打错了。抱歉。不是做灰的。具体做什么可以私聊。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2544 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 12:52 · PVG 20:52 · LAX 05:52 · JFK 08:52
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.