[杭州][阿里][智能信息] 招聘离线数据系统研发工程师(大模型爬虫方向)

84 天前
 guoyuqi

团队 nice ,发展空间大,业务蓬勃发展

职位描述

  1. 参与互联网网页、文档、图片、音视频等境内外内容数据的发现、采集及处理
  2. 优化爬虫架构及平台能力,优化 js 渲染性能和效果,提升反爬对抗能力
  3. 优化数据处理系统,完善数据标注等平台能力
  4. 负责大模型训练语料、RAG 索引等重要数据的交付 职位要求
  5. 编程基本功扎实、熟悉常用数据结构和算法,有大规模、分布式数据处理的经验
  6. 熟悉网页、文档、图片及音视频处理技术的优先考虑
  7. 有浏览器内核开发、爬虫对抗经验的优先考虑
  8. 对搜索业务、大模型及相关行业有较深理解的优先考虑

职位链接: https://talent.quark.cn/off-campus/position-detail?lang=zh&positionId=7000002205

有意请发简历到 robinguo422#gmail.com (# 替换成 @)

1560 次点击
所在节点    酷工作
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1124679

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX