[杭州][阿里巴巴-智能信息] 招聘离线数据系统研发工程师(大模型爬虫方向)

113 天前
 guoyuqi
团队 nice ,发展空间大,业务蓬勃发展

职位描述
1. 参与互联网网页、文档、图片、音视频等境内外内容数据的发现、采集及处理
2. 优化爬虫架构及平台能力,优化 js 渲染性能和效果,提升反爬对抗能力
3. 优化数据处理系统,完善数据标注等平台能力
4. 负责大模型训练语料、RAG 索引等重要数据的交付
职位要求
1. 编程基本功扎实、熟悉常用数据结构和算法,有大规模、分布式数据处理的经验
2. 熟悉网页、文档、图片及音视频处理技术的优先考虑
3. 有浏览器内核开发、爬虫对抗经验的优先考虑
4. 对搜索业务、大模型及相关行业有较深理解的优先考虑

https://talent.quark.cn/off-campus/position-detail?lang=zh&positionId=7000002205


有意请发简历到 robinguo422#gmail.com (# 替换成 @)
1981 次点击
所在节点    酷工作
5 条回复
lasuar
113 天前
这爬虫 JD 写的好斯文啊,是不是大模型优化过的。
guoyuqi
113 天前
@lasuar 还好吧,官网的 jd 不得正式点
guoyuqi
110 天前
夸克是阿里现在全力发展的业务,前进广大,hc 还有 2 周截止,不要错过
maxwel1
110 天前
这么巧
guoyuqi
101 天前
https://mp.weixin.qq.com/s/ZrTl_ECtlsUz-Ud8neRTSg 《夸克 AI 超级框,掀起一场交互变革

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1118471

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX