TheChaos.AI 暑期实习招聘:Fast Inference 工程师( SGLang )
关于我们
TheChaos.AI 是一家北美创业公司,正在构建面向全球社交媒体创作者的 AI 平台。我们拥有全球最大规模的 YouTube 数据库,专注于打造高效低成本的大模型推理系统。
实习内容
我们正在寻找暑期实习生,参与开源大模型(如 Qwen3 、LLaMA4 )在 SGLang 框架上的推理优化,包括: • KV Cache Masking 、Column Switch 等技术 • 多线程高并发推理加速 • 将模型部署成本降低至 1%(和 claude3.7 对比)
我们需要你: • 熟练掌握 SGLang 框架 或能快速上手 • 熟悉 PyTorch ,有一定的性能优化经验 • 对 LLM 系统和推理优化有热情
实习安排 • 时间:2025 年暑期(可远程) • 提供推荐信和核心项目实战经验
联系方式
微信:ai-social-media
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.