职位类型:全职 | 工作地点:远程( Remote )
我们致力于为 AI Agent, 交易 BOT 、量化团队及所有有链上数据需求的团队提供深度数据洞察,推动行业智能化发展。
技能职责:后端业务数据处理与开发:基于业务需求,设计并开发高可用、高性能的数据处理与机器学习工程模块,聚焦机器学习驱动的钱包标签识别场景(机构钱包 / 聪明钱 / 巨鲸钱包 / 风险钱包 / Scammer 钱包等),负责标签相关特征工程、模型训练数据 pipeline 构建,实现标签数据的高效统计、模型驱动的动态更新,支撑链上数据分析平台的核心功能。 跨团队协同:联动产品、前端及算法团队,对齐钱包标签识别的机器学习目标(如模型准确率、召回率优化),收集业务反馈迭代模型落地方案,确保机器学习技术实现与产品路线图、业务价值一致。
理想人选:
核心技术能力:精通 python/Go/JS 等开发语言,具备钱包标签识别系统开发经验;
具备扎实的机器学习基础,熟悉标签识别相关算法(如分类算法、聚类算法、时序分析、异常检测等),能熟练使用特征工程工具( Pandas 、PySpark )、机器学习框架( TensorFlow/PyTorch )及模型部署工具( ONNX 、TensorRT );
能独立完成 “数据清洗 - 特征提取 - 模型训练 - 评估迭代 - 工程化部署” 全流程,具备机器学习模型在高并发场景下的落地经验。
过往业务经验需符合以下至少 1 项要求:
( 1 )主导过机构钱包标签库建设,能通过链下数据关联、链上行为特征工程,结合机器学习模型(如分类算法)优化标签精准分类;
( 2 )具备通过过往交易行为分析聪明钱 / 巨鲸钱包的经验,能基于大额交易、持仓变化等数据构建特征,通过时序分析、聚类算法实现目标钱包识别与标签体系构建;
( 3 )有风险钱包标签体系设计经验,熟悉洗钱、钓鱼等风险场景,能结合机器学习规则引擎(如 Spark MLlib )开发动态风险模型,优化标签定义与规则迭代;
( 4 )参与过 Scammer 钱包识别系统搭建,能基于交易行为、地址关联等数据构建特征,通过监督 / 半监督学习构建识别模型,迭代优化模型效果(如召回率、误判率)。
容器化与部署能力:熟练使用 Docker Compose/K8s 进行容器化部署(含机器学习模型服务化部署,如 TensorFlow Serving 、TorchServe )与集群管理,精通 CI/CD 流程,具备机器学习中间件(如 MLflow )的自动化部署及故障处理能力,支撑高并发标签数据处理与模型推理场景。
联系方式: TG: @Ryan_ie