人事经理 {{contactData.contact_info.contact}} 近半年活跃
小米联系人: {{contactData.contact_info.contact}}
联系手机: {{contactData.contact_info.mobile}}
联系手机: 企业已隐藏当前手机号
联系座机: {{contactData.contact_info.telephone}}
联系微信: {{contactData.contact_info.weixin}}
联系邮箱: {{contactData.contact_info.email}}
联系QQ: {{contactData.contact_info.qq}}
职位联系方式仅对求职者会员开放,请登录查看,联系我时,请说是在米聘人才网上看到的,谢谢!
联系人: {{contactData.contact_info.contact}}
联系手机: {{contactData.contact_info.mobile}}
联系手机: 企业已隐藏当前手机号
联系座机: {{contactData.contact_info.telephone}}
联系微信: {{contactData.contact_info.weixin}}
联系邮箱: {{contactData.contact_info.email}}
联系QQ: {{contactData.contact_info.qq}}
您还没有简历,创建简历后可查看企业联系方式,联系我时,请说是在米聘人才网上看到的,谢谢!
联系人: {{contactData.contact_info.contact}}
联系手机: {{contactData.contact_info.mobile}}
联系手机: 企业已隐藏当前手机号
联系座机: {{contactData.contact_info.telephone}}
联系微信: {{contactData.contact_info.weixin}}
联系邮箱: {{contactData.contact_info.email}}
联系QQ: {{contactData.contact_info.qq}}
企业要求 投递简历后才可查看联系方式,联系我时,请说是在米聘人才网上看到的,谢谢!
联系人: {{contactData.contact_info.contact}}
联系手机: {{contactData.contact_info.mobile}}
联系手机: 企业已隐藏当前手机号
联系座机: {{contactData.contact_info.telephone}}
联系微信: {{contactData.contact_info.weixin}}
联系邮箱: {{contactData.contact_info.email}}
联系QQ: {{contactData.contact_info.qq}}
企业未开启查看联系方式,请直接投递简历,联系我时,请说是在米聘人才网上看到的,谢谢!
企业未开启查看联系方式。您已投递简历,请等待企业联系,联系我时,请说是在米聘人才网上看到的,谢谢!
人事经理 {{contactData.contact_info.contact}} 近半年活跃
小米联系人: {{contactData.contact_info.contact}}
联系手机: {{contactData.contact_info.mobile}}
联系手机: 企业已隐藏当前手机号
联系座机: {{contactData.contact_info.telephone}}
联系微信: {{contactData.contact_info.weixin}}
联系邮箱: {{contactData.contact_info.email}}
联系QQ: {{contactData.contact_info.qq}}
联系人: {{contactData.contact_info.contact}}
联系手机: {{contactData.contact_info.mobile}}
联系手机: 企业已隐藏当前手机号
联系座机: {{contactData.contact_info.telephone}}
联系微信: {{contactData.contact_info.weixin}}
联系邮箱: {{contactData.contact_info.email}}
联系QQ: {{contactData.contact_info.qq}}
职位描述 我们正在寻找经验丰富、技术卓越的大模型训练与推理基础设施工程师,负责构建和优化支持大规模深度学习模型的高效计算和部署平台。此职位将深入参与分布式计算、模型优化、推理加速等核心领域,为前沿 AI 模型的开发和落地提供强大的技术支持。 主要职责 1. 模型训练基础设施开发 - 设计和实现支持大规模分布式训练的计算平台,优化模型训练效率和资源利用率。 - 维护和扩展现有的分布式训练框架,确保平台的高性能和稳定性(如基于 PyTorch、TensorFlow 或 JAX)。 - 集成和优化高性能计算技术(如 CUDA、MPI、NCCL 等)。 2. 模型推理基础设施开发 - 构建高效的推理框架,支持大模型的在线和离线推理需求。 - 优化推理速度、内存占用和能耗,支持多种硬件架构(GPU、NPU等 )。 - 实现PD分离、Context Caching、模型量化、推敲编码等推理优化技术。 3. 性能监控与优化 - 开发工具链和监控系统,跟踪训练与推理过程的性能瓶颈。 - 分析并优化数据加载、通信效率和硬件利用率等关键环节。 4. 跨团队协作 - 与模型研究团队密切合作,理解模型需求,定制训练和推理策略。 - 支持产品团队的模型部署需求,推动大模型在实际场景中的落地应用。 职位要求 基本要求: - 计算机科学、软件工程、机器学习或相关领域的本科及以上学历 - 深入理解深度学习原理和分布式训练框架(如 Horovod、DeepSpeed、Ray 等)。 - 熟练掌握至少一种主流深度学习框架(如 PyTorch、TensorFlow 或 JAX)。 - 熟悉高性能计算技术(CUDA、NCCL、cuDNN 等)及硬件架构(GPU、NPU 等)。 - 具有扎实的编程能力,精通 Python 和至少一种系统级编程语言(如 C++)。 优先条件: - 有参与或主导过大规模模型(如 Transformer、大语言模型)的训练和部署经验。 - 熟悉模型优化技术(如混合精度训练、剪枝、量化等)。 - 对云计算和容器化技术(如 Kubernetes、Docker、Terraform)有实际经验。 - 对新兴 AI 硬件(如 H卡)有实操经验。 - 具备优秀的系统设计和性能调优能力。
求职过程请勿缴纳费用,谨防诈骗!如遇无效、虚假、诈骗信息,请 立即举报