
人事经理 {{contactData.contact_info.contact}} 近半年活跃
马上消费联系人: {{contactData.contact_info.contact}}
联系手机: {{contactData.contact_info.mobile}}
联系手机: 企业已隐藏当前手机号
联系座机: {{contactData.contact_info.telephone}}
联系微信: {{contactData.contact_info.weixin}}
联系邮箱: {{contactData.contact_info.email}}
联系QQ: {{contactData.contact_info.qq}}
职位联系方式仅对求职者会员开放,请登录查看,联系我时,请说是在米聘人才网上看到的,谢谢!
联系人: {{contactData.contact_info.contact}}
联系手机: {{contactData.contact_info.mobile}}
联系手机: 企业已隐藏当前手机号
联系座机: {{contactData.contact_info.telephone}}
联系微信: {{contactData.contact_info.weixin}}
联系邮箱: {{contactData.contact_info.email}}
联系QQ: {{contactData.contact_info.qq}}
您还没有简历,创建简历后可查看企业联系方式,联系我时,请说是在米聘人才网上看到的,谢谢!
联系人: {{contactData.contact_info.contact}}
联系手机: {{contactData.contact_info.mobile}}
联系手机: 企业已隐藏当前手机号
联系座机: {{contactData.contact_info.telephone}}
联系微信: {{contactData.contact_info.weixin}}
联系邮箱: {{contactData.contact_info.email}}
联系QQ: {{contactData.contact_info.qq}}
企业要求 投递简历后才可查看联系方式,联系我时,请说是在米聘人才网上看到的,谢谢!
联系人: {{contactData.contact_info.contact}}
联系手机: {{contactData.contact_info.mobile}}
联系手机: 企业已隐藏当前手机号
联系座机: {{contactData.contact_info.telephone}}
联系微信: {{contactData.contact_info.weixin}}
联系邮箱: {{contactData.contact_info.email}}
联系QQ: {{contactData.contact_info.qq}}
企业未开启查看联系方式,请直接投递简历,联系我时,请说是在米聘人才网上看到的,谢谢!
企业未开启查看联系方式。您已投递简历,请等待企业联系,联系我时,请说是在米聘人才网上看到的,谢谢!

人事经理 {{contactData.contact_info.contact}} 近半年活跃
马上消费联系人: {{contactData.contact_info.contact}}
联系手机: {{contactData.contact_info.mobile}}
联系手机: 企业已隐藏当前手机号
联系座机: {{contactData.contact_info.telephone}}
联系微信: {{contactData.contact_info.weixin}}
联系邮箱: {{contactData.contact_info.email}}
联系QQ: {{contactData.contact_info.qq}}
联系人: {{contactData.contact_info.contact}}
联系手机: {{contactData.contact_info.mobile}}
联系手机: 企业已隐藏当前手机号
联系座机: {{contactData.contact_info.telephone}}
联系微信: {{contactData.contact_info.weixin}}
联系邮箱: {{contactData.contact_info.email}}
联系QQ: {{contactData.contact_info.qq}}
岗位职责 1. 负责大规模模型分布式训练优化,设计NCCL通信优化方案及GPU Kernel级算子加速,提升多机多卡场景下的训练效率。 2. 开发推理加速技术栈,主导模型压缩(如剪枝、量化)、动态批处理及推测解码技术研究,优化端到端推理性能。 3. 参与国产化加速卡适配,开发兼容CUDA生态的算子库及自动化迁移工具链。 4. 参与前沿算法架构设计与创新(如混合并行策略、动态路由机制),推动算法原型到工程落地的验证。 5. 构建GPU资源效能评估体系,设计算力利用率、显存碎片率等核心指标的监控与优化方案。 任职资格 1. 计算机、电子工程或数学相关专业本科及以上学历,3年以上深度学习算法优化经验。 2. 熟悉GPU计算架构及CUDA编程,掌握分布式训练框架(如DeepSpeed、PyTorch Distributed),有NCCL通信优化经验。 3. 掌握模型量化压缩技术(INT8/FP16混合精度)及推理加速框架(TensorRT/ONNX Runtime),具备端到端优化能力。 4. 熟悉国产加速卡开发环境(如昇腾CANN/寒武纪MLU),有CUDA算子迁移或适配经验。 5. 扎实的编程基础(Python/C++),熟悉数据结构与算法设计,具备团队协作和复杂问题拆解能力。"
工作地址:成都马上消费金融绿地之窗房天下大厦1栋8层 求职过程请勿缴纳费用,谨防诈骗!如遇无效、虚假、诈骗信息,请 立即举报
