首页 > 成都 全职 > 职位详细
说明:

此信息由前程无忧(51JOB)审核并发布(查看原发布网址),应届生求职网转载该信息只是出于传递更多就业招聘信息,促进大学生就业的目的。如您对此转载信息有疑义,请与原信息发布者前程无忧(51JOB)核实,并请同时联系本站处理该转载信息。

[成都]摩尔线程智能科技(成都)有限责任公司

职位:机器学习平台开发工程师
发布时间:2025-02-22
工作地点:成都
信息来源:前程无忧(51JOB)
职位类型:全职
职位描述
职能类别:管理培训生
岗位职责:
欢迎加入摩尔线程KuaE SW组,我们专注于大模型在 KuaE GPU 集群的分布式训练稳定性及可观测性,通过构建领先的分布式训练体系,支持万卡规模大模型训练,为国产大模型的发展助力。加入我们,一起探索技术的无限可能!
1. 大规模分布式训练稳定性策略开发及调试。
2. 大规模分布式训练可观测体系的开发及优化。
3. 大模型训练的接入及开发。
4. 提供远程或现场的技术支持,解决客户在进行大规模分布式训练中遇到的技术问题。
5. 编写和维护技术文档,包括故障排除指南、用户手册和***实践。
6.调研业界最新的分布式训练技术及方案。
7. 深度参与研发产品特性开发,为研发产品支持新特性。

任职要求:
1、 计算机科学、电子工程或相关领域的本科及以上学历。
2、良好的逻辑思维能力,精通计算机数据结构和算法;
3、熟悉至少一种编程语言,如GoLang、Python等。
4、熟悉云原生体系,对 Kubernetes,Docker ,Containerd 有一定的了解及使用经验。
5、 熟悉大模型训练,对当前最新大模型如Llama、Qwen、ChatGLM 等有一定的了解,***是做过大模型相关的训练。
6、 至少有一种机器学习框架使用或者开发经验,如PyTorch、Megatron-LM、DeepSpeed、PaddlePadde、Colossal-AI 等。
7、 对大规模分布式训练技术感兴趣,期待做有挑战性的事情;有 owner 意识,具备团队合作的能力。 公司简要介绍:
公司名称:摩尔线程智能科技(成都)有限责任公司
公司类型:民营公司
公司介绍:摩尔线程,从GPU基础科技出发,致力于构建领先的中国自主计算平台,加速图形和视觉计算,人工智能,高性能计算等前沿科技研究和应用;拥有世界级水平GPU专家和成熟软硬件研发团队,砥砺前行,为中国黄金时代的科学家,艺术家和建设者,构造基础核心算力和工具。在伟大事业的征途上,也希望为中国培养新一代的科技人才。热切欢迎有志之士的加入。

登录打开APP 查看全部

上一条:[成都]成都晓多科技有限公司

下一条:[成都]摩尔线程智能科技(成都)有限责任公司

申请该职位 收藏该职位