此信息由浙江大学审核并发布(查看原发布网址),应届生求职网转载该信息只是出于传递更多就业招聘信息,促进大学生就业的目的。如您对此转载信息有疑义,请与原信息发布者浙江大学核实,并请同时联系本站处理该转载信息。
[北京]北京地平线信息技术有限公司
职位:模型训练平台实习生
发布时间:2026-04-08
工作地点:北京
信息来源:浙江大学
职位类型:兼职
职位描述
北京地平线信息技术有限公司
招聘信息
模型训练平台实习生
2026-04-08 15:59:37
职位描述
工作内容
你将参与解决自动驾驶大规模模型训练中的核心系统问题,包括:
- 设计与优化自动驾驶模型的 大规模训练基础设施
- 提升 万卡GPU训练集群 的训练效率与系统稳定性
- 构建可扩展的 PB级自动驾驶数据训练 pipeline
- 分析并解决分布式训练中的性能瓶颈,包括 GPU利用率、通信开销、I/O吞吐等问题
- 与自动驾驶算法团队协作,加速感知、多模态及端到端模型的训练迭代
? 任职要求
【基本要求】
1、计算机科学、人工智能或相关方向 在读博士
2、扎实的编程基础,熟练掌握 Python 或 C++
3、熟悉至少一种深度学习框架,例如 PyTorch
4、熟悉 Linux开发环境,具备良好的系统调试能力
5、对 大规模机器学习系统、分布式训练或AI基础设施 有浓厚兴趣
【加分项】具备以下经验之一者优先:
1、分布式训练经验(DDP / FSDP / DeepSpeed / Megatron 等)
2、CUDA或GPU性能优化经验
3、大规模训练系统或训练平台研发经验
4、自动驾驶相关模型经验(BEV感知、3D检测、多模态融合等)
5、熟悉高性能通信或GPU集群技术(如 NCCL、RDMA、InfiniBand)
6、在 MLSys / 系统 / AI 顶会(如 OSDI、MLSys、NeurIPS 等)有相关研究成果
【关于团队】
我们正在构建支撑下一代自动驾驶模型的大规模训练基础设施。平台每天处理PB级自动驾驶数据,在万卡规模GPU集群上运行大规模分布式训练任务,为感知、预测和端到端驾驶模型提供高效稳定的训练能力。
团队聚焦大规模机器学习系统(ML Systems)与训练基础设施(Training Infrastructure),解决自动驾驶模型训练中的核心系统问题,包括分布式训练效率、数据管线扩展性、以及超大规模GPU集群的稳定性与资源利用率优化。
职位类别:计算机软、硬件/互联网/IT
专业要求:不限
ho***.cn[点击查看]
单位简介
联系方式
公司地址
