首页 > 北京 全职 > 职位详细
说明:

此信息由浙江大学审核并发布(查看原发布网址),应届生求职网转载该信息只是出于传递更多就业招聘信息,促进大学生就业的目的。如您对此转载信息有疑义,请与原信息发布者浙江大学核实,并请同时联系本站处理该转载信息。

[北京]北京理想汽车有限公司

职位:强化学习算法研究员
发布时间:2026-02-14
工作地点:北京
信息来源:浙江大学
职位类型:全职
专业标签:自动化 物流管理与工程
职位描述
北京理想汽车有限公司

招聘信息

强化学习算法研究员

2026-02-14 09:58:40

职位描述

职位描述:
1. 负责面向自动驾驶与具身智能的强化学习算法研究与开发,包括Model-based/Free RL、Online/Offline RL等;
2. 构建大规模分布式强化学习训练系统,推动RL算法在真实场景的规模化应用;
3. 研究数据合成与评测技术,建立数据引擎与评测基准,实现real sim real快速迭代闭环;
4. 探索模仿学习、逆强化学习、Scalable Oversight等技术,提升策略学习效率与泛化能力;
5. 与世界模型团队协作,利用学习式仿真环境进行策略训练与验证,推动sim2real迁移;
6. 参与前沿研究,发表顶会论文,推动强化学习在自动驾驶与具身智能领域的技术进步。

职位要求:
1. 硕士及以上学历,机器学习、强化学习、计算机科学、自动化等相关专业;
2. 扎实的强化学习理论基础,熟悉主流RL算法(PPO、SAC、TD3、IQL等)及其应用;
3. 熟练掌握Python、C++编程语言,熟悉PyTorch等深度学习框架,有分布式训练经验;
4. 对大规模强化学习、策略优化、模仿学习等有深入理解和实践经验;
5. 具有优秀的分析和解决问题能力,自驱性强,能够独立推进研究项目。
【具备以下条件优先】
1. 在NeurIPS/ICLR/ICML/ICRA/CoRL/RSS等顶级会议发表论文者优先;
2. 有自动驾驶、机器人、游戏AI等领域的强化学习应用经验者优先;
3. 有仿真平台(CARLA、NVIDIA Isaac、MuJoCo等)开发或使用经验者优先;
4. 有Model-based RL、World Model、Offline RL、Sim2real等研究经验者优先;
5. 有大规模分布式训练系统开发经验,熟悉Ray、Kubernetes等工具者优先;
6. 维护过重量级开源项目或在RL相关竞赛中获奖者优先;
7. 有实车/实机调试经验,了解传感器栈、控制闭环者优先。

职位类别:学术/科研

专业要求:不限

单位简介

理想汽车是中国领先的新能源智能汽车制造商,设计、研发、制造和销售豪华智能电动汽车。我们坚持自建智能制造基地,并自建供应链体系,保障核心零部件供应。“创造移动的家,创造幸福的家”是我们的品牌使命,我们致力于为家庭打造更安全、更便捷、更舒适的智能电动车。

联系方式

公司地址

登录打开APP 查看全部

上一条:[北京]清华大学于典昆课题组

下一条:[北京]中国贸促会专利商标事务所有限公司

相关招聘信息:

[北京]北京理想汽车有限公司 强化学习算法研究员(2026-02-14,北京) [湖南]先惠智能装备(长沙)有限公司 机械工程师(2026-02-14,其它) [湖南]先惠智能装备(长沙)有限公司 电气工程师(2026-02-14,其它) [湖南]先惠智能装备(长沙)有限公司 装配电工(2026-02-14,其它) [湖南其它]先惠智能装备(长沙)有限公司 项目工程师(2026-02-14,其它) [江西]升达康科技(赣州)有限公司 实习生(2026-02-14,其它)