此信息由前程无忧(51JOB)审核并发布(查看原发布网址),应届生求职网转载该信息只是出于传递更多就业招聘信息,促进大学生就业的目的。如您对此转载信息有疑义,请与原信息发布者前程无忧(51JOB)核实,并请同时联系本站处理该转载信息。
[上海]前程无忧校园
职位:强化学习研究员
发布时间:2025-02-28
工作地点:上海
信息来源:前程无忧(51JOB)
职位类型:全职
职位描述
职能类别:算法工程师
学历要求
博士
专业要求
计算机、电子信息、人工智能等相关专业
工作职责:
1.研究大模型对齐阶段的广义强化算法,提升大模型的能力,探索创新性算法,解决大模型训练中的复杂问题,如奖励稀疏、策略优化等;
2.针对大模型的挑战,提出有效的训练策略和优化方法,改善模型的训练效率、收敛性以及推理能力;
3.进行强化学习算法的系统评估,分析不同算法在大模型上的表现,识别潜在的瓶颈和改进方向;
4.写作高质量研究论文,在***学术会议或期刊上发表研究成果。
任职资格:
1.计算机科学、人工智能等相关专业博士学历;
2.熟练使用TensorFlow/PyTorch等至少一种深度学习框架;
3.深入理解强化学习理论,包括但不限于Q-learning、SARSA、深度Q网络(DQN)、策略梯度方法等;
4.良好的团队合作精神和沟通能力,有责任心,较强的问题分析和解决能力;
5.有可穿戴设备、RLHF微调相关经验是加分项;
6.有人工智能***会议或期刊论文发表经历者优先。
公司简要介绍:
公司名称:前程无忧校园
公司类型:外资(非欧美)
公司介绍:“博 · 未来”是由前程无忧 51JOB 在国家鼓励高质量就业的背景下,连续推出的线上线下联动项目。首届洽谈会于2024年春季成功举办,行业龙头企业近20家、到场博士近200名、参与高校近10所;为高层次人才和企业之间搭建了沟通平台,据不完全统计此次活动共协助解决近130个博士岗位,备受企业和求职者好评。
随着学历教育普及以及招生规模的迅速扩张,而博士毕业生的就业与专业学位类别紧密相关,我国博士毕业生整体待业率呈上升趋势。为适配企业对高层次人才日益增加的招聘需求,打破信息不对称的壁垒,前程无忧打通自有渠道信息资源,打造“ 双选、洽谈、签约一站式 ”完成高层次人才接触的“博 · 未来”平台。
2025年全新升级,更大场地、更广宣传、更多生源、更定制化流程…为企业及高层次人才打造一场圈层洽谈会议。
上一条:[上海]前程无忧校园
下一条:[上海]前程无忧校园