首页 > 北京 上海 兼职 > 职位详细
说明:

此信息由美团审核并发布(查看原发布网址),应届生求职网转载该信息只是出于传递更多就业招聘信息,促进大学生就业的目的。如您对此转载信息有疑义,请与原信息发布者美团核实,并请同时联系本站处理该转载信息。

[北京上海]美团

职位:大语言模型后训练前沿算法研究
发布时间:2026-04-04
工作地点:北京 上海
信息来源:美团
职位类型:兼职
职位描述
【基座大模型北斗实习】大语言模型后训练前沿算法研究

更新时间:2026-04-03
工作地点:北京市
事业群:核心本地商业-基础研发平台
岗位职责

简介:大语言模型后训练前沿算法研究包括但不限于:
1、对齐算法研发:包括 SFT 数据建设,指令微调等。构建高质量的训练数据,包括自动化数据清洗、合成数据生产、高质量 Prompt Engineering 等。优化模型复杂指令遵循、逻辑推理、创作写作、代码生成以及工具调用等能力,提升模型综合能力和用户体验。
2、人类偏好对齐:包括奖励模型、人类偏好对齐等前沿强化算法的探索和实践,提升模型在包括创意写作、对话风格以及模型内生安全对齐等人类偏好上的可控性,生成更符合人类价值观、逻辑习惯和审美偏好的内容。
3、跟踪并实现最新的后训练技术(如数据领域自动化配比、后训练机制设计和优化等)。

岗位基本要求

1、硕士及以上学历,计算机、人工智能、数学等相关专业,博士优先;
2、熟悉NLP、LLM、RL等相关领域,对其中一个或多个方向有深入的研究经历,且有相关实践经验;
3、有较强的分析和解决问题能力,能够自主探索、设计验证和推进落地。

加分项:
1、在有影响力的开源项目中做出过核心贡献;
2、发表过高水平论文(如NeurIPS, ICLR, ICML, ACL, EMNLP等)。

立即申请:zh***com[点击查看]

登录打开APP 查看全部

上一条:[北京上海]美团

下一条:[北京上海]美团