首页 > 北京 上海 兼职 > 职位详细
说明:

此信息由美团审核并发布(查看原发布网址),应届生求职网转载该信息只是出于传递更多就业招聘信息,促进大学生就业的目的。如您对此转载信息有疑义,请与原信息发布者美团核实,并请同时联系本站处理该转载信息。

[北京上海]美团

职位:下一代大模型训练范式研究
发布时间:2026-04-04
工作地点:北京 上海
信息来源:美团
职位类型:兼职
职位描述
【基座大模型北斗实习】下一代大模型训练范式研究

更新时间:2026-04-03
工作地点:北京市
事业群:核心本地商业-基础研发平台
岗位职责

简介:探索下一代大模型训练范式,从模型结构、训练策略、数据策略、算力利用率等角度切入,打造具有更强能力和更高潜力的基座模型

1、设计更高效的模型结构,提高给定数据量、计算量、硬件资源、输出序列长度等约束下的模型能力,如长序列能力、记忆能力等。
2、探索更科学和前沿的训练策略,对影响training dynamic的关键变量(如学习率、batchsize、初始化等)形成更科学的认知,探索diffusion LLM,test-time scaling等技术。
3、研究模型结构和数据的耦合关系,优化分阶段训练范式。
4、结合MLsys解决大规模训练中遇到的卡点问题,实现算法和工程联合设计。

岗位基本要求

1、熟悉NLP、LLM、MLsys、Optimization、OR、Control、RL等相关领域,对其中一个或多个方向有深入的研究经历,且有相关实际项目经验;
2、熟悉Python、C++等至少一门编程语言,熟悉LINUX环境;
3、熟悉Pytorch、 Megatron、DeepSpeed 等开源训练框架。

加分项:
1、有影响力的开源项目中做出过核心贡献;
2、发表过高水平论文优先(如NeurIPS,ICLR,ICML,ACL,EMNLP等)。

立即申请:zh***com[点击查看]

登录打开APP 查看全部

上一条:[北京上海]美团

下一条:[北京上海]美团