首页 > 北京 上海 兼职 > 职位详细
说明:

此信息由美团审核并发布(查看原发布网址),应届生求职网转载该信息只是出于传递更多就业招聘信息,促进大学生就业的目的。如您对此转载信息有疑义,请与原信息发布者美团核实,并请同时联系本站处理该转载信息。

[北京上海]美团

职位:大模型预训练数据科学与模型潜力前沿研究
发布时间:2026-07-01
工作地点:北京 上海
信息来源:美团
职位类型:兼职
专业标签:数学类 计算机
职位描述
【LongCat实习】大模型预训练数据科学与模型潜力前沿研究

更新时间:2026-06-30
工作地点:北京市
事业群:核心本地商业-基础研发平台
岗位职责

本课题聚焦于超大规模预训练数据的深度理解、提纯与价值挖掘,建立数据与模型能力之间的因果联系,打造下一代万亿基座模型的高效数据引擎,致力于提升基座模型的智能上限。研究内容包括但不限于:
1.研发基于模型的高效数据质量评估、去重与清洗算法,提高数据质量、多样性和覆盖度。
2.深入探究数据分布与模型能力的因果关系,建立“训练数据-模型效果”归因机制,探索并突破基座模型的能力上限。
3.探索自动化数据筛选机制、动态配比(Data Mixture)与多阶段训练范式,探索不同类型数据对模型能力的Scaling Law。
4.构建科学、多维度的基座模型能力和潜力评估,驱动预训练数据策略的优化,形成高效的数据迭代闭环。
【为什么是我们】
1.明确的技术判断:团队在原生多模态方向有非共识的长期投入,已发布 LongCat-Next 技术报告(离散自回归原生多模态),不是跟随式的能力补齐。
2.顶级资源支撑:5~6万卡计算集群,万亿参数文本基座已训练完成,多模态正在进行大规模上推验证——你将直接参与业界最前沿规模的多模态实验。
3.主线与探索并行:既承担多模态基座的核心交付工作,也推进下一代原生多模态架构的前沿探索,覆盖"数据→tokenizer→预训练→后训练→RL"全链路。

岗位基本要求

1.硕士及以上学历,计算机、人工智能、数学、NLP等相关专业,博士优先;
2.在大模型领域有研究基础,或参与过有影响力的开源项目,在ICLR/NeurIPS/ICML/ACL等顶会发表论文者优先;
3.对大模型有浓厚兴趣,对“什么是好数据”有深刻洞察和理解,有较强的问题分析、自主探索和快速迭代的能力。

立即申请:zh***com[点击查看]

登录打开APP 查看全部

上一条:[北京上海]美团

下一条:[北京上海]美团

相关招聘信息:

[北京上海深圳]美团 全模态Computer Use Agent前沿研究(2026-07-01,北京 上海 深圳 其它) [北京上海]美团 大模型预训练数据科学与模型潜力前沿研究(2026-07-01,北京 上海) [湖南]汇世纪教育科技有限公司 助教老师(2026-07-01,其它) [四川]江油市教育和体育局 2026校园招聘(2026-06-30,其它) [福建]仰恩大学 2026招聘(2026-06-30,其它) [山东]青岛城市学院 2026招聘(2026-06-30,其它)