首页 > 北京 上海 兼职 > 职位详细
说明:

此信息由美团审核并发布(查看原发布网址),应届生求职网转载该信息只是出于传递更多就业招聘信息,促进大学生就业的目的。如您对此转载信息有疑义,请与原信息发布者美团核实,并请同时联系本站处理该转载信息。

[北京上海]美团

职位:具身智能前沿技术研究
发布时间:2026-07-01
工作地点:北京 上海
信息来源:美团
职位类型:兼职
专业标签:计算机
职位描述
【LongCat实习】具身智能前沿技术研究

更新时间:2026-06-30
工作地点:北京市
事业群:核心本地商业-基础研发平台
岗位职责

具身智能是通往通用人工智能(AGI)的“最后一块拼图”,也是将AI从数字世界(Digital World)引入物理世界(Physical World)的关键枢纽。真正的智能不应仅存在于对话框中,而应具备理解物理法则、感知复杂环境并执行精准操作的能力。本课题致力于打造世界一流的具身智能团队,构建统一的感知-决策-控制底层架构。我们探索将视觉、语言与动作指令深度耦合,赋予机器人像人类一样“看懂世界、预判未来、灵活操作、自然交互”的原生能力,挑战物理世界中的复杂长程任务,推动具身智能从实验室走向千家万户。
具体地,我们关注如下研究方向:
1.具身大模型感知与决策:探索构建端到端(End-to-End)的Vision-Language-Action(VLA)大模型。研究如何将海量互联网多模态数据与机器人异构动作数据进行统一表征预训练,提升模型在开放场景下的零样本任务泛化能力,实现从高层逻辑推理到底层电机控制指令的平滑映射。
2.物理世界模型与因果推理:研究基于生成式架构的物理世界模型,使机器人能够通过视频生成或状态预测“预判”行动后果。探索如何在大模型中建模物理定律(重力、摩擦、刚性/流体等),通过想象进行自监督学习和虚拟进化,解决物理实验数据稀缺与长尾场景模拟的难题。
3.视觉语义导航与长程规划:针对大尺度、动态变化的未知环境,研究结合常识推理的视觉语言导航(VLN)技术。利用大语言模型的逻辑链(CoT)能力,将复杂的模糊指令分解为可执行的动作序列,解决具身智能在复杂物理空间中的定位、语义地图构建及长程任务中的意图保持问题。
4.敏捷运动控制与精细操作:探索强化学习(RL)与大模型结合的全身协同控制方案。包括但不限于:人形机器人的复杂地形敏捷行走、基于触觉-视觉融合的多指灵巧手精细操作。研究如何通过Sim-to-Real技术将大规模仿真学习的策略高效迁移至真实硬件,实现丝滑的物理动作输出。
5.具身人机交互与在线进化:构建自然的自然语言/手势交互界面,使机器人能理解人类的情境、反馈并进行修正。研究基于人类反馈的具身强化学习与示范学习,使智能体能够在与环境、人类互动的过程中实现技能的增量学习与自我迭代。

岗位基本要求

1.硕士及以上学历,计算机科学、人工智能、机器人、软件工程、计算机视觉、自然语言处理等相关专业,博士优先;
2.具备优秀的编程能力,熟悉PyTorch,有大规模分布式训练和物理仿真引擎(Isaac Gym, Sapien, MuJoCo)使用经验;
3.在CV、NLP、Robotics、RL等领域顶级会议(CVPR, ICCV, ACL, NeurIPS, ICLR, ICRA, IROS等)有高质量论文发表;
4.具有良好的沟通协作能力,对物理世界充满好奇心,有志于解决机器人领域的真实痛点问题。
【为什么是我们】
1.全栈顶配算力支持,依托美团大规模算力集群,提供千卡至万卡级算力支持,具备成熟的分布式训练与低延迟推理优化栈,保障 世界动作模型与 VLA 大规模训练;
2.与优秀人才同行,你将与行业顶尖的大模型研究员及机器人领域专家并肩作战,共同攻克具身智能的技术难点。

立即申请:zh***com[点击查看]

登录打开APP 查看全部

上一条:[北京上海广东武汉其它]新华三集团

下一条:[北京上海]美团

相关招聘信息:

[北京上海深圳]美团 全模态Computer Use Agent前沿研究(2026-07-01,北京 上海 深圳 其它) [北京上海]美团 大模型预训练数据科学与模型潜力前沿研究(2026-07-01,北京 上海) [北京上海]美团 具身智能前沿技术研究(2026-07-01,北京 上海) [北京]清华大学网络科学与网络空间研究院 系统研发工程师1(2026-07-01,北京) [北京]清华大学网络科学与网络空间研究院 系统研发工程师2(2026-07-01,北京) [安徽]安徽省弘泰电子信息科技有限公司 工程师助理(2026-07-01,其它)