首页 > 北京 全职 > 职位详细
说明:

此信息由美团审核并发布(查看原发布网址),应届生求职网转载该信息只是出于传递更多就业招聘信息,促进大学生就业的目的。如您对此转载信息有疑义,请与原信息发布者美团核实,并请同时联系本站处理该转载信息。

[北京]美团

职位:分布式AI推理|AI-Infra研发工程师
发布时间:2026-06-04
工作地点:北京
信息来源:美团
职位类型:全职
专业标签:数学类 计算机
职位描述
【北斗】分布式AI推理/AI-Infra研发工程师

更新时间:2026-06-03
岗位职责

为了更好地提升城市即时配送的效率与体验,2017年,美团启动了无人机配送服务的探索,通过科技创新推动履约工具变革,加快建设空地协同的本地即时配送网络。目前,美团已初步完成了自主飞行无人机、智能化调度系统及高效率运营体系的研发建设工作,由此打造了一个服务于多场景、多天候的城市低空物流解决方案。

1、推理框架研发:参与构建与优化高性能分布式 AI 推理引擎,支持大模型在多卡、多机环境下的高效分布式部署与高效通信;
2、分布式任务调度:参与设计与实现面向大模型推理的高效任务调度算法。针对 Prefill与 Decoding阶段的不同资源需求,协助研发 PD 分离架构下的请求流转与精细化调度;
3、全局负载均衡:协助构建多节点、多实例集群的负载均衡策略。基于请求长度预测、全局 KV Cache 缓存命中率以及运行时显存状态,实现智能流量分发,避免集群局部热点与雪崩;
4、弹性伸缩与容错:参与大规模分布式推理集群的健康度监控,协同开发故障自动检测与动态隔离机制,提升高并发在线服务(LLM-as-a-Service)的可用性(SLA);
5、性能剖析与调优:协助排查高并发场景下,由网络延迟、长尾请求(Tail Latency)、线程锁竞争或集合通信(NCCL)瓶颈导致的全局吞吐跌落;
6.主动探索并运用各类AI工具优化日常工作流程,积极推动AI在无人机业务中的落地实践。

岗位基本要求

【岗位要求】
1、2027届获得本科及以上学历,计算机、数学等相关专业优先;
2、具有优秀的基础算法、代码能力,熟练掌握C/C++或Python编程语言,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
3、熟悉计算机体系结构,对 CPU/GPU 内存层次、PCIe/NVLink 带宽有清晰概念;理解操作系统核心原理(如进程调度、内存管理);
4、熟悉分布式系统的基本原理(如一致性协议、一致性哈希、负载均衡算法、集合通信 MPI/NCCL),具备良好的分布式思维;
5、具备 CUDA C/C++ 开发或优化经验,或了解 OpenAI Triton 算子编写者优先;
6、熟悉或阅读过主流推理/训练开源项目的源码者优先,如 vLLM、SGLang、TensorRT-LLM、Triton Inference Server、DeepSpeed、Megatron-LM 等

【岗位吸引力】
在这一职位上:
您将有机会参与无人机、机器人领域内大规模的数据处理分析系统的构建,进而为业务的深入发展做出贡献;
您处理的不是实验室的干净数据,而是自动驾驶、多模态智能体等真实物理世界的海量、高频、连续数据。你的代码将实时支撑物理与数字世界的万亿级流转;
您将全流程参与“底层算力 - 集合通信 - 显存调度 - 集群网关”的端到端优化,你的每一次延迟降低,都将直接变成物理实体更快的反应速度。

立即申请:zh***com[点击查看]

登录打开APP 查看全部

上一条:[北京]美团

下一条:[北京]北京中科闻歌科技股份有限公司

相关招聘信息:

[北京]美团 分布式AI推理|AI-Infra研发工程师(2026-06-04,北京) [北京深圳]美团 自动驾驶感知车云协同视觉大模型实习生(2026-06-04,北京 深圳 其它) [北京]北京金融控股集团有限公司 2026暑期实习生招聘(2026-06-04,北京) [安徽]联宝(合肥)电子科技有限公司 大模型应用开发实习生(2026-06-04,其它) [福建]福建省南平铝业股份有限公司 软件开发工程师|研发主管|研发工程师(2026-06-04,其它) [四川]泸州老窖股份有限公司 2026暑期实习生招聘(2026-06-03,其它)