此信息由北京航空航天大学审核并发布(查看原发布网址),应届生求职网转载该信息只是出于传递更多就业招聘信息,促进大学生就业的目的。如您对此转载信息有疑义,请与原信息发布者北京航空航天大学核实,并请同时联系本站处理该转载信息。
[深圳香港]艾氪互联智能科技(深圳)有限公司
职位:2026招聘强化学习算法工程师
发布时间:2026-02-25
工作地点:深圳 其它
信息来源:北京航空航天大学
职位类型:全职
职位描述
艾氪互联智能科技(深圳)有限公司
发布时间:2026-02-25
福利:"五险一金","带薪年假","午餐补助","节日礼物","扁平管理","岗位晋升","提供住宿"
职位名称:强化学习算法工程师(Agent Reinforcement Learning Engineer)
学历:本科,硕士,博士,外国留学生
需求人数:10
需求专业:数学与应用数学(华罗庚数学班),工科试验班类(中外合作办学,中法未来科技试验班),理科试验班类
|||需求专业:理科试验班类,工科试验班类(中外合作办学,中法未来科技试验班),数学与应用数学(华罗庚数学班)
工作地点:广东省深圳市
职位描述:理想经验:
?有强化学习 / Agent / 决策系统经验
?能将现实问题抽象为状态、动作、奖励
?熟悉 PyTorch / Python
?有系统工程意识
?对真实商业系统有好奇心
加分项:
?多智能体系统
?运筹优化 / 博弈
?供应链 / 定价 / 资源调度经验
?LLM Agent 框架
你将面对的典型问题:
?一个渠道价格策略在不同区域表现完全不同,Agent 如何通过强化学习自动适配?
?库存与履约冲突时,如何让 Agent 学会权衡利润、时效与风险?
?新增一个业务模块,如何快速构建可学习环境?
?真实业务数据噪声极大,如何设计鲁棒 reward?
?企业偏好变化时,如何让 Agent 快速重新对齐目标?
技术栈:
Python / PyTorch
分布式 RL
Agent 框架
Typescript / React(内部工具)
职位联系人:蒙先生
手机:17727442725
简历接收邮箱:guipi@
部门:AI智能体研究中心
地点:香港, 深圳
工作经验:实习生、应届生
招聘人数:10人
关于 echOS(艾氪智能) 艾氪智能集团是全球产业级Agentic OS的开创者与定义者。自主研发echOS——全球首个打破产业三级壁垒、实现跨业务/跨企业/跨行业分布式多智能体集群的操作系统。
基于产业级Agentic Studio开发平台 JovaAI、硅基人才市场WtreeAI、AI产业云脑ICB,构建6000+产业级专业AI工具及skills,支撑多智能体强化学习、分布式感知、跨组织商业博弈与实时决策。该技术体系已在中国多个产业带完成规模化验证,正在更多传统产业带规模化进行跨企业智能体集群的推广,形成AI时代的企业互联标准与产业AI原生底座。
研发中心覆盖香港、深圳、北京、上海、重庆,多次荣获千峰奖、中国人工智能领军企业等荣誉。
?
关于岗位: 我们正在招聘 AI 智能体强化学习工程师,加入 echOS Agent 核心团队。
你将直接参与构建在真实产业环境中运行的智能体系统,让 Agent:
?与复杂业务环境持续交互 ?学习定价、库存、调度等决策策略
?具备长程规划能力 ?基于真实反馈持续自我进化
?根据企业偏好动态调整行为 这是强化学习 + 大模型 + 多智能体协同在真实商业系统中的落地,而不是模拟世界里的 benchmark。
?
工作重点(Focus):
?为产业级 AI Agent 构建环境交互系统(业务状态 / 行为空间 / 奖励建模)
?将强化学习引入真实场景,如渠道定价优化、库存分配、履约调度
?构建 Agent 长程规划与复杂任务拆解能力
?实现偏好学习与反馈优化(企业目标、风险约束、利润权衡)
?设计仿真环境与离线评估体系,用于训练与回放真实业务策略 ?构建 Agent 学习闭环:感知 → 决策 → 执行 → 反馈 → 进化
?搭建自动化训练、评估与部署流水线
?提升大规模 RL 任务的稳定性与可观测性 ?重构 Agent / 数据 / 训练框架,使研究成果快速进入生产系统
","shortContent":"部门:AI智能体研究中心地点:香港, 深圳工作经验:实习生、应届生招聘人数:10人关于 echOS(艾氪智能) 艾氪智能集团是全球产业级Agentic OS的开创者与定义者。自主研发echOS——全球首个打破产业三级壁垒、实现跨业务/跨企业/跨行业分布式多智能体集群的操作系统。基于产业级Agentic Studio开发平台 JovaA
上一条:[南通]南通励成生物工程有限公司
