职位描述
职位描述
搭建面向人形机器人交互的大规模多模态数据处理系统,支持语音、图像、视频、动作等模态的自动化采集、筛选与结构化管理;
构建高吞吐、低延迟的数据解码与加载 pipeline,为多模态大模型的高效训练与评估提供基础设施;
设计数据分布分析与偏差检测机制,发现数据覆盖盲区,优化机器人在真实场景中的感知与表达能力;
联合算法团队制定数据增强与扩展策略,提升交互模型在人设稳定性、多模态一致性方面的表现;
开发数据可视化与管理工具,支持数据版本追踪与跨模态数据闭环建设。
职位要求
本科及以上学历,计算机、人工智能、电子、数学等相关专业;
出色的问题分析和解决能力,自主探索新解决方案的能力强;
关注生成式 AI 和多模态交互技术,对推动人形机器人智能化有热情;
对数据质量有极致追求,具备敏锐的数据洞察力,能精准识别数据中的噪声、偏差、标注错误及潜在风险;
深刻理解数据质量对模型效果(如幻觉、偏见、鲁棒性)的关键影响,并能在数据处理全流程中落实严格的质量控制标准。
加分项:
有机器人场景(如语音交互、视觉引导、动作合成)下的数据支持经验;
在多模态、大模型、基础模型、世界模型、RL、渲染生成领域,有影响力项目的数据建设经验;
在计算机视觉、多模态、AIGC、机器学习、渲染生成等一个或多个领域有较深入的研究者。