此信息由前程无忧(51JOB)审核并发布(查看原发布网址),应届生求职网转载该信息只是出于传递更多就业招聘信息,促进大学生就业的目的。如您对此转载信息有疑义,请与原信息发布者前程无忧(51JOB)核实,并请同时联系本站处理该转载信息。
[合肥-高新区]辉羲智能科技(上海)有限公司
职位:大模型部署实习生
发布时间:2026-04-13
工作地点:其它
信息来源:前程无忧(51JOB)
职位类型:全职
职位描述
福利:可转正 五险一金 弹性工作 定期体检 年假 福利病假 团建
职能类别:算法工程师
我们正在构建面向大模型推理的自研 AI SoC 芯片平台。如果你对“让千亿参数模型在芯片上高效跑起来”这件事感兴趣,欢迎加入!
## 你将参与的工作
- 将主流 LLM / 多模态模型适配并部署到自研 AI SoC 芯片
- 深入理解 Transformer 推理流程(Prefill / Decode / KV Cache)
- 参与算子级优化:
- Matmul / Attention / RMSNorm / RoPE 等核心算子优化
- Kernel 融合与调度优化
- 内存访问与带宽优化
- 参与模型量化(FP16 / BF16 / INT8)与数值一致性验证
- 定位并解决:
- 精度异常(如 NaN / 溢出 / 数值漂移)
- 性能瓶颈(算力利用率、访存瓶颈、调度不均衡)
- 编写性能 profiling 与自动化验证工具
职位要求
## 我们希望你具备
- 熟悉 Transformer / LLM 结构与推理流程
- 理解计算机体系结构基础:
- Cache / Memory hierarchy
- 并行计算模型
- 访存与算力平衡
- 熟练使用 C++ 或 Python
- 熟悉 Linux 开发环境
## 强力加分项(具备任意一项即可)
- 有大模型推理部署经验(如 vLLM / TensorRT / ONNX Runtime 等)
- 有 GPU / NPU / 异构计算开发经验
- 参与过算子开发或 AI 编译器相关项目
- 有性能调优经验(Roofline 分析、带宽建模等)
- 做过模型精度对齐与数值 Debug
## 你将获得
- 深度参与“大模型 × 自研芯片”的完整工程闭环
- 接触真实 AI SoC 架构与底层优化
- 直接面对工程级问题,而不是玩具级 Demo
- 表现优秀可转正
公司简要介绍:
公司名称:辉羲智能科技(上海)有限公司
公司类型:民营公司
公司规模:150-500人
公司介绍:辉羲智能致力于打造具身智能时代算力平台,提供高算力通用具身智能芯片、易用开放工具链及全栈解决方案,运用创新的“数据闭环定义芯片”方法学,助力合作伙伴构建低成本、大规模和自动化迭代能力,实现优质高效的具身智能量产交付,主导具身智能时代的高阶机器人与智能驾驶的突破性应用。目前公司已获多家知名机构投资,并在北京、上海、合肥、杭州、宜宾多地设有研发中心。
