首页 > 上海 全职 > 职位详细
说明:

此信息由复旦大学审核并发布(查看原发布网址),应届生求职网转载该信息只是出于传递更多就业招聘信息,促进大学生就业的目的。如您对此转载信息有疑义,请与原信息发布者复旦大学核实,并请同时联系本站处理该转载信息。

[上海]上海烨知心科技有限公司

职位:2026校园招聘
发布时间:2026-01-14
工作地点:上海
信息来源:复旦大学
职位类型:全职
专业标签:计算机
职位描述
2026年上海烨知心科技校园招聘
发布时间:2026-01-13 15:09:27
一、公司简介
上海烨知心科技有限公司(YeatS AI)是一家人工智能计算创新企业,专注于赋能下一代智能设备,提供从硬件加速到AI算法的全方位一体的端侧AI解决方案。我们的愿景是促进端侧AI加速,让未来智能终端拥有更高效、更无缝、更可靠的AI体验。核心技术团队拥有深厚的海外大厂端侧AI研发实力与丰富的国内芯片量产经验,致力于以深厚的技术积累推动终端智能的规模化应用。

作为一家快速成长的科技企业,烨知心科技现面向全国高校2026届毕业生开展校园招聘,诚邀有理想、有抱负、有激情的你加入我们,共同开创智能科技的未来!

二、招聘对象
2026年应届硕士、博士毕业生(含海外留学生)

三、招聘岗位及要求1. NPU Compiler工程师
工作职责

核心编译技术开发

· 负责NPU专用编译器的设计、开发和优化,构建从深度学习框架到NPU硬件的完整编译流水线

· 实现神经网络计算图的优化、算子融合、自动调度和代码生成

· 开发针对特定NPU架构的优化算法,包括内存布局优化、指令调度、并行化策略等

性能优化与调优

· 分析并解决神经网络模型在NPU上的性能瓶颈,提出优化方案

· 构建性能分析工具和性能模型,指导编译器优化方向

· 实现自动调优框架,针对不同网络结构自动搜索最优编译策略

软硬件协同设计

· 与硬件团队紧密合作,参与NPU指令集架构和微架构设计

· 基于硬件特性和约束开发编译器优化,提升计算单元与带宽利用率

· 构建硬件抽象层和编程模型,简化上层应用与编译器对接

工具链生态建设

· 开发和维护完整的NPU软件工具链,包括编译器、调试器、性能分析器等

· 支持主流深度学习框架(PyTorch, TensorFlow等)的模型导入和转换

· 实现模型量化、剪枝、稀疏化等算法在编译器中的集成和优化

职位要求

基本要求

· 计算机科学、电子工程或相关专业本科及以上学历

· 3年以上编译器开发或高性能计算相关经验

· 精通C/C++或python编程,具备扎实的数据结构和算法基础

· 熟悉计算机体系结构,了解现代处理器设计原理

技术专长(满足以下至少2项)

· 熟悉 LLVM / MLIR / TVM / XLA / TensorRT / Triton等编译框架,掌握后端优化与代码生成

· 熟悉GPU、DSP、Neon、NPU或其他加速器的体系结构,及相关负载的性能优化

· 有神经网络的推理优化经验,熟悉算子优化及融合、图优化等技术

加分项

· 有NPU/GPU/DSP专用编译器开发经验者优先

· 了解计算机编程语言设计

· 了解深度学习框架内部原理,有PyTorch / TensorFlow / ONNX扩展开发经验

· 有高性能计算、并行计算或数值计算背景

· 了解模型量化等模型压缩技术及其在嵌入式设备上的部署实现

· 在顶级会议发表过编译器、体系结构或AI系统相关论文
2. NPU 量化器工程师(NPU Quantization Engineer)
岗位概述

· 负责端侧 NPU 量化工具链与模型量化方案的设计、优化与实施,提升模型在端侧 NPU 上的推理性能、精度和能效。构建可靠的量化校准、误差分析与自动化量化器能力。

岗位职责

· 设计与优化量化方案:设计模型量化策略(包括 PTQ/QAT、混合精度、低比特等),确保模型精度与性能之间的平衡。

· 量化校准与分析:负责量化校准、敏感层识别、误差传播分析、量化噪声建模和精度补偿算法的开发。

· 量化基准设计:设计量化基准,比较最新的量化方案(SOTA),持续提升量化器的能力边界。

· 量化工具开发:开发与增强量化工具,涵盖各类量化算法实现、自动化量化、精度评估及可视化误差分析模块。

· 模型适配优化:针对多模态端侧 LLM 模型进行 NPU 适配的量化优化。

· 跨团队协作:与编译器、算子库及硬件架构团队合作,优化量化后模型在 NPU 的执行效率。

任职要求

必须项

· 具备 3 年以上模型量化、模型训练微调或低比特推理优化经验

· 精通 PTQ/QAT 量化算法原理,熟悉常见量化策略与精度的权衡。

· 熟练使用 PyTorch、TensorFlow 量化 API 或自研量化框架。

· 了解主流 Transformer 模型架构,及其量化挑战与优化方法。

· 扎实的 Python 或 C++ 编程能力,具备量化器工程化能力,能够独立完成量化库的开发。

加分项

· 有端侧 LLM(参数规模在 70B 以内)量化落地经验者优先。

· 了解 NPU 编译器、runtime、算子库,或有混合精度调度实践经验。

· 有AI 加速器(NPU/DSP/GPU/ASIC 等)的模型部署经验,了解硬件量化计算限制。

· 有 Auto-Quantizer、量化数据飞轮体系建设经验者优先。

· 有 SOTA 量化论文发表或开源贡献者优先。

3. 端侧 LLM 算法工程师 / 实习生
职责描述:

· 作为端侧 LLM 算法工程师,您将通过算法优化将大语言模型和多模态 AI 真正跑在端侧,在极低功耗和有限算力条件下实现流畅的交互和智能体验:

· 设计并原型化多模态感知与理解算法(文本、视觉、语音、传感器数据),构建适用于边缘设备的对话式 AI 助手

· 探索提示工程、对话管理、上下文压缩等技术,让小模型也能高效交互

· 实现并测试轻量化模型架构,针对受限硬件优化

· 与硬件和编译器团队协作,让算法和 SoC、运行时系统深度结合

· 开展实验,权衡延迟、精度与功耗

职位要求:

· 2026 级应届毕业计算机、电子工程、人工智能或相关领域硕士/博士

· NLP、语音或计算机视觉相关基础扎实,熟悉 Transformer 模型和多模态学习

· 对对话式 AI、对话系统或人机交互有兴趣

· Python 编程能力强(会 C++ 更佳)

4. 端侧 LLM 优化工程师 / 实习生
职责描述:

· 作为 LLM 优化工程师,您将与编译器/运行时团队协作,致力于将 LLM 在性能受限的端侧 AI 芯片上高效地部署运行:

· 研究和实践模型压缩:量化、剪枝、蒸馏

· 在 CPU、NPU、GPU 等各种硬件上进行 LLM 基准测试

· 原型化多模态模型(文本、视觉、音频),探索实时应用场景

· 快速迭代实验,测量性能并优化

职位要求:

· 计算机、电子工程或相关专业硕士/博士

· 深度学习背景,尤其是 NLP/Transformer 模型

· 熟练使用 PyTorch 或 TensorFlow,有量化、剪枝等模型优化经验更佳

· 扎实的 Python 和 C++ 编程能力,对编译器/运行时系统(TVM、MLIR、ONNX Runtime 等)感兴趣

· 能独立探索、解决开放性问题

四、招聘流程
1. 简历投递
时间:2026年1月6日 - 2026年12月30日
投递方式:简历接收邮箱(career@yeats.ai)。

2. 面试环节
时间:2026年1月 - 2026年12月
流程:初面(技术)+ 终面(HR面)
地点:线上/线下结合(视情况安排)

3. 录用通知与签约
时间:2026年1月起
结果将通过邮件或电话通知,并安排签约事宜。

五、薪资福利
具有市场竞争力的薪酬体系:提供行业内领先的基本薪资+年终奖;

五险一金:全额缴纳,保障员工基本权益;

弹性工作制:鼓励高效工作与生活平衡;

员工培训:入职培训、专业技能提升;

职业发展:清晰的晋升通道,多通道发展路径;

员工关怀:年度体检、节日福利、生日礼物、团建活动等;

六、工作地点
工作地点:上海市浦东新区环科路999号国际人才港

七、联系我们
● 公司官网:yeats.ai



● 简历接收邮箱:career@yeats.ai

● HR微信如下(请备注:姓名+应聘岗位)



加入烨知心科技,与我们一起用科技点亮未来!

上海烨知心科技有限公司
2026年1月

登录打开APP 查看全部

上一条:[上海]上海启林投资管理有限公司

下一条:[上海]上海古堂科技有限公司

相关招聘信息:

[北京]边无际(北京)科技有限公司 IoT边缘计算方向后端研发工程师(2026-01-14,北京) [上海]上海启林投资管理有限公司 2026校园招聘(2026-01-14,上海) [江苏其它]江苏寰宇乾堃航天科技集团有限公司 商务助理(2026-01-14,其它) [上海]上海烨知心科技有限公司 2026校园招聘(2026-01-14,上海) [江苏]常州市羊氏模具有限公司 储备干部(2026-01-14,其它) [北京]中国科学院空间应用工程与技术中心 2026校园招聘(2026-01-14,北京)