首页 > 北京 全职 > 职位详细
说明:

此信息由前程无忧(51JOB)审核并发布(查看原发布网址),应届生求职网转载该信息只是出于传递更多就业招聘信息,促进大学生就业的目的。如您对此转载信息有疑义,请与原信息发布者前程无忧(51JOB)核实,并请同时联系本站处理该转载信息。

[北京]斑马网络技术有限公司

职位:大模型压缩量化部署工程师(J11303)
发布时间:2024-11-18
工作地点:北京
信息来源:前程无忧(51JOB)
职位类型:全职
职位描述
职能类别:算法工程师
工作职责
1. 分析大模型特点,将大模型部署到对应平台,并提升模型的速度与精度表现
2. 负责开发维护高效统一的模型量化压缩及评估工具,构建领先的模型轻量化能力
3. 调研、跟踪业界最新的进展,并能在实际业务中落地

任职资格
1. 计算机基础扎实,熟练掌握Python、C++等常见通信框架方案
2. 了解目前主流的模型及结构,熟悉VLM、LLM等模型在各个领域的应用
3. 了解模型优化加速方案,熟悉模型在线量化、离线量化、稀疏等算法原理和实现细节
4. 熟悉模型部署相关流程,如有TensorRT、QNN/SNPE等工具使用经验,熟悉其中量化相关算法与功能
5. 熟悉Pytorch等工具训练流程,熟悉其中对模型量化等相关的支持,或了解其他量化感知训练相关知识。
6. 有机器学习和视觉算法等竞赛经验优先
7. 有相关优秀开源项目经验优先 公司简要介绍:
公司名称:斑马网络技术有限公司
公司类型:民营公司
公司介绍:

登录打开APP 查看全部

上一条:[北京]五方红(北京)教育科技有限公司

下一条:[北京]斑马网络技术有限公司

申请该职位 收藏该职位