此信息由吉林工程职业学院审核并发布(查看原发布网址),应届生求职网转载该信息只是出于传递更多就业招聘信息,促进大学生就业的目的。如您对此转载信息有疑义,请与原信息发布者吉林工程职业学院核实,并请同时联系本站处理该转载信息。
[北京上海广州]杉数科技(北京)有限公司
职位:大模型技术实习生
发布时间:2025-02-18
工作地点:北京 上海 广州
信息来源:吉林工程职业学院
职位类型:兼职
职位描述
杉数科技(北京)有限公司
大模型技术实习生
7K-8K/月 广州市 北京市 上海市 硕士及以上 模拟面试
发布时间:2025年2月18日
职位描述
岗位职责:
【岗位职责】
1. 大模型推理优化方向: 调研与应用主流attention, MOE, 量化,分布式计算等大模型常用方法,并应用到实际杉数的实际业务中;
2. 大模型微调方向: 调研与应用LLM常用微调与训练方法(lora,DPO,RLFH),并应用到杉数的实际业务项目中;
3. 调研与应用主流文生图/图生图算法,包括但不限于单模态和多模态学习、计算机视觉等。
【任职要求】
1. 学历要求:在读研究生/博士生 or 特别优秀的本科生(C9);
2. 熟悉pytorch,jax基本神经网络框架,attention机制及其变种等;
3. 模型方面:熟悉 BERT 及其衍生,熟悉大模型之后的各个变体,有实际的微调经验;
4. 大模型方面:熟悉大模型基础知识,包括预训练,微调,RLHF;
5. 专业经验:有AI或机器学习领域的实际工作经验,包括数据分析、特征工程, 模型融合、大规模数据并行处理、分布式计算;
6. 时间承诺:获得导师同意,能够保证至少3个月的实习期,每周至少3天的工作时间。
岗位要求:
【岗位职责】
1. 大模型推理优化方向: 调研与应用主流attention, MOE, 量化,分布式计算等大模型常用方法,并应用到实际杉数的实际业务中;
2. 大模型微调方向: 调研与应用LLM常用微调与训练方法(lora,DPO,RLFH),并应用到杉数的实际业务项目中;
3. 调研与应用主流文生图/图生图算法,包括但不限于单模态和多模态学习、计算机视觉等。
【任职要求】
1. 学历要求:在读研究生/博士生 or 特别优秀的本科生(C9);
2. 熟悉pytorch,jax基本神经网络框架,attention机制及其变种等;
3. 模型方面:熟悉 BERT 及其衍生,熟悉大模型之后的各个变体,有实际的微调经验;
4. 大模型方面:熟悉大模型基础知识,包括预训练,微调,RLHF;
5. 专业经验:有AI或机器学习领域的实际工作经验,包括数据分析、特征工程, 模型融合、大规模数据并行处理、分布式计算;
6. 时间承诺:获得导师同意,能够保证至少3个月的实习期,每周至少3天的工作时间。
投递说明:
校招官网 join.shanshu.ai
校招投递链接:
ap***com[点击查看]
单位简介
杉数科技(北京)有限公司成立于2016年7月,总部位于北京,并在上海设有子公司。 同年8月,杉数科技获得了来自真格基金和北极光创投的天使轮融资;2017年7月完成约4000万元 A 轮融资,由高达投资(Pagoda Investment)领投,将门创投、联想创投跟投;2020年3月完成近亿元B轮融资,同时引入万科集团以及天任投资两个重要战略股东;2021年6月宣布完成近2亿元C轮融资,由中银国际领投、天任投资跟投。
杉数科技由四位斯坦福大学博士联合创立,拥有由超过30位海内外一流大学教授组成的科学家团队,具有国内外领先的、不可复制的一流研发水平。依托于行业领先的大规模优化求解和复杂决策建模能力,杉数科技打造以中国首个商业求解器“Cardinal Optimizer”为核心,可真正实现从数据到决策端到端服务的决策产品平台,以完整的技术能力和高度模块化的产品结构灵活高效地为企业赋能,利用数据为企业带来收益及成本端的显著变化,让每一个企业拥有定制最优化决策的能力。
目前,杉数科技已涵盖了零售、物流、电商、工业制造、航空航天、能源等各主流行业,获得包含百威、好丽友、海尔、六国化工、上海通用、滴滴、顺丰、德邦以及万达在内的近百家龙头企业的青睐。
公司网站 ww***.ai[点击查看]
提示:在微信扫描关注,可以直接投递简历哟
杉数科技(北京)有限公司
领域:信息传输、软件和信息技术服务业
规模:100 - 300人
地址:北京市朝阳区利泽中园106号楼1层C101
上一条:[上海]杉数科技(北京)有限公司
下一条:[上海]杉数科技(北京)有限公司