此信息由浙江大学审核并发布(查看原发布网址),应届生求职网转载该信息只是出于传递更多就业招聘信息,促进大学生就业的目的。如您对此转载信息有疑义,请与原信息发布者浙江大学核实,并请同时联系本站处理该转载信息。
[浙江]钉钉(中国)信息技术有限公司
职位:2026招聘语音多模态大模型算法工程师
发布时间:2026-03-26
工作地点:其它
信息来源:浙江大学
职位类型:兼职
职位描述
钉钉(中国)信息技术有限公司
招聘信息
算法工程师-语音多模态大模型
2026-03-26 13:36:48
职位描述
1. 负责语音生成/语音识别/语音合成/声纹/语种/情感等方向的算法研究和开发;
2. 负责语音信号处理的相关算法研究和开发,包括语音增强、回声消除、混响消除、自动增益控制、波达方向估计、波束形成等;
3. 负责口语语言理解/用户意图理解/对话模型/语音交互等算法研究和开发;
4. 语音统一多模态大模型:研究下一代多模态通用大模型技术范式,实现文本、语音、视觉模态的联合建模。
职位要求
1. 硕士及以上学历,计算机科学、人工智能、语音信号处理、自然语言处理或相关专业;
2. 具备扎实的计算机与机器学习理论基础,熟练掌握至少一种编程语言(如 Python/C++),工程实现能力强;
3. 熟悉语音识别、语音合成、口语语言处理、语音交互等核心技术,具备以下一项或多项经验:
- 语音端到端声学建模(如 Transformer、Whisper、Qwen-Omni、Baichuan-Omni);
- 语音无监督预训练(如 Wav2Vec);
- 大语言模型(LLM)相关研发,包括预训练、SFT、强化学习;
- 语音端到端大模型(Audio Encoder + LLM)的联合训练与优化;
4. 对前沿技术有强烈探索欲,具备优秀的自驱力、独立思考能力和团队协作精神。
【加分项】
1. 在 NeurIPS、ICML、ICLR、CVPR、ACL、AAAI、Interspeech、ICASSP、ASRU 等顶级会议/期刊发表过论文(尤其一作);
2. 在 ACM、Kaggle 或语音/多模态相关国际竞赛中获得优异成绩(如前三名);
3. 具备跨领域研究经验(如 NLP + 语音、音频信号处理 + 深度学习);
4. 成功复现或改进过 SOTA 语音算法,或有开源项目贡献。
职位类别:计算机软、硬件/互联网/IT
专业要求:不限
ca***com[点击查看]
单位简介
钉钉(DingTalk),全球最大的工作商务沟通协同平台,帮助4300万中国企业,以及全球中小企业零成本零门槛地实现智能移动办公,实现以人为本的管理方式。同时,钉钉也是智能移动时代各行各业的优秀工作方式的共享平台。
钉钉,是我们中国互联网人的原创产品;钉钉,承载着阿里人的使命和梦想;钉钉,是一群有情有义勇于创新的创业人。
来吧!和我们一起为中小企业做点有意义的事!
联系方式
公司地址
