职位描述
学历要求
本科及以上学历
专业要求
计算机、软件、大数据类
岗位职责
1.负责大数据相关开源组件的配置、封装、部署及性能优化,构建海量数据存储和计算平台,湖仓一体化平台,负责研究跟进大数据领域的新技术,新技术预研;
2.负责编写数据处理和分析相关的程序代码,熟悉Hadoop生态及其组件,如HDFS、MapReduce、Hive、HBase、Spark、Flink等,能够进行相关的研发工作;
3.负责基于Hadoop/Spark/Flink大数据生态系统的部署运维和集群调优;
4.负责系统的数据管理、数据仓库建设与维护,包含数据ETL开发,仓库模型设计,指标体系构建,血缘关系维护,数据采集,数据稽核,数据治理等;
5.根据业务实际需求,选择或设计相应的机器学习或深度学习的算法,对算法模型进行训练、评估和优化;
6.负责大数据相关设计文档、专利、论文的编写。
应聘资格要求
1.本科及以上学历,计算机科学、软件工程、数学、统计学等相关专业,研究生优先;
2.熟练掌握至少一门编程语言,如Java、Python、Scala等,熟悉Linux环境和命令;
3.熟悉Hadoop生态及其组件,如HDFS、MapReduce、Hive、HBase、Spark、Flink等;
4.熟悉机器学习、深度学习相关的算法和技术,具有实践经验者优先;
5.具备较强的数据分析和解决问题能力,能够根据业务需求进行数据分析和模型构建;
6.诚实守信、作风踏实严谨、责任心强,具备良好团队协作精神,善于解决复杂问题,具备良好的沟通和合作能力,能够与业务方等合作,推动项目的顺利实施;
7.对技术的发展和创新保持敏感,具备学习和研究新技术的能力和习惯。