职位描述
学历要求 本科及以上学历等
专业要求 计算机类、电子信息类、软件工程类等相关专业
岗位职责:
1.负责大模型训练数据的清洗、去重、格式标准化及异常值处理,确保数据质量符合模型训练要求;
2.基于海量数据实现数据采集、清洗、存储、计算;
3.构建设计良好的数据流、数据仓库、调度系统、数据服务、分析系统、流程规范,数据工具与产品。
任职要求:
1.本科及以上在读高校学生,计算机科学、人工智能、数据科学等相关专业优先;
2.深入理解数据仓库分层架构,主题划分及数据集成理论,对数据挖掘、数据处理、数据分析、数据应用及数据治理有清晰的认知;
3.熟悉多项大数据处理/分析相关的工具/框架,比如Hadoop、Mapreduce、Hive、Flink、Spark、Hbase、Mysql、Springboot等;熟悉Linux操作系统常用命令,具备Java语言编码能力;
4.性格开朗、责任心强,有技术热情,良好的沟通能力和团队协作能力。
5.每周可到岗3天以上,实习周期不少于3个月(可长期优先)。