初级大数据开发简历模板.docx
《初级大数据开发简历模板.docx》由会员分享,可在线阅读,更多相关《初级大数据开发简历模板.docx(3页珍藏版)》请在第壹文秘上搜索。
1、孙XX简历个人信息姓名:孙XX工作经验:3年性另小男手机:186学历:本科电子邮件:1865求职意向意向:大数据开发工程师状况:离职地点:北京薪资:面议工作经历2020/2至今北京XXX科技有限公司大数据开发工程师专业技能1 .熟练掌握SparkSqRSparkStreamingSparkCore,理解Spark工作机制及Spark任务的执行流程。2 .熟练掌握Had。P分布式集群安装、部署、搭建和配置,能够熟悉应用Hadoop相关工具进行相关应用开发。3,熟悉MapReduce,Hdfs工作机制和运行原理。4 .熟练使用Kafka实现集群分布式高吞吐量通信机制,同时借助Zookeeper建立
2、生产者和消费者的关系,实现负载均衡和持久化。5 .熟悉Linux环境和常用命令以及简单Shell脚本编写。6 .熟悉HBase的系统架构,了解RowKey设计,了解HBase优化。7 .熟悉Hive工作原理,数据仓库基本建立和Hive优化。8 .熟悉开源日志收集系统Flume,能够在不同场景实现日志收集工作。9 .熟悉Sqoop的数据导入导出,实现MySql和Hive之间的数据传输。10 .熟悉OOZie任务调度工具和Azkaban工具实现定时调度任务。IL熟练使用JaVa和Scala语言编程、熟练使用MySql语句。项目经历项目一:XXX数仓项目软件架构:Nginx+Tomcat+Hadoo
3、p+Flume+Zookeeper+Hive+Mysql+Spark+Sqoop+zkaban开发环境:Idea+Maven+Git项目描述:公司发展迅速,针对数据整体统一规划管理,对数据进行统一整理、清洗、过滤、去重、存储,便于以后的日常维护工作和项目开展。责任描述:在本次项目中主要负责并参与数据仓库的流程设计,实现数仓的各层,分别是ODS层(原始数据层)、DWD层(明细数据层)、DWS层(服务数据层)和ADS层(数据应用层),其中DWS层中包含事实层、维度层、宽表层,为了达到拿空间换时间的目的,由事实层中的事实表和维度层的维度表关联形成宽表层。技术要点:1 .Flum收集Web节点日志信息
4、,根据每个Event的Body里存的数据,可以对Log进行判断,设定不同的Header值,然后再经过选择器,根据Header中的某个值来决定走哪个Channel,将清洗完的数据存入HiVe中,作为原始数据。2 .使用ShelI编写脚本,每日定时的通过脚本将数据加载到ODS层,不做数据处理。3 .在DWD层采用SnaPPy压缩,通过该压缩方式解压速率快,存储方式选用ParqUet,后面的需要用Spark处理数据。4 .DWS层将数据进行统一标准、数据维度建模,抽取公共纬度,符合星型模型,将事实表和维度表进行关联,形成字段较多的宽表层,比如订单总数、订单流水等,为应用层服务。5 .对于一些每日变化
5、量不大,但是业务需求有需要统计出来的表,制作拉链表,从而解决即不好用全量表也不用增量表的情况。6 .ADS层数据,是为了满足具体需求,完成报表统计,细分主体,比如优惠券相关统计、用户、订单相关数据统计。7 .在处理DWS层数据时,在使用RDD时,将重复的RDD进行持久化处理。当内存无法将完整的RDD进行缓存时,将RDD进行序列化,减小数据体积。8 .在DWS层计算地区商品前三销量占比时,使UDAF函数解决Sql不方便显示商品占比问题。9 .Hive中开启Fetch,减少某些情况下不用MapReduce,从而加快数据查询。10 .针对个别Key过多导致数据倾斜,将这些个别的Key单独拿出了,并在
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 初级 数据 开发 简历模板