第十五届山东省职业院校技能大赛高职组“大数据技术与应用”.docx
《第十五届山东省职业院校技能大赛高职组“大数据技术与应用”.docx》由会员分享,可在线阅读,更多相关《第十五届山东省职业院校技能大赛高职组“大数据技术与应用”.docx(4页珍藏版)》请在第壹文秘上搜索。
1、第十五届山东省职业院校技能大赛高职组“大数据技术与应用”赛项竞赛试题一、竞赛时间、内容及总成绩(一)竞赛时间竞赛时间共为6小时,参赛队自行安排任务进度,休息、饮水、如厕等不设专门用时,统一含在竞赛时间内。(二)竞赛内容概述序号任务名称具体内容任务一大数据平台环境搭建按照任务书要求,需要基于Docker环境完成HadOOP完全分布式、SPark安装配置、FIink安装配置、Hive安装配置、Kafka安装配置、Flume安装配置、ClickHouse安装配置、HBase安装配置等中的任意三个组件的安装配置任务二数据采集按照任务书要求基于SCala语言基于SPark完成离线数据采集,将数据存入Hi
2、Ve的OdS层中;按照要求使用LinUX命令,利用FlumeMaxwel1Kafka等工具完成实时数据采集任务三实时数据处理按照任务书要求使用SCaIa语言基于Flink完成Kafka中的数据消费,将数据分发至据消a的dwd层中,并在HBase中进行备份同时建立Hive外表,基于Flink完成相关的数据指标计算并将计算结果存入Redis、CliCkHOUSe中任务四离线数据处理按照任务书要求使用SCala语言基于SPark完成离线数据清洗、处理、计算,包括数据的合并、去重、排序、数据类型转换等并将计算结果存入MySQL、HBaseClickHouse中任务五数据可视化按照任务书要求编写前端代码
3、,调用后台数据接口,使用、EChartS完成数据可视化任务六综合分析报告根据要求编写综合分析报告()竞赛总成绩“大数据技术与应用”赛项竞赛总成绩为IOO分,其中包含赛场职业素养5分。二、任务须知L每组参赛队分配一台竞赛服务器、三台客户机,拥有独立IP组。2 .本次比赛采用统一网络环境比赛,请不要随意更改客户端的网络地址信息,对于更改客户端信息造成的问题,由参赛选手自行承担比赛损失;3 .请不要恶意破坏竞赛环境,对于恶意破坏竞赛环境的参赛者,组委会根据其行为予以处罚直至取消比赛资格。4 .比赛过程中及时保存相关文档。5 .比赛相关文档中不能出现参赛学校名称和参赛选手名称,以赛位号(工位号)代替。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十五 山东省 职业院校 技能 大赛 高职 数据 技术 应用