《Spark大数据技术与应用案例教程》教案第20课分析社交网站的用户影响力.docx
《《Spark大数据技术与应用案例教程》教案第20课分析社交网站的用户影响力.docx》由会员分享,可在线阅读,更多相关《《Spark大数据技术与应用案例教程》教案第20课分析社交网站的用户影响力.docx(12页珍藏版)》请在第壹文秘上搜索。
1、课题分析社交网站的用户影响力课时2课时(90min)教学目标知识技能目标:(1)掌握读取数据创建图的方法(2)掌握使用GraphFramc类的属性和图的叫操作方法处理图的方法(3)掌握图的常用算法素质目标:(1)运用图算法处理日常生活中的数据关联性问题。(2)加强自身观察能力,发掘事物之间的关联性。教学重难点教学重点:图的创建、图的数据操作、图的常用算法教学难点:使用图的常用算法解决实际问题教学方法案例分析法、问答法、讨论法、讲授法教学用具电脑、投影仪、多媒体课件、教材教学过程主要教学内容及步骤课前任务【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课前任
2、务请大家回顾上一节课所学知识,并了解GraPhFrameS中图的创建方法、操作方法和常用算法。【学生】完成课前任务考勤【教师】使用APP进行签到【学生】班干部报请假人员及原因问题导入【教师】提出以下问题:你知道在GraphFrames中创建图的方法吗?【学生】思考、举手回答传授新知【教师】通过学生的回答引入新知,介绍图的创建、图的数据操作、图的常用算法等知识一、图的创建【教师】介绍GraphFrames中图的创建方法GraphFrame是GraphFrames中的核心相象,用于表示和操作图数据。从逻辑上看,GraphFrame由顶点DataFrame和边DataFrame组成顶点DataFra
3、me必须包含名为id的列,用于存储唯一的顶点IDe边DataFrame必须包含名为src和dst的列,分别用于存储边的源顶点ID和目标顶点IDe在GraphFrames中,创建图的方法有三种:第一种是根据顶点DataFrame和边DataFrame创建图;第二种是根据RDD创建图;第三种是读取文件中的数据创建图。1.根据顶点DataFrame和边DataFramc创建图在GraphFrames中,可以使用GraPhFrame()方法根据顶点DalaFrame和边DalaFrame创建图,该方法的基本格式如下。GraphFrame(v,e)其中,参数V表示保存顶点信息的DataFrame;参数e
4、表示保存边信息的DataFramee【教师】通过例子,帮肋学生掌握根据顶点DataFrame和边DataFrame创建图的方法【例6-1根据顶点DataFrame和边DataFrame创建图。使用GraPhFrame()方法以城市作为顶点,距离作为边创建图,图的顶点信息和边信息如图6-5所示。hadoopbogon$pysparkfromgraphframesimportGraphFrarnc建顶点DataFrame,包含顶点的标识符(id)和城市(city)vertices=spark.createDataFrame(A,NewYork),(B,London),(,C,Tokyo),idci
5、ty0)舱J建边DataFrame,包含边的源顶点(Src)、目标顶点(dst)和距离(distance)edges=spark.createDataFrame(A,B,55),(B,C,6500),(C,A,8000),I,srcdst,distance)#根据顶点和边的DataFrame创建图graph=GraphFrame(vertices,edges)#显示图的顶点信息graph.vertices.show()#显示图的边信息+srcdstdistance)ABl55001BCl6500ClAl8000十 graph. edges. show()graph.edges.show()gr
6、aph.vertices.show()+IidIcity+IANewYorkBLondon)ICTokyoI+图的顶点信息和边信息图6-52.根据RDD创建图在GraphFrames中,如果斓存储在RDD中,我们首先需要将RDD转换为DataFrame,然后使用GraPhFrameo方法创建图。【教师】通过例子,帮助学生掌握根据RDD创建图的方法【例6-2根据RDD创建图,输出图的顶点信息和边信息,如图6-6所示。|hadoopbogon-$pysparkfromgraphframesimportGraphFrame制建RDD,包含(顶点ID,属性沅组rdd=spark.sparkContex
7、t.parallelize(l,A),(2,B).(3,rC)# 将RDD转换为DataFramevertices_df=rdd.toDF(,id,attribute)跄J建RDD,包含(源顶点ID.目标顶点ID,边属性)元组edges_rdd=spark.sparkContexl.parallelize(1,2,edge).(2,3.,edge2,)# 将RDD转换为DataFrameedges-df=edges_rdd.toDF(src,dst,relationship)# 使用GraPhFrame()方法创建图 graph.vertces.show() graph.edges.show(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Spark大数据技术与应用案例教程 Spark 数据 技术 应用 案例 教程 教案 20 分析 社交 网站 用户 影响力