《Spark大数据技术与应用案例教程》教案第24课预测银行贷款用户是否存在.docx
《《Spark大数据技术与应用案例教程》教案第24课预测银行贷款用户是否存在.docx》由会员分享,可在线阅读,更多相关《《Spark大数据技术与应用案例教程》教案第24课预测银行贷款用户是否存在.docx(4页珍藏版)》请在第壹文秘上搜索。
1、课题预测银行贷款用户是否存在逾期还款的风险课时2课时(90min)教学目标知识技能目标:(1)掌握创建RDD的方法(2)掌握将RDD转换为DataFrame的方法(3)掌握使用SparkMLlib提供的算法解决实际问题的方法素质目标:综合应用所学知识,提升归纳总结能力和实践能力。教学重难点教学重点:SParkMLlib提供的算法教学难点:使用SparkMIJib提供的算法解决实际问题教学方法案例分析法、问答法、讨论法、i井授法教学用具电脑、投影仪、多媒体课件、教材教学过程主要教学内容及步骤课前任务【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课前任务请大
2、家回顾前面所学内容。【学生】完成课前任务考勤【教师】使用APP进行签到【学生】班干部报请假人员及原因问题导入【教师】提出以下问题:SParkMLIib提供了哪些算法?【学生】思考、举手回答课堂实践【教师】描述和分析本次任务内容,并详细演示任务操作过程,引导学生进行操作【任务描述】本任务使用SParkMLIib提供的算法构建预测银行贷款用户是否存在逾期还款风险的模型。该模型可以根据贷款用户的多个特征(如年龄、月收入等),对用户的还款能力和信用风险进行评估,判断用户是否会逾期还款。银行使用这个模型可以快速预测贷款用户逾期还款的风险,从而决定是否批准该用户的贷款申请。【任务分析】本任务先读取数据创建
3、RDD,并将RDD转换为DataFrame;然后将多个特征列合并为单个特征列,并将字符串标签列转换为数值标签列;接着将数据集划分为训练集和测试集,并使用训练集训练决策树分类模型;最后使用训练好的模型预测用户是否会逾期还款,并评估模型的预测准确率。打开PyChaim,在CredilCard目录下新建CreditCardPredictionpy”文件,然后在该文件中编写应用程序,输出模型的预测结果和模型的预测准确率。实现步骤如下。步骤1创建SparkSession对象。步骤2A使用textFile()方法读取数据创建RDD(即rdd).步骤3A过滤掉标题行,保留有效数据,生成T新的RDD(即rdd
4、_map)首先使用firsl()方法获取标题行的内容header;然后使用filler。方法过滤掉标题行,并使用map()方法将除了标题行之外的数据行拆分为列表.(详见教材)【参考代码】frompyspark.sqlimportSparkSessionfrompyspark.sql.functionsimportcolfrompyspark.ml.featureimportVectorAssembler,StringIndexerfrompyspark.ml.classicationimportDecisionTreeClassifierfrompyspark.ml.evalua(ionimp
5、ortMulticlassciassincationEvaluator怆!建SparkSession对象SPark=SparkSession.builder.appName(prediction).getOrCreate()砌建RDDrdd=spark.sparkContext.textFile(file:/usr/local/spark/mycode/CreditCard/CreditCard_data.csv)# 过滤掉标题行,保留有效数据header=rdd.first()rdd_map=rdd.filter(lambdarow:row!=header).map(lambdarow:ro
6、w.split(,)# 将RDD转换为带有列名的DaIaFramedf=rdd_map.loDF(header.split(,H)# 重命名列df=df.withColumnRenamed(,2yrs,label)# 定义列表,存储需要转换为整数类型的列名columns_to_cast_int=age,family,Time30-59,Time60-89,Times90,RealEstate# 定义列表,存储需要转换为双精度浮点数类型的列名columns_to_cast_double=MonihlyIncome,UnsecuredLines,DebiRaiio,OpenCredil# 将指定列
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Spark大数据技术与应用案例教程 Spark 数据 技术 应用 案例 教程 教案 24 预测 银行贷款 用户 是否 存在