《机器学习基础及应用》教案第4课训练线性回归预测模型(二).docx
《《机器学习基础及应用》教案第4课训练线性回归预测模型(二).docx》由会员分享,可在线阅读,更多相关《《机器学习基础及应用》教案第4课训练线性回归预测模型(二).docx(6页珍藏版)》请在第壹文秘上搜索。
1、课题训练线性回归预测模型(二)课时2课时(90min)教学目标知识技能目标:(1)掌握岭回归与套索回归的基本原理与参数调节方法(2)能够编写程序,训练线性回归模型并实现预测素质目标:了解时代新科技,激发学习兴趣和创新思维,增强民族自信心学习基础知识,提高选择合适方法解决不同问题的能力教学重难点教学重点:岭回归与套索回归的基本原理与参数调节方法教学难点:编写程序,训练线性回归模型并实现预测教学方法案例分析法、问答法、讨论法、讲授法教学用具电脑、投影仪、多媒体课件、教材教学过程主要教学内容及步骤课前任务【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课前任务,
2、请大家提前了解机器学习的一般流程有哪些【学生】完成课前任务考勤【教师】使用APP进行签到【学生】班干部报请假人员及原因问题导入【教师】提出以下问题:线性回归模型很容易出现出以合现象。有哪些算法使人们能控制模型的复杂度,避免过拟合现象呢?【学生】举手回答传授新知【教师】通过学生的回答引入要讲的知识,介绍岭回归与套索回归2.3岭回归与套索回归2.3.1 岭回归的原理与参数调节岭回归也是一种常用的回归模型,它实际上是一种改良的最小二乘法,是以损失部分信息、降低精度为代价以获得回归系数,是更为符合实际、更可靠的回归方法,常用于多维问题。1.岭回归原理岭回归是避免线性回归过拟合现象的一种线性模型。过拟合
3、是指模型的学习能力”太强了,以致于把训练样本自身的一些特点当成了所有样本的一般性质进行学习,导致泛化能力下降。因此,要训练实用性更强的模型,就需要减小特征变量对预测结果的影响。岭回归通过保持模型所有的特征变量而减小特征变量的系数值,来减4特征变量对预测结果的影响。这种保留全部特征属性,只是降低特征变量的系数值来避免过拟合的方法称为L2正则化。在Skleam中,可通过如下语句导入岭回归模型。fromsklearn.linear_molelimportRidge【例2-5使用糖尿病数据集,用岭回归训练一个模型,并对其进行评估。【参考代码】#导入岭回归模型、糖尿病数据集及划分样本的方法fromskl
4、earn.linear_modelimportRidgefromsklearn.datasetsimportload_diabetesfromsklearn.model-selectionimporttrain_test_split#将数据集划分为训练集和测试集x,y=load_diabetes().data,】oad_diabetes().targelx_train,x_test,y_train,y_test=train_test_split(x,y,random_state=8)钏练模型model=Ridge()model.fit(x_train.y_train)估模型,计算模型的预测准确
5、率r21=model.score(x_lrain,y_train)附算模型在训练集上的预测准确率r22=model.score(x_test,y_test)#计算模型在测试集上的预测准确率#输出模型的预测准确率Print(”模型在训练集上的预测准确率为:”,r21)Prin1(”模型在测试集上的预测准确率为:,r22)【运行结果】程序运行结果如图所示。与例2-4结果相比,本例中使用岭回归训练的模型,预测的准确率要比线性回归稍微低一些,但是在测试数据集上的准确率与训练数据集上的准确率几乎一致,说明岭回归的泛化能力更强。模型在训练臭上的预测准确率为:0.4326376676137663模型在测试莫
6、上的预测准确率为:0.43252177690681852.岭回归参数的调节在岭回归中,可以通过改变alpha参数的值来控制减小特征变量系数的程度,alpha参数的默认值为L【高手点拨】alpha参数的取值没有一定的规定。alpha的最佳设置取决于特定的数据集。增加alpha值会第氐特征变量的系数,使之趋近于零,从而降低其在训练集上的性能,但更有助于提高泛化能力。【例2-6修改例2-5中糖尿病模型的alpha参数,将其值设置为10,观察其运行结果。【程序分析】将例2-5程序中的model=Ridge()修改为Hmodel=Ridge(alpha=10)m【运行结果】程序运行结果如图2-16所示。
7、可见,提高alpha值之后,模型的性能大大降低了,但是测试集的预测准确率却超过了训练集。模型在训练舆上的预测准确率为:0.1511996236701113模型在测试集上的预测准确率为:0.16202013428866247【例2-7修改例2-5中糖尿病模型的alpha参数,将其值设置为0.1,观察其运行结果。【程序分析】将例2-5程序中的model=Ridge()修改为Mmodel=Ridge(alpha=0.1)m【运行结果】程序运行结果如图2-17所示。可见,把aSha值设置为0.1之后,模型在训练集上的预测准确率就略低于线性回归,但在测试集上的预测准确率却有所提升。如果alpha值非常小
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器学习基础及应用 机器 学习 基础 应用 教案 训练 线性 回归 预测 模型