欢迎来到第壹文秘! | 帮助中心 分享价值,成长自我!
第壹文秘
全部分类
  • 幼儿/小学教育>
  • 中学教育>
  • 高等教育>
  • 研究生考试>
  • 外语学习>
  • 资格/认证考试>
  • 论文>
  • IT计算机>
  • 法律/法学>
  • 建筑/环境>
  • 通信/电子>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 第壹文秘 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    r语言课程设计.docx

    • 资源ID:1061551       资源大小:92.79KB        全文页数:20页
    • 资源格式: DOCX        下载积分:5金币
    快捷下载 游客一键下载
    账号登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    下载资源需要5金币
    邮箱/手机:
    温馨提示:
    快捷下载时,如果您不填写信息,系统将为您自动创建临时账号,适用于临时下载。
    如果您填写信息,用户名和密码都是您填写的【邮箱或者手机号】(系统自动生成),方便查询和重复下载。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    r语言课程设计.docx

    统计软件与应用课程设计兑情危害覆料学院:班级:学号:姓名:指导老师:书目-.背景与意义2二 .问题重述2三 .方法简介2(一).判别分析3(一)BP神经网络4四 .数据处理与分析5(一数据预处理5(二).判别分析61 .模型建立62 .模型优化103 .模型应用11(三)BP神经网络111 .模型建立112 .模型优化143 .建模重建184 .模型应用20五.总结与建议20-.背影与意义农作物主要古虫常年对农作物造成严峻危告,使农业经济遭到损失。预料害虫将来的发生动态,可以使治虫工作得以有目的、彳安排、方重点的进行。害虫的预料预报工作是进行害虫综合防治的必要前提。只有对害虫发生危害的预料预报做到与时、精确,才能正确的拟定综合防治安排,与时实行必要的措施,经济有效的压低害虫的发生数成,保证农业的高产、稳产。问题重述本文选取的预料预报对象是安徽庐江的Ul间水稻。水稻蚊虫是水稻的重要害虫之一,对农作物的危害极大,其数啾的多少确定程度上确定着水稻受危告的严峻程度。通过对此昆虫的基本了解,发觉气候因素对昆虫的发生发展有着亲密关系,可以干脆影响昆虫的生长、发育、生存、繁殖,从而造成告虫不同的发生期、发生量和危害程度。同时水稻螟虫是变温昆虫,其生长、发育和繁殖与气象条件的关系极为亲密,所以我们从气候因索角度入手进行分析是合理的C本文从影响害虫生存繁殖的气候因索角度入手,结合往年的气象资料以与影响告虫生存繁殖的重要气候因素,选取了平均气温、附低气温、口照时间与降雨以四个主要影响因素,运用统计学方法确定虫害的发生量与气候因子的关系,并给出相应的预料方法。三.方法简介针对实际问题,我们须要通过对历史数据的分析,给出准则:当给定新时期下每样本对应的各项气候指标时,能精确的推断其对应的虫害程度。下面介绍两种方法。(一).判别分析判别分析是在分类确定的条件下,依据某一探讨对象的各种特征值判别其类型归属问题的一种多变发统计分析方法,是用以判别个体所属群体的一种统计方法。依据判别中的组数,可以分为两组判别分析和多组判别分析;依据判别函数的形式,可以分为线性判别和非线性判别;依据判别式处理变量的方法不同,可以分为逐步判别、序贯判别;依据判别标准不同,可以分为距离判别、FiSher判别、BayeS判别法。本文选用的是FiShCr判别法。FiShCr判别,是依据线性FiShCr函数值进行判别,运用此准则要求各组变城的均值有显著性差异。该方法的基本思想是投影,即将原来在R维空间的自变量组合投影到维度较低的D维空间去,然后在D维空间中再进行分类。投影的原则是使得每一类的差异尽可能小,而不同类间投影的窗差尽可能大。FiSher判别的优势在于对分布、方差等都没有任何限制,应用范国比较广。另外,用该判别方法建M的判别方差可以干脆用手工计算的方法进行新样品的判别,这在很多时候是特别便利的“(二),BP神经网络BP神经网络是1986年由Rumclhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大M的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是运用梯度下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层、隐藏层和输出层。BP神经网络,由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负贲接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,依据信息变更实力的需求,中间层可以设计为单隐层或者多隐层结构;最终一个隐层传递到输出层各神经元的信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度卜.降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程始终进行到网络输出的误差削减到可以接受的程度,或者预先设定的学习次数为止。本文运用的是单层前馈网络模型,一股称为三层前馈网或二层感知器,即:输入层、中间层(也称隐层)和输出层。如卜.图所示它的特点是:各层神经元仅与相邻层神经元之间相互全连接,同层内神经元之间无连接,各层神经元之间无反馈连接,构成具有层次结构的前馈型神经网络系统。四.数据处理与分析数据来自于19801988年6IO月安徽庐江的月平均温度、月最低温度、月日照时间、月降雨量以与水稻的月平均虫害程度,且数据都是经过标准化之后的。(一) .数据预处理首先,将降雨址的最终一个数据中的空格消退,再把原始数据的前两列合并为一列,并保存为CSV(逗号分隔)格式,之后用函数将数据读入到R的内存中。> shuju<-rcad.csv('chongqing.csv)为了便利之后的操作,对各列进行命名,其中date代表年度时间,xlx4分别代表平均气温、最低气温、日照时间、降雨量,y代表虫害程度。同时给出各类别下的样本量个数,由于本文不接受时间序列预料的方法进行分析,故第一列的数据运用不到,最终确定运用的数据集为剔除原数据框第一列之后的数据框。从原始数据中可知样本量为54,不是很多,假如再进行分块,可能由于样本心的限制无法得到最好的结果,因此,F文中的训练集和测试集均选用原始数据来充当。>names(shuju)<-c(,date,x,"x2','x3x4'y')> XV-ShUjUl,2:6> table(y)y1234356211将数据框X中的变依链接到内存中,降低后续代码的困难程度,提高代码的可读性。> attach(x)(二) .判别分析1 .模型建立安装并加载软件包MASS。> install.packages(mMASSm)> Iibrary(MASS)将训练集中的y变球作为判别变依,其他剩余的变景作为特征变址,运用Idao函数来进行费希尔判别下的线性判别。>lda<-lda(y.,data=x)#线性判别>IdaCall:lda(y.,data=x)Priorprobabilitiesofgroups:12340.648148150.111111110.037037040.20370370Groupmeans:xlx2x3x41-0.03336857-0.007231429-0.0008800-0.228697120.769233330.7488000000.1302167-0.269633330.377650000.4366000000.6406500-0.497350040.565145450.6081909090.2076455-0.2936727Coefficientsoflineardiscriminants:1.Dl1.D21.D3xl1.1966105-1.8868126-3.1952390x20.97735881.18404273.3471367x30.24311362.1779657-0.2219837x4-0.2754396-0.37820630.4283132Proportionoftrace:1.Dl1.D21.D3输出结果的其次项为此次过程中各类别所运用的先验概率,其实就是训练集中判别变量各水平下的数量占总样本量的比例。第三项为各变量在每一类别中的均值,从中可以看出xl-x3在各类别下方较明显的差别,相反X4在各类别5的差别很小,也就说明降雨成对虫害程度的影响不是很显著。第四项给出线性判别式的参数矩阵.第五项给出各线性判别式分别的贡献比例。>plot(lda)从上图可以看到,在3个线性判别式下14这4个类别的分布状况,不同类别样本已经用相应数字标出。可能受样本处的限制,图中并不能看出很明显的分布状况。下面用上述模型对测试集进行预料,并给出测试集中y变量的预料结果与实际类别的混淆矩阵。> PredV-PrediCt(Ida,x,1:4)> Preci$CIaSS111441111441111111111141111441111441111421(42 11144111111111.evels:1234>table(y,prcdSclass)y12341 32OO32 21033 10014 6005上述混淆矩阵的行表示实际的类别,列表示预料判定的类别。在54个测试样本中,实际属于第1类的有35个,而由判定结果,在35个样本中,有32个判定正确,有3个被错判为笫4类;第2类只有1个判定正确,有2个被错判为第1类,3个被错判为第4类;第3类没有一个判定正确;第4类有5个判定正确,6个被错判为第1类。从矩阵中只能看出每一类别的预料结果与实际类别的差距,只是一个直观的推断,并不能由此看出该模型的优劣,所以我们须要构造一个数量指标(误判概率=矩阵非对角线之和/样本总总),通过这个指标来确定模型的优劣。>eda-sum(as.numeric(pred$CIaSS)!=y)nrow(x)>eIda1 0.2962963通过计算,上述模型的误判率为29.6%,可以看出该模型的预料效果并不好,因此须要进一步的改进。2 .模型优化从上文中我们知道,运用FiSher判别要求各组变侬的均值有显著性差异,从上述结果已经知道降雨地在各类别下的均值差异性很小,所以我们可以考虑将其剔除,通过计算各变成在各类别卜均值的方差,来作为剔除某一变量的理论依据。> var=>c(var(ldameans,l),var(ldaSmeans,2),+var(lda$mcans,3|),var(lda$means(,4)> var1 0.116789090.107833140.077188360.01433243从结果来看,x4在各类别产均值的方差相对其他三者而言差别较大,因此考虑将其剔除,然后重新进行线性判别分析。> Ida2<-lda(y-xl+x2+x3,data=x)#线性判别> pred2<-prcdict(lda2,x,1:3)> table(y,pred2$class)y12341 330022 3003> e_lda2<-sum(as.numeric(pred2$class)!=y)/nrow(x)> e_lda21 0.2777778从误判率的角度来看,剔除x4之后的模型误判率为27.8%,相对原来的模型有所降低;但从混滑矩阵来看,对于第2类和第3类的误判率为100%,这相对原来的模型更难让人接受。两个模型各方好坏,但整体而言,都不是很好。3.模型应用假如运用上述两个模型对将来进行预料的活,只需将所须要的变址存放至一个新的数据框,须要留意的是,数据椎中各变量的名字须要和建匕模型时运用的数据框中各变景的名称一样,即平均气温、最低气温、日照时间、降雨虽分别用xlx4来表示。然后干脆运用模型来给出预料结果。(三)BP神经网络1.模型建立安装并加载软件包nnet。> install.packages(*nnetw)> library(nnet)首先在建模之前,先介绍软件包nnet中的一个函数:CIaSS.ind1.该函数可以通过类别变量的因子变量来生成一个类指标矩阵

    注意事项

    本文(r语言课程设计.docx)为本站会员(p**)主动上传,第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知第壹文秘(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 1wenmi网站版权所有

    经营许可证编号:宁ICP备2022001189号-1

    本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!

    收起
    展开