第12章简单线性回归.ppt
《第12章简单线性回归.ppt》由会员分享,可在线阅读,更多相关《第12章简单线性回归.ppt(72页珍藏版)》请在第壹文秘上搜索。
1、第十二章 简单线性回归n对于考察变量与变量之间关系时,我们采用回归分析的方法建立模型或方程进行变量间关系的分析。n因变量:被预测的变量n自变量:进行预测的变量n简单线性回归模型(对总体而言)n 为未知参数,为随机误差项,反映其它未列入回归模型的变量对因变量的影响。XY1021,n关于简单线性回归模型的标准假设:n1.,可推知,该方程称为回归方程。n2.对于所有的X,误差项 的方差 一样:即同方差假定。n3.误差项 独立。其协方差为零,n4.自变量是给定的变量,与误差项线性无关。n5.误差项 服从正态分布,从而说明Y服从正态分布0)(EXYE10)(20)cov(jin对于总体的线性回归模型,由
2、于总体参数未知,我们只能利用样本数据进行估计,得到样本回归模型(对样本而言)。n 分别为 的估计。n其中真实值与估计值之间的差距用e来表示:n 是y的一个估计值。exbby10y iiiiixbbyyye1010,bb21,我们称下式为估计回归方程:xbby10n估计回归方程与总体回归模型之间的区别。n总体回归模型是未知的,它只有一个。而估计回归方程则是根据样本数据拟合的,每抽取一组样本,便可以拟合一个样本估计方程。n总体回归模型中的1和2是未知的参数,表现为常数。而回归估计方程中的 和 是随机变量,其具体数值随所抽取的样本观测值不同而变动。n总体回归模型中的E是Y 与未知的总体回归线之间的纵
3、向距离,它是不可直接观测的。而样本回归模型中的e 是Y 与估计回归线之间的纵向距离,当根据样本观测值拟合出估计回归方程之后,可以计算出e 的具体数值。0b1b最小二乘估计法n该法的目的:使残差平方和达到最小n残差:因变量y的观察值与估计值之间的距离n求该式对应的b0,b1n可以根据微分的方法求解最优解。2102)(min)(miniiiixbbyyyn令niiiniixbbyeQ121012)(niiiiniiixbbyxbQxbbybQ110111000)(20)(2xxxyiiiiiiiiiSSnxxnyxyxxxyyxxb/)(/)()()(2221xbyb10披萨连锁店的销售量与学生人
4、数的回归方程连锁店12345678910学生人数2688121620202226销售收入5810588118117137157169149202序号xyx-x均值y-y均值(x-x均值)*(y-y均值)(x-x均值)21258-12-7286414426105-8-25200643888-6-422523648118-6-127236512117-2-132646161372714472015762716236820169639234369221498191526410262021272864144x均值y均值 SUM SUM141302840568x求和y求和140130055682840)
5、()(21xxyyxxbiii601413010bb模型的拟合度n判定系数:用来判断估计回归方程的拟合程度。n误差平方和SSEn总平方和SSTn回归平方和SSRnSST=SSR+SSE n判定系数2)(yySSEi2)(yySSTi2)(yySSRiSSTSSRr 2nSST=SSR+SSE WHY?)()(2)()(2)()()()(2222yyyySSRSSEyyyyyyyyyyyyyySSTiiiiiiii0)()()()()()(10110110101101iiiiiiiiiiiiiiiixbbyxbxbbyxbxbbyxxbbyxbxbbyxxbyyyy序号xyy估计x-x均值y-y
6、均值(x-x均值)*(y-y均值)(x-x均值)2(y-y均值)2(y-y估计)2125870-12-7286414451841442610590-8-25200646252253888100-6-4225236176414448118100-6-127236144324512117120-2-132641699616137140271444997201571606271623672998201691606392343615218192214917081915264361441102620219012728641445184144x均值y均值SUMSUMSUMSUM14130284056815
7、730142001530 x求和y求和SSTSSRSSE1401300判定系数=SSR/SST0.902734n在该披萨店的例题中,由样本估计得到的回归方程的判定系数为:0.9027n我们认为:该估计回归方程n有90.27%的总平方和可以通过估计回归方程来解释,我们认为该模型较好的拟合了学生人数与销售额之间的线性关系。xy560n判定系数与相关系数的关系:xxxyiiiiiiiiiiiiiiiSSxnxyxnyxxnxxnxyxnyxxxbSSR222222222221)(1)(1()(1()(1)(1()(yyiiSynySST)(122n从而有:n判定系数=SSR/SST=n回忆相关系数的
8、计算公式:n 本例中:r0.9501yyxxxySSS2yyxxxyiiiiSSSyyxxyyxxyxyxr22)()()()var()var(),cov(2rr模型的显著性检验n在模型进行估计以后,得到了估计回归方程。由于估计回归方程是由样本信息得到的,具有随机性。为了由样本推及总体,我们需要对估计参数进行显著性检验。因此可以利用之前介绍的假设检验的统计方法来判断。1.估计回归模型中残差项的方差n之前的假设中,令误差项 的方差记为n可得,n因此 也代表了y值的方差。n数学上可以证明,方差 的无偏估计为MSE(mean square error)2222102)()()()(EXYEYEYEY
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 12 简单 线性 回归
