第11讲简单线性回归.ppt
《第11讲简单线性回归.ppt》由会员分享,可在线阅读,更多相关《第11讲简单线性回归.ppt(52页珍藏版)》请在第壹文秘上搜索。
1、简单线性回归Linear regressionn回归是设法找出变量间在数量上的依存变化关系,用函数表达式表达出来,这个表达式称之为回归方程。两变量间的关系n确定性关系:两变量间的函数关系 圆的周长与半径的关系:C2R 速度、时间与路程的关系:LST X与Y的函数关系:Ya+bX n非确定性关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄的关系;身高与体重的关系:标准体重(kg)=身高(cm)-105 药物浓度与反应率的关系;一、线性回归的概念一、线性回归的概念n当两个变量存在当两个变量存在准确、严格的准确、严格的直线关系时,可以用直线关系时,可以用Y=a+bX,
2、表示两者的函数关系。表示两者的函数关系。n其中其中X 为为自变量(自变量(independent variable););Y是因变量是因变量(dependent variable)。)。n但在实际生活当中,由于其它因素的干扰,许多双变量之但在实际生活当中,由于其它因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程来准确间的关系并不是严格的函数关系,不能用函数方程来准确反映,为了区别于两变量间的函数方程,我们称这种关系反映,为了区别于两变量间的函数方程,我们称这种关系为回归关系,用直线方程来表示这种关系称为回归直线或为回归关系,用直线方程来表示这种关系称为回归直线或线性回归。线
3、性回归。Yabx小插曲:为什么叫”回归“?F.Galton K.Pearson二、回归参数的估计二、回归参数的估计n式中的式中的 是由自变量是由自变量X推算应变量推算应变量Y的估计值,的估计值,a是回归直是回归直线在线在Y 轴上的轴上的截距截距;b为样本的为样本的回归系数回归系数,即回归直线的斜,即回归直线的斜率,表示当率,表示当X变动一个单位时,变动一个单位时,Y平均变动平均变动b个单位。个单位。n计算原理:计算原理:最小二乘法最小二乘法,即保证各实测点到回归直线的纵,即保证各实测点到回归直线的纵向距离的平方和最小,并使计算出的回归方程最能代表实向距离的平方和最小,并使计算出的回归方程最能代
4、表实测数据所反映出的直线趋势。测数据所反映出的直线趋势。YabxY22YYYabXXbYaXXXYllXXYYXXb 2)()(例例12-1 某医师为了研究正常成年男性的运动某医师为了研究正常成年男性的运动后最大心率与年龄的关系,测得后最大心率与年龄的关系,测得20名正常成年男名正常成年男性的有关数据,散点图如下。性的有关数据,散点图如下。年龄504846444240383634心率200190180170160150140130年龄与运动后最大心率的回归方程 41.8 166.8381.2 4477.2 1226.8XXYYXYX Ylll=-1226.8 3.218381.2XYXXlbl
5、-=-301.31243.218YX=-166.8-(-3.218)41.8301.3124a=回归系数和回归方程的意义及性质回归系数和回归方程的意义及性质nb 的意义na 的意义n 的意义n 的意义n 的意义bXaY YY niiiYY12 Yb 的意义n斜率(slope)n 301.3124-3.218 Xn 年龄每增加 1 岁,其运动后最大心率平均减少 3.218(次/分钟)nb 的单位为(Y的单位/X的单位)Y b0,y increase with the increase of X b0b F0.05(1,18),P0.05,拒绝拒绝H0 H0:=0 H1:0 =0.05t检验法22
6、,0()/bbvnSy xblxxbXXSSvtss剩余剩余 Sb是样本回归系数的标准误是样本回归系数的标准误nH 0:0,nH 1:0,n=0.05。()2.529.0409529.0409,5.42142025.42140.2777381.23.21811.588,18,P0.0010.2777Y XbbYYsstv-=-=-=-=年龄与运动后最大心率间存在回归关系。决定系数决定系数(coefficient of determination)n 取值在0到1之间,反映了回归贡献的相对程度。n决定系数除了作为回归拟合效果的概括统计量,还可利用它对回归方程做假设检验。2SSRSS回总2R22(
7、1)(2)MSRkFRnMS回剩四、回归问题的区间估计四、回归问题的区间估计n回归系数的可信区间估计n估计值 的可信区间估计n个体Y值的容许区间估计 Y 总体回归系数 的可信区间估计n根据 t 分布原理估计:n-3.2182.1010.2777-3.8014-2.63462 0 nsbtbb,bnstb2,的可信区间估计总体回归线的95%置信带 Y 样本 总体Y的总平均给定X时Y的平均 (Y的条件均数)YYY 22.2,2,)()(1XXXXnstYstYXYnYn n根据 t 分布原理:的容许区间估计个体Y值的容许区间 22.2,2,)()(11XXXXnstYstYXYnYn n给定 X
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 11 简单 线性 回归