欢迎来到第壹文秘! | 帮助中心 分享价值,成长自我!
第壹文秘
全部分类
  • 幼儿/小学教育>
  • 中学教育>
  • 高等教育>
  • 研究生考试>
  • 外语学习>
  • 资格/认证考试>
  • 论文>
  • IT计算机>
  • 法律/法学>
  • 建筑/环境>
  • 通信/电子>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 第壹文秘 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    -原始数据的处理方法..docx

    • 资源ID:1279238       资源大小:55.63KB        全文页数:16页
    • 资源格式: DOCX        下载积分:5金币
    快捷下载 游客一键下载
    账号登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    下载资源需要5金币
    邮箱/手机:
    温馨提示:
    快捷下载时,如果您不填写信息,系统将为您自动创建临时账号,适用于临时下载。
    如果您填写信息,用户名和密码都是您填写的【邮箱或者手机号】(系统自动生成),方便查询和重复下载。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    -原始数据的处理方法..docx

    其次章原始数据的处理方法原始数据的处理是数据分析中极为重要的内容。在本节中,我们将介绍原始数据的来源及其特点,着重阐述原始数据初始变换的几种方法,并利用例子进展演示。第一节原始数据的来源及其特点原始数据一般包括反映自然资源区域特征,如海况、气象、水文、地形、地貌、动植物等:反映区域社会经济条件和生产力水平,如人口及其人口密度、捕捞劳力、海疆而积、渔船数量、渔船功率以及渔业总产值、捕捞产值、养殖产值等。原始数据按其性质大体可分为(1)科学试验和观测数据:(2)社会经济统计三;(3)生产阅历数据;(4)有关部门的决策和目标数据:(5)定性资料的量化数据等。不同的数据有不同的来源。但归纳起来,主要的来源有:(1)国家统计部门和行业部门的历年统计资料,这些多为社会经济指标(2)有关业务部门的历年观测数据及其科学试验报告,这些多数为自然因素指标,如东海区渔业资源和环境观测数据;(3选择有代表性的单位或年度,进展实地典型调查所得的数据;(4)区域规划部门通过收集、调查、观看和计算积存的数据;(5)调查访问有实践阅历的劳动者、生产技术人员、科研人员以及治理人员所得的数据;(6)国家有关部门制定的进展规划、建设方案等决策数据;(7)其它方面的数据。我们将以上所获得的各种资料和数据成为原始数据。这些数据来源不同,其类型也不同。从利用分析的角度来看,这些数据有以卜几个主要特点:(I)不同的量纲。如渔业产值为元,渔业产量为公斤,水温为摄氏度,作业时间为天,航程为海里,捕捞努力气为吨、千瓦、艘、人数,CPUE为吨/天、吨/小时、吨/千瓦等。(2)数量级大小相差悬殊,有的数字仅是小数级,有的数字大到亿万。如渔业产值以亿万元或万元计算,而劳动生产率只有几十元到几百元:渔业资源量上千万吨或几万吨等。(3)大局部数据有肯定的随机性,特别是统计或观测的时间序列或偶测值,不管是自然指标还是经济数据,都有随机变化,均有明显的摇摆。(4)大量数据具有肯定的灰色度,运用上述方法收集来的数据绝大多数是区域内各样点的平均值或统计值,在时间上或空间上并不是一个精准的白色参数,而是一个有上限、下限的灰色数。如某调查船进展的渔业资源和环境调查,其所得的数据只能是某一点某一时刻的数据值,但由于条件和仪器设备的限制会使数值产生误差,这一误差值的多少无法知道,因而产生了灰区。如某年某区的降水量,是该区内各次实际观测纪录的平均数,由于测量方法不同和在时间计算上引起的误差等,是无法知道的。同样的问题在一些经济统计数字中也存在。因此,严格地说,收集来的数据绝大多数是灰色参数,都具有不同程度的灰色度。其次节原始数据白化和初始变换的几种方法一、原始数据的取值和白化对于绝大多数灰色参数来说,需要进展白化或淡化处理,以提高白色度,削减灰色度。也就是说通过信息的不断补充,使灰色参数渐渐成为一个比较接近实际的数值。数据白化处理的方法主要有:(1)直接承受距样点最近观测站的多年平均值。例如海水温度和盐度等,可承受多年来的观测平均值或近几天的平均值。依据各个因素指标的等值线图,利用插入法计算其数值。如表层水温、盐度、海底地形等指标,各代表样点不完全有现成的准确观测值,可在“等水温线图”、“等盐度图”、“地饰线图”上,利用插值法计算出其白化值。结合实际状况和数据特征,确定合理的数据。如反映海洋环境质量的指标有有机质、含氮量、含磷量等。在使用时,我们不行能把全部的因子都输入模型,为了计算上的便利,可以归结为一个综合指标。即用该区域内最资料,查出各样点的各项因素指标,然后用“极差变换”的方法求出变换后的数据,相加即可得到一个综合性数字。这样,可解决各因素间量纲不同和数量级大小相差悬殊的问题。(4)对经济指标进展推测。海洋经济的分类划区应当有相对的稳定性,同时应用的综合指标又应反映海洋经济的动态特征,所以,在使用相应的指标数据时,就需要先对指标数据进展进展推测,然后依据推测值进展分类划区。推测的方法很多,常用的是灰色系统GM(1,1模型和指数递增率模型。承受具有一样权数的相对数值。依据统计学原理.,各个个体应当是等权的,但实际上各种统计对象个体不等积,不等形,也即存在着不等权问题。例如,各样点的海疆面积、人口产量、产值等指标,确定值差异很大,无疑是不等权的。假设用特定范国内海疆比重、人口密度、单位平均产量、人均产值等相对数来表示,便可以解决各样点同项因素不等权的问题。二、常用的几种数据变换方法由于原始数据存在着上述特点,进展统计分析建立数学模型有肯定的困难和限制,因此需要依据所建数学模型的类别,对原始数据进展变换。变换的目的主要是:(1)使指标数据尽可能呈正态分布:(2)统一变量指标间的量纲;(3)使两变量指标的非线性关系变换为线性关系;(4)用一组的、指标数量较少的、相互独立的变量,代替一组有相互联系的原始变量指标。不同的数学模型对指标变量的要求不同。大多数的多元统计分析,要求变量总体上听从多元正态分布,且要求量纲全都。如判别分析要求变量呈正态分布;回归分析则要求因变量呈正态分布,要求各自变量与因变量之间有亲热的相关关系。而聚类分析则要求各变量量纲全都,变量间相互独立。因此,数据的变换肯定要依据数学模型的要求,有的放矢地进展。常用的变换方法主要有:(一)标准化变换计驿公式为:X-X(i=1.,2,N样点数;j=1.2,,P变量数)式中:X为变换后的数据;UX1.J为原始数据;.XijX为第j变量的算术平均值,即元=一;ijNs.为变量j的标准差,即si=IqT-二'一VNI变换后的各变量数据平均值为0,方差为1,呈标准正态分布,各变量间有了统一的量纲,而两个变局在变换前后的相关程度不变。从几何意义上讲,标准化变换相当于座标原点移至重心(即平均值)位置,标准化变换适用于量纲不同且数量级大小不一的连续性数据.我们现在以陈军的博士学位论文渔业资源可持续利用评价实证分析中有关数据进展说明。1978-1984年东海区渔业资源可持续利用系统的资源环境子系统如下:年份1978197919801981198219831984X.2.642.722.732.722.642.632.54X,63.1959.1246.4851.0648.1838.641.03相43.641.156.958.562.264.567.7XS69.78559.44651.04743.15636.68429.15224.835X52.6092.2441.5471.4791.4351.2991.258X。1.1781.051.0380.9560.9350.8750.891其中:X为渔获物的养分级,单位为级;X,为优质鱼类产量占海洋捕捞产量的比重,单位为%;X为非选隹性渔具捕捞产量占海洋捕捞产量的比重,单位为%:X4为单位机动渔船的平均捕捞产量,单位为吨/艘;X5为机动渔船每吨位的平均捕捞产量,单位为吨/船吨位;X6为机动和非机动渔船每千瓦的平均捕捞产量,单位为吨/千瓦。在资源环境子系统中,各评价指标的单位不一样,因此需要进展初值化。现分别求出序列X,X.X5网依丁均XA值及其标准差。7=(X÷X÷.÷X)/7=(2.64+2.72+.+2.54)/7=2.66I197819791984又=(X+X+.+X)/7=(63.19+59.12+.+41.03)/7=49.672197819791984又=(X+X+.+X)/7=(43.6+41.1+.+67.7)/7=56.363197819791984X=(X+X+.+X)7=(69.78+59.44÷.+24,83)/7=44.874197819791984X=(X+X+.+X)17=(2.61+2.44+.÷1.26)/7=1.70519719791984X=(X+X+.+X)/7=(1.18+1.05+.+0,89)/7=0.996197819791984S=I1."I=.(2.64-2.66)2÷-(2.54-2.66)2=nn7VN-I7-1i(X-X)21.C_i'aii(63.19-49.67)2+.(41.03-49.67)2ftQQ2V-17-17-1(43.656.36)2+.(67.756.36)2=1247-1(69.78-44.87)2+.(69.78-44.87)2=行28(2.61-1.7)2+.(1.26-1.7)27-1-U.OZS3=0.11I(1.18-0.99)2+.(0.89-0.99)2则数据变换为:X'=I1.2.64-2.660.07=-0.29其他数据变换类同。则获得经过变换后的资源环境子系统的各个序列:年份1978197919801981198219831984x,-0.290.861.000.86-0.29-0.43-1.71X21.511.05-0.360.15-0.17-1.23-0.96X3-1.25-1.490.050.210.570.791.11X,41.530.900.38-0.11-0.50-0.97-1.23X51.751.05-0.29-0.43-0.51-0.77-0.85X,61.710.550.44-0.31-0.50-1.05-0.90(一)极差变换计算公式为:vX-XijjmnjX-Xjmaxjmin式中:X为变换后的数据;UXij为原始数据:Xinwx为第j变最原始数据的最大值;Xjmin为第j变量原始数据的最小值。极差变换后的数据有了统一的量纲,其最大值为1,最小值为0,全部数据变化在01之间。变换前后两两变量之间的相关程度不变,其儿何意义相当于把座标原点移至最小值位置。极差变换适用于量纲不同、数量大小不一的连续型的原始数据的变换。同样以上述例子进展分析。先求出各个指标的最大值和最小值。它们分别为:X=2.73X=2.54ImaxX=63.19IminX=38.602maxX=67.702minX=41.103maxX=69.793minX=24.844maxX=2.614minX=1.265maxX=1.185minX=0.886max6min则其数据变换为:丫,X-12.64-2.54=X11Imm5311X2.73-2.54ImaXImn其余数据转换类同。则可获得经过极差变换后的资源环境子系统各序列:年份1978197919801981198219831984X,10.530.951.000.950.530.470.00X,21.000.830.320.510.390.000.10X,30.090.000.590.650.790.881.00X,

    注意事项

    本文(-原始数据的处理方法..docx)为本站会员(p**)主动上传,第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知第壹文秘(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 1wenmi网站版权所有

    经营许可证编号:宁ICP备2022001189号-1

    本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!

    收起
    展开