基于K-means的功率特性测试数据清洗方法.docx
《基于K-means的功率特性测试数据清洗方法.docx》由会员分享,可在线阅读,更多相关《基于K-means的功率特性测试数据清洗方法.docx(8页珍藏版)》请在第壹文秘上搜索。
1、【摘要】风电场技术后评估主要目的在于评估项目建成后是否达到设计发电能力,是否充分发挥了前评估所判定技术层的预期功效。目前,大多数业主单位开展的后评估工作主要服务于投资决策,尚未对风电场运行维护、升级改造、对比及对标分析等深入开展工作。由于缺乏统一的后评估标准,不同风机、风电场之间横向对比、对标等存在客观困难,对生产分析与性能评估带来诸多问题。同时,现场缺少计算相关生产指标的工具,如人为手动计算,工作量大,计算精度低。基于上述情况,用于风电场后评估指标的工具应用前景十分广阔,本方法针对后评估工具中功率曲线计算与评估中数据清洗方面进彳亍说明。一、研究意义风能作为一种清洁和可再生的能源。近年来,世界
2、各地安装的风力发电机越来越多。风电机组安装的数据采集与监视控制系统已经广泛的用于风力发电工况检测,其中包括风电曲线异常数据检测。风电功率曲线是在风电机组运行特性的评价过程中的一项重要指标,与风电机组的设计依据、性能评价指标、发电量考核指标、风电场的收益关系十分密切。风电机组良好的发电性能是保证风力发电企业生产运行管理和发展战略规划的决定因素。功率曲线作为描述风电机组运行性能的一个重要指标,但由于受到温度、气压和机组自身特性等因素的影响,不同风场、不同机组、不同时间所形成的功率曲线具有相当大的差异性。明确实际功率曲线与合同功率曲线之间的差异,对于技术后评估工作具有相当大的参考价值。本文介绍的基于
3、K-means的功率特性测试数据清洗方法是功率曲线模拟流程中数据预处理的一部分,对于提升功率曲线模拟的准确性具有一定意义。二、研究方法基于风电功率曲线的异常数据可以归纳为三种A、B、C三种类型。A类异常数据主要是通用数据异常问题,包括全空数据、部分缺失数据、重复数据、时间异常数据、时间重复数据等。B类异常数据主要是按需数据异常问题,包括时间间隔不达标数据、状态位异常数据、风速越界数据、限功率数据等。C类异常数据主要是离散数据异常问题,包括传感器故障数据、传感器噪声数据和一些不受控随机因素造成的异常数据等。针对不同类别的异常数据,使用不同的数据识别和清洗方法。基于K-means的数据清洗方法主要
4、针对C类异常数据。三、通用数据清洗通用数据清洗模块主要用于处理通用数据异常的问题。对于全空数据,主要存在于SCADA导出和合并过程中,对于全空数据的清洗有众多方法。其中无论是判断任一字段是否为空还是判断文档大小,均可以对全空数据进行数据清洗。对于部分缺失数据,主要存在于SCADA采集过程中出现某种导致的错误或是导出过程中存在某些异常造成的数据部分缺失,对于研究的字段进行针对性的非空检测是处理部分缺失数据的可靠方法。对于重复数据,主要存在于SCADA采集过程中出现某种导致的错误导致的重复或是导出过程中存在某些异常造成的数据重复,对于重复数据的识别主要基于特殊字段的重复检测,清洗手段需要根据所研究
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 means 功率 特性 测试数据 清洗 方法