《基于 SSA-Bi-LSTM的港口环境空气质量指数预测.docx》由会员分享,可在线阅读,更多相关《基于 SSA-Bi-LSTM的港口环境空气质量指数预测.docx(13页珍藏版)》请在第壹文秘上搜索。
1、摘要为贯彻绿色港口发展理念,提升港口大气污染监测治理能力,本研究提出了一种基于双向长短期记忆神经网络模型(BidirectionaI1.STM,Bi-1.STM)的港口空气质量指数预测算法,并引入了麻雀搜索算法(SPalToWSearehAlgorithm,SSA)进行参数优化,以提高预测精度和模型的稳定性。选取浙江省嘉兴市乍浦港空气质量监测数据和气象数据为实验样本进行模型训练,实验结果显示,SSA-Bi-1.STM模型相比1.STM、CNN-1.STM、Bi-1.STM模型误差更小,通过该算法的应用,能够更准确地预测港口环境空气质量指数,为港口大气监测与治理提供科学依据和决策支持。OlBi-
2、1.STM模型1.11.STM神经网络1.STM(1.ong-ShortTermMemory)是一种特殊类型的循环神经网络,通过其设计的记忆单元,能够有效地处理和建模时间相关的数据。相较于传统的循环神经网络,1.STM能够更好地捕捉时间序列中的长期依赖关系。1.STM的主要优势在于其记忆单元(MemOryCelI)引入了遗忘门(Forgetgate)、输入门(Inputgate)和输出门(Outputgate)等机制,这些机制使得1.STM网络能够选择性地遗忘和记忆输入序列中的信息,并控制信息的流动,避免了传统循环神经网络中的梯度消失和梯度爆炸问题。其结构如图1所示。图I1.STM结构基于图1
3、展示的连接结构,1.STM神经元可以用如下数学表达式表示:Tt=(wfhh1+wfxxt+bf)it=(wlhht1+wixxt+d)cx=tanh(的九1+wexxt+bs)ct=ft-Cjl+%1Ot=c(w,%+WOXXt+bo)t=ottanh(ct)式(1)中,X1表示该时刻的输入向量;f,i,O分别表示遗忘门、输入门与输出门的激活向量;C表示记忆单元向量;h表示神经网络单元的输出向量;W表示权重系数;b表示偏执向量;。为激活函数。Bi-1.STM神经网络Bi-1.STM模型由GraVeS提出,其在传统1.STM模型上,同时考虑了正向和反向的历史信息,可以更好地捕捉时间序列的上下文特
4、征。Bi-1.STM神经网络模型包含2个独立的1.STM结构,分别按照时间顺序和时间逆序处理序列,然后进行特征提取,将两个网络的输出向量(即提取后的特征向量)进行联接后形成的向量作为最终特征表达。02SSA改进的BI-1.STM2.1麻雀搜索算法麻雀搜索算法受到麻雀的群体行为启发,算法通过定义和更新麻雀的位置和速度来模拟搜索过程,适用于解决复杂、非线性和多模态的问题,具有寻优能力强,收敛速度快的优点。在模拟环境中,麻雀位置可以用矩阵表示,如式(2)所示:xl,lx=I:l,d假设算法中有n只麻雀,麻雀的适应度值表示为加而问题的优化变量维度为d,那么所有麻雀的适应度值表示如下:FX=7(,dD/
5、(口2,12,dl)-/(%,1X,dD.在SSA中,适应度值较高的发现者优先获取食物,通过不断地迭代和位置更新,进行最优解的搜索:X;厂exp(J)ifR2ST式(4)中,t表示当前迭代次数;j=l,2,,d,表示第i个麻雀在第j维中的位置信息;设置最大迭代次数itermax;是介于01之间的任意数字;用和ST分别代表警戒值和安全阈值,取值范围分别为01与0.5l;Q为服从正态分布的随机数;1.表示IXd的单位矩阵。在迭代过程中,加入者会更新自己的位置去寻找更好的食物,加入者的位置更新如下:1+-11.ifin/2otherwise式(5)中,X,代表发现者的最佳位置,而Xwg代表目前全局最
6、差位置,A为矩阵,大小为Ixd,其中每个元素的值为随机数1或-1。式中,A=AT(AAT)在模拟中,假设一部分麻雀具备侦察预警机制,将数量设定为麻雀总数量的10%20%,这部分麻雀称为警戒者,其初始位置通过如下方式生成:XiUt+IXIJ-X1.StlXj-KVorStl(E儿)+ifftfg(6)式(6)中,XbeSt表示全局最优位置;B代表步长控制参数,服从均值为0,步长为1的正态分布;K为随机数,取值为-1到1.f表示当前麻雀适应度值;fg和fw分别表示全局最优、最差适应度值;E为避免分母为。的常数。2.2SSA-Bi-1.STM通过SSA算法,将Bi-1.STM的学习率及迭代次数以及隐
7、含层节点数作为优化变量,步骤概述为:(1)对种群、迭代次数、捕食者和加入者序列进行初始化设置。(2)以Bi-1.STM预测值和实测值的均方根误差作为SSA适应度值,并排序。(3)利用式(4)(6)进行计算,更新发现者、加入者、警戒者的位置。(4)进行exp适应度值计算,更新麻雀位置。(5)判断是否符合终止条件,若符合则退出算法,输出结果,否则返回步骤(2)(4)进行迭代。03实验与结果分析数据描述本实验所用数据为浙江省嘉兴市乍浦港区2022年3月空气质量监测数据和气象要素监测数据,以小时为监测单位,共计744个监测样本,指标包括大气污染监测指数和气象监测数据,具体为:AQI指数、PM仄、O,、
8、PM10.SO2、No2、C0、温度、风力、降雨量、湿度。本文数据样例如表1所示。表1样本数据示例序号时间AQlPMjsgm,Os/(gm,)PMio/(jigm,)SO2/(gInT)NO:/(gInT)CO(gm)温度”风力级降雨ftmm湿度0h020纪310:0069506477Il470.713008512022X11:0071525783Il450.71310.489220223/12:008462569612420.814208832022313:007857728415380.81520754202214:006648887113260.914307674320223/31230
9、664871618221.2IO3069本模型依据前八小时的AQI指数及其他污染物浓度指标和气象因子来预测下一小时的AQI指数,数据集被分为训练集、验证集与测试集,取前500组数据用于模型训练,中间144组数据用于模型验证,最后100组数据用于模型测试,评估模型准确率。模型正式训练前,数据还需要经过异常检测、清洗、归一化处理等,以上全样本数据麻雀种群初始化及参数确定数据清洗计算种群自适应度值并更新麻雀位置平滑去噪数据处理数据归一化样本分类SSA寻参及神经网络构建保存最优个体位置和全局最优位置得到网络最优参数构建输入样本模型输入训练集验证集利用最优参数构建Bi-1.STM网络测试集反归-化预测数
10、据计算误差、绘制预测曲线与真实曲线模型评价AQl指数、PM”、03、PM0温度、风力、降雨量、湿度图2SSA-Bi-1.STM的AQI指数预测流程3.2模型评价指标选取均方根误差(RootMeanSquaredErTor,RMSE)平均绝对误差(MeanAboluteError,MAE)、平均绝对百分比误差(MeanAboIutePercentageErTor,MAPE)作为评估模型准确性的指标,如式(7)所示:1NRMSE=HN冲-yY1NMAE=-ytMAPE=100%NNt=式中,N为样本数量;y为预测数据;3为实测数据。实验分析与模型评价3.3.1 SSA-Bi-1.STM模型预测结果
11、分析如图3所示,AQI预测值与实测值呈现近似对角分布的状态,且在数值低的区域和数值高的区域,点的分布比较均匀,说明通过SSA-Bi-1.STM预测的AQI指数,在整体上呈现出较好的预测精度与稳定性。如图4所示,SSA-Bi-1.STM对AQI预测值的结果残差整体上接近正态分布,其中有80%的预测结果的绝对误差低于10,其中有50%的结果低于5,只有5%706040蜃OV20,111203040506070AQI实测050505浜3v图3SSA-Bi-1.STM预测值和实测值散点分布-203035404550556065AQl实测505050511一TT烂金赧於51015频数图4SSA-BI-1
12、.STm预测值和实测值残差分布3.3.2 模型对比为了校验SSA-Bi-1.STM的预测性能,基于相同的数据及处理逻辑,对其他神经网络模型进行学习,其他神经网络模型包括1.STM模型、CNN-1.STM模型、Bi-1.STM模型,如图5所示。图5不同神经网络模型预测效果对比图图5中(八)、(b)、(c)、(d)分别显示了1.STM模型、CNN-1.STM模型、Bi-1.STM模型、SSA-Bi-1.STM模型在AQl指数上的预测值同实测值的效果对比图,其中横坐标为监测数据时间序列,纵坐标为AQl值。其中(e)子图中,对四种神经网络模型的表现情况集中观测。从对比结果中可以看到,四种模型的预测趋势
13、与真实数据的走势基本相符。CNN-1.STM和Bi-1.STM的预测效果较好,提升了1.STM模型表现,而SSA-BI-1.STM的预测表现又较CNN-1.STM和Bi-1.STM更优。计算了四种神经网络模型的预测值效果的评价指标,如表2所示。SSA-Bi-1.STM预测模型的RMSE、MAEMAPE分别为8.16、6.28、14.86%,与Bi-1.STM的RMSE、MAE、MAPE相比分别降低了1.12、0.77和0.88%;与CNN-1.STM的RMSE、MAE、MAPE相比分别降低了1.o5、0.77和2.22%;与1.STM的RMSE、MAE、MAPE相比分别降低了1.8、1.54和4.76%。结果显示,SSA-Bi-1.STM在测试数据上具有更好的预测效果。表2四种神经网络模型预测值结果评估参数实测ISTMCNN-1.STM模笈Bi-1.STMSSA-Bi-1.STNf均值43.1845.5640.9239.9942.28中值41.0040.6338.7437.0541.4925%分位数32.0037.4532.0331.2738.1375%分位数55.0056.3449.8046.5647.58标一差12.2810.5810.1210.747.74均方根误差(RMSE)9.969.219.288.16平均绝对误差(MAE)7.827.05