馬文菁 郭曉杰 曹姍姍 孫春華 夏國強 齊承英
(河北工業大學,天津)
對熱負荷的準確預測是實現供熱系統優化控制和節能運行的前提。常用的預測方法可以分為白箱法、黑箱法和灰箱法[1]。其中,黑箱法是基于數據驅動的預測方法,僅靠輸入參數即可得到負荷預測值。基于機器學習的黑箱預測算法在供熱領域得到了廣泛的應用,包括人工神經網絡(artificial neural network, ANN)[2]、極限學習機(extreme learning machine, ELM)[3]、支持向量回歸(support vector regression, SVR)[4]、隨機森林(random forest,RF)[5]等。
ELM算法是由新加波南洋理工大學黃廣斌教授提出的,具有泛化能力較好、處理速度快的優點[6-7]。但該方法的輸入權值和隱含層閾值是隨機產生的[8],導致預測結果的穩定性不足[9]。因此,本文引入粒子群優化(particle swarm optimization, PSO)算法對ELM的輸入權值、隱含層閾值進行優化,并通過案例驗證粒子群優化極限學習機(PSO-ELM)算法的優勢。
1.1 極限學習機(ELM)
ELM算法是由單隱層前饋神經網絡(SLFNs)算法發展而來。圖1為典型的ELM網絡結構,主要包括輸入層、隱含層和輸出層[10]。
注:x1~xm為輸入變量;b1~bL為隱含層的節點偏置;H為輸出函數;m、L分別為輸入層、隱含層的節點個數;ωi為連接輸入層節點i與隱含層節點j的輸入權重;βj為連接隱含層節點j與輸出節點的輸出權重。
對于輸入樣本為X且隱含層節點數為L的ELM網絡結構,隱含層輸出函數矩陣H表示為
(1)
式中g(x)為激活函數。
(2)
式中H+為隱含層輸出函數H的Moore-Penrose廣義逆矩陣。
1.2 粒子群優化(PSO)算法
PSO算法是一種群體智能模型優化算法,在模型中,每個粒子都代表優化問題的解。粒子的速度決定自身運動的距離和方向,通過不斷迭代跟蹤個體極值pbest和群體極值gbest,更新自身位置,獲得問題的全局最優解[11]。
設種群規模為N的粒子群在D維空間構成的種群為M=[M1,M2,…,Mn],第j個粒子在空間中的位置表示為Mj=[Mj1,Mj2,…,MjD],速度表示為Vj=[Vj1,Vj2,…,VjD]。將第j個粒子的個體最優位置即個體極值表示為pj=[pj1,pj2,…,pjD],群體極值表示為pg=[pg1,pg2,…,pgD],則速度和位置的更新公式為
(3)
(4)
式(3)、(4)中 下標d為粒子的維度空間,d=1,2,3,…,D;φ為該粒子對原來運動速度的保持程度,即慣性權重;c1、c2為學習因子,c1為該粒子保持自身個體極值的程度,c2為該粒子對全局的群體極值學習程度的系數;r1、r2為0~1之間的隨機數;t為迭代次數。
PSO在每次迭代中需要根據適應度函數來計算粒子所處位置的適應度,評價粒子的優劣。本文以所有預測樣本預測誤差的歐幾里得范數作為適應度函數,定義見式(5)。由此適應度值更新個體極值pbest和群體極值gbest,直到滿足終止條件,即達到最小誤差或最大迭代次數。
(5)
1.3 PSO-ELM組合算法
ELM的輸入與隱含層之間連接的權值ω和偏置b是隨機產生的,會造成預測結果不穩定,為此本文引入PSO對ω和b進行優化。主要流程為:
1) 確定輸入和輸出樣本。根據熱負荷相關性分析選擇合適的影響因素,包括室外溫度、歷史負荷、歷史供回水溫度、歷史流量等。
2) 對輸入和輸出數據進行歸一化處理。
3) 確定ELM的隱含層節點個數L和激活函數g(x),并由ELM隨機產生的權重ω和偏置b作為PSO優化的變量。
4) 初始化PSO各參數,包括學習因子c1和c2、最大迭代次數、慣性權重φ,并規定粒子速度和位置的范圍。
5) 訓練ELM,并根據適應度函數求出個體最佳pbest和全局最優值gbest。
6) 根據式(3)、(4)更新速度和位置,在達到終止條件時輸出pbest和gbest。
7) 根據PSO確定的權值ω和偏置b,將測試集輸入模型。
8) 對PSO-ELM組合算法進行有效性和精確性評價。
采用PSO-ELM組合算法對熱負荷進行預測,流程見圖2。
圖2 PSO-ELM組合算法預測熱負荷流程
1.4 評價指標
選取算法的評價指標見式(6)~(8),包括平均絕對誤差(EMAE)、均方根誤差(ERMSE)和平均絕對百分比誤差(EMAPE)。3個指標的數值越小,模型預測精度越高。
(6)
(7)
(8)
2.1 研究對象
以天津市某小區熱力站為研究對象。該熱力站安裝了自動控制裝置,可實現數據采集與遠程傳輸。其中采集參數包括室外溫度、一次供回水溫度、二次供回水溫度、瞬時流量和熱量,采集周期為10 min。應用該熱力站2018年11月16日至2019年2月20日的運行數據進行算法的訓練與驗證。由于數據采集設備故障或通訊異常等原因,原始數據需要經過預處理。采用四分位法剔除異常值,由臨近點的線性趨勢來補充缺失值,并對長期缺失數據的日期進行刪除。本研究預測熱力站未來2 h的熱負荷,在剔除異常數據后,由式(9)將采集參數處理為時間步長為2 h的數據集。
(9)
式中S為每2 h熱負荷數據的平均值;Si為第i個參數值。
2.2 算法輸入參數的確定
本研究采用皮爾遜相關系數r[12]對熱負荷影響因素進行分析。r∈[-1,1],r>0表示正相關,r<0表示負相關。|r|越大,相關性越強。|r|≥0.8視為高度相關;0.5≤|r|<0.8視為中度相關;|r|<0.5視為低度相關,應當不予考慮。各影響因素的相關性分析結果見表1。由表1可知,歷史熱負荷Qi-n、室外溫度tw、一次供/回水溫度tg1,i-1/th1,i-1、二次供/回水溫度tg2,i-1/th2,i-1和二次流量G2,i-1與熱負荷的r均大于0.5。其中,前24個周期的歷史熱負荷與熱負荷的r都在0.7以上,為了避免輸入參數集合過大,選取r>0.8的前15個周期(30 h)的歷史熱負荷。而二次供回水壓差Δp2,i-1和一次流量G1,i-1與熱負荷的r均小于0.5,予以剔除。基礎輸入參數集合記為A={tg1,i-1,th1,i-1,tg2,i-1,th2,i-1,G2,i-1,tw,Qi-1,Qi-2,…,Qi-14,Qi-15}。
表1 各影響因素的相關系數
2.3 PSO-ELM預測結果
以第2.2節中篩選集合A為輸入參數,2018年11月16日至12月24日的運行數據為訓練集,2018年12月25—31日的運行數據為測試集,對PSO-ELM的預測效果進行驗證。
首先,應用ELM方法在不調節任何參數的情況下進行1 000次預測,記錄預測值的最大值、最小值和平均值3組數據,以10×1 000次預測為1組,記錄30個EMAPE,并進行10組預測。圖3為10組預測結果的EMAPE箱型圖。由圖3可知,該模型在10組預測中EMAPE最大為16.73%,最小為4.93%。在不調節參數的情況下,預測結果并不穩定,這是權值ω和隱含層偏置b隨機產生造成的。
圖3 ELM模型10組預測的EMAPE箱型圖
然后,應用PSO-ELM組合算法對熱負荷進行預測。PSO算法的參數設置為:粒子搜索維度為2,種群規模為30,最大迭代次數為50,學習因子c1=1、c2=2,位置區間為[-1,1],速度區間為[0,1],ELM隱含層神經元的數量為20,激活函數為sig函數。
PSO-ELM和ELM的預測結果和絕對誤差見圖4、5。由圖4可知,整體上,PSO-ELM預測結果比ELM預測結果更接近實際值。由圖5可知,多數情況下PSO-ELM預測結果的絕對誤差在-1.44~0.17 GJ之間,最大為13.70 GJ;多數情況下ELM預測結果的絕對誤差在0.93~3.38 GJ之間,最大為18.00 GJ。
圖4 PSO-ELM與ELM預測結果對比
圖5 PSO-ELM與ELM預測結果的絕對誤差對比
2.4 預測精度對比
2.4.1不同特征組合下的預測精度
為分析不同特征組合下模型的預測精度,本研究將熱負荷影響因素組合成3個特征集,將特征集A1中的輸入參數依次去除供回水溫度參數和流量參數,構成特征集A2和特征集A3,詳細信息見表2。
表2 不同參數構成的特征集
表3給出了ELM、PSO-ELM、SVR、PSO-SVR(粒子群優化支持向量回歸)分別在特征集A1~A3上的預測誤差。4種算法均在特征集A3上誤差最小,即室外溫度和前15個周期熱負荷的特征組合。其中PSO-ELM誤差最小,EMAE、ERMSE和EMAPE分別為1.64 GJ、2.73 GJ和3.52%。
表3 4種算法在特征集A1、A2和A3上的預測誤差
2.4.2不同負荷變化幅度下的預測精度
由圖4可知,在負荷的2個突變點,算法的誤差大于其他時刻。為研究不同負荷變化幅度下模型的預測精度,定義負荷變化率δmax,見式(10)。以2.4.1節中預測誤差最低的特征集A3為參照,并根據δmax篩選得到A3-1和A3-22個變化幅度不同的特征集,見表4。
表4 特征集A3-1和A3-2訓練集和測試集的劃分
(10)
式中τ為時間,h,取2 h。
4種算法在特征集A3-1和A3-2上的預測結果見圖6。由圖6a可知:在12月20日,熱負荷從36.11 GJ突變至24.66 GJ,預測值明顯高于實際值;在此之前熱負荷變化平穩,預測值與實際值十分接近。圖6b中熱負荷變化相對平穩,4種算法的預測值均接近實際值。
圖6 4種算法在特征集A3-1和A3-2上的預測結果
4種算法在特征集A3-1和A3-2上的預測誤差見表5。結合表3可知,4種算法均在特征集A3上的預測誤差最大,在特征集A3-2上的預測誤差最小。其中特征集A3的δmax=7.4 GJ/h,A3-2的δmax=2.3 GJ/h,即熱負荷變化平穩的工況下,預測精度更高。其中,在熱負荷變化劇烈時PSO-ELM的預測效果最佳,在熱負荷變化平穩時PSO-ELM與PSO-SVR效果接近。
表5 4種算法在特征集A3-1和A3-2上的預測誤差
2.4.3不同樣本容量下的預測精度
為分析不同樣本容量下算法的預測精度,以特征集A3為例,將訓練集和測試集進行分割,分割情況見圖7。將2018年12月25—31日期間共計84組數據固定為測試集。初始訓練集為2018年11月16日至12月24日的數據,依次減少1天構成新的訓練集。由于數據傳輸異常等原因,在部分時間內沒有數據,分別從11月16日至12月15日開始一共構成了20個訓練集,記為T1~T20。
圖7 訓練集和測試集的分割情況
圖8顯示了不同樣本容量下4種算法的預測誤差,圖中標明了各算法的最小誤差。由圖8可知:ELM和SVR在特征集T1~T17上的預測誤差比較平穩,在特征集T18~T20上的預測誤差均明顯增大,對應的3個訓練集數據占比分別為61%、59%和54%;PSO-SVR從特征集T18開始預測誤差變大,而PSO-ELM誤差變化不明顯。為了進一步驗證訓練集數據比例對PSO-ELM算法預測精度的影響,在特征集T20基礎上減去1~7 d的數據構成特征集T21~T27進行預測。由圖8b可知,PSO-ELM直至特征集T27誤差才明顯增大,此時訓練集數據占比為36%。因此,PSO-ELM可以通過更少的數據進行預測,節省預測時間。
圖8 樣本容量變化時4種算法的預測誤差
綜上,當訓練集在一定范圍內變化時,對預測誤差的影響較小,為了縮短訓練時間,可以遺忘掉前面部分數據,但是若訓練集數據量過少,預測誤差會增大。
1) 對于不同特征組合下的負荷預測結果,PSO-ELM的效果均最優,其中最優特征組合為室外溫度和前15個周期的歷史負荷。
2) 在負荷比較穩定的工況下,PSO-ELM和PSO-SVR的預測精度均較高;而負荷波動較大的工況下,PSO-ELM的預測精度更高。
3) 樣本容量在一定范圍內變化對預測精度影響不大,在預測時可遺忘部分數據以節省運算時間。PSO-ELM可遺忘的數據最多,訓練集占比為36%時的預測效果仍優于其他3種算法訓練集占比60%的預測效果。
猜你喜歡 粒子精度負荷 基于粒子群優化的橋式起重機模糊PID控制測控技術(2018年10期)2018-11-25基于DSPIC33F微處理器的采集精度的提高電子制作(2018年11期)2018-08-04基于粒子群優化極點配置的空燃比輸出反饋控制浙江工業大學學報(2017年5期)2018-01-22防止過負荷時距離保護誤動新判據東北電力技術(2016年2期)2016-05-17主動降負荷才是正經事中國化肥信息(2016年35期)2016-05-17GPS/GLONASS/BDS組合PPP精度分析測繪科學與工程(2016年5期)2016-04-17負荷跟蹤運行下反應堆一回路控制系統仿真與驗證核科學與工程(2015年2期)2015-09-26改進的Goldschmidt雙精度浮點除法器電子設計工程(2015年3期)2015-02-27Savitzky-Golay在含沖擊負荷短期負荷預測中的應用電測與儀表(2014年14期)2014-04-04巧用磨耗提高機械加工精度河南科技(2014年14期)2014-02-27