王兆國 清華大學(xué)信息技術(shù)研究院,清華大學(xué)信息科學(xué)技術(shù)國家實(shí)驗室(籌)
劉座銘 國網(wǎng)吉林省電力有限公司電力科學(xué)研究院
徐麗媛 清華大學(xué)信息技術(shù)研究院,清華大學(xué)信息科學(xué)技術(shù)國家實(shí)驗室(籌)
李 靜 電網(wǎng)安全與節(jié)能國家重點(diǎn)實(shí)驗室(中國電力科學(xué)研究院)
薛一波 清華大學(xué)信息技術(shù)研究院,清華大學(xué)信息科學(xué)技術(shù)國家實(shí)驗室(籌)
1 引言
化石能源是目前全球主要消耗的能源,大量化石能源消耗導(dǎo)致環(huán)境污染、氣候變暖等諸多問題。近幾年清潔能源的使用,大力發(fā)展可再生能源已經(jīng)成為全球共識。同期,我國提出全球能源互聯(lián)網(wǎng)戰(zhàn)略,實(shí)現(xiàn)風(fēng)能、光能、水能和火能互補(bǔ)的發(fā)展戰(zhàn)略[1]。國家能源局印發(fā)的《風(fēng)電發(fā)展“十三五”規(guī)劃》中明確指出,提高風(fēng)能比重,實(shí)現(xiàn)風(fēng)電由補(bǔ)充向替代能源轉(zhuǎn)變[2]。國家能源局發(fā)布風(fēng)電并網(wǎng)統(tǒng)計數(shù)據(jù),2016年新增風(fēng)電裝機(jī)容量1930萬kW,風(fēng)電發(fā)電量2410億kW h[3],可見風(fēng)電正在逐步大規(guī)模并入電網(wǎng)。但風(fēng)力發(fā)電易受到風(fēng)向、風(fēng)速、時間、季節(jié)等環(huán)境因素影響,具有間歇性和波動性等特性。這些多變因素給風(fēng)力發(fā)電量精準(zhǔn)預(yù)測、電網(wǎng)的調(diào)度、運(yùn)行和控制帶來極大影響。僅2016年全社會用電量達(dá)59198億kW h,其中3.5%因電力預(yù)測的偏差,而白白消耗。
在電力預(yù)測方面,風(fēng)電功率預(yù)測是指風(fēng)電場風(fēng)力發(fā)電機(jī)發(fā)電功率的預(yù)測,按照時間劃分主要包含:超短期預(yù)測、短期預(yù)測、中期預(yù)測和長期預(yù)測。超短期預(yù)測主要預(yù)測未來30min以內(nèi)數(shù)據(jù),主要用于風(fēng)機(jī)智能控制及電能質(zhì)量評估。短期預(yù)測一般預(yù)測未來30min到72h,主要用于電力系統(tǒng)調(diào)度、電力系統(tǒng)穩(wěn)定和電能質(zhì)量控制。中期預(yù)測一般預(yù)測未來數(shù)周或數(shù)月,主要用于設(shè)備狀態(tài)評估和制定維修計劃。長期預(yù)測是針對未來幾年的預(yù)測,主要用于發(fā)電廠投入決策和全年發(fā)電量預(yù)估。
按照預(yù)測方法劃分主要包含:持續(xù)法、時間序列分析法、卡爾曼濾波法、神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)模型和組合預(yù)測方法。持續(xù)法[4]是通過將最近時刻的歷史風(fēng)速值作為下一刻預(yù)測的方法,常用于超短期預(yù)測。時間序列分析法[5,6],主要通過系統(tǒng)采集的風(fēng)功率數(shù)據(jù),按照時間序列擬合曲線建模,并基于模型預(yù)測。卡爾曼濾波法[7,8]主要通過單一序列建立模型,基于卡爾曼濾波器原理實(shí)現(xiàn)預(yù)測,此類算法主要用于實(shí)時在線計算。神經(jīng)網(wǎng)絡(luò)方法[9],如BP神經(jīng)網(wǎng)絡(luò)等,是基于并行信息計算的算法模型,通過仿生物學(xué)原理利用神經(jīng)元互通互聯(lián)提升系統(tǒng)模式識別能力,最新進(jìn)展利用深度神經(jīng)網(wǎng)絡(luò)方法完成風(fēng)功率預(yù)測[10]。依據(jù)機(jī)器學(xué)習(xí)模型完成風(fēng)功率預(yù)測的方法主要包含梯度提升[11]、支持向量機(jī)[12]、隨機(jī)森林[13]、K近鄰[14]等模型。組合預(yù)測[15-17]方法主要通過多種預(yù)測方法組合的方法,進(jìn)而提高精度、減小誤差。
本文提出一種新型的風(fēng)功率預(yù)測模型,該方法首先通過統(tǒng)計觀察歷史風(fēng)機(jī)功率數(shù)據(jù),發(fā)現(xiàn)風(fēng)功率具有明顯季節(jié)變化特性,并基于季度風(fēng)電功率數(shù)據(jù)建立多工況的風(fēng)機(jī)預(yù)測模型。而對于同一時刻的多次天氣預(yù)報數(shù)據(jù)采用均值互補(bǔ)策略,消除偶然氣象數(shù)據(jù)的誤差。其次,利用構(gòu)建好的歷史風(fēng)電功率數(shù)據(jù)和氣象數(shù)據(jù),建立隨機(jī)森林預(yù)測模型。實(shí)驗結(jié)果表明,本文方法具有較小的預(yù)測誤差,適用于多工況復(fù)雜的風(fēng)電功率預(yù)測問題。
2 基于隨機(jī)森林的風(fēng)功率預(yù)測模型
2.1 隨機(jī)深林模型建模過程
建立2001年Breiman提出隨機(jī)森林模型(RandomForest,RF)[18]。隨機(jī)森林模型是一個包含多個決策樹的分類器,以分類回歸樹(CART)作為元分類器,用Bootstrap完成有放回的重抽樣方法,從原始訓(xùn)練數(shù)據(jù)中抽取多個樣本子集進(jìn)行決策樹建模,通過多個決策樹基于投票原則得出最終結(jié)果。隨機(jī)森林模型具有計算精度高、泛化誤差可控、收斂速度快、有效解決不平衡分類等優(yōu)點(diǎn)。
2.2 基于時間序列的風(fēng)電功率建模
IEEE與Kaggle[20]機(jī)器學(xué)習(xí)比賽平臺聯(lián)合發(fā)起的GEFCom全球能源預(yù)測比賽之一的風(fēng)力發(fā)電預(yù)測,數(shù)據(jù)集包含發(fā)電量數(shù)據(jù)和氣象數(shù)據(jù)。發(fā)電量數(shù)據(jù)為2009/7/1/1時至2010/12/31/24時之間以1小時為時段記錄,分別由七家發(fā)電站產(chǎn)生的真實(shí)發(fā)電量數(shù)據(jù),清洗并歸一化處理后共18758條記錄。其中“date”參數(shù)表示數(shù)據(jù)采集時間,如“2009070100”表示為2009年7月1日0時。“wp1-7”表示7個參數(shù)歸一化后的7家風(fēng)電場的發(fā)電量數(shù)據(jù),如“wp1 0.045”表示第一家風(fēng)電場發(fā)電量為0.045,數(shù)據(jù)樣例如表1所示。
表1 風(fēng)電功率數(shù)據(jù)示例
風(fēng)電功率受限于風(fēng)資源的變化,而風(fēng)能資源易受到海陸熱力差異、行星風(fēng)帶位置移動、風(fēng)季環(huán)流等方面的影響,而形成季節(jié)性周期變化。為了探尋風(fēng)電功率數(shù)據(jù)的季節(jié)性變化,本文將風(fēng)電功率數(shù)據(jù)按照季度刻畫風(fēng)電功率變化趨勢,如圖1所示。由圖1觀測可知,風(fēng)電功率數(shù)據(jù)具有明顯季度變化特性,因此在建模時,分別按照不同季度單獨(dú)訓(xùn)練模型,以提高預(yù)測的精度。
圖1 風(fēng)電功率季節(jié)性變化趨勢圖
2.3 基于滑動均值的氣象信息模型
建立2001年Breiman提出隨機(jī)森林模型對發(fā)電量進(jìn)行預(yù)測,重要依據(jù)是氣象數(shù)據(jù),數(shù)據(jù)中包含了風(fēng)的各項預(yù)報,包括風(fēng)向、風(fēng)速和相對的發(fā)電裝置的風(fēng)向分量。氣象數(shù)據(jù)中“date”參數(shù)表示采集時間,如“2009070100”表示為2009年7月1日0時發(fā)布的氣象數(shù)據(jù)。“h”參數(shù)表示未來某時刻數(shù)據(jù),如“1”表示2009年7月1日1時預(yù)計的氣象數(shù)據(jù);“u、v”分別表示相對于的發(fā)電裝置的風(fēng)向分量;“ws(wind speed)”表示風(fēng)速,通過標(biāo)準(zhǔn)化處理,將風(fēng)速數(shù)據(jù)轉(zhuǎn)化為0~10的數(shù)據(jù);“wd(wind direction)”表示風(fēng)向數(shù)據(jù),數(shù)據(jù)樣例如表2所示,每個風(fēng)電場氣象數(shù)據(jù)約10萬條。
表2 氣象數(shù)據(jù)示例
氣象數(shù)據(jù)每日兩次分別于0時及12時發(fā)布,每次發(fā)布未來48小時的氣象預(yù)測數(shù)據(jù),因此每個時間點(diǎn)至多有四次氣象預(yù)報數(shù)據(jù),數(shù)據(jù)示例如圖2所示。基于數(shù)據(jù)特性,部分氣象數(shù)據(jù)缺失,且同時刻多次預(yù)測數(shù)據(jù)均有浮動誤差,為了提高預(yù)測準(zhǔn)確性,減小偶然誤差,本文采取滑動平均值方法完成氣象預(yù)測數(shù)據(jù)的平滑處理。
圖2 平滑均值氣象數(shù)據(jù)
2.3 基于隨機(jī)森林的風(fēng)電功率預(yù)測流程
2001年,Breiman提出的隨機(jī)森林模型,對于風(fēng)電功率預(yù)測主要包含:數(shù)據(jù)清洗與建模、多工況數(shù)據(jù)分類、機(jī)器學(xué)習(xí)模型訓(xùn)練、實(shí)時氣象數(shù)據(jù)輸入、風(fēng)電功率預(yù)測等幾個模塊,如圖3所示。數(shù)據(jù)清洗與建模主要包含對天氣預(yù)報數(shù)據(jù)的平滑均值處理和基于時間序列的風(fēng)電功率分析,得到多工況的多個子數(shù)據(jù)集,并依據(jù)已有的機(jī)器學(xué)習(xí)模型分別對不同工況的子數(shù)據(jù)集建模,形成多工況的數(shù)據(jù)預(yù)測模型。當(dāng)實(shí)時氣象數(shù)據(jù)作為數(shù)據(jù)輸入多工況風(fēng)電功率預(yù)測模型時,模型自動預(yù)測并輸出預(yù)測的數(shù)據(jù)。
圖3 風(fēng)電功率預(yù)測流程圖
3 實(shí)驗評估
3.1 實(shí)驗平臺與數(shù)據(jù)集說明
實(shí)驗平臺采用航天聯(lián)志Aisino5230R服務(wù)器,雙CPU共32核,DDR3-32G內(nèi)存,4T硬盤,2MCache,前端總線1333Mhz, 實(shí)驗環(huán)境為SKlearn[21]。為了檢驗?zāi)P偷臏?zhǔn)確性和抗過擬合能力,按照比賽規(guī)則:訓(xùn)練數(shù)據(jù)集為2009/7/1/1時至2010/12/31/24時,間隔為1小時的風(fēng)電功率數(shù)據(jù)和同時段的氣象數(shù)據(jù),訓(xùn)練過程采用實(shí)則交叉驗證方法防止過擬合。而測試集為2011/1/1/1時至2012/6/28/12時間隔1小時的風(fēng)電功率數(shù)據(jù)和氣象數(shù)據(jù)。按照圖3的訓(xùn)練測試流程,模型輸入為測試集的氣象數(shù)據(jù),預(yù)測風(fēng)電場的風(fēng)電功率。
3.2 評價指標(biāo)
均方根誤差(Root-Mean-Square Error,RMSE)是觀測值與真值偏差的平方和與觀測次數(shù)N比值的平方根。均方根誤差對觀測數(shù)據(jù)中的特大或者特小誤差反應(yīng)敏感,因此均方根誤差能夠很好的反應(yīng)出測量的精密度。在Kaggle[20]機(jī)器學(xué)習(xí)比賽中,均選擇RMSE作為模型評價標(biāo)準(zhǔn)。
3.3 實(shí)驗評估
按照圖3的系統(tǒng)測試流程,其預(yù)測結(jié)果與真值結(jié)果擬合度評估如圖4所示,其中橫坐標(biāo)為2011/1/1/1時至2012/6/28/12時間隔1小時對應(yīng)的氣象數(shù)據(jù),縱坐標(biāo)為相應(yīng)時刻對應(yīng)的風(fēng)電功率。從圖4中觀測結(jié)果所示風(fēng)電功率的預(yù)測曲線和真值曲線擬合度良好。
圖4 真實(shí)值與測量值擬合實(shí)驗
為了進(jìn)一步評估算法和模型,選取普通最小二乘(Ordinary Least Square,OLS)、梯度提升(Gradient Boosting Regressor,GBR)、隨機(jī)森林(Random Forest Regressor, RFR)、K最近鄰(K Neighbors Regressor,KNN)完成模型構(gòu)建和評估,并分別對七個風(fēng)電場風(fēng)電功率數(shù)據(jù)建模,并根據(jù)測試結(jié)果完成RSME評估,其檢測結(jié)果如表3所示。
由表3數(shù)據(jù)可知,本文提出基于不同季度數(shù)據(jù)和多工況預(yù)測模型在七個風(fēng)電場中預(yù)測結(jié)果均表現(xiàn)優(yōu)異,其中隨機(jī)森林模型的RSME為0.1371695,此結(jié)果優(yōu)于Kaggle[20]機(jī)器學(xué)習(xí)比賽第一名成績0.14566。
表3 模型算法評估
4 結(jié)語
本文方法充分考慮風(fēng)電特性,按照季度和多工況特性訓(xùn)練多工況的風(fēng)電功率預(yù)測模型。該模型具有較好的擬合特性和較低的均方根誤差值,其實(shí)驗結(jié)果表明本文方法優(yōu)于Kaggle測評比賽中第一名成績,可見本文數(shù)據(jù)建模方法、模型選擇和模型訓(xùn)練方面具有較好的特性,適合多工況復(fù)雜條件下的風(fēng)功率預(yù)測。
基金項目: 國家科技支撐計劃資助項目(2015BAK34B00);國家電網(wǎng)公司科技項目互聯(lián)大電網(wǎng)一體化網(wǎng)絡(luò)分析計算支撐服務(wù)及關(guān)鍵技術(shù)研究(KY-SG-2016-031-JLDKY)
作者簡介
王兆國(1986-),男,黑龍江七臺河人。現(xiàn)為清華大學(xué)信息技術(shù)研究院博士后,主要研究方向為電力大數(shù)據(jù)智慧分析、網(wǎng)絡(luò)與信息安全。
參考文獻(xiàn):
[1] 劉振亞. 全球能源互聯(lián)網(wǎng)[M]. 北京: 中國電力出版社, 2015.
[2] 國家能源局. 國家能源局關(guān)于印發(fā)《風(fēng)電發(fā)展“十三五”規(guī)劃》的通知[Z]. 北京: 國家能源局.
[3] 國家能源局. 2016年風(fēng)電并網(wǎng)運(yùn)行情況[Z]. 北京: 國家能源局, 2017.
[4] 李麗, 葉林. 基于改進(jìn)持續(xù)法的短期風(fēng)電功率預(yù)測[J]. 農(nóng)業(yè)工程學(xué)報, 2010, 26(12): 182-187.
[5] Wang J, Hu J. A robust combination approach for short-term wind speed forecasting and analysis–Combination of the ARIMA (Autoregressive Integrated Moving Average), ELM (Extreme Learning Machine), SVM (Support Vector Machine) and LSSVM (Least Square SVM) forecasts using a GPR (Gaussian Process Regression) model[J]. Energy, 2015, 93: 41 - 56.
[6] Lydia M, Kumar S S, Selvakumar A I, et al. Linear and non-linear autoregressive models for short-term wind speed forecasting[J]. Energy Conversion and Management, 2016, 112: 115 - 124.
[7] Chen K, Yu J. Short-term wind speed prediction using an unscented Kalman filter based state-space support vector regression approach[J]. Applied Energy, 2014, 113: 690 - 705.
[8] Zuluaga C D, Alvarez M A, Giraldo E. Short-term wind speed prediction based on robust Kalman filtering: An experimental comparison[J]. Applied Energy, 2015, 156: 321 - 330.
[9] Quan H, Srinivasan D, Khosravi A. Short-term load and wind power forecasting using neural network-based prediction intervals[J]. IEEE transactions on neural networks and learning systems, 2014, 25(2): 303 - 315.
[10] Hu Q, Zhang R, Zhou Y. Transfer learning for short-term wind speed prediction with deep neural networks[J]. Renewable Energy, 2016, 85: 83 - 95.
[11] Jiang Y, Xingying C, Kun Y U, et al. Short-term wind power forecasting using hybrid method based on enhanced boosting algorithm[J]. Journal of Modern Power Systems and Clean Energy, 2017, 5(1): 126 - 133.
[12] Liu Y, Sun Y, Infield D, et al. A hybrid forecasting method for wind power ramp based on Orthogonal Test and Support Vector Machine (OT-SVM)[J]. IEEE Transactions on Sustainable Energy, 2017, 8(2): 451 - 457.
[13] Lahouar A, Slama J B H. Hour-ahead wind power forecast based on random forests[J]. Renewable Energy, 2017, 109: 529 - 541.
[14] Yesilbudak M, Sagiroglu S, Colak I. A novel implementation of kNN classifier based on multi-tupled meteorological input data for wind power prediction[J]. Energy Conversion and Management, 2017, 135: 434 - 444.
[15] Yuan X, Tan Q, Lei X, et al. Wind power prediction using hybrid autoregressive fractionally integrated moving average and least square support vector machine[J]. Energy, 2017, 129: 122-137.
[16] Saleh A E, Moustafa M S, Abo-Al-Ez K M, et al. A hybrid neuro-fuzzy power prediction system for wind energy generation[J]. International Journal of Electrical Power & Energy Systems, 2016, 74: 384 - 395.
[17] Yuan X, Tan Q, Lei X, et al. Wind power prediction using hybrid autoregressive fractionally integrated moving average and least square support vector machine[J]. Energy, 2017, 129: 122 - 137.
[18] Breiman L. Random forests[J]. Machine learning, 2001, 45(1): 5 - 32.
[19] Krause J. Introduction to Bootstrap[M]. Introducing Bootstrap 4. Apress, 2016: 23 - 32.
[20] GEFCom2012. Global Energy Forecasting Competition 2012-Wind Forecasting[OL]. https://www.kaggle.com/c/GEF2012-wind-forecasting/leaderboard
[21] Scikit-learn. Scikit-learn[OL]. http://scikit-learn.org/stable/.
摘自《工業(yè)控制系統(tǒng)信息安全》專刊第四輯