無論是在過去的電力中長(zhǎng)期交易市場(chǎng)里,還是即將到來的電力現(xiàn)貨交易市場(chǎng)里,負(fù)荷預(yù)測(cè)都是各大售電公司和電力大用戶馳騁市場(chǎng)的必備技能。不會(huì)做負(fù)荷預(yù)測(cè)或者負(fù)荷預(yù)測(cè)做得不好,必將被無情的市場(chǎng)按在地板上摩擦。
在過去幾年的業(yè)務(wù)發(fā)展中,匯電云聯(lián)累積了70多個(gè)行業(yè)、3000多用戶2年以上的一級(jí)能效數(shù)據(jù)。經(jīng)過補(bǔ)全,清洗等ETL處理后,把用戶每天的真實(shí)負(fù)荷繪制成曲線,發(fā)現(xiàn)真是千姿百態(tài):有的上躥下跳日復(fù)一日,有的一馬平川偶爾會(huì)皮一下,如下圖所示。
圖一:不同用戶的負(fù)荷曲線
負(fù)荷預(yù)測(cè)的方法,從根據(jù)用戶歷史耗電情況的估算,到基于統(tǒng)計(jì)的分析預(yù)測(cè)模型如ARIMA,再到現(xiàn)在大行其道的循環(huán)神經(jīng)網(wǎng)絡(luò)如LSTM及其變種,無一例外地都對(duì)穩(wěn)定負(fù)荷變化有強(qiáng)烈的需求。負(fù)荷越穩(wěn)定,規(guī)律越明顯,預(yù)測(cè)的準(zhǔn)確率就越高。這就是我們?cè)趯?shí)際操作中,會(huì)發(fā)現(xiàn)統(tǒng)調(diào)負(fù)荷預(yù)測(cè),很輕松就能達(dá)到98%以上,而具體到單個(gè)用戶的負(fù)荷預(yù)測(cè),準(zhǔn)確率會(huì)低到懷疑人生。
對(duì)于售電公司,預(yù)測(cè)所代理的用戶總體的負(fù)荷曲線才是實(shí)實(shí)在在的需求,同時(shí)還可以深入挖掘和發(fā)展不同行業(yè)、不同用電習(xí)慣的用戶,來平衡手中已有用戶的總體負(fù)荷曲線。這對(duì)他們拓展業(yè)務(wù),降低被考核風(fēng)險(xiǎn),以及在現(xiàn)貨市場(chǎng)中獲利都至關(guān)重要。
匯電云聯(lián)根據(jù)不同的場(chǎng)景需求,建立起豐富的算法模型庫,在這些算法和模型庫中,本著實(shí)事求是不浮夸不忽悠的科學(xué)精神,我們會(huì)陸續(xù)公布不同場(chǎng)景,不同數(shù)據(jù)組合,不同特征工程下的負(fù)荷預(yù)測(cè)實(shí)戰(zhàn)結(jié)果。本期公布的是【有色金屬冶煉】這個(gè)行業(yè)。
每張圖展示的結(jié)果,選擇的訓(xùn)練集都是從2018-04-01到T-1,其中T為要預(yù)測(cè)的那一天。比如要預(yù)測(cè)2018-12-23這一天24個(gè)點(diǎn)的負(fù)荷,訓(xùn)練集是2018-04-01到2018-12-23,依次類推。每張表展示是T當(dāng)天的預(yù)測(cè)結(jié)果,表的最后一行是所有預(yù)測(cè)時(shí)間的平均預(yù)測(cè)結(jié)果。
在所有的模型和算法中,我們充分考慮了工作日、周末和節(jié)假日的區(qū)別,但是由于沒有對(duì)用戶的周末、節(jié)假日的負(fù)荷使用情況進(jìn)行調(diào)研,會(huì)導(dǎo)致這部分時(shí)間的預(yù)測(cè)準(zhǔn)確率比較低。圖中顯示的預(yù)測(cè)準(zhǔn)確率,是從12-23到12-31這段時(shí)間的平均預(yù)測(cè)準(zhǔn)確率,準(zhǔn)確率評(píng)估公式是國(guó)網(wǎng)公布的公式,該公式相對(duì)于常用的回歸算法的評(píng)估公式比如MAPE,對(duì)異常值更加敏感,意味著同一套數(shù)據(jù),用該公式算出的準(zhǔn)確率,會(huì)比使用MAPE算出來的準(zhǔn)確率低一些。
圖二:國(guó)網(wǎng)準(zhǔn)確率評(píng)估公式
第一組算法是一組很巧妙的、取不同時(shí)間長(zhǎng)度的數(shù)據(jù)作為自變量的算法。該算法的思想取自生產(chǎn)的連續(xù)性,當(dāng)然也受限于生產(chǎn)的連續(xù)性。因此,在趨勢(shì)穩(wěn)定不中斷的情況下,準(zhǔn)確率相當(dāng)可觀,如其中12-27、12-28這兩天。但對(duì)突然的減產(chǎn)檢修等生產(chǎn)行為,則表現(xiàn)得會(huì)措手不及。
圖三:方式一預(yù)測(cè)方法
第二組算法是機(jī)器學(xué)習(xí)領(lǐng)域的回歸算法,取相似日同時(shí)刻的歷史負(fù)荷值構(gòu)建特征矩陣,這是一種比較直觀比較傳統(tǒng)的做法,對(duì)比較穩(wěn)定的工作日的負(fù)荷預(yù)測(cè)效果,也是杠杠的好。
圖四:機(jī)器學(xué)習(xí)算法組
第三組算法還是機(jī)器學(xué)習(xí)領(lǐng)域的算法,根據(jù)電力場(chǎng)景構(gòu)建特有的特征,我們一共構(gòu)建了有14維的特征矩陣。如下列圖表所示,效果略差于第一、二組算法得到的結(jié)果。
圖五:自建特征算法組
第四組算法是用不同的差異比較大的簡(jiǎn)單算法模型做的STACKING,結(jié)果也還過得去。
從上面提供的四組算法得到的結(jié)果來看,反而是比較傳統(tǒng)的相似日同時(shí)刻模型得到的準(zhǔn)確率更高,而Kaggle上刷分的常勝技能STACKING,也不見得甩了其他算法幾條街。另外12-30是元旦假期的第一天,預(yù)測(cè)值誤差比較大,這主要是因?yàn)椴煌脩舻墓?jié)假日安排不同步造成的。
當(dāng)然我們這一次實(shí)驗(yàn)數(shù)據(jù)比較單一,后面我們會(huì)陸續(xù)提供包括天氣、用戶生產(chǎn)情況在內(nèi)的諸多因素構(gòu)建維度更多更復(fù)雜的特征,敬請(qǐng)期待。
聯(lián)系客服