You are on page 1of 13

Ц2 16

ПРИМЕНА МАШИНСКОГ УЧЕЊА ЗА ПРЕДВИЂАЊЕ ПОТРОШЊЕ


ЕЛЕКТРОЕНЕРГЕТСКОГ СИСТЕМА СРБИЈЕ

АЛЕКСАНДАР БОЈАРОВ1
СКАЛАМЕРИЕ ДОО

ИВАН МИЛЕНКОВИЋ
ОГРАНАК ,,WSP UK LTD” БЕОГРАД

БЕОГРАД

СРБИЈА

Кратак садржај — Рад се бави описом математичког модела за предвиђање


потрошње електроенергетског система Србије. Модел се базира на неколико
напредних техника машинског учења које се користе за предвиђање временских
серија и за моделовање комплексних система. Комплексни системи садрже велики
број параметара који утичу на њихов рад. Самим тим, у циљу одређивања
корелације између улазних података и потрошње система, потребни су улазни
подаци различитог типа и у великом броју. Као извор података користимо
платформу за транспарентност удружења европских оператора преносних система
(https://transparency.entsoe.eu/). Комбинацијом различитих статистичких,
математичких и модела машинског учења, можемо добити врло поуздана
предвиђања потрошње у распону од 24 часа. Модел можемо да користимо и за
предвиђања за дужи временски период, али са пропорционално мањим степеном
поузданости. Предвиђања модела за наредна 24 часа биће јавно доступна на нашем
интернет сервису, као и историјски подаци, у циљу провере квалитета рада модела
машинског учења (https://www.skalamerie.com/dodona/eeload.php).

Кључне речи — машинско учење – предвиђање - временскe серијe - комплексни


системи - вештачка интелигенција - наука о подацима - планирање рада еес

1
acabojarov@gmail.com
1 УВОД
Електроенергетски систем (ЕЕС) представља један од најраспрострањенијих система у
свакодневној употреби. Потрошња електричне енергије у оквиру ЕЕС је веома
динамична карактеристика на коју утиче велики број различитих фактора. Одржавање
равнотеже између потрошње и производње електричне енергије је од велике важности за
правилно и економично функционисање ЕЕС.
Потрошња електричне енергије је веома битна, јер је то параметар на који не можемо да
утичемо, а од ког зависи целокупна организација производње електричне енергије. У
контексту савремених тенденција додавања обновљивих извора енерије на постојећи
ЕЕС, предвиђање потрошње добија још већи значај. Производња елктричне енергије из
обновљивих извора зависи од низа околности као што су временски услови, сезонске
појаве и микроклиматски услови, што представља додатни отежавајући фактор у
планирању рада описаног динамичког система. Поуздано предвиђање потрошње
електричне енергије омогућава организацију рада произвођача електричне енергије.
Ефикасна организација прозвођача доприноси стабилности система, оптималној
потрошњи енергената и искоришћености обновљивих извора, а самим тим и смањење
штетних ефеката на околину.
У циљу предвиђања временских серија, као што је и ЕЕС, успешно се користи машинско
учење. Приликом предвиђања потрошње електричне енергије користе се алгоритми који
на основу историјских података могу да процене будуће вредности. Поред машинског
учења, користимо и статистичко учење у комбинацији са дубоким неуронским мрежама
и методама базираним на стаблима одлучивања. Да би се користило машинско учење за
предвиђање временских серија, потребно је прикупити довољно података и истражити
утицај различитих фактора као што су временски услови, дани у недељи, празници,
сезонски утицаји и остали слични фактори који могу да утичу на потрошњу електричне
енергије [1-5].
Подела предвиђања потрошње електричне енерегије могу се класификовати у неколико
класа на основу дужине периода предвиђања. У овом раду се бавимо веома кратким
предвиђањима за дан унапред, тако да одређени споро променљиви фактори попут
економских, урбанистичких и демографских – могу бити занемарени [6,7].

2 ПРЕГЛЕД МОДЕЛА MAШИНСКОГ УЧЕЊА


Предвиђање временских серија за веома кратак период се углавном базира на моделима
који користе историјске податке из непосредне прошлости. Поред података о потрошњи,
у напреднијим моделима машинског учења користимо и метеоролошке податке из
непосредне прошлости. Наш модел потрошње ЕЕС заснован је на модификованој
ауторегресивној методи са клизећом средњом вредношћу (енг. Moving Average). Код ове
методе временску серију разлажемо на три суперпонирана сигнала која покушавамо
засебно да моделујемо:

(1)

где je yi потрошња у сату i, Ti је тренд који рачунамо као средња вредност у оквиру од 24
часа, Si је периодична компонента и Ci је компонента циклуса у сату i.
За моделовање тренда користимо неколико техника статистичке обраде, линарне
регресије и разлагање на периодичне компоненте. Вредности које добијамо
екстраполирамо како би добили вредности за следеће 24 тачке предвиђања. У овом
кораку предвиђања садрже неправилности и велику количину шума, тако да над овим
подацима примењујемо технике машинског учења и дубоку неуронску мрежу како би
добили што боље слагање са правим вредностима тренда.

Када добијемо задовољавајуће предвиђање тренда, из Фуријеове трансформације


сигнала из прошлости добијамо периодичне компоненте које користимо да предвидимо
периодичну компоненту сигнала. Цикличну компонент одређујемо на основу парцијалне
аутокорелације сигнала са вредностима из прошлости.

Из наведеног можемо закључити да је метод за предвиђање тренда од велике важности,


јер директно утиче на све следеће кораке у моделовању.

2.1 Предвиђање тренда дан унапред

Tренд подразумева клизећу средњу вредност у 24 тачака, којu можемо описати


изразом:

(2)

где је N број тачака за које рачунамо средњу вредност.

Слика 1. Потрошња ЕЕС и тренд рачунат као клизућа средња вредност 24 тачака.
На слици 1 је приказан тренд и вредност потрошње за неколико месеци. Из израза 2
можемо заклључити да је за прорачун тренда у једној тачки потребно укупно 24
вредности потрошње, односно 23 вредности из непосредне прошлости и једна, садашња,
вредност. Самим тим за предвиђање сатних вредности тренда потребно је користити неку
врсту екстраполацију података. Проблем код једноставних метода екстраполације је тај
што вредности које добијамо за касније тренутке одступају од правих вредности
пропорционална са порастом времена предвиђања. На слици 2 дата је једноставна
линеарна екстраполација на свака 24 часа. У циљу боље предикције тренда потребно је
комбиновати неколико различитих метода интерполације као улаз за комплекснији
модел који може дати вернији приказ тренда. Поред различитих метода екстраполације
као улаз користимо и меторолошке податке. На слици 2 дата је предикција тренда на
основу екстраполације сигнала добијеног инверзном Фуријеовом трансформацијом
(ИФТ) доминантних простопериодичних компоненти тренда.

Слика 2. Потрошња, тренд и два начина екстраполације вредности тренда у циљу


предвиђања нових 24 тачака (линеарна и периодична екстраполација).

Поред клизеће средње вредности, користимо још неколико различитих врсти тренда и
њихових екстраполација као улаз у комплексни систем машинског учења. Како би
добили прецизније вредности тренда у каснијим тренуцима користимо дубоку неуронску
мрежу, која има за циљ да на основу улазних вектора исправи предикције за описани
тренд. Улаз у неуронску мрежу су вектори (x1, x2, … xK) где сваки представља један
улазни податак са N тачака из историје. У вектор улазних података имамо историјске
статистичке параметре потрошње (клизећа средња вредност, клизећа медијана, клизећа
експоненцијална средња вредност) и њихове тренутне предикције добијене различитим
ектраполацијама. Поред историјских података користимо и екстерне метеоролшке
варијабле: температуру, притисак, УВ индекс, количина падавина и брзина ветра. Такође
користимо и класификаторе: сат у дану, дан у недељи и дан/ноћ класификатор сата.

Укупно имамо K различитих података у N историјских тачака, што чини матрицу КxN
(приказано на слици 3). На излазу неуронске мреже добијамо нови вектор x K+1. Нови
вектор, заједно са осталим екстраполацијама третирамо као улаз у мултивариабилни
полиномни линеарни регресор (МПЛР) који има за циљ да на најбољи начин комбинује
различите предикторе тако да на излазу даје најмању грешку. Излаз МПЛР-а
пропуштамо кроз нископропусни филтар (НПФ), који има за циљ да уклони статистички
шум услед низа екстраполација које смо користили. Ниско пропусни филтер користи
податке из 14 претходних дана. На крају добијамо знатно побољшање у предвиђању
тренда, за разлику од једноставних екстраполација (слика 4).
Слика 3. Шематски приказ комплексног модела за машинско учење тренда потрошње.

Слика 4. Потрошња, тренд и предвиђање тренда комплексног модела.

2.2 Периодична компонента потрошње

Након што смо одредили тренд, следећи корак је да одузмемо предвиђени тренд од
сигнала како би смо уклонили компоненту која није брзо променљива. Фуријеову
трансформацију примењујемо на сигналом за тренинг Sti, који представљамо следећим
изразом:

(3)

У изразу 3, потрошња је дата као yi, док је Tpi предвиђање тренда за час i на основу излаза
комплексног модела из претходног поднаслова. Изглед сигнала Sti дат је на слици 5,
одакле се може уочити да је периодична компонента око десет пута мање магнитуде од
тренда. Фуријеову трансфомацију користимо за прозор од 14 дана, након чега
предвиђамо периодични сигнал за један дан. На слици 5 дато је предвиђање периодичне
компоненте Sp на основу сигнала за тренинг St. Може се приметити да инверзна
фуријеова трансформација детаљно опонаша сигнал за тренинг, док одступање постоји
у последњих 24 тачака на слици које нисмо користили за тренинг.
Слика 5. Периодична компонента потрошње добијена уклањањем тренда, сигнал St, и
предвиђање периодичне компоненте за један дан применом инверзне Фуријеове
трансформације Sp.

Слика 6. Предвиђање потрошње коришћењем предиктора за тренд и периодични сигнал.

Померањем прозора за један дан добијамо предикције суперпонирањем сигнала тренда


и перодичне компоненте (слика 6). На слици 6 приметна су извесна одступања, нарочито
код тачака које припадају данима викенда (нерадни дани). Додатно побољшање
предвиђања можемо постићи апроксимацијом циклуса.

2.3 Циклуси

Под циклусима подразумевамо појаве које нису периодичне али које су у корелацији са
појавама у историји. Циклусе не можемо да предвидимо екстраполацијом периодичних
појава, као што је инверзна Фуријеова трансформација. Један од метода за проналажење
циклуса у сигналу јесте аутокорелација, при чему тражимо међусобне зависности између
вредности сигнала у различитим тренутцима у прошлости. Да би добили временску
серију коју можемо да третирамо статистичким методама аутокорелације, прво морамо
да уклонимо тренд и периодичне појаве. Временска серија Cti, коју користимо за тренинг
аутокорелативне методе у сврху одређивања цикличне зависности можемо описати
изразом:

(4)

На слици 7 приказана је временска серија коју користимо за предвиђање циклуса одакле


се може уочити да смо одступања у односу на одступања сигнала St, смањили око два
пута. На истој слици дато је и предвиђање цикличних компоненти на основу линеарне
регресије историјских вредности од значаја (сигнал Cp).

Слика 7. Сигнал за тренинг линарног регресора (Ct) и предвиђање цикличних компоненти


(Cp).

Можемо уочити да предвиђање цикличних компоненти прати тренд правих цикличних


вредности, тако да ће додатно смањити одступања предвиђања претходна два модела.
Коначно предвиђање потрошње добијамо у облику:

(5)

На слици 8 приказано је коначно предвиђање комплетног модела приказаног у овом раду.


Квантитативним показатељима поузданости предвиђања бавимо се у следећем
поднаслову, где ћемо показати начин на који одређујемо поузданост методом
конформалне предикције.
Слика 8. Потрошња (сигнал y) и предвиђање потрошње (сигнал yp) за дан унапред за
комплетан модел представљен у раду.

3 ПРОЦЕНА ПОУЗДАНОСТИ ПРЕДВИЂАЊА

Основни метод који користимо за процену поузданости предвиђања је конформална


предикција. Конформална предикција је метод за одређивање интервала предвиђања и
тестирање хипотеза којим се формирају области поузданости за моделе машинског
учења без претпоставки о статистичкој расподели података. Meтод се базира на идеји о
статистичкој анализи одступања предвиђања од познатих вредноси, при чему се
формирају скупови који гарантују области поузданости предвиђања [8-12].

Слика 9. Расподела одступања предвиђања за први и последњи сат у једном дану.

То значи да уз задати ниво поузданости, област предвиђања садржи праву вредност са


одређеном вероватноћом. На пример, ако конструишемо област предвиђања са нивоом
поузданости од 95%, онда ће то значити да можемо да гарантујемо да ће 95% правих
вредности упасти у област предвиђања.

Један од разлога за одабир метода конформалне предикције јесте што имамо могућност
да одредимо ниво поузданости засебно за сваки сат у оквиру интервала предвиђања. У
даљем размазтрању користимо распон од 483 дана за формирање области поузданости.
Саму временску серију користимо за тестирање модела тако што за сваки од 483 дана
тренирамо модел на претходном сету података и користимо искључиво историјске
податке из ,,локалне прошлости”, т.ј. прошлост у односу на дан за који радимо
предикцију. Након што се модел истренира рачунамо одступање предикције на основу
познатих вредости потрошње. Укратко, сваки дан из распона од 483 третирамо као
,,сутрашњи”. На слици 9, дат је хистограм релативних одступања предвиђања за први и
последњи сат у току једног дана.

Следећи корак је да одредимо границе одступања, за сваки сат посебно, у којима упада
95%, односно 90%, свих одступања. На слици 10 дате су две област предвиђања са
поузданошћу од 95%, и са поузданошћу од 90%. Као што се може предпоставити, што је
ниво поузданости већи, то је и област конформалне предикције шира јер мора да
обухвати већи број одступања. Област конформале предикције користимо заједно са
приказом резултата самог предвиђања као показатељ поузданости.

Поред конформалне предикције, за оцену квалитета предвиђања потрошње у


индустријског пракси стандардно се користи MAPE (Mean Absolute Percentage Error) на
дневним интервалима. На основу тестног сета података и предвиђања (укупно 483 дана)
можемо прерачунати MAPE у сваком сату као и његову укупну вредност за сва
предвиђања. На слици 11 приказана су MAPE одступања по сваком сату као и просек за
сва предвиђања. Са слике можемо закључити да су одступања изједначена за сваки сат у
току дана и крећу се од 4% до 5.75%, са средњом вредношћу од 4.64%.

Слика 10. Област конформалне предикције за два нивоа поузданости.


Слика 11. Средња вредност апсолутне вредности процентуалног одступања (MAPE) по
сатима у току дана. Просек свих одступања је 4.64%.

На слици 12 приказан је коначан изглед једног предвиђања потрошње, заједно са


областима са нивоом поузданости од 95%. Форма приказа резултаза предикције даје нам
визуелни приказ области у којој очекујемо, са великом вероватноћом, да ће се наћи
вредности праве потрошње.

Слика 12. Коначан облик предвиђања са облашћу поузданости од 95%.

4 ЗАКЉУЧАК

У овом раду представили смо један начин за краткорочна предвиђања потрошње ЕЕС
Србије. За предвиђање користимо више различитих метода од статистичих до метода
машинског учења и дубоких неуронских мрежа. Посебна пажња је посвећена
квантитативној евалуацији поузданости предвиђања, на начин на који можемо за свако
предвиђање дати и област поузданости произвољног нивоа.
Методе представљене у овом раду је само мали део корпуса метода које постоје за
предвиђање временских серија. Оно што је карактерситично за методе претставњене
овде је што омогућују специфичан увид у процесе које утичу на потрошњу ЕЕС. Активно
радимо на побољшању модела и планирамо да редовно објављивујемо наше резултате на
адреси https://www.skalamerie.com/dodona/eeload. Заједно са предвиђањем за дан
унапред, објављиваћемо и квалитет предиктора методом конформалне предикције.
Поред самих предвиђања потрошње ЕЕС, као коначан излаз модела, предвиђања
користимо као један од улазних података за моделовање цене електричне енергије на
берзи електричне енергије.

5 ЛИТЕРАТУРА

[1] H. L.Willis, Spatial Electric Load Forecasting, Macel Decker, New York, 2002.
[2] J. S. Armstrong, Strategic Planning And Forecasting Fundamentals, General Economics and
Teaching 0502066, 2005.
[3] T. Hong, Short Term Electric Load Forecasting, Graduate Faculty ofNorth Carolina State
University, Raleigh, North Carolina, PhD Thesis 2010.
[4] M. T. Hagan and S M Behr, The Time Series Approach to Short Term Load Forecasting,
IEEE Transactions on Power Systems, vol. 2, pp. 785-791, 1987.
[5] H. S. Hippert and C. E. Pedreira, Estimating temperature profiles for short-term load
forecasting: neural networks compared to linear models, IEEE Proceedings - Generation,
Transmission and Distribution, vol. 151, pp. 543-547, 2004.
[6] K. Bandaraa, R. J. Hyndmanb and C. Bergmeirc, MSTL: A Seasonal-Trend Decomposition
Algorithm for Time Series with Multiple Seasonal Patterns, arXiv:2107.13462v1, 2021.
[7] S. Ružić, A. Vučković, and N. Nikolić, Weather sensitive method for short term load
forecasting in Electric Power Utility of Serbia, IEEE Transactions on Power Systems, vol. 18,
pp. 1581-1586, 2003.
[8] V. Vovk, A. Gammerman, and G. Shafer, Algorithmic Learning in a Random World.
Springer, 2005.
[9] L. Guan, Conformal prediction with localization, arXiv:1908.08558, 2020.
[10] C. Xu and Y. Xie, Conformal prediction interval for dynamic time-series, in International
Conference on Machine Learning, PMLR, 2021, pp. 11 559–11 569.
[11] V. Manokhin, Awesome Conformal Prediction, version v1.0.0, Apr. 2022.
[12] A. N. Angelopoulos and S. Bates, A Gentle Introduction to Conformal Prediction and
Distribution-Free Uncertainty Quantification, arXiv:2107.07511v6, 2022.
APPLICATION OF MACHINE LEARNING FOR PREDICTING THE LOAD IN THE
ELECTRIC POWER UTILITY OF SERBIA

ALEKSANDAR BOJAROV
SKALAMERIE DOO

IVAN MILENKOVIĆ
BELGRADE OFFICE OF ,,WSP UK LTD”

BELGRADE

SERBIA

Summary: The paper describes a mathematical model for predicting the load in the
Serbian electric power utiliity system. The mathematical model is based on several
advanced machine learning techniques used for time series prediction and modeling of
complex systems behaviour. Since complex systems have a large number of parameters
that affect their operation, input big data of different types is needed to determine the
correlation between the input and the system’s load. The data source used is the platform
for transparency of the association of European transmission system operators
(https://transparency.entsoe.eu/). By combining various statistical, mathematical, and
machine learning models, we can obtain highly reliable predictions of consumption within
a range of 24 hours. The model can also be used for longer time periods but with
proportionally lower reliability. The model's predictions for the next 24 hours will be
publicly available on our internet service, along with historical data in order to su inform
about the quality of the predictions of the machine learning model
(https://www.skalamerie.com/dodona/eeload.php).

Keywords: machine learning, prediction, time series, complex systems, artificial


intelligence, data science, electricity system planning.
ПРИМЕНА МАШИНСКОГ УЧЕЊА ЗА ПРЕДВИЂАЊЕ ПОТРОШЊЕ
ЕЛЕКТРОЕНЕРГЕТСКОГ СИСТЕМА СРБИЈЕ

APPLICATION OF MACHINE LEARNING FOR PREDICTING THE LOAD IN THE


ELECTRIC POWER UTILITY OF SERBIA

АЛЕКСАНДАР БОЈАРОВ
СКАЛАМЕРИЕ ДОО

ИВАН МИЛЕНКОВИЋ
ОГРАНАК ,,WSP UK LTD” БЕОГРАД

БЕОГРАД

СРБИЈА

Кратак садржај — Рад се бави описом математичког модела за предвиђање


потрошње електроенергетског система Србије. Модел се базира на неколико
напредних техника машинског учења које се користе за предвиђање временских
серија и за моделовање комплексних система. Комплексни системи садрже велики
број параметара који утичу на њихов рад. Самим тим, у циљу одређивања
корелације између улазних података и потрошње система, потребни су улазни
подаци различитог типа и у великом броју. Као извор података користимо
платформу за транспарентност удружења европских оператора преносних система
(https://transparency.entsoe.eu/). Комбинацијом различитих статистичких,
математичких и модела машинског учења, можемо добити врло поуздана
предвиђања потрошње у распону од 24 часа. Модел можемо да користимо и за
предвиђања за дужи временски период, али са пропорционално мањим степеном
поузданости. Предвиђања модела за наредна 24 часа биће јавно доступна на нашем
интернет сервису, као и историјски подаци, у циљу провере квалитета рада модела
машинског учења (https://www.skalamerie.com/dodona/eeload.php).

Кључне речи — машинско учење – предвиђање - временскe серијe - комплексни


системи - вештачка интелигенција - наука о подацима - планирање рада еес

You might also like