Professional Documents
Culture Documents
Ц1 05 274 - Stanko Vujnovic - Danilo Komatina - PROGNOZA CENA NA TRZISTU ELEKTRICNE ENERGIJE KORISCENJEM MASINSKOG UCENJA U PLEXOS SOFTVERU
Ц1 05 274 - Stanko Vujnovic - Danilo Komatina - PROGNOZA CENA NA TRZISTU ELEKTRICNE ENERGIJE KORISCENJEM MASINSKOG UCENJA U PLEXOS SOFTVERU
BEOGRAD
SRBIJA
Dečanska 21, Beograd, Srbija, stanko.vujnovic@go2power.eu
1 UVOD
U Zapadnoj Australiji, najveći deo energije se trguje van tržišta kojim upravlja AEMO, preko
bilateralnih ugovora direktno između kupaca i proizvođača, ali svoje bilateralne pozicije učesnici mogu
da izmene na tržištima kojim upravlja AEMO. WEM se sastoji od dva tržišta za električnu energiju:
Kratkoročno tržište za električnu energiju (eng. Short Term Energy Market, STEM) i Balansno tržište
(eng. Balancing Market, BM). STEM je tržište za dan-unapred na kome kupci i proizvođači mogu da
modifikuju svoje ugovorene bilateralne pozicije, dok je BM unutar-dnevno tržište gde se trguju razlike
između stvarnih pozicija i pozicija sa STEM tržišta. BM je definisano po „gross-pool” principu sa 30-
minutnim vremenskim intervalima i rotirajućim zatvaranjem ponuda 90 minuta pre početka svakog
intervala, a gde svaki proizvodni objekat mora da ponudi svoj ukupan kapacitet. Na osnovu dostavljenih
ponuda, AEMO sprovodi ekonomsku raspodelu opterećenja (eng. economic dispatch) sa kliring cenom
koja predstavlja balansnu cenu električne energije, i upravo ona je predmet prognoziranja upotrebom
mašinskog učenja. Okvirni vremenski dijagram trgovanja električnom energijom u Zapadnoj Australiji
je predstavljen na Slici 2.
Slika 2 – Vremenski dijagram trgovanja el. energijom u Zapadnoj Australiji
➢ Izbor i priprema ulaznih podataka – Analiziraju se dostupni podaci koji mogu biti od uticaja za
prognozu izabrane veličine. Ukoliko je neophodno, vrši se i dodatna obrada podataka u formate
prilagođene za PLEXOS.
➢ Modelovanje u PLEXOS-u – Izrada baze modela u PLEXOS-u koja se koristi i za treniranje
modela i za upotrebu istreniranog modela za prognoziranje.
➢ Treniranje modela pripremljenim ulaznim podacima – Nakon pokretanja simulacije sa
ostvarenim ulaznim podacima u PLEXOS-u, u njegovom rešenju se vrši treniranje modela.
➢ Upotreba istreniranog modela za prognoziranje izabrane veličine – Nakon ponovnog pokretanja
simulacije u PLEXOS-u, ali sa prognoziranim ulaznim podacima i istreniranim modelom
mašinskog učenja, u njegovom rešenju se ispisuju vrednosti prognozirane veličine.
Ključni ulazni podatak je onaj koji je izabran za predviđanje, a u ovom slučaju to je cena električne
energije. Za izbor ostalih ulaznih podataka ključna su dva faktora:
U naredim odeljcima su opisani svi izabrani ulazni podaci i potrebne obrade na sirovim podacima kako
bi se mogli upotrebiti za treniranje modela mašinskog učenja u PLEXOS-u.
Kao što je već spomenuto, ovaj ulazni podatak je specifičan jer je izabran za veličinu koja se
predviđa, ali i njegove ostvarene vrednosti moraju biti dostavljene kod treniranja modela. Ostvarene
cene električne energije su javno dostupni podaci i mogu se preuzeti sa AEMO veb sajta za tržišne
podatke* iz odeljka „Balancing Market Summary”. Sirovi podaci su smešteni u tekstualne datoteke CSV
formata, za svaku godinu od početka rada BM (1. jul 2012) i za svaki interval od 30 minuta. Iz ovih
datoteka se vrlo lako mogu formirati CSV datoteke koje su direktno čitljive u PLEXOS-u.
2.2 „Konzum“
Veličina na koju se prvo pomisli da ima uticaj na cenu električne energije je „Konzum“. Ostvarene
vrednosti konzuma su izračunate kao sume ostvarenih proizvodnji svih proizvodnih objekata koje se
mogu preuzeti sa AEMO veb sajta za tržišne podatke iz odeljka “Facility SCADA”. Zbog ogromne
veličine, podaci su spakovani u CSV datoteke za svaki mesec. Koristeći „Power Query” alat u Excel-u,
*
https://www.aemo.com.au/energy-systems/electricity/wholesale-electricity-market-wem/data-wem/market-
data-wa
od mesečnih datoteka su formirane objedinjene CSV datoteke za svaku fiskalnu godinu u „Datetime”
formatu (format CSV datoteke podržan u PLEXOS-u gde su u prvoj koloni ispisani vremenski intervali
definisani kao datum + vreme), gde su ostvarenja za svaki proizvodni objekat upisana po kolonama, a
poslednja kolona je rezervisana za ukupan konzum i predstavlja sumu proizvodnje svih proizvodnih
objekata za svaki interval od 30 minuta. Iz ovako formiranih datoteka se onda lako može sačuvati CSV
datoteka za konzum spremna za povezivanje sa PLEXOS-om.
Ostvarene proizvodnje iz obnovljivih izvora se mogu lako dobiti iz objedinjenih CSV datoteka iz
prethodnog odeljka, tako što se vrednosti po intervalima sabiraju posebno za vetroelektrane i solarne
elektrane. Dobijene vrednosti se zatim sačuvaju u nove CSV datoteke koje mogu da se koriste u
PLEXOS-u.
Budući da se radi o ostvarenjima, neraspoloživi proizvodni kapaciteti uključuju sve planirane zastoje
i neplanirane ispade. Ovi podaci se mogu skinuti sa AEMO veb sajta za tržišne podatke iz odeljka
„Outages”, kao CSV datoteke za svaku kalendarsku godinu. Vrednosti neraspoloživih kapaciteta su u
ovim datotekama definisani po proizvodnim objektima i vremenskim intervalima od 30 minuta, i to u
dva različita tipa: „Ex-Ante Outage” – vrednosti prijavljene pre početka vremenskog intervala; i „Ex-
Post Outage" – prave ostvarene vrednosti koje su dostavljene naknadno i upravo one su usvojene kao
ulazni podatak za treniranje modela mašinskog učenja. Za obradu sirovih podataka mora se upotrebiti
Excel-ov „Power Query” alat, kojim se podaci sabiraju za svaku komponentu neraspoloživosti (mogu
biti planirani, prinuđeni i posledični) i prikazuju u „Datetime” formatu sa kolonama za svaki proizvodni
objekat. Zatim se iz ove datoteke formiraju dve CSV datoteke za PLEXOS, jedna sa ukupnim
neraspoloživim kapacitetom za ceo sistem i druga sa neraspoloživim kapacitetima sabranim po
različitim tehnologijama proizvodnje (ugalj, gas, dizel itd.).
Ostvarene prosečne mesečne cene za prirodni gas u Zapadnoj Australiji su preuzete sa Gas Trading
Australia Pty Ltd veb sajta†. Ovaj podatak je usvojen kao ulazni tek nakon svih ostalih ulaznih podataka
jer se pokazalo da može imati značajan uticaj na cene električne energije, budući da su vršne elektrane
u Zapadnoj Australiji uglavnom na prirodni gas.
3 MODELOVANJE U PLEXOS-u
Nakon što su izabrani svi ulazni parametri koji će se koristiti za mašinsko učenje i kreirane
odgovarajuće ulazne CSV datoteke za PLEXOS, može se pristupiti i izradi baze modela u PLEXOS-u.
Budući da za mašinsko učenje u PLEXOS-u nije potrebno pokretati klasičnu matematičku
†
https://www.gastrading.com.au/
optimizacionu simulaciju, već simulaciju u „dry run“ režimu gde se samo ulazni podaci prosleđuju
direktno u PLEXOS rešenje, dovoljno je kreirati vrlo jednostavnu bazu modela u PLEXOS-u sa
osnovnim objektima, relacijama i svojstvima potrebnim samo za prosleđivanje ovih podataka. U
sledećim odeljcima biće detaljnije objašnjeni upotrebljeni objekti i svojstva, kao i njihove relacije sa
drugim objektima.
3.1 Generatori
Definisano je ukupno 6 generatora za svaku tehnologiju proizvodnje kao što se vidi na Slici 3. Svi
generatori su pridruženi jedinom čvoru nazvanom „WEM“ (ova relacija mora biti definisana da bi
generatori bili povezani na sistem), dok je samo generator „Gas“ povezan i sa istoimenim objektom za
gorivo.
Na Slici 4 prikazana su svojstva koja su upotrebljena za jedan generator. Radi se o 3 različita svojstva:
„Units” i „Max Capacity” kao svojstva koja se moraju definisati za svaki generator; i „Rating” kao
svojstvo koje je upotrebljeno za prosleđivanje ulaznih podataka u PLEXOS rešenje, nakon pokretanja
simulacije. Kao što se može primetiti, svojstvo „Rating” je upotrebljeno za više različitih ulaznih
podataka korišćenjem odgovarajućih „Data File“ objekata i pridruženih „Scenarija“, koji su zatim
uključeni u različite simulacione modele i odgovarajuće modele za mašinsko učenje. Ulazni podaci
vezani za generatore su „Proizvodnja iz obnovljivih izvora“, „Neraspoloživost“ i „Raspoloživost
proizvodnih kapaciteta“.
Kao što je već napomenuto, kreiran je samo jedan objekat za gorivo pod nazivom „Gas“ koji je
pridružen generatoru „Gas“. Na Slici 5 prikazana su svojstva koja su upotrebljena za ovaj objekat.
Svojstvo „Units” koje služi za uključivanje i isključivanje ovog objekta iz simulacije korišćenjem
odgovarajućih scenarija, i svojstvo „Price“ upotrebljeno za prosleđivanje cena prirodnog gasa kao
ulaznog podatka za mašinsko učenje.
3.3 Region
Region je objekat koji se mora definisati za svaku bazu modela u PLEXOS-u. Generatori su uključeni
u region „WEM“ preko jedinog čvora „WEM“, jer je uspostavljena relacija između ovog čvora i regiona.
Na Slici 6 su prikazana svojstva koja su upotrebljena za ovaj objekat. Svojstvo „Load” je upotrebljeno
za prosleđivanje vrednosti konzuma, a svojstvo „Price“ je upotrebljeno za prosleđivanje ostvarenih cena
električne energije za treniranje modela mašinskog učenja.
3.4 Čvorovi
Jedan čvor „WEM“ je kreiran samo da bi se generatori povezali na sistem odnosno region „WEM“ i
nije bilo potrebe za definisanjem svojstava za ovaj objekat.
„Data File“ objekti služe za povezivanje ulaznih CSV datoteka, pripremljenih u poglavlju 2, sa
bazom modela u PLEXOS-u. Na Slici 7 prikazani su neki od ovih objekata, dok je na Slici 8 prikazano
kako je jedan od ovih objekata povezan sa spoljnom datotekom upotrebom svojstva „Filename”.
Slika 7 – Datoteke za podatke u bazi modela u PLEXOS-u
3.7 Scenariji
Scenariji su definisani za svaki simulacioni model kako bi se u ove modele uključili samo određeni
objekti i svojstva, odnosno određene kombinacije ulaznih podataka kod modela za treniranje ili
potrebnih ulaznih podataka kod modela za prognozu.
Kao što se može primetiti, kao ulazni podaci za modele za prognozu se isto koriste ostvareni podaci.
Razlog ovome je da se iz proračuna eliminišu greške u prognozi ulaznih veličina i da rezultati mašinskog
učenja zavise samo od kvaliteta modela mašinskog učenja. Takođe, modelima za prognozu nije potrebno
dostaviti ostvarene „Cene el. energije“ jer je ta veličina izabrana za prognozu, ali ipak ove cene se mogu
pasivno povezati sa modelima za prognozu kako bi se u PLEXOS rešenju mogle upotrebiti za direktno
poređenje sa prognoziranim cenama. Na Slici 10 su prikazani svi spomenuti modeli za treniranje i
prognozu raspoređeni po odgovarajućim kategorijama u PLEXOS-u.
Ovaj objekat definiše vremenski okvir i rezoluciju simulacije. Za treniranje je definisan vremenski
okvir od 1. jula 2020 do 31. oktobra 2022 (28 meseci), dok je za prognozu definisan vremenski okvir
od 1. novembra 2022 do 30. novembra 2022. Takođe, urađena je i dodatna analiza za prognozu koja
obuhvata vremenski okvir od 1. decembra 2022 do 31. decembra 2022 gde je model istreniran na
podacima od 01. jula 2022 do 30. novembra 2022 (29 meseci) ali on neće biti detaljno objašnjen jer je
postupak identičan kao u prethodnom slučaju. Iz ove analize biće prikazani samo neki od rezultata u 5.
poglavlju. U svim simulacijama definisana je rezolucija od 30 minuta za vremenski interval, a dodatna
opcija je i da svaki dan na tržištu električne energije počinje od 08:00 časova. Na Slici 12 prikazana su
podešenja Horizonta za simulacione modele za trening.
U „Report” objektu se definišu opcije vezano za prikaz rezultata simulacije u PLEXOS rešenju, i u
ovom slučaju ovde je najbitnije uključiti izveštavanje za svojstva koja se koriste za prosleđivanje ulaznih
podataka. Za generatore to je svojstvo „Rating“, za region to su svojstva „Load“ i „Price“, i za gorivo
to je samo „Price“ (Slika 13).
4 TRENIRANJE MODELA
Nakon pokretanja svakog simulacionog modela za treniranje, potrebno je otvoriti PLEXOS rešenje
u kome se izaberu svi ulazni podaci za treniranje modela, tako što se jedan po jedan prebace u „ML
Grid” kao što je prikazano na Slici 14.
Kad su svi potrebni ulazni podaci nalaze u „ML Grid-u”, potrebno je još izabrati vremenska
podešenja za mašinsko učenje. Za treniranje svih 5 modela izabrana su ista vremenska podešenja, prvo
za mesec, pa za dan u sedmici i na kraju za svaki 30-minutni period (Slika 15).
Slika 15 – Vremenska podešenja na ML Grid-u u PLEXOS rešenju
Ovo znači da će algoritmi mašinskog učenja tražiti korelaciju i šablone samo onih ulaznih podataka koji
pripadaju istom mesecu u godini, istom danu u sedmici i istom 30-minutnom intervalu u tom danu.
Pritiskom na dugme Train… otvara se prozor sa postavkama za treniranje modela mašinskog učenja
koji je prikazan na Slici 16.
Na ovom prozoru potrebno je izabrati putanju i naziv datoteke gde će biti sačuvan istrenirani model,
veličinu koja se prognozira, i vreme trajanja treniranja. Za sve modele usvojeno vreme treniranja je 900
sekundi, a veličina za prognozu je uvek „Cena el. energije“ odnosno cena regiona u PLEXOS rešenju.
Pritiskom na dugme „Train” pokreće se treniranje modela mašinskog učenja, a kada je treniranje
završeno, istrenirani model se snima na definisanu lokaciju. Na Slici 17 prikazani su rezultati treniranja
u vidu raznih parametara od kojih se izdvaja „R-squared” koji predstavlja parametar kvaliteta treniranja
modela (u idealnom slučaju ima vrednost 1).
Slika 17 – Rezultati treniranja modela mašinskog učenja
U ovom trenutku, PLEXOS radi sa 3 različita algoritma za mašinsko učenje (koje možete videti na
slici iznad): „LightGbmRegression“, „FastTreeRegression“ i „FastTreeTweedieRegression“. Kao što
se može zaključiti iz njihovih imena, sva tri su zasnovana na regresiji:
Kao i kod treniranja, prvo je potrebno pokrenuti simulacioni model za prognozu i otvoriti PLEXOS
rešenje. U PLEXOS rešenju, prognozirane „Cene el. energije“ dobijene modelom mašinskog učenja se
nalaze pod svojstvom „Value” varijable „ML Price Forecast”. Takođe, u rezultatima je moguće izabrati
i svojstvo „Price“ regiona „WEM“, koji u ovom slučaju predstavlja ostvarene cene na BM pa može
poslužiti za poređenje sa prognoziranim cenama (Slika 18).
Slika 18 – Rezultati prognoze modela mašinskog učenja u PLEXOS rešenju
6 REZULTATI
Kada su na internetu objavljeni svi ostvareni podaci za decembar 2022, odlučili smo da isprobamo
mašinsko učenje i na ovom mesecu. Na Slikama 27-30 su prikazana poređenja prognozirane i ostvarene
cene u decembru 2022 za prvi četiri modela kao krive trajanja. Sa grafika se može primetiti da su
odstupanja cena u decembru 2022 primetno veća nego u novembru 2022.
Slika 27 – Model #1 - Poređenje prognozirane i ostvarene cene kao krive trajanja za decembar 2022
Slika 28 – Model #2 - Poređenje prognozirane i ostvarene cene kao krive trajanja za decembar 2022
Slika 29 – Model #3 - Poređenje prognozirane i ostvarene cene kao krive trajanja za decembar 2022
Slika 30 – Model #4 - Poređenje prognozirane i ostvarene cene kao krive trajanja za decembar 2022
Pokušali smo odgonetnuti šta je uzrok većih odstupanja u decembru u odnosu na novembar, i
istraživajući po internetu došli smo do saznanja da je tokom decembra došlo do naglog povećanja cene
prirodnog gasa u Zapadnoj Australiji. Zbog toga je odlučeno da se kreira i model #5 sa ulaznim
podatkom u vidu prosečnih mesečnih cena za prirodni gas, koji je jedino javno dostupni podatak o ceni
gasa na internetu. Na Slikama 31-34 su prikazana poređenja prognozirane i ostvarene cene za ovaj model
u decembru 2022 i novembru 2022.
Kao što se može primetiti, ova ulazna veličina je značajno popravila rezultate za decembar 2022, dok
su rezultati za novembar 2022 ostali na nivou prethodnog modela. Verovatno su nagle promene cena
prirodnog gasa u decembru 2022 uticale na promenu ponašanja učesnika na tržištu u vidu promena
profila ponude.
Prosečna relativna greška za ovaj model u decembru je 0.461, dok je za novembar 2022 jednaka 0,37.
Kao numerički parametar kvaliteta treniranja modela za mašinsko učenje već je ranije spomenut „R-
squared”. Što je njegova vrednost veća znači da je kvalitet treniranja modela bolji, odnosno drugim
rečima, on predstavlja parametar korelacije između ulaznih podataka koji je prepoznat od strane
algoritma mašinskog učenja. Kao numerički parametar kvaliteta prognoze usvojena je prosečna
relativna greška koja se izračunava po sledećoj formuli:
𝑇
1 |𝑃𝐶𝑒𝑛𝑎𝑡 − 𝑂𝐶𝑒𝑛𝑎𝑡 |
𝑃𝑅𝐺 = ∑
𝑇 𝑂𝐶𝑒𝑛𝑎𝑡
𝑡=1
gde su „PCena“ i „OCena“ prognozirana i ostvarena cena u svakom vremenskom intervalu „t“ (osim u
intervalima kad je „OCena“ jednaka nuli), a „T“ je ukupan broj vremenskih intervala. Na Slici 35
prikazan je dijagram sa vrednostima ovih parametara za svaki model.
Slika 35 – Parametri treniranja i prognoze za svaki model u novembru 2022
7 ZAKLJUČAK
Kao što se može primetiti iz prethodnih rezultata, svakim dodavanjem nove ulazne veličine u
mašinsko učenje dobija se očigledno poboljšanje u tačnosti prognoziranja, a u modelima #3 i #4 za
novembar 2022 krive prognoziranih i ostvarenih cena su prilično bliske. Međutim za decembar 2022,
ovakav nivo tačnosti rezultata se dobija tek uključivanjem cene prirodnog gasa kao ulaznog parametra.
Kad poredimo numeričke parametre krećući se sa jednog modela na drugi, možemo uočiti trend
poboljšanja kvaliteta treniranja i tačnosti prognoziranja, što upravo i pokazuju povećanje R-squared
parametra i smanjenje prosečne relativne greške na sumarnom grafiku iz prethodnog odeljka.
BELGRADE
SERBIA
BEOGRAD
SRBIJA