SIAE2004 Adrian Bulac

= SISTEME DE INTELIGENTA ARTIFICIALA IN ELECTROENERGEICK 04 ‘Smposon interes _ "ipa O METODA [MBUNATATITA DE IMPLEMENTARE A SISTEMELOR DE INVATARE AUTOMATA PENTRU ANALIZA STABILITATI DE TENSIUNE A SISTEMELOR ELECTROENERGETICE Dr.ing. Adrian-Ion Bulac* Conf.dr.ing. Constantin Bulac** Prof.dr.ing. Mircea Eremia** As.ing. Lucian Toma** * SC Quidico Software SRL +* Universitatea “Politehnica” din Bucuresti Rezumat: “Arborii de decizie —tehnici ale Inteligentei Artficiale (1A) ~ au inceput s& fie folositi din ce in ce mai mult in ultimele doud decenii atat in domeniul invayari automate cAt gin recunosterea de forme. In domeniul stabilitati sistemelor electroenergetice, arborii de decizie au fost folositi mai intai in analiza stabilitati tranzitorii, dar in ‘rezent, majoritatea universitatilor gi companiilor de profil din intreaga lume intreprind eercetéri ample iin domeniul analizeistablitait de tensiune a sistemelor electroenergetice In cadrul lucrarii se prezint& modul in care se poate implementa in Microsoft SQL. Server 2000 (MS SQL 2000) un sistem inteligent, bazat pe tehnica arborilor de decizie, destinat analizei stablitaii de tensiune a SEE. 1. Introducere Dezvoltarea si continua evolutie a sistemelor electroenergetice (SEE) a complicat progresiv posibilitile lor de coordonare. Chiar si in cazul unor conditii normale de functionare, controlul tensiunii a devenit mult mai dificil, iar in urma unor perturbatii severe controlul tensiunii respectiv al suportului de putere reactiva poate fi pierdut, fapt ce conduce 1a aparitia fenomenului de instabilitate si colaps de tensiune. ; Stabilitatea de tensiune a SEE poate fi evaluata foarte rapid gi exact cu ajutorul tehnicilor de invajare automata. Prin utilizarea unei anumite tehnici de inteligenfa artificiala este construit tun model euristic ce va fi antrenat cu un numar foarte mare de situafii de functionare diferite ce au atasate diversi indicatori de evaluare a stabilitafi. De obicei, numérul de cazuri analizate gi de variabile este foarte mare, aceasta putdnd reprezenta un important impediment al utilizarii tehnicilor de invatare automata. Primul mare avantaj al implementarii in Microsoft SQL Server il constituie faptul c& acesta este o aplicatie client/server, permitandu-se astfel execujia simultand a unor studii de caz independente. Totodati, prin utilizarea utilitarului Data Transformation Services (DTS) este posibila conversia datelor de intrare/iesire in aproape orice format, ceea ce permite o interfajare usoard gi eficienté cu sistemele de culegere a datelor din SEE. ‘Algoritmul de construire a unui arbore de decizie este un algoritm recursiv “lacom’”. De accea, in cazul unei implementari a acestui algoritm intr-un limbaj de programare (C, Pascal etc.) este necesara alocarea/dealocarea dinamica a memoriei utilizate. in cazul unor probleme foarte complexe, acest Iucru poate genera erori. Deoarece MS SQL 2000 dispune de un mecanism automat de dealocare a memoriei neutilizate, se climin’ ,grija” programatorului de alocare/dealocare a memoriei, 38SISTEME DE INTELIGENTK ARTIFICIALA IN ELECTROENERGETIC 04 ‘Simpl ier - aia at 2. Utilizarea arborilor de decizie in analiza sistemelor electroenergetice invafarea Automata (iA) este domeniul cel mai provocator al inteligentei artificiale, si in acelasi timp, cel mai rezistent fata de incercarile de automatizare completa. Termenul de invajare automata este utilizat pentru a indica un domeniu de cercetare multidisciplinar si un set de metode de extragere a informafiei sintetice (de nivel inalt) din baze de date ce conjin cantitati mari de informatie neprelucraté (de nivel scdzut). Spre deosebire de sistemele expert, tehnicile de invajare automata prezinta avantajul modificarii automate a bazei de cunostinje, fra interventia expertilor umani [1] Cea mai cunoscuti metod’ de invatare automata este metoda arborilor de decizie, care utilizeaza o reprezentare restrictiva de propozitii logice special construite pentru invajare, aceasta metoda find foarte atractiva din trei motive [2]: (i) ofera ipoteze ce dau rezultate bune in situafiile noi, neutilizate in procesul de construire; ii) are un timp de calcul redus, acesta find direct proportional cu numarul de exemple si de atribute ce descriu un exemplu; ii) furnizeaza o reprezentare foarte ugor de infeles de cAtre operatorii umani, in general, un sistem de invafare automata cuprinde trei etape: generarea bazei de date, extragerea informatiei si prelucrarea acesteia (fig. 1) [3]. | GeneRanea EXTRAGEREA PRELUCRAREA | BAZEIDE DATE <> INFORMATIEL INFORMATIEL Defies mat bi de ee Teepe mode ‘Exemple reale Refele neuronale: ‘Utiliaare model . leat pri de Managemeatal romped bor de egee Manage Sioulr names Meioe sate Manager elo Fi 1. Structura unui sistem de invajare automat Dupa cum se poate observa, in cadrul unui sistem de invafare automata sunt uti trei baze de date: —baza de date primare ce confine datele preluate din SEE; baza de antrenare ce confine datele relevante pe baza cirora se construieste sistemul de invafare automata; —baza de cunostinfe ce confine relafiile de interdependenfa intrari/iesiri .invatate” de sistemul inteligent. Deoarece MS SQL 2000 permite definirea si utilizarea bazelor de date relajionale, implementarea celor trei baze de date se realizeaz& foarte uor, ele putdnd fi inglobate in una singura. Legatura intre cele trei module se realizeazA prin definirea unor relafii de interdependent i a unor proceduri stocate, prin intermediul acestora modificdndu-se datele dintr-un anumit modul pe baza unor modificari survenite in alt modul 39-0 SISTEME DE INTELIGENTA ARTIFICIALA IN ELECTROENERGETICA, ‘Simpazi international - aia «Ta, ‘Astfel, daca este definité tabela Buses in care sunt stocate datele despre nodurile refelei, tabela Lines — in care sunt stocate datele despre liniile electtice — confine dou coloane BusFirstld si BusSecondld ce sunt referinje la tabela Buses. Prin utilizarea constrangerilor referentiale se elimina riscul definirii unor linii a cror noduri terminale nu au fost definite (nu apartin sistemului studiat), Programatorul nu mai trebuie si efectueze verificarea datelor introduse, puténd fi definite foarte simplu astfel de constringeri. Pe lingi cele doua tabele enumerate anterior, in cadrul bazei de date primare existA gi alte tabele ce stocheaza date despre clementele sistemului electroenergetic (bobine, transformatoare, baterii cu condensatoare etc.) Baza de antrenare confine date despre diferite stari ale sistemului electroenergctic. Acestea sunt formate din exemple de antrenare, fiecare exemplu fiind caracterizat de starea sistemului electroenergetic (stirile liniilor electrice, valorile puterilor active/reactive generate/consumate, starea mijloacelor de reglaj etc.) si de valoarea unui indicator pentru evaluare stabilitajii de tensiune (VSI). Baza de cunostinfe confine arborele de decizie construit pe baza mulfimii de antrenare (exemplele din baza de antrenare). Fiecare element al acestei baze este descris de: numarul nodului, testul atagat, mulfimea de antrenare aferenta si cei doi fii ai sti Prin definirea relajiilor de interdependenta dintre cele trei baze si utilizarea declansatorilor si a coloanelor calculate, o modificare a unei valori de intrare (spre exemplu valoarea tensiunii intr-un nod) va genera instantaneu modificarea unei alte valori (spre exemplu indicele Voltage Stability Index). Astfel, utilizarea unui sistem de invafare automat pentru analiza stabilitafii de tensiune a SEE este foarte simpla si rapida, pretandu- se unei implementari on-line. Ftapa de extragere a informatie’ reprezinta esenja construirii unui sistem de invajare automat, Plecénd de la informatiile stocate in baza de date, in aceasta etapa se construieste sistemu! inteligent ce poate invaja (un arbore de decizie, un arbore de regresie, o retea neurons artificiald etc.). Un arbore de decizie este un arbore binar sau multicai, cu proprictatea cf nodurile sale confin 0 multime de exemple. Radacina arborelui confine intreaga mulfime de exemple, iar frunzele acestuia confin exemple ce sunt fie numai pozitive (nod "DA") fie numai negative (nod "NU"), Cea mai cunoscutd metodii de construire a arborilor de decizie este algoritmul de inductie sus-jos (ISJAD) [4]. Procedura ISJAD este un algoritm “greedy”, scopul implicit al cautarii iterative fiind de a produce un arbore cét mai simplu care s4 confin& maximum de informatie despre variabilele de clasificare ale exemplelor de antrenare, O implementare a metodei de induefie sus-jos a arborilor de decizie o constituie algoritmul 1D3 prezentat in continuare. 1D3(Exemple, Clase, Atribute) Creeaz nodul ridicina Dacé toate exemplele aparjin aceleiasi clase, eticheteazA radacina cu numele clasei respective. Altfet nceput CCalculeaza cAstigl informajional pentru fiecare atribut uilizand formula de calcul a entropiei Selecteazi atributul A cu entropia medie cea mai sc&zuti (céstigul informational cel mai mare) si acesta devine testul asociat ridacinii Pentru fiecare valoare posibila v a acestui atribut Adauga o nou ramurd rédacinii, corespunzitoare lui A =v ie Exemple(v) toate acele exemple pentru care A= 40KSAc« ‘SISTEME DE INTELIGENTA ARTIFICIALA IN ELECTROENERGE| Dacit Exemple(w) este vida, ramificatia devine o frunz& etichetaté cu clasa corespunzatoare tuturor exemplelor din muljimea Exemple Altfel Ramura creata va fi ID3(Exemple(v), Clase, Atribute\{A}) Sarsit Sfarsit Algoritm Metoda de selectie a atributului pe baza caruia se realizeazi partitionarea multimii de antrenare este foarte importanta gi uneori destul de greu de automatizat, ordinea de considerare a atributelor influenfand dimensiunea si performangele arborelui de decizie rezultat. De-a lungul timpului, au fost propuse diverse criterii de selectie a atributului pe baza caruia se face partitionarea multimii de exemple. in continuare sunt prezentate cele mai cunoscute metode de selectie a atributului si anume criteriul cdstigului [4], criterful céstigului raportat [5] si metoda Uig [3]. Daci se noteazi cu n, numarul de exemple de antrenare aparfindnd clasei c, si cu n numarul de exemple ce trebuie clasificate in acest pas, cu n/ numarul exemplelor ce apartin clasei c, si rezultatului 7 al testului, iar cu 7’ numarul total de exemple ce apartin rezultatului J al testului, se pot defini urmatoarele marimi: — entropia de clasificare: 210g, w ieee = entropia testului: Wan He SES @) — cantitatea informationala a testului Me=He Hop @) — entropia rezultatului testului: Hee os 4 Lites @ — céstigul: r castig(T) 22% (5) He. +H, in cazul criteriului cdstigului, testul pe baza caruia se face partitionarea mul exemple este acela care are cantitatea informafionala cea mai mare, Atunci cand se utilize criteriul céstigului raportat, se selecteazd testul ce are raportul maxim dintre cantitatea informationala si entropia rezultatului testului, Dezavantajul utilizarii criteriului céstiguiui sau al cAstigului raportat este acela ca arborii de decizie construifi sunt dezechilibrafi. Acest dezavantaj dispare daca este utilizat’ metoda Ulg, dar, in acest caz, nodurile terminale nu mai sunt pure (nu ‘mai confin exemple aparfinand unei singure clase) astfel cd eroarea de antrenare nu mai este nul, in etapa de validare, se considera o multime de alte M exemple, care nu sunt clasificate (multime test). Rezultatele oferite de arborele de decizie sunt comparate cu cunostinfe deja stiute sau cu rezultatele date de programele algoritmice specifice problemei studiate (in cazul de fata ‘un program pentru calculul regimutui permanent si evaluarea stabilitiii de tensiune). 4l= mm SISTEME DE INTELIGENTA ARTIFICIALA IN ELECTROENERGETICA ‘Simpozion international _ dia aa, Galag Pentru evaluarea performanfelor arborelui de decizie se utilizeaz& trei criterii: al erorilor, al interpretabilitajii si al incertitudinii de clasificare. in ceea ce priveste criteriul erorilor, performanfele arborelui sunt exprimate prin urmatoarele tipuri de erori [6]. — eroarea de antrenare: © — eroarea de test: ee Ne (%) a N, — eroarea de invajare: Mot Neng & N,N, (%) (8) unde: Nez este numérul de exemple al multimii de antrenare gresit clasificate; Ne — numérul de exemple al multimii de test gresit clasificate; N, — numarul total de exemple al mulfimii de test; Nz — numérul total de exemple al mulfimii de antrenare, in literatura de specialitate se considerd cA eroarea de invalare trebuie s& fie de ordinul 0,5+4%. Daca eroarea rezult& mai mare, arborele este “prea partinitor”, iar dac& ea este prea mica, arborele este “prea general” [6] in cazul utilizacii unui limbaj de programare procedural pentru calculul entropiei de clasificare este necesara parcurgerea intregii multimi de antrenare si determinarea, pentru fiecare exemplu, a apartenenjei Ja una din clase. In MS SQL 2000 entropia de clasificare se determina astfel: declare @N int set @N = (select count(*) from Training ) 5 select sum(cast(Item.NJ__ as dec(8,4)V/cast(@N as deo(8,4))*log(cast(Item.NJ as dec(8,4))/cast(@N as dec(8,4)))Vvlog(2) * -1.0 from ( select count(*) NJ from Training group by Class Yas Item Analog, entropia testului se poate defini astfel: declare @N int set @N = (select count(*) from Training ) select sum(cast(NJ as dec(8,4)V/east (@N as dec (8,4)) * S) * -1.0 from (elect sum(cast(NIJ as dec(8,4)V/cast(NJ as deo(8,4))*log(cast(NII as dec(8,4))/cast(NJ as dee(8,4)))) S from (select count(*) NJ from (select count(*) NIJ, Result from Training group by Result, Class 42= SISTEME DE INTELIGENTA ARTIFICIALA IN ELECTROENERGETI 04 ‘Simpozion iaternti - ain aT as Item! group by Result )as Item2 as Item Determinarea celui mai bun céstig se poate implementa astfel: select max(HC - HCT) from Training 3. Studii de eaz Metoda de implementare a algoritmului de construire a arborilor de decizie propus’ in acest articol este simpli. Pentru a demonstra c& este si eficienta din punct de vedere al timpului de caleul, aceasti metoda a fost comparatd cu programul MLT 2001 [7]. Deoarece arborii de decizie obtinuti prin metoda propus’ sunt identici cu arborii de decizie rezultati prin utilizarea programului MLT 2001, erorile si complexitatea lor sunt identice. De aceea, in cele ce urmeaza vor fi prezentati doar timpii de calcul necesari construirii arborilor de decizie. Pentru teste a fost uutiizat un calculator PC cu un microprocesor de 1,8 GHz si 512 MB RAM. {in cadrul primului studiu de caz s-a utilizat refeaua TEST? avand in component 13 noduri, 5 generatoare si 15 laturi [7]. Pentru aceasta refea au fost simulate 7322 de regimuri de functionare, in 4108 situafii sistemul fiind stabil, iar in 3214 situafii acesta fiind instabil. Aceste regimuri au fost generate prin modificarea valorilor puterilor active si reactive consumate in nodurile 1, 6 si 9 intre 80% si 130% fafa de regimul de baz respectiv a stiri liniei L1-10 (conectati/deconectat) [7]. Variindu-se numirul de exemple de antrenare, au fost generati | arbori de decizie (metoda de construire aleasi este ID3) prin ambele implementari. in functie de numérul de exemple utilizate la construirea arborilor de decizie s-au obfinut diversi timpi de | antrenare (fig. 2) t Mt 200 |—as sau | | 100 200002000 3am wom . 2. Timpi de antrenare pentru studiul de caz efectuat pe refeaua Test2 In cadrul celui de-al doilea studiu de caz a fost utilizata refeaua test IEEE30 [7]. in acest sens, au fost simulate 6732 de regimuri, acestea constituind exemplele de antrenare (4488) si de testare (2444). Regimurile au fost generate finand cont de valorile puterilor active/reactive consumate in noduri gi de starea mijloacelor de control (cele 4 baterii cu condensatoare gi cele 4 transformatoare cu regiaj sub sarcind a ploturilor) [8]. Timpii necesari construirii arborelui de decizie (metoda ID3) sunt prezentati in figura 3. 43= SISTEME DE INTELIGENTA ARTUFICIA I ELECTROENEREETICA Spo nano _M aa a secundo 100 200 S00 1000» 2000-3000 4000—5000 Fig, 3. Timpii de antrenare pentru studiul de caz efectuat pe refeaua IEEE30. Pentru ambele studii efectuate s-a demonstrat c& cele mai bune rezultate le au arborii de decizie ortogonali [7], [8]. Arborii de decizie ortogonali au proprietatea ca ofera rezultate mai bune, dar necesit un timp de calcul mai mare. Pentru diferite dimensiuni ale mulfimii de antrenare s-au construit arbori de decizie ortogonali ~ metoda OCI [9] pentru care s-au inregistrat timpii de calcul necesari construirii arborelui de decizie prin cele doua implementiri. Din studiile de caz anterioare se poate concluziona c& fn cazul unor mulfimi de antrenare de dimensiuni reduse timpii de calcul obtinuyi prin cele dou implementari sunt comparabili in timp ce in cazul uno mulfimi de antrenare de dimensiuni mai mari utilizarea MS SQL este o metods mai eficient& de construire a arborilor de decizie. Diferenfa intre timpii de calcul este mult mai evidenta in cazul arborilor de decizie ortogonali. 100 200800 100020003000 «4000-5000 Fig. 3. Timpii de construire ai unui arbore de decizie ortogonal 4. Coneluzii Utilizarea arborilor de decizie pentru analiza stablitaii, atdt cea tranzitorie cét i cea de tensiune, sistemelor electroenergetice s-a dovedit a fi o metodtrapida gi viabila, Etapa de construire a unui arbore de decizie este cea mai “costisitoare” din punct de vedere Computational. Pan& in prezent, pentru implementarea acestei metode s-au folosit limbaje de Programare dedicate ~ Lisp [3] sau procedurale — C, Fortran [5], [7], [9]. in acest articol, a fost Prezentata o noua posibilitate de implementare a acestui algoritm, aceasta avand avantajul unui timp de calcul mai scaizut. 44Ich eal ai - sure erst AACA M LEcTRONNNRCETCA 4 Editia a H-a, Galagi Totodatd, utilizarea MS SQL 2000 permite realizarea unui sistem integrat care si inglobeze atit tehnicile algoritmice cat si cele euristice de analiza a stabilitajii de tensiune. Prin utilizarea sa pot fi create baze de date complexe in care si fie stocate date despre sistemele electroenergetice reale si pe baza acestora s& fie efectuate diferite studii de caz. 5. Bibliografie {I]_ M, Eremia, D. Petricica, A.1. Bulac, C. Bulac, I. Tristiu - Telmici de inteligenta artificial Concepte si aplicati in sistemele electroenergetice, Ed. Agit, Bucuresti, 2001 (2] SR. Safavian, D. Langrebe - “A Survey of Decision Tree Classifier Methodology”, IEEE Transaction on Systems, Man and Cibernetics, No. 21, 1991 B]_—_L. Wehenkel ~ Automatic Learnig Techniques in Power Systems, Kluwer Academic Publishers, New York, 1998. [4] 1.R. Quinlan — Induction of decision tree. Machine Learning vol I, 1986. [5] Quinlan, LR. ~ C4.5 Programs for Machine Learning. Morgan Kauffman, 1993. [6] Bulac, A.L, Eremia, M., Bulac, C., Tristiu, I. - Analiza stabilitiyii de tensiune a sistemelor electroenergetice, folosind tehnica arborilor de decizie. Simpozionul Sisteme de Inteligenta Artficiala in Electroenergeticd — SIAE"98, Editia I, Galati, Romania, octombrie 1998, [7] AL. Bulac - Tehnici de inteligenta artificiald — arbori de decizie pentru analiza stabilixajit de tensiune a sistemelor electroenergetice, Tez de Doctorat, Universitatea “Politehnica” din Bucuresti, 2002. [8] A. Bulac, M. Eremia, C. Bulac, "Decision Trees for Voltage Stability Assessment”, 1S4P : Conference, Budapesta, 2001. [9] P.E. Utgoff, C.E. Brodley, “An Incremental Method for Finding Multivariate Splits for Decision Trees”, Proceedings of the Seventh International conference on Machine Learning, Los Altos, 1990. 45

SIAE2004 Adrian Bulac

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

SIAE2004 Adrian Bulac

Uploaded by

Copyright:

Available Formats

You might also like