You are on page 1of 230

Anne 2007

THSE
Prpare au Laboratoire dAnalyse et dArchitecture des Systmes du CNRS En vue de lobtention du Doctorat de lUniversit Paul Sabatier - Toulouse III et lUniversit de los Andes, Colombie Spcialit Systmes Automatiques

tel-00136382, version 1 - 13 Mar 2007

par

Victor-Hugo GRISALES PALACIO


MSc. en Ingnierie Electrique de lUniversit de los Andes, Colombie _______________________________

MODLISATION ET COMMANDE FLOUES DE TYPE


TAKAGI-SUGENO APPLIQUES UN BIOPROCD DE TRAITEMENT DES EAUX USES
_______________________________ Soutenue le 22 fvrier 2007 devant le jury : Prsident Joseph AGUILAR Directeur de Recherche mrite, LAAS-CNRS

Rapporteurs : Sylvie GALICHET Jean-Philippe STEYER Directeurs de thse : Gilles ROUX Alain GAUTHIER
Examinateur : Fernando JIMENEZ

Professeur lUniversit de Savoie, Annecy Directeur de Recherche lINRA de Narbonne Professeur lUniversit Paul Sabatier - Toulouse III Professeur lUniversit de los Andes, Colombie
Professeur lUniversit de los Andes, Colombie

tel-00136382, version 1 - 13 Mar 2007

ii

iii

Avant-propos
Laboutissement du travail de thse prsent dans ce manuscrit a t possible grce a la collaboration entre plusieurs personnes et organismes, tant en France quen Colombie. Ce travail en cotutelle a t ralis au Laboratoire dAnalyse et dArchitecture des Systmes (LAAS) du Centre National de la Recherche Scientifique (CNRS) Toulouse, France, ainsi quau Groupe dInformatique et dAutomatisation pour la Production (GIAP) lUniversit de los Andes, Bogota, Colombie. Je tiens tout dabord remercier Messieurs Malik GHALLAB et Raja CHATILA, respectivement ancien et actuel Directeurs du LAAS, ainsi que Monsieur Joseph AGUILARMARTIN et Madame Louise TRAVE-MASSUYES, respectivement ancien et actuelle responsables du groupe DIagnostic, Supervision et COnduite qualitatifs, pour mavoir accueilli au sein du laboratoire et du groupe DISCO. tel-00136382, version 1 - 13 Mar 2007 Je suis trs reconnaissant de lhonneur que mont fait Madame Sylvie GALICHET, Professeur lUniversit de Savoie et Monsieur Jean-Philippe STEYER, Directeur de Recherche lINRA de Narbonne, France, en acceptant la tche dvaluer en qualit de rapporteurs les travaux prsents dans ce mmoire. Leurs prcieuses et judicieuses remarques ont t pour moi dune grande aide et valeur. Je tiens galement remercier vivement Monsieur Joseph AGUILAR-MARTIN, Directeur de Recherche au CNRS, davoir accept de prsider le jury de cette thse et Monsieur Fernando JIMENEZ, Professeur lUniversit de Los Andes, Colombie, pour avoir accept de prendre part au jury. Je voudrais exprimer ma reconnaissance et toute ma gratitude envers mes Directeurs de thse : Monsieur Gilles ROUX, Professeur lUniversit Paul Sabatier de Toulouse, pour sa patience, disponibilit et soutien permanent et Monsieur Alain GAUTHIER, Professeur lUniversit de Los Andes, Colombie, pour sa confiance, son charisme et bons conseils au cours de ces annes de thse. Cest un honneur pour moi davoir eu loccasion de travailler et dapprendre au ct de personnes ayant des qualits humaines exceptionnelles. Je remercie vivement lUniversit Distrital Francisco Jos de Caldas Bogota, Colombie, davoir permis la poursuite de mes tudes de doctorat ltranger, la Fondation pour le futur de la Colombie ainsi que les Programmes de Coopration de lAmbassade de France en Colombie et lInstitut Colombien pour lAvancement de la Science (COLCIENCIAS), qui ont rendu possible une grande partie du soutien financier pour le droulement de ce travail de thse. Je tiens galement remercier les collgues du Laboratoire dAutomatique, Microlectronique et Intelligence Computationnelle (LAMIC) de lUniversit Distrital FJDC, pour la collaboration fructueuse dans la ralisation de ce travail et sa future continuit dans le cadre de la recherche et lenseignement. Jadresse aussi ma sympathie toutes les personnes de France et de Colombie qui mont apport leur aide et connaissance dune faon ou dune autre et qui ont contribu faire voluer mon esprit : jai appris beaucoup plus que jamais je naurais imagin au dbut. Je ne cite pas de noms pour viter doublier quelquun. Je suis sr quils se reconnaitront dans ce paragraphe. Un grand merci.

iv

Finalement, je tiens tmoigner toute ma gratitude au Crateur, source infinie dinspiration et connaissance et ma famille pour leur soutien quotidien, leur encouragement et leur immense disponibilit. Du plus petit au plus grand, vous avez t force desprit et exemple damour pour accomplir cette thse de doctorat. Il y aura un premier docteur dans la famille !

tel-00136382, version 1 - 13 Mar 2007

Ce nest quau dbut du crpuscule que la chouette Minerve prend son vol. Hegel

Table des matires


Liste des figures ....................................................................................................................... ix Liste des tableaux .................................................................................................................... xi Introduction .............................................................................................................................. 1 PART I. TRAITEMENT DES EAUX USES : UN POINT DE VUE DE LINGNIERIE ..................................................................................................... 5 1. Introduction aux procds biologiques de traitement des eaux ................................... 7 1.1. Les procds de traitement des eaux uses ................................................................ 9 1.1.1. Leau et la pollution ....................................................................................... 9 1.1.2. Les indicateurs de qualit de leau ............................................................... 11 1.1.3. La lgislation : quelques lments ............................................................... 12 1.1.4. Le traitement des eaux uses........................................................................ 15 1.2. Le traitement biologique des eaux uses.................................................................. 18 1.2.1. Les principaux polluants .............................................................................. 19 1.2.2. Les micro-organismes purateurs................................................................. 20 1.2.3. Les processus mtaboliques ......................................................................... 22 1.2.4. Les traitements biologiques.......................................................................... 24 1.3. Lautomatique des bioprocds................................................................................ 26 1.3.1. Les problmes spcifiques de lAutomatique des bioprocds.................... 27 1.3.2. Modlisation et identification des bioprocds............................................ 28 1.3.3. La commande des bioprocds .................................................................... 31 1.4. Conclusions .............................................................................................................. 36 2. Modlisation dynamique de procds biologiques ....................................................... 39 2.1. Description des procds biologiques ...................................................................... 42 2.1.1. Les micro-organismes et leur utilisation ...................................................... 42 2.1.2. Les types de bioracteurs ............................................................................. 43 2.1.3. Les trois modes de fonctionnement.............................................................. 43 2.2. Les modles de bilans-matire ................................................................................. 45 2.2.1. Les approches microscopique et macroscopique de modlisation............... 45 2.2.2. Le taux spcifique de croissance.................................................................. 46 2.2.3. Equations dtat............................................................................................ 49 2.3. Influence du transfert de matire.............................................................................. 50 2.4. Quelques modles reprsentatifs.............................................................................. 51 2.4.1. Fermentations continues............................................................................... 51 2.4.2. Fermentations semi-continues...................................................................... 55 2.4.3. Procds boues actives ............................................................................ 56

tel-00136382, version 1 - 13 Mar 2007

vi 2.5. Modlisation du bioprocd de traitement des eaux uses par lagunage are ....... 59 2.5.1. Traitement biologique des effluents de papeterie par lagunage are.......... 60 2.5.2. Modlisation des cintiques de croissance et de dgradation ...................... 62 2.5.3. Equations dvolution du procd................................................................ 65 2.5.4. Variables de commande du procd............................................................. 67 2.6. Conclusions .............................................................................................................. 69 PART II. IDENTIFICATION - COMMANDE FLOUES ET APPLICATION AU BIOPROCD DE TRAITEMENT DES EAUX USES .............................. 71 3. Identification de modles flous Takagi-Sugeno (TS) partir de donnes.................. 73 3.1. Modlisation floue de systmes ............................................................................... 76 3.1.1. Structure gnrale et diffrents types de modles flous............................... 76 3.1.2. Le modle flou de type Takagi-Sugeno ....................................................... 84 3.2. Identification (Construction) de modles flous........................................................ 88 3.2.1. Structure du modle flou .............................................................................. 89 3.2.2. Le problme didentification et ses solutions............................................... 90 3.2.3. Lidentification base sur des donnes entre-sortie.................................... 91 3.3. Mthodes de coalescence floue (clustering flou) ..................................................... 93 3.3.1. Notation et Concepts de base ....................................................................... 93 3.3.2. Groupage c-moyennes floues (algorithme FCM)......................................... 98 3.3.3. Groupage avec matrice de covariance floue (algorithme GK)................... 101 3.3.4. Groupage avec prototypes linaires (algorithme FCRM) .......................... 103 3.3.5. Groupage avec rgression ellipsodale (algorithme FER).......................... 105 3.3.6. Groupage robuste en prsence de bruit (algorithme RoFER) .................... 110 3.4. Construction de modles TS partir de donnes : mthodologie gnrale ........... 118 3.4.1. Validation du nombre de clusters............................................................... 122 3.4.2. Gnration des fonctions dappartenance des antcdents ........................ 124 3.4.3. Obtention des paramtres des consquents ................................................ 126 3.4.4. Validation numrique du modle flou........................................................ 128 3.4.5. Outil logiciel pour la modlisation-identification floue de type TS........... 129 3.4.6. Exemples .................................................................................................... 130 3.5. Conclusions ............................................................................................................ 140 4. Commande floue TS base sur modle ........................................................................ 143 4.1. Stabilit et stabilisation partir de modles flous.................................................. 146 4.1.1. Modeles flous dynamiques de type Takagi Sugeno (TS)........................... 146 4.1.2. Stabilit des modles flous......................................................................... 148 4.1.3. Stabilisation des modles flous TS............................................................. 150 4.2. Commande PDC sous optimale par retour dtat................................................... 153 4.2.1. Commande LQR pour des modles affines temps discret....................... 154 4.2.2. Commande PDC avec compensation de gain statique ............................... 158 4.2.3. Commande PDC avec ajout dintgrateurs ................................................ 160 4.2.4. Choix des matrices de pondration Q et R................................................. 163 4.3. Conclusions ............................................................................................................ 165

tel-00136382, version 1 - 13 Mar 2007

vii 5. Identification et Commande floues TS du bioracteur .............................................. 167 5.1. Description entre-sortie du bioprocd de traitement des eaux uses.................. 169 5.1.1. Le modle de bilan matire ........................................................................ 169 5.1.2. Les paramtres du modle.......................................................................... 170 5.1.3. Les objectifs de conduite du procd ......................................................... 171 5.1.4. Les contraintes sur les actionneurs............................................................. 172 5.2. Modlisation et identification floue du bioprocd partir des donnes............... 172 5.2.1. Elaboration du jeu des donnes entre-sortie............................................. 173 5.2.2. Utilisation du clustering flou Gustafson-Kessel et RoFER........................ 176 5.3. Commande floue de type TS du bioprocd base sur le modle flou .................. 188 5.4. Conclusions ............................................................................................................ 195 Conclusions et prospectives ................................................................................................. 197 Rfrences bibliographiques ............................................................................................... 201 tel-00136382, version 1 - 13 Mar 2007

tel-00136382, version 1 - 13 Mar 2007

viii

ix

Liste des figures

Figure 1.1. Filire dpuration des eaux rsiduaires (daprs ). ............................................... 16 Figure 1.2. Les micro-organismes et leurs besoins nutritifs et nergtiques (Daprs ). ......... 22 Figure 1.3. Reprsentation du systme de commande dun bioprocd (daprs ).................. 32 Figure 2.1. Les diffrents modes de fonctionnement des racteurs biologiques...................... 43 Figure 2.2. Loi de Monod pour max = 0,5 h-1 et plusieurs valeurs du paramtre KS ............... 47 Figure 2.3. Loi dAndrews pour max = 0,5 h-1, KS = 0,5 gS/L et plusieurs valeurs du KI........ 48 Figure 2.4. Cycle dlimination des pollutions azotes. .......................................................... 53 Figure 2.5. Principales tapes de la digestion anarobie.......................................................... 54 Figure 2.6. Schma typique dun procd dpuration par boues actives .............................. 57 Figure 2.7. Pilote exprimental dun procd boues actives (Universit de los Andes) ..... 58 Figure 2.8. Schma synoptique de l'installation du procd pilote..................................................... 62 Figure 2.9. Les interactions microbiennes : comptition et activation/inhibition comptitive 65 Figure 2.10. Phnomnes dinteractions microbiennes et mortalit bactrienne endogne..... 67 Figure 2.11. Alimentation du bioracteur dans le cas multi-variable ...................................... 68 Figure 3.1. Formes typiques reprsentatives des fonctions dappartenance ............................ 78 Figure 3.2. Reprsentation interne dun systme flou.............................................................. 80 Figure 3.3. Identification par clustering flou (adaptation daprs ) ......................................... 92 Figure 3.4. Interprtation gomtrique de la matrice de covariance floue (daprs ) ............ 102 Figure 3.5. Illustration des fonctions robustes wi et i associes chacun des clusters......... 113 Figure 3.6. Vue gnrale de la mthodologie didentification non linaire base sur lapproche de clustering flou ................................................................ 119 Figure 3.7. (a) Illustration du mcanisme de projection et (b) de lerreur de dcomposition au moment de la recomposition (intersection floue) dans lespace de lantcdent. 125 Figure 3.8. Approximation des donnes projetes par une fonction dappartenance paramtrique......................................................................................................... 126 Figure 3.9. Interprtation gomtrique de lorientation du cluster partir de la matrice de covariance floue (cas de lalgorithme GK). ......................................................... 127 Figure 3.10. Fonction y ( x ) = sinusc( x ) ................................................................................... 130 Figure 3.11. Fonction y ( x ) = sinusc( x ) avec bruit et points aberrants (cercles)..................... 131 Figure 3.12. Approximation TS de la fonction y ( x ) = sinusc( x ) - algorithmes GK et RoFER ........................................................................................................................................ 132 Figure 3.13. Approximation TS de la fonction y ( x ) = sinusc( x ) + - algorithmes GK et RoFER............................................................................................................... 133 Figure 3.14. Fonction valle de Rosenbrock.......................................................................... 135 Figure 3.15. Fonction valle de Rosenbrock avec bruit et points aberrants (cercles)............ 135 Figure 3.16. Approximation TS de la fonction valle de Rosenbrock................................... 136 Figure 3.17. Approximation TS de la fonction valle de Rosenbrock avec bruit et points aberrants ............................................................................................................ 138 Figure 4.1. Reprsentation du concept de compensation parallle distribue (PDC) ............ 145 Figure 4.2. Schma gnral de la commande du type rgulateur PDC pour des sous modles affines ................................................................................................................... 157

tel-00136382, version 1 - 13 Mar 2007

x Figure 4.3. Schma gnral de la commande du type rgulateur PDC avec pr compensateur ........................................................................................................................................ 160 Figure 4.4. Schma gnral de la commande PDC avec action intgrale pour des sous modles affines ................................................................................................................... 163 Figure 5.1. Schma de principe entre-sortie du bioprocd de traitement des eaux uses... 169 Figure 5.2. Signaux dentre u1(t) et u2(t) pour lidentification du bioprocd ..................... 173 Figure 5.3. Rpartition des donnes dans lespace des entres du procd. .......................... 174 Figure 5.4. Rpartition des donnes dans lespace des sorties du procd ............................ 175 Figure 5.5. Evolution des sorties du procd donnes didentification .............................. 175 Figure 5.6. Signaux dentre u1(t) et u2(t) pour le premier test de validation du bioprocd 177 Figure 5.7. Premier test de validation du modle flou TS du bioprocd avec donnes dopration en mode "mixte" (batch/continu). Sortie du procd (ligne en trait plein), sortie du modle avec clustering GK (ligne pleine) et sortie du modle avec clustering RoFER (ligne pointille). .................................................................... 178 Figure 5.8. Deuxime test de validation du modle flou TS du bioprocd avec donnes dopration en mode continue. Sortie du procd (ligne en trait plein), sortie du modle avec groupement GK (ligne pleine) et sortie du modle avec groupement RoFER (ligne pointille). ..................................................................................... 179 Figure 5.9. Partition X(k) avec GK donnes dopration en mode continue.......................... 181 Figure 5.10. Partition Sx(k) avec GK donnes dopration en mode continue ....................... 181 Figure 5.11. Partition Se(k) avec GK donnes dopration en mode continue ....................... 182 Figure 5.12. Partition X(k) avec RoFER donnes dopration en mode continue ................. 182 Figure 5.13. Partition Sx(k) avec RoFER donnes dopration en mode continue................. 183 Figure 5.14. Partition Se(k) avec RoFER donnes dopration en mode continue................. 183 Figure 5.15. Evolution des concentrations X(k) et Sx(k) suivant le scnario de contrle dsir. ........................................................................................................................................ 193 Figure 5.16. Evolution des variables de commande u1(k) et u2(k) du bioprocd. ................ 194

tel-00136382, version 1 - 13 Mar 2007

xi

Liste des tableaux


Tableau 1.1. Caractristiques gnrales des rejets ................................................................... 13 Tableau 1.2. Valeurs limites des rejets urbains........................................................................ 13 Tableau 1.3. Valeurs limites des rejets industriels ................................................................... 14 Tableau 1.4. Normes sur les rejets (Art. 72 Dcret 1594 de 1984, Colombie) ........................ 15 Tableau 2.1. Caractristiques d'effluents d'usines de papier et de pte papier ............................. 60 Tableau 2.2. Valeurs des variables d'environnement ............................................................... 61 Tableau 3.1. Principales t-normes et t-conormes ..................................................................... 81 Tableau 3.2. Rgles du modle flou TS pour la fonction y ( x ) = sinusc( x ) ............................ 132 Tableau 3.3. Centres des clusters du modle flou y ( x ) = sinusc( x ) algorithmes GK et RoFER ........................................................................................................................................ 132 Tableau 3.4. Rgles du modle flou TS pour la fonction y ( x ) = sinusc( x ) + ....................... 133 Tableau 3.5. Centres des clusters du modle flou y ( x ) = sinusc( x ) + algorithmes GK et RoFER............................................................................................................................ 133 Tableau 3.6. Evaluation de la qualit de lapproximation de la fonction y ( x ) = sinusc( x ) .... 134 Tableau 3.7. Rgles du modle flou TS pour la fonction valle de Rosenbrock algorithme GK .................................................................................................................................. 137 Tableau 3.8. Rgles du modle flou TS pour la fonction valle de Rosenbrock algorithme RoFER............................................................................................................................ 137 Tableau 3.9. Centres des clusters du modle flou pour la fonction valle de Rosenbrock sans bruit ................................................................................................................................ 137 Tableau 3.10. Evaluation de la qualit de lapproximation de la fonction z ( x, y ) = rosenbrock ( x, y ) ................................................................................................ 137 Tableau 3.11. Rgles du modle flou TS pour la fonction valle de Rosenbrock avec bruit et points aberrants algorithme GK ................................................................................... 139 Tableau 3.12. Rgles du modle flou TS pour la fonction valle de Rosenbrock avec bruit et points aberrants algorithme RoFER ............................................................................. 139 Tableau 3.13. Centres des clusters du modle flou pour la fonction valle de Rosenbrock avec bruit et points aberrants .................................................................................................. 139 Tableau 3.14. Evaluation de la qualit de lapproximation de la fonction z ( x, y ) = rosenbrock ( x, y ) + ........................................................................................... 139 Tableau 5.1. Paramtres stchiomtriques et cintiques du bioprocd ............................... 171 Tableau 5.2. Bornes des variables dans le systme dalimentation du bioprocd................ 172 Tableau 5.3. Performance numrique de la validation du modle flou TS pour le bioracteur rsultats avec lalgorithme GK....................................................................................... 180 Tableau 5.4. Performance numrique de la validation du modle flou TS pour le bioracteur rsultats avec lalgorithme RoFER ................................................................................ 180 Tableau 5.5. Paramtres des consquents du modle flou TS pour X (k + 1) - algorithme GK ........................................................................................................................................ 184 Tableau 5.6. Centres des clusters du modle flou TS pour X (k + 1) - algorithme GK......... 184 Tableau 5.7. Paramtres des consquents du modle flou TS pour X (k + 1) - algorithme RoFER............................................................................................................................ 185 Tableau 5.8. Centres des clusters du modle flou TS pour X (k + 1) - algorithme RoFER... 185

tel-00136382, version 1 - 13 Mar 2007

xii Tableau 5.9. Paramtres des consquents du modle flou TS pour S x (k + 1) - algorithme GK ........................................................................................................................................ 186 Tableau 5.10. Centres des clusters du modle flou TS pour S x (k + 1) - algorithme GK ...... 186 Tableau 5.11. Paramtres des consquents du modle flou TS pour S x (k + 1) - algorithme RoFER............................................................................................................................ 186 Tableau 5.12. Centres des clusters du modle flou TS pour S x (k + 1) - algorithme RoFER 186 Tableau 5.13. Paramtres des consquents du modle flou TS pour S e (k + 1) - algorithme GK ........................................................................................................................................ 187 Tableau 5.14. Centres des clusters du modle flou TS pour S e (k + 1) - algorithme GK ...... 187 Tableau 5.15. Paramtres des consquents du modle flou TS pour S e (k + 1) - algorithme RoFER............................................................................................................................ 188 Tableau 5.16. Centres des clusters du modle flou TS pour S e (k + 1) - algorithme RoFER 188 Tableau 5.17. Critres des performances en boucle ferme du systme de commande flou de type PDC bas sur le modle dynamique flou affine de type Takagi-Sugeno............... 194
tel-00136382, version 1 - 13 Mar 2007

Introduction

Introduction
Leau est lorigine de la vie. Sans eau, aucun organisme, quil soit vgtal ou animal, simple ou complexe, ne peut vivre. Historiquement, les premires civilisations se sont fondes au bord des mers, lacs et rivires. Les eaux utilises pour les besoins domestiques, lagriculture et les activits de production taient rejetes et elles atteignaient les corps deau sans aucun type de traitement. Les rivires arrivaient se dbarrasser de leurs dchets par auto-puration; et leau tait suffisante par rapport aux besoins humains quotidiens. Lquilibre naturel autrefois existant a beaucoup t modifi. Lhomme a apport au cycle de leau une perturbation quantitative par ses prlvements et sa consommation et qualitative par la pollution quil engendre. Cest ainsi quau fil du temps lindustrialisation et la croissance acclre des villes ainsi que les besoins dune population en augmentation constante ont entran la ncessit de cration d'units dpuration pour traiter les volumes rejets et la concentration en substances polluantes. Ces substances peuvent avoir des origines polluantes diverses : physique (prsence des matires en suspension), chimique, organique et bactriologique. Parmi la gamme des diffrentes formes de pollution, les dchets biodgradables constituent une des sources les plus frquemment trouves dans la pratique. Quand la pollution organique est non toxique, elle peut tre dgrade par le milieu naturel - si la mase deau est suffisante - grce au phnomne dauto-puration, due aux organismes vivant dans le milieu aquatique : bactries, protozoaires, algues, qui permettent leau de retrouver sa qualit premire. Cependant, quand les rejets de matires organiques sont trop concentrs, la capacit naturelle dauto-puration est sature et la pollution persiste, en affectant lquilibre cologique. Pour faire face ce problme, lhomme a mis en place des rseaux dgout qui collectent les eaux uses et les acheminent vers les stations dpuration, ou le traitement des effluents se fait laide de techniques efficaces, afin de minimiser l'effet polluant avant que leau soit rejete dans le milieu naturel. Lpuration dun effluent pollu peut comporter des traitements de nature assez varie : biologiques, chimiques et/ou physico-chimiques. La nature des problmes denvironnement lis aux activits humaines est une affaire de socit qui demande un effort croissant et qui doit tre entrepris lchelle globale pour mieux comprendre la complexit et maitriser les phnomnes inhrents la dpollution. Dans les domaines des bioprocds (ou les procds de traitement des eaux sont un cas particulier), il est ncessaire davoir une participation pluridisciplinaire afin de couvrir le trs large spectre de connaissances impliques pour parvenir des procds de traitement optimiss [STE98]. En effet, pour mieux comprendre les diffrents acteurs impliqus, du point de vue biotechnologique, lactivit dans le domaine peut grosso modo tre regroupe en trois domaines dactivit principaux, videment complmentaires [DOC01] :

tel-00136382, version 1 - 13 Mar 2007

La microbiologie et le gnie gntique, qui ont pour objectifs de dvelopper des microorganismes permettant la production de nouveaux produits et de choisir les meilleures souches de microorganismes de manire obtenir certains produits dsirs ou certaines qualits de produit.

Introduction Le gnie des bioprocds, qui soccupe de choisir les meilleurs modes de fonctionnement ou de dvelopper des procds et/ou racteurs qui permettent damliorer le rendement et/ou la productivit des bioprocds. Lautomatique des bioprocds, qui quant elle, a pour but daugmenter le rendement et/ou la productivit en dveloppant des mthodes de surveillance et de commande automatises permettant loptimisation en temps rel du fonctionnement des bioprocds.

Dans les domaines des biotechnologies et du traitement des eaux en particulier, lamlioration de la performance dans les industries de production ainsi que les nouvelles normes lgislatives ont rendu ncessaire la modlisation, lidentification et la commande en temps rel des procds de traitement biologique [QUE00]. La complexit des mcanismes mis en jeu et le fonctionnement au quotidien de tels procds ont soulign le besoin de mesurer, danalyser et de contrler certaines concentrations et variables caractristiques des effluents. Les cintiques non-linaires, les paramtres variant dans le temps, labsence de mesures fiables et directement accessibles, les fortes variations des conditions opratoires imposent le dveloppement et lutilisation de techniques avances de lAutomatique.
tel-00136382, version 1 - 13 Mar 2007

Les travaux prsents dans ce manuscrit concernent lexploration doutils alternatifs de lautomatique bass sur la logique floue, pour la modlisation et la commande dun bioprocd de traitement des eaux uses. Ces travaux ont t dvelopps dans le cadre dune thse en cotutelle entre lUniversit Paul Sabatier - Laboratoire LAAS-CNRS en France et lUniversit de los Andes - Laboratoire GIAP en Colombie. Afin dapporter des lments de rfrences par rapport nos travaux, nous nous permettons de prsenter en quelques lignes quelques axes de recherche qui sont tudis dans les tablissements scientifiques impliqus. En ce qui concerne le Laboratoire LAAS1-CNRS2 et plus particulirement le groupe DISCO3, les principaux travaux de recherche portent sur le dveloppement des outils de diagnostic, supervision et conduite pour les systmes dynamiques complexes, pouvant inclure lhomme. Le groupe met laccent sur le caractre qualitatif et quantitatif, sans ignorer les aspects continus ou discrets des systmes. De ce fait, les systmes hybrides et linterface entre signaux continus et leur interprtation sous forme plus abstraite vnements discrets sont un des axes de recherche. La nature qualitative des connaissances et lincertitude entachant les donnes font appel des formalismes qualitatifs et symboliques trouvant leurs origines en Intelligence Artificielle comme le raisonnement qualitatif et la modlisation floue et neuronale, de mme qu des mthodes de classification, dapprentissage et de reconnaissance des formes. En ce qui concerne lautomatique des bioprocds, le groupe a trait diffrents problmes lis lestimation, lobservation, la commande, la classification, la supervision et le diagnostic de certains procds biologiques et chimiques [ROU92] [BEN96] [DAH96] [ROU01] [KEM04] [ATI05] [HER06] [DAH06]. Pour sa part, le Laboratoire GIAP4 est ddi au dveloppement et aux applications des mthodes et techniques avances dans plusieurs domaines : modlisation et commande des systmes, robotique, potabilisation et traitement des eaux, technologies de production, infographie et ralit virtuelle. En ce qui concerne le groupe dautomatique et dinformatique, les travaux de recherche dvelopps portent sur la modlisation de systmes hybrides,
1 2 3 4

LAAS : Laboratoire dAnalyse et dArchitecture des Systmes. CNRS : Centre National de la Recherche Scientifique. DISCO : DIagnostic, Supervision et COnduite qualitatifs. GIAP : Groupe dInformatique et dAutomatisation pour la Production.

Introduction

lidentification paramtrique des systmes et la commande des procds (par des diverses techniques de commande : adaptative, prdictive, robuste, floue et hybride). Le groupe est orient aussi vers des applications pour lindustrie. Notre travail au sein des Dpartements de Gnie Electrique et Civil-Environnemental a t focalis sur lexploration et lapplication de techniques alternatives de lautomatique au domaine des procds biotechnologiques [GAU97] [GIR98] [ROD02] [ORO03] [DUQ03] [MOJ05]. En effet, cest dans ce cadre que se situent notre motivation et notre intrt pour la modlisation et la commande des procds biologiques de traitements des eaux uses. Nous esprons contribuer lamlioration du fonctionnement dune station dpuration des effluents de papeterie par lagunage ar en dveloppant des techniques de modlisation et de commande floue de type Takagi-Sugeno (TS). Au niveau de lidentification, nous avons utilis des mthodes floues de regroupement des donnes entre-sortie pour construire un modle dynamique non linaire du procd. Le type dapproche suivi, peut tre considr comme une approche de type bote grise qui reprsente le systme dynamique non linaire comme un modle base de rgles du type Si-Alors , concatnant un ensemble de sous modles localement linaires sous la forme dauto-rgression non-linaire (NARX5) dans lespace dtat. De plus, nous avons dvelopp une version graphique de la bote outils FMID6 pour la modlisation floue des systmes non linaires. A partir de cette reprsentation, nous dveloppons une commande floue TS base sur le modle, en utilisant la philosophie de la commande de type compensation parallle distribue (PDC7). Nous nous sommes intresss, en particulier, la commande sous-optimale linaire quadratique par retour dtat base sur des modles TS affines en temps discret. Pour cela, ce mmoire est structur en cinq chapitres, dont une premire partie concernant le traitement des eaux uses et la seconde, sur la modlisation, lidentification et la commande floues avec application sur le bioprocd de traitement des eaux rsiduaires. Dans la premire partie, constitue des deux premiers chapitres, nous dveloppons de manire non exhaustive, des aspects sur lingnierie des traitements des eaux uses, en mettant laccent sur la modlisation dynamique des procds biologiques. Le premier chapitre prsente une introduction aux procds de traitement des eaux. Nous positionnons le problme de pollution de leau et nous prsentons les concepts de base sur les indicateurs de qualit de leau et les procds de traitement. Ensuite nous prsentons le traitement biologique des eaux uses, ainsi que la problmatique gnrale de lautomatique des bioprocds. Le deuxime chapitre aborde la modlisation dynamique des procds biologiques utiliss dans le domaine du traitement des eaux rsiduaires. Nous donnons dabord un aperu global en dcrivant le rle des microorganismes, les types de racteurs et les modes de fonctionnement des bioprocds. Ensuite, au niveau de la modlisation, nous nous focalisons sur lapproche des bilans de matire des composants principaux pour caractriser la dynamique de tels procds. Ensuite nous prsentons quelques modles reprsentatifs des procds biologiques. Finalement, nous dcrivons le procd considr au niveau de lapplication, qui est un bioracteur arobie multivariable en mode continu pour le traitement
NARX : Nonlinear AutoRegressive with eXogenous input. FMID : Fuzzy Model Identification Toolbox for Matlab, dvelopp par le Prof. Robert Babuka, Delft University of Technology, The Netherlands. 7 PDC : Parallel Distributed Compensation.
6 5

tel-00136382, version 1 - 13 Mar 2007

Introduction

des eaux uses issues dune industrie papetire. Le modle considr est une version du simulateur utilis lors du projet europen FAMIMO8 pour lequel nous avons propose lajout dun terme de mortalit endogne au niveau de la dynamique bactrienne. La deuxime partie de ce mmoire, comportant les chapitres 3 5, concerne la modlisation, lidentification et la commande de systmes complexes en utilisant lapproche floue avec application au bioprocd de traitement des eaux uses de notre tude. Dans le troisime chapitre, nous traitons du problme didentification (construction) des modles flous de type Takagi-Sugeno (TS) partir de donnes entre-sortie. Nous introduisons dabord la modlisation floue de systmes, en nous focalisant particulirement sur le modle de type TS. En utilisant ce formalisme, nous reprsentons le comportement non linaire dun systme par une composition de rgles du type Si-Alors , concatnant un ensemble de sous-modles localement linaires. Pour la construction de tels modles nous abordons dune part, diffrentes mthodes de classification floue (clustering) et, dautre part, nous proposons lapplication dune mthode d agglomration comptitive , robuste en prsence de bruit : il sagit des algorithmes FER9 et RoFER10. Les mthodes considres appartiennent aux mthodes de clustering bases sur la minimisation dune fonction objectif. Enfin aprs avoir considr la mthodologie gnrale pour la construction de modles flous TS partir de donnes, nous prsentons quelques exemples illustratifs dapplication. Le quatrime chapitre concerne la commande des systmes non linaires base sur les modles flous de type Takagi-Sugeno, en utilisant la philosophie de commande du type compensation parallle distribue (PDC). Nous commenons par un aperu gnral sur la synthse (stabilisation) des contrleurs flous base sur un modle flou homogne TS du systme. Ensuite nous dveloppons spcifiquement une commande sous-optimale linaire quadratique par retour dtat base sur un modle affine TS en temps discret. Pour cela, nous proposons trois lois de commande qui tiennent compte du terme indpendant caractristique du modle affine. Les lois de commande sont de type rgulateur, rgulateur avec compensation de gain statique et rgulateur avec action intgrale, ce qui permet lannulation des erreurs statiques. Le cinquime chapitre est consacr lapplication des mthodes floues didentification et de commande au bioprocd de traitement des eaux uses. Nous reprenons dabord le modle du bioracteur introduit au chapitre 2. Ensuite, nous dveloppons le modle Takagi-Sugeno pour le bioracteur en appliquant les techniques floues de construction bases sur des donnes exprimentales entre-sortie considres dans le chapitre 3. En fin, en appliquant la philosophie de commande du type PDC base sur modle prsente dans le chapitre 4, nous faisons la synthse de la loi de commande la mieux adapte au bioprocd. Nous nous sommes intresss, en particulier, la commande sous-optimale linaire quadratique par retour dtat pour les modles TS affines en temps discret, afin de rguler les concentrations de biomasse et de substrat xnobiotique du bioprocd. Les rsultats obtenus en simulation soulignent les caractristiques dapplicabilit, de performance et certaines limitations pour lutilisation avec succs de ces techniques sur ce systme non linaire multivariable. Enfin, nous terminons ce mmoire par une conclusion gnrale du travail dvelopp et par quelques-unes des prospectives qui nous semble les plus intressantes tudier.
Waste-water Benchmark, in Fuzzy Algorithms for the Control of Multiple-Input, Multiple Output Processes (FAMIMO) project, funded by the European Comission (Esprit LTR 21911). 9 FER : Fuzzy Ellipsoidal Regression. 10 RoFER : Robust Fuzzy Ellipsoidal Regression.
8

tel-00136382, version 1 - 13 Mar 2007

tel-00136382, version 1 - 13 Mar 2007

PART I. TRAITEMENT DES EAUX USES : UN POINT DE VUE DE LINGNIERIE

tel-00136382, version 1 - 13 Mar 2007

Introduction aux procds biologiques de traitement des eaux

___________________________________________________________________________

Chapitre 1

1. Introduction aux procds biologiques de traitement des eaux


___________________________________________________________________________

Dans ce chapitre, nous prsentons une introduction aux procds de traitement des eaux. Nous positionnons le problme de pollution de leau et nous prsentons les concepts de base des indicateurs de qualit de leau et les procds de traitement. Ensuite nous prsentons le traitement biologique des eaux uses, ainsi que la problmatique gnrale de lautomatique des bioprocds.
tel-00136382, version 1 - 13 Mar 2007

Introduction aux procds biologiques de traitement des eaux

Sommaire ___________________________________________________________________________

tel-00136382, version 1 - 13 Mar 2007

Introduction aux procds biologiques de traitement des eaux

La forme de vie dite moderne de lhomme a beaucoup modifi lquilibre cologique naturel autrefois existant sur la plante. Les problmes d'environnement lis la concentration des populations et aux activits humaines, que ce soit au niveau urbain, agricole ou industriel, deviennent de plus en plus importants. La pollution gnre par l'homme affecte de plus en plus le cycle de l'eau et des traitements artificiels doivent souvent tre appliqus pour complter les cycles naturels d'auto-puration. Ces traitements sont en place lheure actuelle sur les stations dpuration. Le vaste domaine du traitement des eaux uses met en jeu plusieurs disciplines qui se matrialisent par exemple au niveau de la conception, la mise au point et la conduite des stations dpuration. Cette pluridisciplinarit est constitue de la microbiologie et du gnie gntique, en passant par le gnie civil, jusqu' lautomatique. Nous tenterons donc, de prsenter dans ce chapitre, quelques concepts fondamentaux lis au problme dassainissement biologique de leau, ainsi que des lments de base sur lautomatique des bioprocds, afin de mettre disposition pour ceux qui ne sont pas forcment spcialistes, des notions de base dans ce domaine multidisciplinaire. Ces lments nous permettront de fixer un cadre de rfrence pour mieux comprendre les tudes dveloppes au cours de cette thse. Une grande partie de ce chapitre est base sur les documents [STE98] [HAD99] [QUE00] [DOC01]. Pour une tude plus dtaille et plus spcifique des divers aspects lis au domaine du traitement de leau et des bioprocds, nous suggrons les ouvrages suivants : [HEN02] aborde en profondeur les principes fondamentaux des procds biologiques et chimiques les plus utilises dans le traitement de leau ; [ORO03] dtaille les caractristiques et le dimensionnement des procds biologiques du point de vue de lingnierie ; [MET03] traite en dtail les tapes de la chane de traitement et met laccent sur les aspects de la rutilisation de leau et des boues ; [BAS90] et [DOC01] dveloppent et appliquent des outils avancs de lautomatique au domaine des bioprocds.

tel-00136382, version 1 - 13 Mar 2007

1.1. Les procds de traitement des eaux uses


Dans cette section nous prsentons des lments de base concernant les procds de traitement des eaux uses. En particulier nous insisterons sur quelques points particuliers: leau et la pollution, les indicateurs de qualit de leau, la lgislation en France et le traitement des eaux uses.

1.1.1.

Leau et la pollution

La pollution se dfinit comme lintroduction dans un milieu naturel de substances provoquant sa dgradation. La pollution des ressources en eau au niveau des stations d'puration provient de diverses sources, notamment les formes relatives aux activits humaines [HAD99] [STE98] [QUE00] :

La pollution domestique et urbaine : les eaux uses urbaines sont rejetes par les installations collectives (hpitaux, coles, commerces,) et comportent les eaux mnagres (dtergents, graisses, ...) et les eaux vannes (eaux sanitaires : matire organique et azote, germes et matires fcales, ...). Les eaux rsiduaires urbaines (ERU) peuvent tre considres comme la plus importante industrie en termes de masse de matriaux bruts traiter. A titre d'exemple, tant en France quen Colombie la consommation moyenne en eau est gnralement estime 150 litres par jour et par habitant. Dans la communaut europenne il est produit quotidiennement un volume proche 40 millions de m3 d'eaux uses.

10

Introduction aux procds biologiques de traitement des eaux La pollution industrielle : le degr et la nature de la pollution gnre par des rejets industriels varient suivant la spcificit de chaque activit industrielle. Certains rejets troublent la transparence et loxygnation de leau ; ils peuvent avoir un effet nocif sur les organismes vivants et nuire au pouvoir dauto-puration de leau. Ils peuvent causer aussi laccumulation de certains lments dans la chane alimentaire (mtaux, pesticides, radioactivit,). Les eaux rsiduaires industrielles (ERI) reprsentent une part importante des rejets arrivant aux stations d'puration. A titre d'exemple, les deux tiers des industriels redevables des Agences de l'Eau en France (ceux qui gnrent le plus de pollution) sont raccords aux stations d'puration des collectivits territoriales. Ils produisent 10% de la charge polluante industrielle brute, ce qui quivaut un quart de la pollution domestique. Cet apport pose de srieux problmes aux exploitants de stations d'puration urbaines, tant au niveau des capacits que des performances de traitement. En effet, les effluents industriels toxiques11 constituent un danger permanent pour les stations de dpollution biologique. De plus, il faut bien noter que, selon le ministre de l'Environnement Franais, 30% des rejets industriels s'chappent encore dans la nature sans aucun traitement ! La pollution agricole : ce type de pollution sintensifie depuis que lagriculture est entre dans un stade dindustrialisation. Les pollutions dorigine agricole englobent la fois celles qui ont trait aux cultures (pesticides et engrais) et llevage (lisiers et purins). Nanmoins, le problme de la pollution agricole est un peu diffrent, dans la mesure o cette source de pollution n'arrive qu'indirectement la station. C'est le cas en particulier des engrais et pesticides qui passent d'abord travers les milieux naturels (nappes phratiques, rivires...). C'est aussi le cas des dchets solides issus des industries agroalimentaires et des concentrations des levages qui entrainent un excdent de djections animales (lisiers de porc, fientes des volailles...) par rapport la capacit dabsorption des terres agricoles ; celles-ci, sous leffet du ruissellement de leau et de linfiltration dans le sous-sol, enrichissent les cours deau et les nappes souterraines en drivs azots et constituent aussi une source de pollution bactriologique. La pollution dorigine naturelle et leau de pluie : La teneur de leau en substances indsirables nest pas toujours le fait de lactivit humaine. Certains phnomnes naturels peuvent y contribuer (contact de leau avec les gisements minraux, ruissellement des eaux de pluie, irruptions volcaniques,). En ce qui concerne leau de pluie, bien que longtemps considre comme propre, l'eau d'origine pluviale est en fait relativement pollue. L'origine de cette pollution peut provenir des gaz ou solides en suspension rejets dans l'atmosphre par les vhicules, les usines ou les centrales thermiques. Ces polluants (oxyde de carbone, dioxyde de soufre, poussire) sont envoys vers le sol la moindre averse. Lorsqu'elle ruisselle, l'eau de pluie a un second effet nocif: elle transporte les hydrocarbures, les papiers, les plastiques et les dbris vgtaux accumuls sur la terre et les toitures. De plus, cette pollution est dverse sur de courtes priodes et peut atteindre des valeurs trs leves ce qui provoquent un effet de choc sur le milieu biologique.

tel-00136382, version 1 - 13 Mar 2007

En ne parlant que de la pollution de l'eau, ce bilan est loin d'tre exhaustif puisqu'il faudrait lui rajouter tous les dchets solides, constitus d'ordures mnagres, des dchets mnagers encombrants (mobilier, cuisinires, rfrigrateurs,...), des dchets automobiles (carcasses, batteries, huiles et pneus usags), des dchets provenant de l'entretien des espaces verts urbains, des dchets d'assainissement des eaux uses (boues), des dchets inertes (les 2/3 des dchets solides industriels), et enfin des dchets produits ou recycls dans l'agriculture et les industries agro-alimentaires.
11

Ceux qui contiennent une forte proportion de mtaux lourds ou de molcules organiques toxiques.

Introduction aux procds biologiques de traitement des eaux

11

1.1.2.

Les indicateurs de qualit de leau

Les eaux uses sont des liquides de composition htrogne, chargs de matires minrales ou organiques pouvant tre en suspension ou en solution, et dont certaines peuvent avoir un caractre toxique. L'laboration et la dfinition de paramtres qualitatifs de la pollution ont conduit tablir des mesures quantitatives de la pollution [HAD99] [QUE00] :

Matires en suspension (MES) : quantit (en mg/L) de particules solides, de nature minrale ou organique, vhicules par les eaux uses. La mesure des MES est effectue par filtration ou bien par centrifugation dun chantillon, aprs schage 110 C. Demande chimique en oxygne (DCO) : permet de mesurer la consommation d'oxygne (en mgO2/L) dans les conditions d'une raction d'oxydation complte. C'est une mesure de la pollution organique. On utilise pour cela un oxydant puissant (le bichromate de potassium) dans un milieu acide (acide sulfurique). La quantit doxygne cde par loxydant au cours de la raction constitue la demande chimique en oxygne. Celle-ci est dautant plus importante que leau est pollue. Cette mthode qui permet un rsultat rapide, est utilise surtout pour les eaux trs pollues. On spare gnralement la DCO particulaire de la DCO soluble pour diffrencier les matires en suspension (partie organique) des matires organiques solubilises. Demande biochimique en oxygne (DBO) : reprsente la consommation d'oxygne (en mgO2/L) rsultant de la mtabolisation de la pollution organique biodgradable par les micro-organismes. Lchantillon prlev est dilu par une solution contenant les substances nutritives appropries et une semence dun grand nombre de populations bactriennes. La procdure danalyses biochimique dpendant des prvisions de la charge pollue, normalement plusieurs tests sont effectus avec diffrentes dilutions, afin de couvrir la gamme complte des concentrations possibles. Le mlange est laiss en incubation dans un flacon tanche, isol de lair, pour faciliter les mesures doxygne utilis durant les ractions de mtabolisme. Un test supplmentaire est ralis sur la culture de micro-organismes avec une dilution deau, afin dtablir les corrections lies la fraction doxygne consomme par la semence biologique. Les rsultats de ce test dpendent de la temprature ainsi que de la priode dincubation. Si la temprature standard est fixe 20 C, la dure doxydation peut varier. La Demande Biochimique en Oxygne (DBO) est souvent mesure aprs 5 jours, la notation utilise dans ce cas est gnralement DBO5. Au cours de cette priode, loxydation nest pas totale (de 60 70% de la raction complte), alors quelle est estime entre 90% et 95% aprs une incubation de 20 jours. La DBO a t reconnue depuis trs longtemps comme la principale mesure de la pollution organique. Azote global (NGl) : quantit totale d'azote (en mgN/L) correspondant l'azote organique (Norg) et ammoniacal (ion ammonium, NH + 4 ) et aux formes minrales oxydes de l'azote : nitrates ( NO 3 ) et nitrites ( NO 2 ). Lanalyse de lammoniac est ralise sous un pH lev par la technique de minralisation (chauffage et condensation) et un test de colorimtrie. Le test Kjeldahl consiste faire subir un chantillon, un processus de digestion o lazote organique est transform en ammoniac. Par consquent, lazote Kjeldahl (NTK) reprsente lazote organique et ammoniacal. Les formes oxydes (nitrates et nitrites) sont mesures par colorimtrie.

tel-00136382, version 1 - 13 Mar 2007

12

Introduction aux procds biologiques de traitement des eaux Phosphore total (PT) : quantit (en mgP/L) correspondant la somme du phosphore contenu dans les orthophosphates, les polyphosphates et le phosphate organique. Le phosphore qui pollue les eaux est en majeure partie sous forme de phosphates ( PO 3 4 ). Typiquement ce compos est dtermin directement par addition dune substance chimique qui forme un complexe color avec le phosphate.

On pourrait y rajouter des mesures plus spcifiques concernant la prsence de toxiques d'origine minrale (mercure, cadmium, plomb, arsenic...) ou organique (composs aromatiques tels que le phnol, PCP...). On trouvera aussi les mesures du Carbone Organique Total (COT), autre mesure de la quantit de matire organique, des Matires Volatiles en Suspension (MVS) qui reprsentent la partie organique (donc biodgradable) des MES, ou encore des Matires Oxydables (MO). Cette dernire est dfinie comme:
MO = 2 DBO5 + DCO 3

Cette mesure est particulirement utilise par les Agences de l'Eau pour tablir les quantits de matires organiques prsentes dans un effluent.
tel-00136382, version 1 - 13 Mar 2007

1.1.3.

La lgislation : quelques lments

Les eaux rsiduelles sont devenues un des problmes environnementaux les plus critiques, si nous considrons que l'accroissement dmographique de la majorit des centres urbains moyens et grands, est important dans plusieurs pays12 et rgions du monde. Cette situation se reflte dans l'augmentation des dcharges de type domestique et productif, en dtriorant chaque fois plus l'tat de la qualit de leau comme ressource. La situation est plus critique lorsquon altre les conditions de qualit de l'eau requises pour l'approvisionnement d'activits spcifiques (domestique, industriel, agricole, d'levage, etc..) et la vie aquatique. Afin de faire face cette problmatique environnementale, plusieurs organismes et gouvernements se sont engags ce propos en dveloppant un cadre lgal ainsi que des programmes spcifiques pour le traitement des eaux en mettant en commun la problmatique et les solutions auprs de lensemble des collectivits et des acteurs impliqus. Malgr le fait quen pratique on constate des diffrences propres la culture et aux intrts de chaque pays, la base, lesprit et les principes de ces normes restent les mmes : favoriser la protection de lenvironnement en gardant un quilibre avec le dveloppement. A titre illustratif et en prenant en compte les pays impliqus dans le cas de la cotutelle de thse, nous prsentons quelques lments sur la lgislation en France et en Colombie.
La lgislation en France

La lgislation franaise sur la pollution des eaux, les conditions de rejet et leur traitement repose en grande partie sur la loi sur l'eau n92-3 du 3 janvier 1992 et les dcrets du 29 mars 1992 et du 3 juin 1994 [STE98] [QUE00]. Les arrts prvus par ces dcrets ont permis la France de transposer en droit interne les directives europennes "eaux rsiduaires urbaines" du 21 mai 1991. Ils imposent aux communes, sur l'ensemble du territoire franais, l'laboration et la mise en uvre d'un programme d'assainissement avant le 31 dcembre 2005, prenant en compte la collecte et le traitement biologique des eaux rsiduaires urbaines.

12

En Colombie le phnomne est probablement plus accentu tant donn la situation actuelle (2007) socioconomique et d'ordre public du pays.

Introduction aux procds biologiques de traitement des eaux

13

Les conditions de rejets sont fixes par les arrts du 22 novembre 1994 pour les effluents urbains et des 1er mars 1993 et 25 avril 1995 pour les effluents industriels. Ces arrts prcisent en particulier les caractristiques physico-chimiques des rejets, avec, en particulier, les valeurs limites des critres de pollution (MES, DCO, DBO5, NGl et PT) fixes en concentrations et en rendements. Les caractristiques gnrales des rejets sont dtailles dans le Tableau 1.1. Les valeurs limites sont rsumes dans le Tableau 1.2. pour les rejets urbains et dans le Tableau 1.3. pour les rejets industriels.

Caractristique pH Temprature Couleur

Effluents urbains 6 < . < 8,5 < 25

Effluents industriels 5,5 < . < 8,5 < 30 < 100 mg Pt/L

Tableau 1.1. Caractristiques gnrales des rejets

tel-00136382, version 1 - 13 Mar 2007

Remarque
R 1.1

Pour les rejets dans des cosystmes et milieux aquatiques sensibles l'eutrophisation, la lgislation est plus contraignante, tout au moins en ce qui concerne l'azote et le phosphore.

Ainsi, l'application de la Directive Europenne et de la loi sur l'eau de 1992 ncessite non seulement une extension des stations au traitement de l'azote et du phosphore, mais galement une fiabilisation de ces traitements, c'est dire un respect continu des niveaux de rejets. A titre illustratif, en Midi-Pyrnes13 par exemple, la situation t relativement alarmante au dbut du XXI sicle puisque environ 70% des pollutions azotes et 80% des pollutions phosphores ne sont pas traites dans les stations d'puration domestiques.

Paramtre

Pollution journalire kg/L toutes charges toutes charges 120 600 > 600 600 6000 > 6000 600 6000 > 6000

Valeur limite moyenne/24h mg/L 35 125 25 15 10 2 1

Rendement minimal % 90 75 70 80 70 70 80 80

MES DCO DB05 NGl PT

Tableau 1.2. Valeurs limites des rejets urbains

13

La rgion de Midi-Pyrnes avec ses 45348 m2 reprsente 8,3% de la superficie franaise. Elle est constitue de 8 dpartements ; parmi eux la Haute-Garonne avec sa capitale Toulouse.

14

Introduction aux procds biologiques de traitement des eaux

Paramtre

Flux journalier autoris kg/L


15 > 15 100 > 100 30 > 30 50 15

Valeur limite moyenne/24h mg/L 100 35 300 125 100 30 30 10 moyenne/mois mg/L

MES DCO DB05 NGl PT

Tableau 1.3. Valeurs limites des rejets industriels

tel-00136382, version 1 - 13 Mar 2007

La lgislation en Colombie

Pour la Colombie, les valuations reportent que les centres urbains dans le pays recueillent autour de 170 m/s d'eau laquelle est perdue entre 40% et 50 %. Entre 70% 80% des eaux consommes retournent l'environnement sous forme d'eaux rsiduelles. On estime qu'en Colombie on apporte quotidiennement environ 700 tonnes de charge organique du secteur domestique urbain aux corps d'eau. L'inventaire des systmes de traitement d'eaux rsiduelles du Ministre de l'Environnement, reporte que seulement 22% des municipalits du pays effectuent un traitement des eaux rsiduelles et beaucoup prsentent des disfonctionnement. On reporte que les dpartements qui ont une plus grande couverture d'usines de traitement d'eaux rsiduelles (PTAR) sont Cundinamarca (38 PTAR), Antioquia (26 PTAR), Cesar (14 PTAR), Valle del Cauca (14 PTAR) et Tolima (13 PTAR). En ce qui concerne les normes sur les dversements d'eaux rsiduelles et les aspects institutionnels, elles sont fondes sur des politiques nationales et des normes spcifiques mentionnes depuis les annes 70. On souligne principalement le Code des Ressources Naturelles (dcret de loi 2811 de 1974), le dcret 1594 de 1984 et le Rglement Technique dEau Potable et dAssainissement (RAS14), comme principales normes de rglement environnemental et sanitaire [GUIA02]. Les communes doivent donc s'occuper des normes de dversement tablies (cf. Tableau 1.4), et de certains paramtres d'intrt sanitaire (e.g. Article 72 Dcret 1594 de 1984).

14

RAS : Reglamento Tcnico de Agua Potable y Saneamiento (RAS), Ministerio de Desarrollo Econmico, Colombia, 2000

Introduction aux procds biologiques de traitement des eaux

15

Paramtre pH Temprature Matires grasses et huiles Matires en suspension DB05 Niveau urbain Niveau industriel

Installation dj existante 5-9 < 40 Efficacit > 80% Efficacit > 50% Efficacit > 30% Efficacit > 20%

Nouvelle Installation 5-9 < 40 Efficacit > 80% Efficacit > 80% Efficacit > 80% Efficacit > 80%

Tableau 1.4. Normes sur les rejets (Art. 72 Dcret 1594 de 1984, Colombie)

tel-00136382, version 1 - 13 Mar 2007

1.1.4.

Le traitement des eaux uses

Leau est le vhicule de transport et de dissmination idal de nombreux polluants. Les contraintes dassainissement, de plus en plus strictes, exigent le traitement dun nombre plus important de polluants (matires organiques, minrales, pathognes et toxiques). Etant donne la grande diversit de ces dchets, lpuration dun affluent rsiduaire comporte plusieurs tapes, chacune spcifique aux caractristiques particulires des lments traiter. Dun point de vue gnral, est sans vouloir tre exhaustif, compte tenu de la diversit des procds mis en uvre selon les cas, l'puration de l'eau amne toujours avant leur rejet dans le milieu naturel [QUE00] : - sparer et liminer les matires en suspension, - liminer la pollution organique, principalement par voie biologique, et, plus rcemment les pollutions azotes et phosphores. Le schma fonctionnel de la filire dpuration des eaux rsiduaires est indiqu sur la Figure 1.1 [HAD99] :

16

Introduction aux procds biologiques de traitement des eaux

tel-00136382, version 1 - 13 Mar 2007

Figure 1.1. Filire dpuration des eaux rsiduaires (daprs [HAD99]).

Globalement, la filire de traitement est constitue de diffrents modules o les eaux brutes sont soumisses une combinaison ou une succession de diffrents processus de purification. Lpuration dun effluent pollu peut comporter cinq phases principales :

Le prtraitement : est un traitement prliminaire comportant un certain nombre doprations caractre mcanique (procds physiques). Le but est dextraire de leau les gros dchets en suspension ou en flottation (sables, huiles) qui pourraient gner les traitements subsquents. Llimination pralable de ces matires permet dviter des effets nocifs secondaires (odeurs, colmatage). Parmi ces mthodes de sparation primaires, les plus courantes sont :

Introduction aux procds biologiques de traitement des eaux

17

- le dgrillage, qui a pour fonction la suppression des dchets les plus grossiers par passage travers une grille. - le dessablage, qui permet le dpt du sable et des graviers susceptibles dendommager les machines de pompage. - le dshuilage, qui favorise, par injection dair, la flottation des graisses et des hydrocarbures qui sont spars par raclage de surface.

Le traitement primaire : permet dliminer de leau plus de la moiti des matires en suspension sous forme de boues dites boues primaires , recueillies ensuite par pompage de fond. Il fait appel diffrents procds physiques : - La flottation, visant sparer les phases solides des phases liquides par la pousse dArchimde. En flottation naturelle, les flocs de faible densit remontent librement la surface. La flottation assiste sobtient par injection dair. - La dcantation, permet aux matires en suspension de se dposer, sous forme de boues, en utilisant la force de gravit pour sparer les particules de densit suprieure celle du liquide.

tel-00136382, version 1 - 13 Mar 2007

- La filtration, est le passage du mlange liquide-solide travers un milieu poreux (filtre) qui retient les solides et laisse passer les liquides.

Le traitement secondaire : a pour objectif principal llimination des matires en suspension et des composants solubles dans leau (matires organiques, substances minrales). Il fait habituellement appel aux procds biotechnologiques, car les matires prsentes dans les eaux uses sont gnralement dorigine organique. Au terme du traitement secondaire, leau, dbarrasse des lments qui la polluaient est pure 90%. Les matires polluantes agglomres la suite de ce traitement sont recueillies par dcantation sous forme de boues. On utilise typiquement : - Les traitements physico-chimiques, qui consistent transformer chimiquement, laide de ractifs, les lments polluants non touchs par les traitements biologiques (matires non biodgradables). - Les traitements biologiques, qui sont appliqus aux matires organiques en utilisant des cultures de microorganismes (notamment bactries) reproduisent le processus de lautopuration naturelle dans des bassins adaptes ce propos (les bioracteurs). Plus rcemment, le traitement biologique de lazote a t intgr cette tape, et de la mme manire, le traitement des phosphates commence aussi y tre intgr. Les impurets sont alors digres par des tres vivants microscopiques et transformes en boues. La culture des bactries se fait soit en milieu ar (arobie), soit en absence doxygne (anoxie). On distingue aussi les cultures fixes (lits bactriens, disques biologiques), et les cultures libres (lagunage ar, boues actives). On reviendra dans la section 1.2. plus en dtail sur le traitement biologique des eaux uses.

Le traitement tertiaire : est un traitement complmentaire qui a un rle daffinage, dans le but soit dune rutilisation des eaux pures des fins agricoles ou industrielles (e.g. refroidissement des turbines), soit de la protection du milieu rcepteur pour des usages spcifiques (rejet dans les milieux aquatiques en zone plus ou moins sensible), soit encore de la protection des prises deau situes en aval. Diffrentes mthodes de nature varie peuvent alors tre utilises : - biologiques, pour llimination de lazote (processus de nitrification-dnitrification) et du phosphore (dphosphatation).

18

Introduction aux procds biologiques de traitement des eaux - physico-chimiques, pour la prcipitation du phosphore (coagulation-dcantation) ou llimination des dernires matires en suspension (filtration sur lits de sable, tamis mtalliques ou charbon actif). Llimination de lazote et du phosphore par voie biologique ou chimique vite la prolifration de vgtaux dans les corps deau15 (les lacs, les tangs ou les rivires) et protge la vie aquatique. - chimiques, pour la dsinfection dans le traitement final des effluents. Llimination des risques de contamination bactriologique ou virale se fait souvent par oxydation en utilisant des agents tels que le chlore et lozone. Les procds chimiques sont utiliss aussi pour ladoucissement de leau et pour la neutralisation en agissant sur le pH. - radiatifs, pour les oprations de dsinfection de leau telle que les rayonnements ultraviolets qui irradient les cellules vivantes indsirables permettant dliminer les risques de contamination due aux bactries et virus. Suivant la quantit dnergie UV reue, elles sont soit strilises (effet bactriostatique) soit dtruites (effet bactricide).

tel-00136382, version 1 - 13 Mar 2007

Le traitement des boues : a pour but le traitement et le conditionnement des boues rsiduaires extraites du dcanteur, en permettant de rduire leur volume en liminant leau (paississement, dshydratation) et les cas chant de les stabiliser (digestion, compostage). Pour ces boues, quatre destinations sont typiquement possibles : - lpandage agricole, qui reprsente une valorisation de ce sous-produit fertilisant. - llaboration de compost, par incorporation de paille ou de sciure. - lincinration, pour quelques grosses units ou lorsquune installation locale existe dj pour les ordures mnagres. - la mise en dcharge, solution qui devrait tre progressivement abandonne dans les annes venir.

Remarque
R 1.2

Compte tenu de lvolution des directives, le traitement des pollutions dues aux nitrates et phosphates ainsi que les diffrentes oprations de traitement biologique sont pass peu peu du traitement tertiaire vers le traitement secondaire. Mais ceci nest quaffaire de prsentation et ne change rien dans les principes [QUE00] .

1.2. Le traitement biologique des eaux uses


Le traitement biologique des effluents dans des installations appropries est un moyen efficace pour rpondre aux problmes environnementaux lis aux activits humaines et complter lactivit des micro-organismes dans les cosystmes, en imitant les cycles naturels d'auto-puration. Les procds de traitement biologique de l'eau sont particulirement adapts l'puration d'eaux pollues essentiellement par de la matire organique facilement biodgradable et, dans tous les cas, exemptes de composs toxiques des concentrations importants. Ces procds sont donc particulirement adapts l'puration des eaux rsiduaires urbaines. Les eaux industrielles ncessitent gnralement des traitements spcifiques. Elles

15

Lapport constant de substances nutritives (nitrates et phosphates) au corps deau facilite la prolifration dmesure d'algues et autres vgtaux aquatiques qui favorisent l'appauvrissement du milieu en oxygne, phnomne connu sous le terme deutrophisation.

Introduction aux procds biologiques de traitement des eaux

19

peuvent parfois rejoindre la station d'puration, au prix toutefois d'un traitement physicochimique pralable, car la prsence de toxique dtruirait la flore bactrienne [QUE00].
Le principe gnral d'un procd biologique, ou bioprocd, est d'utiliser les proprits naturelles d'organismes vivants afin de produire ou d'liminer certaines substances chimiques ou biochimiques, dans des conditions optimales de fonctionnement. En effet, certains micro-organismes ont de grandes facults de transformation mtabolique et de dcomposition des matires biodgradables. Ils constituent par leur multiplication rapide et leur action biochimique, des agents purateurs trs efficaces.

Dans cette section nous prsentons en quelques lignes une vue panoramique du traitement biologique des eaux uses. En particulier nous insisterons sur quelques points particuliers : les substrats polluants, les micro-organismes purateurs, les processus mtaboliques et les traitements biologiques [HAD99] [MET03].

1.2.1.
tel-00136382, version 1 - 13 Mar 2007

Les principaux polluants

Les phnomnes de pollution des eaux se traduisent par des effets particuliers lis aux spcificits cologiques propres aux milieux aquatiques. En effet, leau peut dissoudre, souvent avec facilit, de nombreuses substances chimiques et biologiques. Par consquent, tout polluant peut tre vhicul fort loin de la source de contamination. La problmatique des dchets prsents dans leau peut tre aborde de plusieurs faons, qui donnent chacune lieu une classification diffrente. Ainsi, les impurets peuvent tre identifies suivant quelles soient vivantes ou inertes, minrales ou organiques, solides ou dissoutes. Dautres techniques de classification sont bases sur leur dimension, leurs degrs de toxicit, Parmi les principaux polluants on peut distinguer les suivants :

Les matires organiques : constituent, de loin, la premire cause de pollution des ressources en eaux. Ces matires organiques (djections animales et humaines, graisses,) sont notamment issues des effluents domestiques, mais galement des rejets industriels (industries agro-alimentaire, en particulier). La pollution organique peut tre absorbe par le milieu rcepteur tant que la limite dauto-puration nest pas atteinte. Les lments minraux : regroupent essentiellement les produits azots ainsi que les produits phosphors. Ces matires proviennent principalement des activits agricoles. La pollution minrale des eaux peut provoquer le drglement de la croissance vgtale ou des troubles physiologiques chez les animaux. Les mtaux lourds : les plus frquemment rencontrs mais qui sont aussi les plus dangereux sont le mercure, le cuivre, le cadmium, le chrome, le plomb et le zinc. Ils ont la particularit de saccumuler dans les organismes vivants ainsi que dans la chane trophique. La pollution radioactive peut avoir des effets cancrignes et mutagnes sur les peuplements aquatiques. Les matires pathognes : sont constitues de virus et bactries entrainant souvent une inhibition des mcanismes biologiques. La pollution micro-biologique se dveloppe conjointement la pollution organique, par une prolifration des germes dorigine humaine ou animale dont certains sont minemment pathognes. Les substances toxiques : sont des composs chimiques de synthse, issus des activits industrielles et agricoles. Les consquences souvent dramatiques de la pollution chimique sur les cosystmes, varient suivant la concentration de composs dans les rejets.

20

Introduction aux procds biologiques de traitement des eaux Les hydrocarbures : provenant des industries ptrolires et des transports, ces composs chimiques sont des substances peu solubles dans leau est difficilement biodgradables. Leur densit inferieur leau les fait surnager et leur vitesse de propagation dans le sol est 5 7 fois suprieure celle de leau. Ils constituent un redoutable danger pour les nappes phratiques.

Une autre classification trs importante est fonde sur le pouvoir de dgradation des dchets polluants. On distingue ainsi deux classes principales :

Les matires biodgradables : affectes par les activits biologiques des microorganismes, ces substances sont soumises aux divers processus biochimiques de conversion. Cette fraction biodgradable peut tre structure en deux groupes : - Les matires aisment dgradables, composes des substances solubles, ces matires ont la caractristique de pouvoir tre directement absorbes par les bactries. - Les matires lentement dgradables, composes des substrats particulaires forms par un mlange de substances organiques solides, collodales et solubles. Ces matires sont soumises certains processus intermdiaires avant dtre absorbes par les populations bactriennes.

tel-00136382, version 1 - 13 Mar 2007

Les matires non-biodgradables : ces substances inertes ne subissent aucun phnomne biologique de transformation. Ces matires sont soit prsentes dans les eaux rsiduaires, comme les mtaux lourds, soit issues des phnomnes de mortalit des micro-organismes au cours des processus biologique dpuration. Les composants non-biodgradables solubles peuvent traverser la station dpuration sans tre modifis mais les matires inertes en suspension peuvent tre limines par des mcanismes de dcantation. La structure chimique des polluants permet de distinguer deux types de composs :

Les matires organiques : elles sont constitues dun grand nombre de composs qui ont la particularit commune de possder au moins un atome de carbone, do leur nom de substance carbones. Ces atomes de carbone sont oxyds biologiquement par les microorganismes pour fournir lnergie ncessaire leur croissance. Les matires inorganiques : sont des substances ne contenant pas de carbone. La fraction minrale des aux rsiduaires reprsente principalement les produits azots et phosphors.

1.2.2.

Les micro-organismes purateurs

Le monde vivant est class en trois catgories principales : les vgtaux, les animaux et les protistes (organismes eucaryotes unicellulaires), qui se distinguent des deux autres rgnes par la structure relativement simple et la multiplication rapide de leurs individus. Ces microorganismes sont composs essentiellement des bactries, des algues et des protozoaires (prdateurs des bactries). Certains de ces populations microbiologiques ont la facult de dgrader les substances polluantes prsentes dans les eaux rsiduaires pour les convertir en eau, en dioxyde de carbone et en matires minrales dont leffet polluant est moins nuisible pour les milieux rcepteurs. Ces micro-organismes sont la base de lpuration biologique qui est le procd le plus utilis pour restaurer la qualit de leau en la dbarrassant de ses principales impurets pourvu quelles soient plus ou moins biodgradables et ne contiennent pas de toxiques qui font lobjet dun traitement particulier (puration physico-chimique).

Introduction aux procds biologiques de traitement des eaux

21

Parmi tous les individus du monde protiste, trois populations jouent un rle fondamental dans le traitement :

Les bactries : unicellulaires, ces micro-organismes possdent la structure interne la plus simple de toutes les espces vivantes. Les tests effectus sur diffrentes populations ont montr que les bactries sont composes de 80% deau et 20% de matire sche dont 90% est organique. Elles croissent et se multiplient en gnral par scissiparit (scission binaire). Ces cellules reprsentent la plus importante population de la communaut microbienne dans tous les procds biologiques, avec souvent des concentrations qui dpassent 106 bactries/mL. Les protozoaires : de structure plus complexe que celle des bactries, la distinction de protozoaires est plus simple. Certains groupes de protozoaires sont de redoutables prdateurs pour les bactries. Ils ont la facult de se dplacer et sont classifis suivant leur mode de mouvement (nageurs, rampants,). Ces organismes peuvent jouer un rle important au cours du processus dpuration par leur abondance et leurs interactions avec les bactries puratrices (comptition et prdation). Les algues : ce sont des organismes photosynthtiques unicellulaires ou multicellulaires formant une population htrogne. Les algues sont indsirables dans les sources deau car elles affectent leur got et leur odeur. Dans le traitement, on les retrouve dans deux types de procds uniquement : les lits bactriens ainsi que les bassins de lagunage, mais ce nest que dans ces derniers quelles jouent une rle bnfique dans lpuration.

tel-00136382, version 1 - 13 Mar 2007

Une grande partie du poids sec des micro-organismes est constitu en gnral, du carbone (50%), doxygne (20%), dazote (10 15%), dhydrogne (8 10%) et du phosphore (1 3%). Afin daccomplir ses fonctions biologiques, cette faune microscopique se nourrit des matires organiques qui contiennent ces lments nutritifs vitaux pour son dveloppement. La consommation des polluants permet aux populations bactriennes de : - fournir la matire ncessaire pour la synthse cytoplasmique dont le compos fondamental est le carbone ; - assurer leurs besoins nutritifs pour leur croissance, lazote tant ncessaire pour la synthse des protines par exemple ; - servir comme source dnergie pour la croissance cellulaire et les ractions biosynthtiques, le phosphore joue un rle trs important dans le transfert dnergie ; - servir comme accepteur final dlectrons librs au cours des ractions doxydation, loxygne joue le rle dagent oxydant dans le processus de respiration arobie. Selon la nature de leurs besoins nutritifs, les micro-organismes peuvent tre classs en plusieurs catgories. Sans vouloir rentrer dans les dtails dautres classifications plus labores, les catgories les plus couramment utilises sont [HAD99] :

Forme chimique du carbone ncessaire :


) comme - les autotrophes, utilisent le dioxyde de carbone (CO2) et le carbonate ( HCO 3 unique source de carbone pour la synthse de leurs biomolcules (les plantes par exemple). - les htrotrophes, utilisent le carbone sous forme organique relativement complexe pour la synthse de nouvelles cellules vivantes (les animaux par exemple).

22

Introduction aux procds biologiques de traitement des eaux


Source dnergie : - les phototrophes, utilisent la lumire solaire comme source dnergie (les plantes par exemple). - les chimiotrophes, obtiennent leur nergie partir des ractions doxydo-rduction (les animaux par exemple). Accepteur final dlectrons : - arobies, se servent des molcules doxygne comme accepteurs dlectrons. Les microorganismes arobies se dveloppent donc en prsence doxygne (les animaux par exemple). - anarobies, ont la facult dutiliser dautres molcules que loxygne comme accepteurs dlectrons (dioxyde de carbone, sulfate,). Les micro-organismes anarobies peuvent se passer doxygne pour se dvelopper (certaines souches de bactries comme les acidognes et les mthanognes par exemple). - facultatifs, utilisent comme agents oxydants, loxygne ou dautres composants chimiques comme le nitrate (conditions danoxie). Cependant, leur croissance est plus efficace sous les conditions darobiose (les plantes par exemple).

tel-00136382, version 1 - 13 Mar 2007

La Figure 1.2 prsente un rsum des populations biologiques et leurs besoins nutritifs et nergtiques :

Figure 1.2. Les micro-organismes et leurs besoins nutritifs et nergtiques (Daprs [HAD99]).

1.2.3.

Les processus mtaboliques

Les composants chimiques consomms par les micro-organismes sont soumis de nombreuses ractions biochimiques qui font partie dun des deux mcanismes mtaboliques fondamentaux pour le dveloppement des bactries :

le catabolisme : reprsente lensemble des ractions doxydation et de dgradation enzymatique. Cest une activit exothermique qui libre lnergie inhrente la structure complexe des molcules organiques et minrales, et qui est stocke par les microorganismes. lanabolisme : reprsente lensemble des ractions de rduction et de synthse enzymatique. Cest une activit endothermique qui utilise lnergie libre par les processus catabolique pour dvelopper la taille et la structure chimique des composants organiques.

Introduction aux procds biologiques de traitement des eaux

23

Parmi le grand nombre de processus biochimiques mis en jeu au cours du traitement biologique des polluants par les diffrentes populations bactriennes, on peut distinguer principalement les activits suivantes :

Oxydation : cest une raction qui implique une perte dlectrons suivie dune production dnergie. Une partie des matires absorbes par les micro-organismes est utilise pour fournir lnergie ncessaire afin daccomplir leurs fonctions biologiques. Selon la nature de laccepteur final dlectrons, le processus doxydation peut seffectuer sous les conditions darobiose (prsence doxygne), danarobiose (absence doxygne) ou danoxie (prsence de nitrate). Digestion : la caractristique de la digestion appele aussi fermentation est que ce processus ne ncessite pas un accepteur dlectrons externe. Cest un mcanisme anarobie de production dnergie qui nimplique pas de chane de transport dlectrons. La fermentation est provoque par des bactries anarobies capables de dcomposer la matire organique en acides et alcools et de donner du mthane (CH4) et du gaz carbonique (CO2).
Nitrification : cest une transformation chimique de lazote organique en nitrate ( NO 3 ) par des organismes dits nitrifiants (Nitrosomas et Nitrobacter). La nitrification a lieu en trois tapes dans les conditions darobiose : lammonification (conversion de lazote organique en ammoniac ( NH + 4 )), la nitritation (oxydation de lion ammoniac en nitrite ( NO 2 )) et la nitratation (oxydation du nitrite en nitrate).

tel-00136382, version 1 - 13 Mar 2007

Dnitrification : cest un processus de conversion du nitrate, effectu par les htrotrophes facultatifs sous les conditions danoxie. La dnitrification peut avoir lieu selon deux activits biologiques diffrentes : lassimilation, o le nitrate est rduit en ammoniac qui peut servir comme source dazote pour la synthse cellulaire et la dissimilation, qui joue un rle plus important dans llimination totale du nitrate. Floculation : dans les cultures en suspension o les micro-organismes flottent librement dans les eaux traiter, ceux-ci ont tendance sagglutiner sous forme de petits amas appels bioflocs. Certaines substances biodgradables (particules, collodes, grosses molcules) ne sont pas directement absorbes par les bactries. La floculation permet aux micro-organismes damliorer leurs caractristiques dadsorption des aliments sur leur membrane cellulaire. Adsorption : certains composs organiques comme les substances biodgradables particulaires ne peuvent pas tre directement absorbs par les bactries. Ces matires sont dabord adsorbes par les micro-organismes et stockes leur surface avant de subir un processus de conversion qui gnre des substances simples aisment dgradables. Hydrolyse : cest une srie de ractions enzymatiques extra-cellulaires appliques aux substances adsorbes et qui ont lieu la surface des micro-organismes. Les molcules organiques complexes sont converties en molcules plus simples qui peuvent diffuser travers la membrane cellulaire. Mortalit : la population biologique est soumise divers phnomnes de mortalit : la prdation (protozoaires), le processus de lyse (dissolution) et la respiration endogne o une partie des composants cellulaires est oxyde pour satisfaire les besoins en nergie ncessaires pour maintenir en vie les autres cellules quand le substrat nest pas disponible.

24

Introduction aux procds biologiques de traitement des eaux Une fraction des produits de mortalit est biodgradable, lautre partie reprsente les rsidus endognes inertes.

1.2.4.

Les traitements biologiques

Le traitement biologique est largement utilis dans la dpollution de leau, compte tenu des grandes facults de certains micro-organismes, notamment des bactries, de transformation mtabolique et de dcomposition de la matire organique biodgradable, lorsque les composs toxiques sont des concentrations faibles. Lpuration biologique consiste alors favoriser la prolifration de ces micro-organismes pour utiliser leurs proprits remarquables dans les conditions les plus adaptes au rsultat dsir. Ces conditions reproduisent le processus de lauto-puration naturelle dans les bioracteurs, des bassins adaptes ce propos. Les impurets sont alors digres par les micro-organismes et transformes en boues. Les polluants ingrs par la biomasse sont dorigine organique mais certains lments minraux ou inertes sont affects par les processus mtaboliques ou floculs au cours des ractions biochimiques [MET03]. L'limination de la production polluante conduit toujours, en fonction des caractristiques physico-chimiques des rejets et du degr d'puration souhait, la conception dune chane de traitement constitue d'une succession d'oprations unitaires ou de stades de traitement entre lesquels il existe gnralement des interactions. On peut cependant, dans de nombreux cas, simplifier le fonctionnement global du cycle d'puration de l'eau (de son prlvement son renvoi dans le milieu naturel, en passant par son utilisation, les traitements physico-chimiques et biologiques, et la gestion des boues produites) en plusieurs sous-systmes traits indpendamment. C'est en particulier le cas pour les stations de traitement biologique, dans lesquelles les traitements de la pollution peuvent tre, selon les cas, considrs de manire globale ou dcouple [QUE00]. Historiquement, le premier objectif des installations de traitement des eaux uses tait llimination de la pollution carbone. La nitrification, mieux connue et mieux maitrise que la dnitrification, a ensuite t ajoute ces installations. Les procds de dnitrification sont apparus plus tardivement et se sont intgrs aux systmes nitrifiants prexistants. Ltape de traitement du phosphore, quant elle, commence aussi y tre intgr dans les procds modernes [STE98]. Cette chronologie historique explique le nombre important de racteurs en cascade pouvant tre observs dans les configurations de traitement tertiaire existantes lheure actuelle. Parmi les diffrentes possibilits de classement de bioprocds de traitement des eaux uses, nous voulons faire appel ceux qui correspondent au trois critres suivants : lemplacement des populations bactriennes, les conditions de lenvironnement et les types de procds biologiques. Suivant lemplacement des bactries puratrices dans le bioracteur, on distingue deux dispositifs [EDE97]:

tel-00136382, version 1 - 13 Mar 2007

Le procd cultures libres : Les micro-organismes sont maintenus en suspension dans le mlange purer. La biomasse entre ainsi constamment en contact avec les polluants. Ces dispositifs ont lavantage davoir un traitement plus homogne et une meilleure matrise des facteurs dpuration (apport deau rsiduaire et de masse bactrienne) compars aux procds culture fixe.

Introduction aux procds biologiques de traitement des eaux

25

Le procd cultures fixes : Les micro-organismes sont fixs sur des supports. Le contact entre les eaux traiter et les cellules puratrices est assur soit par arrosage des supports avec leau use (lits bactriennes), soit par rotation des supports dans le mlange pollu (disques biologiques). Ces procds permettent dobtenir des concentrations en biomasse plus importantes et donc des traitements intensifs, mais prsentent des risques de colmatage ou dmanation dodeurs. Une purge des boues accumules dans l'ouvrage est cependant rgulirement ncessaire pour prvenir le colmatage du filtre. Nanmoins, les procds biomasse fixe gagnent en compacit par rapport aux procds boues actives et ne ncessitent pas la prsence d'un dcanteur en sortie.

Suivant les conditions de lenvironnement des cellules dans lunit de dpollution, on distingue deux modes de traitement [HAD99] :

Le traitement arobie : Ce type de traitement fait appel aux bactries arobies qui se dveloppent en prsence doxygne. La dgradation des polluants est effectue par des ractions doxydation dans un milieu ar. Le traitement anarobie : Ce traitement seffectue en condition danarobiose, cest-dire, en absence doxygne. Les bactries anarobies assurent la dcomposition mtabolique des composs biodgradables par des processus de fermentation.

tel-00136382, version 1 - 13 Mar 2007

Parmi lensemble des procds biologiques utiliss dans le traitement des eaux uses, on peut citer les principaux procds suivants :

Les lits bactriens : Ce procd arobie cultures fixes consiste faire supporter les micro-organismes par des matriaux poreux. Leffluent est distribu par aspersion en surface et loxygnation est apporte par ventilation naturelle de bas en haut. Laffluent arrive par la partie suprieure alors que leffluent est vacu par le fond afin de ne pas perturber la fonction arobie. De ce fait, ce systme prsente un inconvnient majeur, dans le sens quil ncessite un dispositif de relevage. La biomasse se dveloppe la surface du support. Lorsquelle devient trop importante, la pellicule bactrienne se dtache naturellement ; elle doit alors tre spare de leffluent par dcantation. Les disques biologiques : Dans ce procd, les micro-organismes sont fixs sur des disques demi immergs et tournent lentement (quelques tours par minute) autour dun axe horizontal. La biomasse est ainsi alternativement mouille par les eaux rsiduaires et are par lair ambiant. Cette technique prsente lavantage dtre peu coteuse en nergie mais peut entrainer lmanation dodeurs. Les boues actives : Ce systme comprend deux compartiments principaux. Le premier est le bassin daration o ont lieu les activits biologiques de transformation des polluants biodgradables par lintermdiaire des micro-organismes en suspension. Le bassin est associ un dcanteur-clarificateur qui permet de recycler les boues en tte du bassin d'une part, et de rcuprer l'effluent trait d'autre part. Outre les matires organiques assimils par les htrotrophes, principaux constituants des boues actives, les composs azots peuvent aussi tre oxyds par des phnomnes de nitrification-dnitrification. Les bactries floculantes utilises dans ce systme, ont la facult de transformer les lments ingrs en matire corpusculaire. Les flocs forms dans le bassin daration sont alors conduits vers un second compartiment appel dcanteur secondaire o a lieu la sparation des solides de la phase liquide par dcantation.

26

Introduction aux procds biologiques de traitement des eaux De nombreuses variantes du procd par boues actives sont disponibles. Par exemple, selon le cas, le bassin d'aration peut tre constitu de plusieurs bassins en srie privilgiant chacun le traitement d'une pollution spcifique (organique, nitrification, dnitrification, dphosphatation), ou d'un seul bassin permettant de raliser les diffrentes ractions biologiques simultanment, par exemple par alternance de phases ares et non ares intgrant mme au sein d'un unique bassin des cultures arobies et anoxies.

tel-00136382, version 1 - 13 Mar 2007

Le lagunage : Il sagit dun tang ou un systme de lagunes mettant en uvre une culture mixte algo-bactrienne. Le lagunage est un procd de traitement extensif qui repose sur le principe de la dgradation en eau libre de la pollution organique. Il sagit dune boue active sans recyclage de boue, avec ou sans dcanteur final [EDE97]. Laration peut tre naturelle ou artificielle, lorsque l'apport d'oxygne est assur par des arateurs externes. Suivant la profondeur du bassin, on peut distinguer diffrents rgimes de fonctionnement. En zone peu profonde, le traitement seffectue dans des conditions darobiose. Les deux populations vivent en symbiose. Les besoins en oxygne des bactries sont principalement assurs par lactivit photosynthtique des algues exposes la lumire. De leur ct, les vgtaux profitent du gaz carbonique ainsi que des nutriments inorganiques produits au cours des ractions mtaboliques des cellules vivantes. Dans le cas de lagunes plus profondes, en plus de la zone suprieure arobie, on peut distinguer une rgion intermdiaire o la disponibilit de loxygne dpend de la lumire solaire. Le traitement a lieu dans des conditions darobiose le jour, et en anarobiose durant la nuit. Les dpts de boues au fond des bassins suffisamment profonds forment une couche anarobie o ont lieu des processus de fermentation. La digestion anarobie : Ce procd repose sur les ractions de fermentation qui ont lieu dans des conditions danarobiose et sont effectues par une biomasse anarobie complexe. De manire gnrale, on distingue trois tapes dans ce processus. Dans la phase de liqufaction, des bactries hydrolytiques solubilisent les matires complexes. Dans la deuxime tape, une population actogne transforme les composs organiques en acides, qui serviront ultrieurement de nourriture des bactries mthanognes. Au cours de ltape finale les acides organiques sont transforms en mthane et gaz carbonique. Le mtabolisme anarobie librant trs peu dnergie compar au processus arobie, provoque une faible production de boues. Nonobstant, lpuration anarobie est plus lente que lpuration arobie.

1.3. Lautomatique des bioprocds


Comme on vient de le voir dans les sections 1.1 et 1.2, les procds de traitement des eaux uses et en particulier les procds biologiques sont des systmes complexes qui font appel la croissance des micro-organismes par la consommation de substrats ou de nutriments en imitant les cycles d'auto-puration trouvs dans la nature. Au niveau des stations dpuration, cette croissance nest possible quen prsence de conditions environnementales favorables. Par conditions environnementales, on entend les conditions physico-chimiques (pH, temprature, agitation, aration,) ncessaires une bonne activit des micro-organismes. Pour parvenir ces conditions et aux exigences techniques, conomiques et environnementales actuelles, il est ncessaire de faire appel des systmes de mesure, de commande, de supervision et de surveillance. Ces problmatiques sont traites dans le domaine de lAutomatique.

Introduction aux procds biologiques de traitement des eaux

27

Cest dans le cadre de cette approche que nous abordons dans cette section quelques aspects gnraux concernant lautomatique des bioprocds, en faisant rfrence aux travaux de [DOC01] et [QUE00]. Cela nous permettra ensuite de mieux comprendre les problmes spcifiques, ainsi que la contribution que lautomatique peut apporter aux procds de traitement biologique des eaux uses.

1.3.1.

Les problmes spcifiques de lAutomatique des bioprocds

tel-00136382, version 1 - 13 Mar 2007

Le domaine des procds biotechnologiques est assez vaste, en effet il englobe plusieurs types de procds comme : les fermentations pour la production de substances chimiques haute valeur ajoute (e.g. pharmaceutiques), la production en grande quantit daliments et de boissons (e.g. yaourt, fromage, bire) ainsi que les traitements biologiques des rsidus, quils soient solides (compostage), liquides (e.g. boues actives) ou gazeux (biofiltres). Lutilisation industrielle des procds biotechnologiques a considrablement augmente ces dernires dcennies pour diverses raisons (normes lgislatives plus svres dans les industries de traitement, amlioration de lefficacit et de la qualit des procds, etc.). Les problmes poss par cette industrialisation sont globalement les mmes que ceux rencontrs dans no importe quelle industrie des procds et on rencontre, dans le domaine des bioprocds, la quasi-totalit des problmatiques abordes en Automatique. Ainsi, les besoins en systmes de commande, de supervision et de surveillance des procds sont ncessaires afin d'en optimiser le fonctionnement, dtablir une meilleure conduite ou encore de dtecter des dysfonctionnements. Nanmoins, dans la pratique industrielle, trs peu d'installations sont munies de tels systmes. Deux raisons principales expliquent cet tat de fait : la complexit de ces procds et l'absence de capteurs dans la plupart des cas, la fois peu coteux et fiables pour des applications en ligne. Les procds biologiques sont des procds complexes, due la nature trs varie des phnomnes multiples qui se droulent en faisant intervenir des organismes vivants. Du point de vue de lAutomatique, ces procds sont caractriss de manire gnrale comme des systmes multivariables, non-linaires et non-stationnaires [ROU01]. De fait, la modlisation de ces systmes se heurte deux difficults principales : d'une part, un manque de reproductibilit des exprimentations et une imprcision des mesures qui entranent la fois des difficults relatives au choix de la structure des modles, mais galement des difficults lies aux procdures d'identification; d'autre part, on rencontre galement des difficults lors de la phase de validation de ces modles dont les jeux de paramtres peuvent prcisment avoir volu au cours du temps [DOC01]. Ces variations peuvent tre la consquence de changements mtaboliques de la biomasse ou encore de modifications gntiques non prvisibles et inobservables d'un point de vue macroscopique. tant donn que les organismes vivants sont le cur de ces procds, il en rsulte que la modlisation mathmatique de ces procds est une tche difficile. En effet les modles sont centraux au dveloppement de systmes de commande, donc la commande en ligne devient elle aussi complexe. Une seconde difficult majeure est l'absence quasi systmatique de capteurs permettant d'accder aux mesures ncessaires pour connatre le fonctionnement interne des procds biologiques [VAN98]. C'est bien l que se trouve la principale limitation retardant l'automatisation complte des processus biotechnologiques, et de manire plus cruciale encore, des procds de traitement des eaux uses. La plupart des variables cls de ces systmes (concentrations en biomasses, en substrats et en produits) ne peuvent tre mesures

28

Introduction aux procds biologiques de traitement des eaux

qu' l'aide d'analyses de laboratoire, dont la dure, les cots et surtout le mode opratoire limitent la frquence et l'automatisation des mesures. C'est ainsi que la plupart des stratgies de commande existantes se limitent bien souvent de la commande de type indirecte des procds de fermentation par des boucles de rgulation des variables environnementales telles que la concentration en oxygne dissous, la temprature, les dbits de liquide et de gaz le pH, etc. [DOC01]. Cependant, le problme des capteurs reoit une attention de plus en plus importante au cours des ces annes. Malgr cela, mme si un effort important a t fait au niveau des centres de recherche pour dvelopper et fiabiliser des capteurs, le transfert de ces derniers vers l'industrie et les collectivits territoriales reste naissant et doit encore se dvelopper dans les annes venir. Concernant les capteurs, quelles que soient les solutions retenues, on voit toujours apparatre deux types de systmes : les capteurs in situ, directement implants dans les racteurs biologiques et les capteurs en ligne, implants sur une boucle spciale de prise d'chantillons. En gnral, il apparat diverses solutions qui tentent de rsoudre le problme de l'instrumentation :
tel-00136382, version 1 - 13 Mar 2007

- Intgration de capteurs existant dans une boucle de mesure, l'ide conductrice est dans ce cas d'automatiser des capteurs hors ligne, de manire obtenir, sans intervention humaine, les mesures sur site des variables intervenant directement dans les modles bilans-matires. Ceci se fait partir d'un chantillonneur implant directement dans le bioracteur, ou plus gnralement dans une boucle de mesure. - Couplage de mesures indirectes et de modles mathmatiques pour reconstruire au travers d'observateurs les variables du procd (souvent appels capteurs logiciels ou virtuels). Dans la plupart des cas, c'est un observateur de type filtre de Kalman tendu qui permet de reconstruire les variables contrler. - Dveloppement de capteurs spcifiques, appels biocapteurs, qui sont des dispositifs qui permettent, par lintermdiaire dune couche de reconnaissance ionique ou molculaire, de transformer l'information "biologique" en un signal lectrique analogique. Leur utilisation reste cependant limite, due au degr de spcialisation des mesures et aux limitations de transfert au niveau industriel.

1.3.2.

Modlisation et identification des bioprocds

La notion de modle dynamique joue un rle central en Automatique. C'est en effet sur la base de la connaissance de l'volution au cours du temps du procd que s'effectue toute la conception, l'analyse et la mise en uvre des mthodes de commande et de surveillance. Dans le cadre des bioprocds, la manire la plus courante de dterminer les modles qui permettent de caractriser la dynamique du procd est de considrer des quations diffrentielles de bilans de matire (et ventuellement d'nergie) des composants principaux du procd [DOC01]. Ce type dapproche est bas sur des lois physiques et/ou principes fondamentaux (approche mcanistique ou phnomnologique) qui mettent en vidence le fonctionnement interne du systme, au moins du point de vue macroscopique. Cest une approche de modlisation o les paramtres du modle sont lis la description physique des conversions biochimiques. Ces modles sont trs appropris pour des objectifs de conception, de dimensionnement et doptimisation de bioprocds [TEB98]. Un des aspects importants des modles de bilan matire est qu'ils sont constitus de deux types de termes reprsentant respectivement la conversion et le transport. La conversion englobe la cintique laquelle se droulent les diverses ractions biochimiques du procd et

Introduction aux procds biologiques de traitement des eaux

29

les rendements de conversion des divers substrats en biomasse et produits. La dynamique de transport regroupe le transit de la matire au sein du procd sous forme solide, liquide ou gazeuse, et les phnomnes de transfert entre phases. Concernant la modlisation dynamique de procds biologiques nous abordons, dans le chapitre 2, une approche dite bote blanche . Dautres approches de modlisation existent, certaines dentre elles plus orients vers la modlisation de la connaissance, problmatique qui peut complter la tradition des sciences dites objectives, lesquelles se proccupent essentiellement de la modlisation de l'univers physique. Ces techniques ont montre leur applicabilit comme des mthodes alternatives pour la modlisation de systmes dynamiques non-linaires [NAR90] [BAB98a]. Ce sont des structures mathmatiques flexibles, qui exhibent comme caractristiques, la capacit dapproximation des comportements non-linaires et lapprentissage partir des donnes. Les problmes de reprsentation et d'utilisation des connaissances sont au centre d'une discipline scientifique relativement nouvelle et en tout cas controverse : l'intelligence artificielle. Cette discipline a eu un impact limit, jusqu'a une date rcente, sur les applications industrielles, parce qu'elle a mis l'accent, de faon pratiquement exclusive, sur le traitement symbolique de la connaissance, par opposition la modlisation numrique utilise traditionnellement dans les sciences de l'ingnieur. Plus rcemment, on a assist un retour du numrique dans ces problmes d'intelligence artificielle, avec les rseaux de neurones artificiels16 et la logique floue17. Alors que les rseaux de neurones proposent une approche implicite de type bote noire de la reprsentation des connaissances, faisant abstraction de la reprsentation interne du systme trs analogue la dmarche d'identification classique des systmes en Automatique, la logique floue est plus proche de l'intelligence artificielle symbolique, qui met en avant la notion de raisonnement, et ou les connaissances sont codes explicitement. Nanmoins, la logique floue permet de faire le lien entre la modlisation numrique et la modlisation symbolique. Le comportement du systme se matrialise par une reprsentation base de rgles du type Si-Alors qui apportent une description linguistique la fois transparente et interprtable pour lutilisateur du modle. Cette reprsentation peut tre construite en intgrant la connaissance sur le comportement du systme, donne par des experts, mais aussi partir des donnes entre-sortie du systme, ce qui correspond une construction plus systmatique du modle. Nous dvelopperons cette approche plus en dtail dans le chapitre 3, en nous focalisant sur la modlisation et lidentification floue de type Takagi-Sugeno [TAK85]. La thorie des ensembles flous a galement donn naissance un traitement original de l'incertitude, fonde sur l'ide de dfinir des ensembles pouvant contenir des lments de faon partielle (et pourtant avec un relatif degr dappartenance ), permettant de formaliser le traitement de l'ignorance partielle. Les ensembles flous ont galement eu un impact sur les techniques de classification automatique et la commande non-linaire et ont donc contribu un certains renouvellement des approches existantes de l'aide la dcision. Du point de vue de lidentification des systmes et plus particulirement en ce qui concerne la modlisation des systmes non-linaires, ces outils ont permis le dveloppement dune approche dite bote grise qui permet dun ct dintroduire dans la modlisation la connaissance a priori sur le systme identifier (connaissance de lexpert sous la forme de rgles, choix dentres/sous-modles, descriptions de rgions de validit,) et dautre part, plus rcemment, dincorporer des donnes entre-sortie pour la construction du modle.
16 17

tel-00136382, version 1 - 13 Mar 2007

En anglais : ANN, Artificial Neural Networks. En anglais : Fuzzy Logic.

30

Introduction aux procds biologiques de traitement des eaux

tel-00136382, version 1 - 13 Mar 2007

Dans le domaine des bioprocds ces mthodes de modlisation trouvent leurs origines en Intelligence Artificielle. On peut citer a titre dexemple le cas de la modlisation hybride (semi-mcanistique) qui combine une partie mcanistique (bilan de matire) et un modle neuronal [PSI92] ou flou [BAB96a] [VANL02] qui a pour but le modliser la cintique mal connue partir des donnes exprimentales. Dans ce dernier article, lauteur propose un modle flou qui prdit le taux de conversion dobtention de la Pnicilline-G. Le modle dcrit qualitativement la dpendance de la cintique de lenzyme par rapport aux concentrations de composants qui interviennent dans la conversion. Le modle flou qui modlise la cintique, a t incorpor dans une modle bote blanche base de bilan matire. Dautre part on peut citer aussi lapplication des techniques neurofloues qui visent intgrer les capacits dapprentissage partir des donnes que distinguent les rseaux de neurones avec la capacit de description linguistique du comportement qui caractrisent les modles flous. Comme exemple, [TAY00] propose une reprsentation neurofloue pour des systmes anarobies de traitement des eaux uses bas sur le modle ANFIS18 [JAN93]. Le modle conceptuel propos est utilis pour la prdiction de la rponse du systme (production volumtrique de Mthane, DCO et concentration dAGV19) aux variations des charges organique, hydraulique et dalcalinit ; [BEL99] prsente le dveloppement dun modle pour la prdiction de la DCO de leffluent dans une station dpuration. Pour cela il utilise des rseaux htrognes neurofloues bases sur des variables oprationnelles de linstallation industrielle tels que le dbit, la DCO et le TSS20 de laffluent. Dans le mme ordre dide, [TOM99] propose lobtention dun modle neuroflou de simulation de la DCO pour un procd de boues actives. En ce qui concerne lapplication directe de la logique floue la problmatique de la modlisation des bioprocds, plusieurs travaux se sont drouls depuis deux dcennies (cf. [HOR02] et rfrences inclues). Dans les premires applications de la thorie des ensembles flous aux procds biologiques, lapproche floue est vue comme une mthode pour lautomatisation des bioprocds o la modlisation linguistique de lexpertise des operateurs joue un rle important dans leur opration et commande. Ainsi, [FIL85] prsente la modlisation floue pour la simulation dune fermentation alcoolique base sur des rgles de production ; [DOH85] propose ltude dun modle flou dun fermenteur qui utilise des descriptions linguistiques du comportement ; [CZO89] considre la modlisation dun contrleur flou appliqu sur des procds biologiques ; [HOR95] applique des mthodes statistiques et des procdures didentification floue pour la caractrisation des phases de cultures microbiennes ; [EST95] prsente la modlisation floue dun bioprocd de digestion anarobie en utilisant une description semiqualitative du procd ; [POL02] ralise une tude comparative avec des rsultats exprimentaux concernant la modlisation floue dun digesteur anarobie. Lincorporation des coefficients flous sur le taux de croissance permet de prendre en considration linfluence de la temprature et du pH sur la dynamique du systme. Dautres approches plus rcentes concernant la modlisation floue des bioprocds partir de donnes se sont dveloppes au cours des dernires annes. Ces approches se sont focalises sur les comportements entre-sortie du systme, en particulier sous la forme de modle flou de type Takagi-Sugeno (TS). On peut citer titre dexemple quelques applications : [GEO01] prsente la modlisation floue TS, sous forme dentre-sortie et despace dtat, dun procd biotechnologique de fermentation en mode batch pour la production de gomme de xanthane21.
ANFIS : Adaptive-Network-based Fuzzy Inference Systems. AGV : Acides Gras Volatils. 20 TSS : Total Suspended Solids. 21 Fabriqu par la bactrie Xanthomonas Campestris, le xanthane est le plus connu des polysaccharides pouvant tre produits par voie microbienne. Cette substance est ajoute de nombreux aliments comme stabilisateur.
19 18

Introduction aux procds biologiques de traitement des eaux

31

Le modle permet la description des dynamiques non-linaires de la croissance de biomasse, de la consommation de substrat et de laccumulation de produit ; [RAG01] considre le problme de dfinition de la structure et de la dtermination des paramtres dun modle flou TS appliqu la prdiction dynamique de labsorption UV comme mesure indirecte de la DCO dans une station dpuration des eaux uses ; [GRI05] propose lutilisation des techniques de clustering flou, partir des donnes entre-sortie, pour lidentification dun modle dynamique TS de type NARX qui reprsente le comportement non-linaire des concentrations de biomasse et des substrats dans un bioprocd de traitement des eaux uses.

1.3.3.

La commande des bioprocds

tel-00136382, version 1 - 13 Mar 2007

La commande des procds a pour objectif lamlioration (voir loptimisation) de la performance, de la qualit et de lefficacit conomique des procds tout en garantissant leur sret gnrale et celle des operateurs, ainsi que le respect de la lgislation et de lenvironnement. Dans le contexte des bioprocds, caractriss par nature par des dynamiques non-linaires et complexes, cet objectif principal peut se traduire par le dveloppement et limplantation de ralisations matrielles et/ou informatiques, afin de maintenir le procd biologique dans des conditions opratoires stables et, si possible, optimales en dpit de perturbations internes/externes pouvant affecter son bon fonctionnement [DOC01]. Les perturbations qui agissent sur ces systmes sont dues la non stationnarit des phnomnes biologiques (variations internes) ou laction sur le systme dentres inconnues (non mesures) telles que les concentrations des diffrents substrats, le pH, la prsence de toxiques, la temprature, les biais sur les capteurs et/ou actionneurs, etc. [STE98]. Bien que l'utilisation de stratgies de commande s'avre ncessaire pour optimiser le fonctionnement des procds biologiques, le contrle, dans le sens conventionnel employ en Sciences pour l'Ingnieur, ne s'applique encore aujourdhui que difficilement. Comme nous l'avons dj soulign, deux types de difficults expliquent largement ce manque d'application gnralise de systmes de commande sophistiqus aux bioprocds : la premire lie la modlisation de la dynamique des bioprocds et la seconde lie l'instrumentation et la difficult de mesurer en ligne de manire fiable toutes les variables-cls du procd. L'utilisation d'un calculateur pour contrler et commander un procd biologique est reprsente schmatiquement sur la Figure 1.3. L'lment central de ce schma est le procd (reprsent ici par un racteur). Sur ce procd, on effectue une srie de mesures, soit dans le milieu liquide (typiquement, des mesures de pH, de temprature, ou de concentrations), soit dans le milieu gazeux (sous forme de mesures de dbits gazeux). Ces mesures sont envoyes un ordinateur qui peut en particulier les traiter dans un objectif de commande (qui pourrait tre aussi de surveillance) du procd. Le rgulateur (ici intgr dans l'ordinateur) permet de calculer une action de commande appliquer au bioprocd sur la base des mesures (physiques et logicielles), de la connaissance de la dynamique du procd et des objectifs de commande choisis. Dans la situation dcrite, cette action de commande est reprsente schmatiquement par l'ouverture d'une vanne permettant de moduler le dbit de substrat d'alimentation dans le racteur. Sa valeur est la sortie d'un algorithme de commande qui utilise les informations disponibles sur le procd. Ces informations regroupent d'une part, l'tat du procd jusqu' l'instant considr (i.e. les mesures) et, d'autre part, des connaissances disponibles a priori (par exemple sous la forme d'un modle du type bilan-matire ) et relatives la dynamique du procd biologique et aux interactions mutuelles des diffrentes variables du procd. Nous retrouvons dans le schma la notion de boucle ferme. Cette boucle est constitue de l'ensemble procd-capteurs-ordinateur-actionneurs.

32

Introduction aux procds biologiques de traitement des eaux

tel-00136382, version 1 - 13 Mar 2007

Figure 1.3. Reprsentation du systme de commande dun bioprocd (daprs [DOC01]).

Bien que les principes de base de la commande des bioprocds restent les mmes, ils existent des diffrences en fonction du secteur dapplication. Ainsi, dans le cas des procds de dpollution, il est important de noter que rguler la concentration de substrat revient contrler le degr de pollution rejete dans lenvironnement alors que dans dautres procds biologiques (i.e., finalit agro-alimentaire, pharmaceutique,), rguler le substrat permet gnralement doptimiser la production de biomasse et/ou de produit en limitant les inhibitions [STE98]. En ce qui concerne les procds biologiques de dpollution des eaux rsiduaires, selon les connaissances disponibles sur le procd et les objectifs de commande spcifis par l'utilisateur, nous allons pouvoir dvelopper et mettre en uvre des algorithmes de commande plus ou moins complexes. On peut alors distinguer deux types de stratgie de commande : une approche directe , qui consiste minimiser la pollution en sortie du procd en rgulant la concentration de leffluent et une approche indirecte , qui consiste en le maintien de conditions opratoires permettant dassurer un fonctionnement nominal du racteur sans rguler la concentration du polluant en sortie. Dans ce cas, la connaissance des spcialistes en biotechnologie et des experts des procds nous assure simplement que, certaines variables tant rgules des niveaux donns, le fonctionnement du procd sera satisfaisant.
Remarque
R 1.3

Lapproche indirecte concerne par exemple la rgulation de la concentration en oxygne dissous lintrieur dun racteur arobie dans lequel cette concentration doit tre maintenue suffisamment haute pour garantir une activit bactrienne satisfaisante. Il est vident que le maintien de ce taux minimum sans autre considration sur les variables comme le pH, lagitation ou encore la temprature ne garantit en rien une dpollution effective [STE98].

Introduction aux procds biologiques de traitement des eaux

33

En gnral, la mthode de synthse des lois de commande des bioprocds dpend de nombreux facteurs. Tout dabord, ce choix dpend des objectifs mmes de commande et de la stratgie utilise (directe ou indirecte). Plus les spcifications de commande vont tre prcises, plus l'approche analytique va tre justifie. Bien videmment, on peut ensuite envisager diverses combinaisons prcision des spcifications/complexit de la stratgie de commande . On peut ainsi imaginer des spcifications de commande trs strictes mais trs faciles vrifier, dans la mesure o la variable commander est directement mesure par un moyen trs complexe. A l'inverse, un problme de rgulation d'une variable environnementale facilement mesurable peut tre rsolu par un rgulateur trs simple bas sur un modle linaire trs succinct. Le choix du type de loi de commande va ensuite dpendre de la connaissance disponible a priori sur le procd. De ce point de vue, il convient de rappeler ici quelques rgles lmentaires pouvant orienter l'utilisateur dans son choix [DOC01] : tel-00136382, version 1 - 13 Mar 2007

lorsqu'un modle analytique suffisamment prcis - quelle qu'en soit sa nature - est disponible, alors il faut l'utiliser ; si un modle analytique n'est pas disponible mais que l'expertise disponible sur le fonctionnement du procd est importante, alors les approches heuristiques (logique floue, systmes base de connaissance, etc.) peuvent tre utilises ; lorsqu'un modle analytique s'avre trop long obtenir, que peu d'expertise est disponible, mais qu'en revanche une grande quantit de donnes est disponible, alors il peut tre intressant d'utiliser une approche statistique ou neuronale/floue permettant en particulier d'obtenir des modles de comportement non linaires (cf. par exemple [MON94], [GRI05]).

On constate dans les faits que les boucles de commande implantes sur les procds au stade industriel sont typiquement des rgulateurs de type PID22 compltement dcouples [QUE00] et pourtant mono-variables. Les algorithmes de commande classique ont t appliques aux bioprocds pour a rgulation autour dun point de fonctionnement ou pour le suivi dune trajectoire prtablie dans des conditions opratoires bien spcifiques [VAN98a]. Cependant, lefficacit de ces algorithmes est souvent limite en pratique, compte tenu de la diversit des phnomnes mis en jeu dans les bioprocds, ce qui ncessite de contrler la fois plusieurs variables et de tenir compte des variations des conditions opratoires et du comportement des micro-organismes. Cela a conduit la recherche de solutions de contrle plus avances et plus performantes. A la lecture de la bibliographie sur les techniques de contrle des bioprocds, on peut retrouver plusieurs approches de commande selon les caractristiques les plus importantes du systme commander, la connaissance du procd et les objectifs de commande dfinis par lutilisateur. Sans vouloir tre exhaustifs, nous essayons de faire un tour dhorizon concernant les techniques le plus souvent rencontrs dans la littrature : la commande adaptative, consistent rajuster certains paramtres intervenant dans le calcul de la commande en fonction de la dynamique du processus pour maintenir les performances du systme lorsque les paramtres du modle varient. Elle est de loin la technique la plus largement dveloppe au niveau de la commande pour les bioprocds [BAS90] [DOC91] [ROU92] [ROU94] [BAS95] [BEN96] [DAH06] ; la commande robuste, oriente vers la conception de correcteurs paramtres fixes capables dassurer ces proprits en prsence de perturbations et dincertitudes paramtriques du modle valable dans un domaine de fonctionnement [QUE97] [JUL97] [PAI97] [GOM02] [RAP02] ; la commande
22

PID : Contrleur Proportionnel - Intgral - Driv.

34

Introduction aux procds biologiques de traitement des eaux

optimale, intresse trouver partir dun modle et parmi les commandes admissibles, celle qui permet la fois : de vrifier des conditions initiales et finales donnes, de satisfaire diverses contraintes imposes et doptimiser un critre mathmatique choisi [OHN76] [DUV88] [TSO95] [ASE96] [DON01] ; la commande prdictive, qui se base sur lutilisation dun modle dynamique du systme pour anticiper son comportement futur [MOR92] [BEN96] [ZHU00] [RAM05] ; la commande neuronale, qui savre intressante pour la commande des systmes en sappuyant sur des modles non-linaires dentre-sortie obtenus partir des donnes [MUR95] [EMM96] [PAT97] [YU98] [WEN98] [OBE99] ; la commande floue, technique approprie tant pour formaliser la connaissance heuristique exprime par des rgles, que pour intgrer cette connaissance sur le comportement des procds avec linformation obtenue partir des donnes numriques. Nous allons faire une tude bibliographique plus approfondie de cette mthode de commande en nous focalisant sur le domaine dapplication qui nous intresse, dans les paragraphes qui suivent.
Remarque
R 1.4

tel-00136382, version 1 - 13 Mar 2007

Les techniques de commande que lon vient de dcrire peuvent tre complmentaires en visant lexploitation des caractristiques les plus avantageux de chacune. On peut citer titre illustratif la commande optimale adaptative [VAN98a] ou bien la commande prdictive non-linaire base sur des modles neuronal ou flou du procd [TEB98] [VEN99]. Avec une comprhension croissante du comportement biochimique ainsi que les progrs au niveau des technologies de mesure, on peut prvoir lamlioration et lapparition de nouvelles approches de commande des bioprocds dans la dcennie venir.

En ce qui concerne lapplication de la logique floue la commande des procds biologiques [HON00] [HOR02], il faut souligner que dans un premier temps, la commande floue consiste reprsenter sous la forme de rgles linguistiques la connaissance et le savoir faire des oprateurs experts pour assurer le bon fonctionnement du procd. Le contrleur flou dtermine directement la sortie de commande partir de la base de connaissance experte et des donnes en ligne. On peut ainsi citer plusieurs exemples : [NAK85] prsente la commande floue du taux dalimentation de sucre dans un procd de fermentation; des approches similaires ont t appliques pour la commande des concentrations de glucose et dthanol en cultures semi-continues [PAR93] [SHI94] et pour le pilotage de fermentations de levures [SII95]. Dans le cas particulier des procds biologiques de dpollution, les premiers systmes utilisant lexpertise humaine ont t dvelopps sur la base de lapproche floue vers la fin des annes 1970 [DOC01]. En utilisant le profil doxygne dissous, un systme dinfrence floue a par exemple permis destimer la consommation du substrat dans un procd boues actives et de donner des conseils aux oprateurs humains sur le changement des consignes des rgulateurs classiques de linstallation [FLA80]. La mme anne, vingt rgles floues ont t proposes pour la rgulation des dbits dun procd de boues actives [TON80]. Plus rcemment, un systme de commande flou des solides en suspension pour le mme type de procd a t dvelopp [TSA96]. Dans le mme ordre dides, lapproche floue a t utilise avec succs pour le contrle des perturbations dans un processus de traitement des eaux rsiduaires [MUL97], ainsi que pour le contrle de labattement de la demande chimique en oxygne dans une station dpuration urbaine [FU98]. A la mme priode, [EST97] propose lanalyse et la commande par logique floue dun procd de digestion anarobie en lit fluidis pour la dpollution des vinasses de vin. Dernirement, la commande floue pour maintenir la concentration de MES constante dans une procd de dpollution des eaux uses a t propos [TRA03]. Limplantation industrielle de la

Introduction aux procds biologiques de traitement des eaux

35

tel-00136382, version 1 - 13 Mar 2007

commande dite intelligente23 dans les automates programmables a t aussi dcrite depuis peu [MAN98]. On peut retrouver aussi lapplication de la logique floue pour le rglage des contrleurs traditionnels (e.g. de type PID) qui oprent au niveau du procd biologique lui mme [ROD99] ou bien comme un contrle supervis [KIT94] [VON94] ou encore comme un outil pour lidentification de ltat physiologique du procd (diffrentes phases des cultures microbiennes) avant dappliquer la stratgie de commande elle mme [KON89] [KIS91] [KON92]. On assiste un dplacement progressif de la conception des contrleurs flous vers ltablissement des procdures de synthses plus mthodiques qui se rapprochent beaucoup plus des techniques traditionnelles de lAutomatique, en sappuient sur des modles. A titre illustratif, [GEO96] prsente une approche pour la synthse de la commande des procds biologiques en mode batch, base sur un modle qui combine une description dterministe avec un modle flou, dans lequel le modle flou sert reprsenter le comportement entre-sortie du procd. Egalement, [POL01] propose la synthse dobservateurs pour plusieurs concentrations et lalcalinit dans un racteur de digestion anarobie en utilisant un modle flou de type Takagi-Sugeno. En effet, bien que le formalisme flou soit capable dintgrer linformation heuristique, il nous semble percevoir en pratique une orientation vers des techniques qui sappuient sur des modles mathmatiques nonlinaires, focaliss sur le comportement entre-sortie des procds. Cest justement cette capacit intgrer la connaissance experte avec la puissance de la commande base sur des modles, qui nous a motiv pour explorer cette dernire approche dans notre travail. En particulier, nous dvelopperons une proposition pour la commande floue sous-optimale base sur des modles flous de type Takagi-Sugeno dans le chapitre 4. Jusqu prsent, nous avons peu abord la question de la supervision des bioprocds, terrain sur lequel les techniques issues de lIntelligence Artificielle (plus spcifiquement la logique floue et le raisonnement qualitatif) jouent un rle majeur ces dernires dcennies, comme des outils daide la dcision. La supervision24, reprsente la surveillance25 (dtermination de ltat) dun systme physique et la prise de dcisions appropries en vue de maintenir son opration face des dfaillances26. Les donnes provenant du systme sont utilises par la surveillance pour reprsenter ltat de fonctionnement puis dtecter les volutions de comportements anormaux. Le diagnostic identifie la cause, la localisation et loccurrence de ces volutions, ensuite laide la dcision intervient pour proposer des actions correctives. Cette approche dintgration des outils de surveillance, de diagnostic et daide la dcision au niveau de la supervision [TRA97] est pertinente dans les procds biologiques en complment de systmes primaires de mesure et de commande, compte tenu de la difficult de conduite. Pour le cas spcifique des bioprocds de traitement des eaux uses, le niveau de supervision est important dans la mesure o ces procds sont en gnral aussi plus complexes que les procds classiques (i.e., ceux utiliss dans les industries agro-alimentaires ou dans la pharmacie) puisquil sagit gnralement dcosystmes et non pas de cultures pures. Dautre part, ils sont soumis aussi un nombre beaucoup plus significatif de perturbations la fois externes et internes.

Nous prfrons plus modestement de parler ici de systmes de commande issus de techniques de lIntelligence Artificielle. 24 Daprs la dfinition qui a t discut au sein du SAFEPROCESS Technical Committee de lInternational Federation of Automatic Control. 25 La surveillance est une tche continue et en temps rel, de dtermination de ltat dun systme. Elle consiste en lenregistrement de linformation ainsi quen la reconnaissance et lindication de comportements anormaux. 26 Une dfaillance ou panne est une interruption permanente de la capacit du systme remplir une fonction requise dans des conditions dopration spcifies.

23

36

Introduction aux procds biologiques de traitement des eaux

Cette approche intgre de la supervision est un domaine de recherche actif, mais en mme temps trs vaste, nous allons simplement citer ici quelques axes de travaux et certains dveloppements qui pourraient tre appliques aux procds biologiques : la dtection des dfaillances, le diagnostic, la reconfiguration du processus et la maintenance [ISE97] [COL00]. Nous suggrons au lecteur intress se reporter louvrage [DOC01] (en particulier au chapitre 8 [STE01] et les rfrences incluses, consacr aux outils daide au diagnostic et dtection de pannes), pour un traitement approfondi sur le sujet dans le cas des procds biologiques de dpollution.

1.4. Conclusions
Le traitement des eaux uses est un domaine vaste, qui englobe plusieurs disciplines, comme la microbiologie, le gnie des procds et lAutomatique. Ce premier chapitre nous a permis de prsenter les notions de base des procds biologiques de dpollution des eaux rsiduaires ainsi que le positionnement de lAutomatique dans ce contexte, avant daborder les problmes de modlisation et de commande floues reprsentant les principaux objectifs de ce travail de thse.
tel-00136382, version 1 - 13 Mar 2007

La pollution des ressources en eau dans les stations dpuration provient de diffrentes origines, notamment des activits humaines au niveau domestique, agricole et industrielle. Nous avons commenc par une description des diverses sources de pollution ainsi que les indicateurs de qualit de leau. Aprs avoir prsent un tour dhorizon sur la lgislation correspondante en France, en concordance avec une normativit mondiale chaque fois plus contraignante, nous avons fait une description globale dune filire de traitement en mentionnant les diffrentes tapes dune chane de dpollution des eaux rsiduaires. En effet, tant donne la grande diversit de dchets, les eaux brutes sont soumises une combinaison ou une succession de diffrents processus de purification, de nature varie : physique, chimique, biologique, Nous avons dtaill, plus particulirement, le traitement biologique, sur lequel porte spcifiquement notre tude, compte tenu de lefficacit montr pour ce type de traitement pour restaurer la qualit de leau en dgradant principalement les matires organiques. Nous avons dcrit les principaux polluants, les micro-organismes purateurs, leurs besoins nutritifs et les processus mtaboliques les plus importants pour le dveloppement des populations bactriennes. Nous avons aussi dcrit diffrents modes et procds spcifiques de traitement biologique. Par la suite, le lagunage faisant intervenir des bactries arobies sera la base dune premire tude de modlisation en utilisant lapproche de bilans de matires dans le chapitre suivant. Une deuxime tude comportant la modlisation et la commande, en utilisant lapproche floue, fera lobjet dapplication au chapitre 5. Le fait de faire intervenir des organismes vivants dans les procds biologiques de traitement des eaux uses rend ce type de procds trs intressante du point de vue scientifique et dingnierie, mais en mme temps trs complexe tant donne la nature trs diverse des interactions et des phnomnes multiples mis en jeu. De manire gnrale, ces procds sont caractriss par des systmes multivariables, non-linaires et non-stationnaires. Malgr la difficult lie la modlisation de la dynamique des bioprocds et le manque actuel dune instrumentation de mesure en ligne permettant de connatre le fonctionnement interne des ces procds, nous sommes vraiment convaincus que les besoins croissants en systmes de supervision et de commande demanderont une intervention encore plus pousse de lAutomatique dans les annes venir, afin de garantir un rejet faible et stable des effluents dans le milieu naturel avec une gestion efficace des installations. Nous considrons galement que lapproche floue, qui a dj montre son applicabilit pour lautomatisation des

Introduction aux procds biologiques de traitement des eaux

37

bioprocds o la modlisation linguistique de lexpertise des oprateurs qui a jou un rle important dans leur conduite, peut contribuer aussi au niveau de la modlisation et la commande, en permettant une intgration de la connaissance experte avec lincorporation des donnes du procd et lutilisation des modles pour le contrle. En effet, nous assistons un changement dorientation dune conception heuristique de ces systmes vers une autre plus systmatique que nous dvelopperons par la suite, dans le cadre de la modlisation - avec une dmarche didentification trs similaire celle classique des systmes en Automatique - partir des donnes entre-sortie du comportement du procd dans le chapitre 3 et pour la commande floue base sur de modles Takagi-Sugeno, dans le chapitre 4. Dans le chapitre 2, nous allons donc aborder la modlisation dynamique des bioprocds, afin dtablir un modle de connaissance initial qui va nous servir de rfrence pour comparer la performance des modles flous comme modles de description de comportement nonlinaire entre-sortie du systme.

tel-00136382, version 1 - 13 Mar 2007

38

Introduction aux procds biologiques de traitement des eaux

tel-00136382, version 1 - 13 Mar 2007

Modlisation dynamique de procds biologiques

39

___________________________________________________________________________

Chapitre 2

2. Modlisation dynamique de procds biologiques


___________________________________________________________________________

tel-00136382, version 1 - 13 Mar 2007

Dans ce chapitre, nous faisons une description des procds biologiques utiliss dans le domaine de traitement des eaux rsiduaires. Nous commenons dabord par un aperu global en dcrivant le rle des microorganismes, les types de racteurs et les modes de fonctionnement des bioprocds. Ensuite, au niveau de la modlisation, nous nous focalisons sur lapproche de modlisation macroscopique qui considre les bilans de matire des composants principaux pour caractriser la dynamique de tels procds. Ensuite nous prsentons quelques modles reprsentatifs : des fermentations continues, semi-continues et de procds boues actives. Finalement, nous dcrivons le procd considr au niveau de lapplication, qui est un bioracteur arobie multivariable en mode continu pour le traitement des eaux uses issues dune industrie papetire. Le modle considr est une version du simulateur utilis lors du projet europen FAMIMO27 pour lequel nous avons propose lajout dun terme de mortalit endogne au niveau de la dynamique bactrienne.

27

Waste-water Benchmark, in Fuzzy Algorithms for the Control of Multiple-Input, Multiple Output Processes (FAMIMO) project, funded by the European Comission (Esprit LTR 21911).

40

Modlisation dynamique de procds biologiques

Sommaire
___________________________________________________________________________

tel-00136382, version 1 - 13 Mar 2007

Modlisation dynamique de procds biologiques

41

Fidle la procdure traditionnelle en Automatique, une premire tape vers des actions hirarchiques suprieurs (e.g. commande, supervision, optimisation) est forcment ltablissement dun modle. Bien que dans le domaine scientifique on utilise souvent ce terme, il convient de donner une dfinition afin dtablir sa porte, plus spcifiquement dans le cas de procds biochimiques : Un modle est un systme physique, mathmatique ou logique reprsentant dune faon simplifi et relativement abstraite, les structures essentielles dune ralit, en vue de la dcrire, de lexpliquer ou de la prvoir. Il est possible daffirmer que la modlisation des procds biologiques sur lesquels se basent les traitements des eaux rsiduaires, est un exercice dlicat, compte tenu de la complexit des diffrents phnomnes mise en jeu. En effet, il nexiste pas de lois caractrisant lvolution des micro-organismes [BER01]. Dautre part, la qualit du modle, ainsi que sa structure devront avant tout correspondre l'objectif pour lequel le modle a t construit. En effet, un modle peut tre dvelopp dans des buts trs diffrents, qu'il faudra clairement identifier ds le dpart. Ainsi, le modle pourra-t-il tre utilis pour :
tel-00136382, version 1 - 13 Mar 2007

reproduire un comportement observ, expliquer un comportement observ, prdire l'volution d'un systme, aider comprendre les mcanismes du systme tudi, estimer des variables qui ne sont pas mesures, estimer des paramtres du procd, agir sur le systme pour le gouverner et contrler ses variables, dtecter une anomalie dans le fonctionnement du procd, etc.

La construction de modles biochimiques devient une tache complexe qui demande normalement des comptences spcialiss. Dans la plupart des cas, le comportement au niveau microscopique, les interactions entre lenvironnement et les mtabolismes cellulaires ne sont pas connus en dtail. Il est difficile de ternir compte de tous les facteurs qui peuvent influencer lvolution des micro-organismes pour laborer des modles pour ces procds [ROU01]. Dans le cadre de nos travaux, nous nous intressons dans ce chapitre dfinir les principes de base de la modlisation de procds biochimiques en utilisant une description au niveau macroscopique de lensemble des ractions biologiques et chimiques, en mettant en vidence le fonctionnement interne des bioprocds. Aprs avoir fait une description sur les bioracteurs et leurs modes de fonctionnement, nous considrerons les modles de bilans de matire ainsi que les cintiques des ractions. Finalement, nous dcrirons le procd considr au niveau de lapplication, qui est un bioracteur arobie en mode continu pour le traitement des eaux uses issues dune industrie papetire. Comme nous lavons indiqu prcdemment, ce modle de connaissance nous servira de rfrence pour comparer la performance du modle flou reprsentant le comportement non-linaire entre-sortie du systme. La modlisation floue du bioprocd sera une partie du chapitre 5. Nous invitons le lecteur se rfrer [PAV94] pour une rflexion plus approfondie sur la modlisation en biologie et en cologie et aux ouvrages [EDE97] et [ORO03] pour une description de lnergtique, du mtabolisme et de la dynamique des populations microbiennes. Une grande partie de ce chapitre est base sur les documents [STE98] [QUE00] [BER01] et [BEN96].

42

Modlisation dynamique de procds biologiques

2.1. Description des procds biologiques


Dans cette section nous donnons dabord un aperu global sur les procds biologiques, en dcrivant les lments de base, les types de racteurs et les modes de fonctionnement.

2.1.1.

Les micro-organismes et leur utilisation

La fermentation28 microbienne est un procd qui consiste faire crotre une population de micro-organismes (bactries, levures, moisissures...) aux dpens de certains lments nutritifs (nutriments) sous des conditions environnementales (temprature, pH, agitation, aration...) favorables. Elle correspond la transformation de substances (substrats carbons gnralement) en produits rsultant de l'activit mtabolique des cellules [BER01]. De faon schmatique, tout processus dans lequel interviennent des micro-organismes peut tre dcrit par la raction gnrale suivante :
S X +P

Les composs principaux de la raction sont ainsi :


tel-00136382, version 1 - 13 Mar 2007

- les substrats, nots S, qui sont les lments nutritifs ncessaires pour la croissance des micro-organismes, ou bien qui sont des prcurseurs d'un compos produire. Ces substrats contiennent le plus souvent une source de carbone (glucose, thanol,..) et parfois d'azote (NO3, NH4,), de phosphore (PO4,...), etc. ; - la population microbienne encore appele biomasse29, note X ; - les produits, nots P, finalit agro-alimentaire (huiles, fromages, bires, vins,...), chimique (solvants, enzymes, acides amins,...), pharmaceutique (antibiotiques, hormones, vitamines,...) ou pour la production d'nergie (thanol, biogaz,...), etc. A ces composs principaux s'ajoutent les sels minraux et les vitamines, qui, bien qu'apparaissant rarement dans les modles, n'en sont pas moins indispensables la croissance. En effet, la population microbienne, une fois ensemence dans un milieu de culture, ne peut sy dvelopper correctement que si elle y trouve des aliments et des conditions denvironnement favorables. De plus, la vitesse de croissance des micro-organismes est proportionnelle la vitesse du processus interne le plus lent. Il sagit donc danalyser et de rsoudre les diverses tapes limitantes pouvant survenir [STE98] : - au niveau physiologique : synthses des enzymes, transferts des substrats de lextrieur vers lintrieur des cellules, des produits de lintrieur vers lextrieur des cellules, inhibitions par excs de substrats, par accumulations intracellulaires de mtabolites, par les produits excrts dans le milieu de culture, - au niveau de lenvironnement des micro-organismes : pH, temprature, apports doxygne et de substrats compatibles avec les exigences de la croissance, prsence de gaz carbonique, Chaque type de micro-organisme possde des caractristiques lies son patrimoine gntique et ses systmes de rgulation interne. Ainsi, la fermentation peut avoir diffrentes utilisations :

28 29

Transformation de la matire organique sous laction des micro-organismes. Masse totale des organismes vivant prsente dans un espace ou un volume dtermins.

Modlisation dynamique de procds biologiques

43

- croissance microbienne : l'objectif premier est la croissance du micro-organisme. C'est le cas des fermentations visant produire la levure de boulanger. - production mtabolique : l'objectif est de favoriser la synthse d'un mtabolite par la cellule (thanol, pnicilline,...). - consommation de substrat : dans ce cas, c'est la dgradation du substrat qui est privilgie. On trouvera essentiellement dans cette catgorie les procds de dpollution (traitement biologique des eaux uses, dgradation de polluants spcifiques,...). - tude phnomnologique : ici, la fermentation a pour but l'tude du micro-organisme. Cela peut tre par exemple, pour mieux comprendre comment le micro-organisme se dveloppe dans le milieu naturel. La majorit des procds biotechnologiques dvelopps l'chelle industrielle utilisent des cultures microbiennes composes d'une seule espce de micro-organisme pour la synthse ventuelle d'un produit bien dtermin (culture pure). Dans certains cas cependant, plusieurs espces peuvent tre amenes crotre en parallle (culture mixte), mais cela ne peut tre possible que si elles ne sont pas trop comptitives. Les procds biologiques de traitement des eaux uses se caractrisent par la prsence de cultures mixtes.

tel-00136382, version 1 - 13 Mar 2007

2.1.2.

Les types de bioracteurs

Du point de vue de la modlisation mathmatique, les racteurs biologiques peuvent se dcomposer en deux grandes classes [BAI86] : - les racteurs infiniment mlangs (en anglais stirred tank reactors, nots STR), pour lesquels le milieu ractionnel est homogne et la raction est dcrite par des quations diffrentielles ordinaires ; - les racteurs gradient spatial de concentration, tels que lits fixes, lits fluidiss, air lifts, etc., pour lesquels la raction est dcrite par des quations aux drives partielles. Nous nous intressons, dans ce chapitre, uniquement la premire classe, les racteurs infiniment mlangs et le lecteur intress par la seconde classe pourra se rfrer [DOC94].

2.1.3.

Les trois modes de fonctionnement

Dans la pratique, les modes opratoires se caractrisent par les changes liquides, c'est-dire par la faon dont les racteurs biologiques sont aliments en substrat [BER01]. Nous distinguons trois modes principaux (Cf. Figure 2.1).

Figure 2.1. Les diffrents modes de fonctionnement des racteurs biologiques

44

Modlisation dynamique de procds biologiques

Le mode discontinu (ou batch)

Dans ce mode de fonctionnement la totalit des lments nutritifs ncessaires la croissance biologique est introduite lors du dmarrage de la raction. Aucun apport ni prlvement (except bien sr pour quelques mesures hors lignes ventuellement) n'est par la suite ralis et la raction se droule volume constant. Les seules actions possibles de l'oprateur ne concernent que les variables d'environnement (pH, temprature, vitesse d'agitation, aration,...). Peu de moyens sont ainsi ncessaires sa mise en uvre, ce qui en fait son attrait du point de vue industriel (e.g. secteurs chimique et pharmaceutique). Le second avantage est de garantir l'axnicit des cultures, car les risques de contamination de la culture sont minimes. Le revers de la mdaille est le peu de moyens qui permettent d'agir sur le fermenteur pour optimiser l'utilisation des micro-organismes. Il souffre cependant de deux inconvnients majeurs: - sa dure requise, car chaque nouveau remplissage du racteur, avant que la raction ne dmarre, on observe une priode de latence lie au temps dadaptation des microorganismes, ce qui entrane la gnration de temps morts lors de lopration ;
tel-00136382, version 1 - 13 Mar 2007

- son inadquation lorsque la raction gnrale est sensible une inhibition par le substrat (les quantits introduites sont en effet importantes car devant couvrir lensemble des besoins des micro-organismes sur la totalit du fonctionnement) ou par un produit (toute production est en effet conserve dans le racteur jusqu lachvement attendu de la raction), ce qui se traduit par des dures de traitement allonges et des limitations de la charge initiale admissible. Pour le cas des procds biologiques de dpollution des eaux uses, ce mode de fonctionnement exigerai la prsence en amont dun dispositif de stockage des affluents. Par ailleurs, de par les contraintes imposes par le traitement des effluents (celui-ci doit tre continu), ce mode de fonctionnement nest que trs rarement utilis en dpollution.
Le mode semi-continu (ou fedbatch)

Tout en ncessitant un dispositif de stockage des affluents, ce mode de fonctionnement se distingue du prcdent par un apport des diffrents lments nutritifs au fur et mesure des besoins constats des micro-organismes. La variation du volume du milieu ractionnel est donc une fonction directe de ltat davancement de la raction. Ce mode permet essentiellement de lever les problmes d'inhibition associs au mode prcdent, et de fonctionner des taux spcifiques de croissance proches de leur valeur maximale. A partir d'un volume initial pralablement ensemenc, le racteur est aliment par un dbit augmentant typiquement de faon exponentielle, ncessitant un contrle en boucle ferme. C'est d'ailleurs ce dernier point qui a fortement limit l'utilisation du fedbatch en milieu industriel. Ce mode de fonctionnement est essentiellement utilis pour des productions issues de procds dj anciens : production de levure, de vinaigre, de bire, Il est par ailleurs, tout comme le prcdent, galement prconis lorsque la rcupration des produits est ralise en discontinu (accumulation intracellulaire par exemple) ou que l'on ne peut se permettre de relarguer des matires toxiques rsiduelles (cas du fonctionnement en continu).
Le mode continu

Caractris par un volume ractionnel constant, il est soumis un soutirage de milieu ractionnel gal au flux d'alimentation en matire nutritive. Les procds continus

Modlisation dynamique de procds biologiques

45

fonctionnent en rgime permanent, en maintenant, pour des conditions d'alimentation fixes, le systme dans un tat stationnaire, tout en vitant tout phnomne inhibiteur grce l'effet de dilution d l'alimentation. En agro-alimentaire, pharmacie ou autres industries productrices, ils autorisent de plus des productions importantes dans des racteurs de taille rduite. Dans le domaine de la dpollution biologique des eaux rsiduaires, il sagit l du mode de fonctionnement prfrentiel. Avant de prsenter le principe de la modlisation par bilans-matires, il convient de dire quen pratique il est possible de trouver des racteurs avec une opration qui est en fait une combinaison au cours du temps des diffrents modes de fonctionnement prcdents30. L'ide est de rcuprer la biomasse par sdimentation ou le produit du surnageant entre deux squences de production (ou de traitement).

2.2. Les modles de bilans-matire


Contrairement la physique o il existe des lois connues depuis des sicles (loi d'Ohm, loi des gaz parfaits, relation fondamentale de la dynamique, principes de la thermodynamique,...), la plupart des modles en biologie reposent sur des lois empiriques. La construction de modles biochimiques devient une tache dlicate, car il nexiste pas de lois caractrisant lvolution des micro-organismes. Dans le cadre des bioprocds, la manire la plus courante de dterminer les modles qui permettent de caractriser la dynamique du procd est de considrer des quations diffrentielles de bilans de matire des composants principaux du procd [DOC01]. Ce type dapproche est bas sur des lois physiques et/ou principes fondamentaux (approche mcanistique ou phnomnologique) qui mettent en vidence le fonctionnement interne du systme, au moins du point de vue macroscopique. Nous allons explorer cette approche par la suite.

tel-00136382, version 1 - 13 Mar 2007

2.2.1.

Les approches microscopique et macroscopique de modlisation

Comme nous lavons soulign, les phnomnes mis en jeu dans les procds biologiques possdent une dimension particulire par rapport aux exemples habituels dapplications : ils relvent du vivant. Il est ainsi logique de mettre le micro-organisme au centre de toute analyse. Cest la dmarche du biologiste ou du biochimiste qui cherche expliquer les modifications du milieu ractionnel partir des lois de croissance et de fonctionnement de la population microbienne. Deux approches essentielles permettent dapprhender les phnomnes intervenants lors dune raction biologique [STE98] :
approche microscopique pour laquelle chaque cellule est considre comme un racteur lmentaire. Cette mthodologie se heurte cependant au manque de capteurs. Il nest en effet que peu envisageable de pouvoir un jour mesurer en ligne les concentrations des composants intracellulaires ou encore la composition dune paroi cellulaire, approche macroscopique au cours de laquelle le bilan global de la raction est modlis. Cette approche possde le mrite daffronter des phnomnes plus facilement accessibles mme si, lheure actuelle, toute linformation nest pas physiquement disponible. Nanmoins, il est dans ce cas possible dappliquer certaines techniques de filtrage pour reconstituer ltat global de la fermentation partir des mesures indirectes (Cf. par exemple lapplication du filtre de Kalman et ses drivs).

30

Cest le cas des racteurs batch squentiels (Sequencing Batch Reactors, SBR).

46

Modlisation dynamique de procds biologiques

Les modles de bilans de matire appartiennent la deuxime approche. Ces types de modles permettent de dcrire le comportement dynamique des diffrents composants de la raction biologique en exprimant par des quations diffrentielles la variation de la quantit dun compos comme gale la somme de ce qui est produit ou apport, diminu de ce qui est consomm ou soutir. Un des aspects importants des modles de bilan matires est qu'ils sont constitus de deux types de termes reprsentant respectivement la conversion est le transport. La conversion englobe la cintique laquelle se droulent les diverses ractions biochimiques du procd et les rendements de conversion des divers substrats en biomasse et produits. Pour sa part, la dynamique de transport regroupe le transit de la matire au sein du procd sous forme solide, liquide ou gazeuse, et les phnomnes de transfert entre phases. Dans ce chapitre nous nous intressons au dveloppement des expressions qui nous permettront de modliser les phnomnes globaux de bioconversion. Bien que la recherche des expressions mathmatiques dcrivant le fonctionnement du processus demeure encore aujourdhui une phase capitale et une source dtude remarquable, une distinction importante doit toutefois tre faite entre les modles de connaissance et les modles daction [STE98]. En effet, la structure et la complexit dun modle ne peuvent tre dfinies indpendamment de lobjectif dsir. Il faut prciser le but dutilisation auquel on le destine. Alors que les modles de connaissance se proposent de dcrire des phnomnes extrmement complexes en incluant un certain nombre dtages de conversions enzymatiques - et par l mme un grand nombre de paramtres - les modles daction sont essentiellement labors en vue de la commande. Ces derniers, souvent obtenus par simplification des modles de connaissance, font intervenir deux aspects de modlisation :

tel-00136382, version 1 - 13 Mar 2007

dtermination des cintiques de conversion au travers des vitesses de raction des variables macroscopiques, dtermination des quations d'tat du systme par l'intermdiaire des bilans de matire relatifs aux principaux composs intervenants dans la raction.

2.2.2.

Le taux spcifique de croissance

Dans tout procd biologique, la vitesse de croissance de la masse cellulaire - v X - est proportionnelle la variation de la concentration en microorganismes - X - tout instant. Nous obtenons : 1 d ( XV ) vX = (2.1) V dt

Le taux spcifique de croissance, note , est dfinie comme tant la vitesse de croissance ramene l'unit de masse de la biomasse :

1 d ( XV ) XV dt

(2.2)

Ce paramtre est un des plus importants pour la description de l'volution de la population microbienne. Malheureusement, d'un point de vue gnral, le taux de croissance dpend fortement de plusieurs facteurs tels que les conditions opratoires (temprature, pH...) et le milieu ractionnel (concentrations en composs carbons, azots, phosphores, en produits forms, en sels minraux, en oxygne...). La modlisation de ces diffrentes influences au sein d'une expression mathmatique unique est trs complexe, voire impossible. La mthodologie usuellement employe consiste donc fixer les variables d'environnement des valeurs dtermines exprimentalement comme tant optimales. Ne demeurent alors que les influences des substrats, produits et ventuellement de la biomasse.

Modlisation dynamique de procds biologiques

47

Historiquement l'expression la plus couramment utilise est le modle empirique de Monod [MON42], qui lui a permis de dcrire la croissance bactrienne de la loi introduite au dbut du XXe sicle par Michalis-Menten pour une cintique enzymatique :

(t ) = max

S (t ) K S + S (t )

(2.3)

avec S(t) : concentration en substrat (gS/L)31, max : taux spcifique de croissance maximal (h-1), KS : constante de demi-saturation (gS/L), correspond laffinit des microorganismes pour le substrat limitant. Cette expression dcrit que le taux spcifique de croissance , en prsence dune quantit donne de substrat S, commence par augmenter rapidement lorsquon augmente S, puis devient finalement indpendante de S par un effet de saturation. Egalement lexpression permet de dcrire le phnomne de limitation de la croissance par manque de substrat et l'arrt complet lorsque le substrat n'est plus disponible. Le comportement de en fonction de la concentration de substrat en suivant la loi de Monod est reprsent dans la Figure 2.2 pour plusieurs valeurs du paramtre KS [0,1 ; 5] [STE98].

tel-00136382, version 1 - 13 Mar 2007

Figure 2.2. Loi de Monod pour max = 0,5 h-1 et plusieurs valeurs du paramtre KS

Toutefois, le modle dcrit par lexpression prcdente possde l'inconvnient de ne traduire que la limitation en substrat. Pour prendre en compte les effets inhibiteurs des hautes concentrations, ces phnomnes sont gnralement modliss par lexpression de Haldane, introduite dans le cas des ractions enzymatiques et reprise par Andrews [AND68] dans le cas de ractions biologiques, en particulier dans la digestion anarobie :

= max

S KS + S + S 2 / KI

(2.4)

o KI est ici la constante d'inhibition (gS/L). Le comportement du taux spcifique de croissance en fonction de la concentration de substrat en suivant la loi dAndrews est reprsent dans la Figure 2.3 pour KS constant et plusieurs valeurs du paramtre KI [0,1 ; 100] [STE98].

31

Afin dviter toute confusion au niveau de la notation, nous utiliserons toute au long de ce document L pour dnoter litre comme lunit de mesure de volume.

48

Modlisation dynamique de procds biologiques

Figure 2.3. Loi dAndrews pour max = 0,5 h-1, KS = 0,5 gS/L et plusieurs valeurs du paramtre KI.

tel-00136382, version 1 - 13 Mar 2007

Il convient de noter que de nombreuses autres relations algbriques ont t tablies pour dcrire ces phnomnes de limitation et/ou d'inhibition, mais que leur utilisation reste marginale. De la mme manire, certains modles prennent en compte l'influence de la concentration en micro-organismes [CON59], en comtabolite, de la temprature, du pH, A ce propos, une liste de plus de 50 expressions analytiques peut tre trouve dans [DOC86]. Le cas de loxygne est un peu particulier. En effet, dans le cas de procds fonctionnant en arobie, loxygne correspond un cosubstrat de la raction et peut ainsi tre trait comme tel, c'est--dire intervenir sous la forme d'un terme de type Monod dans l'expression du taux de croissance, conduisant ainsi l'expression suivante:

= max

S O2 K S + S K O2 + O2

(2.5)

avec O2 : concentration en oxygne dissous (gO2/L), K O2 : constante de demi-saturation pour loxygne (gO2/L). Cependant, cette expression est souvent omise sous lhypothse que le racteur est suffisamment ar et que K O2 est trs petit par rapport la concentration en oxygne dissous prsente dans le racteur en fonctionnement normal. Dans certains cas, la prsence du cosubstrat peut aussi se manifester de manire comptitive. Considrons cet effet une bactrie telle que pseudomonas putida qui peut, sous certaines conditions, utiliser simultanment le phnol (S1) et le glucose (S2) comme sources d'nergie. Le taux spcifique de croissance peut alors s'exprimer comme la somme de deux taux spcifiques de croissance sur chacun des substrats :

= 1 ( S1 + S 2 ) + 2 ( S1 + S 2 )

(2.6)

Le phnomne dactivation/inhibition comptitive dans le mlange bisubstrat peut tre dcrit par une expression de la forme [WAN96] :

i (S i + S j ) =

max,i S i
K S ,i + S i + S i2 / K I ,i + K 3,i S j + K 4,i S i S j

, i, j = 1,2, i j

(2.7)

Modlisation dynamique de procds biologiques

49

En labsence du substrat Sj, i ( S i ,0) se ramne l'expression d'Andrews prcdemment dcrite. Par un choix judicieux de K 3,i , K 4,i , i = 1,2, on peut alors aisment dcrire les phnomnes d'inhibition comptitive ou non, croise ou partielle.

2.2.3.

Equations dtat

Quel que soit le mode de fonctionnement (batch, fed batch, continu), le comportement dynamique des diffrents composants de la raction biologique (biomasse, substrat, produits) dcoule directement de l'expression des bilans de matires. L'quation gnrale dvolution de chacun de ces lments sur un intervalle de temps dtermin est rgie par :

Variation de la quantit Quantit Quantit Quantit Quantit = apporte soutire + produite consomme dans le racteur
Dans le cas gnral d'un racteur infiniment mlang32 alimentation et soutirage permanent et volume variable, les quations de fonctionnement dcrivant la croissance d'une population de micro-organismes sur un simple substrat est alors reprsente par les quations diffrentielles ordinaires suivantes33 [STE98] : Variation d (VX ) dt d (VS ) dt dV dt avec Sin Qin Qout V X vX vS = = = Quantit apporte 0 Qin Sin Qin Quantit soutire Qout X Qout S Qout + + + Quantit produite
vX V

tel-00136382, version 1 - 13 Mar 2007

Quantit consomme 0 vS V 0

0 0

: concentration de substrat dans la solution d'alimentation (gS/L), : dbit d'alimentation en substrat (L/h), : dbit de soutirage (L/h), : volume ractionnel (L), : concentration en micro-organismes (gX/L), : vitesse de croissance de la biomasse (gX/Lh), : vitesse de consommation du substrat (gS/Lh).

Le couplage entre croissance de la biomasse et consommation du substrat est gnralement dcrit par la relation algbrique suivante :

vS =

YX / S

(2.8)

avec Y X / S le rendement de conversion substrat/biomasse (gX/gS).

32 33

Stirred Tank Reactor, not STR, signifique que le milieu ractionnel est homogne. En raison de notre domaine dapplication, nous sommes intresss par les volutions de la biomasse et du substrat. Toutefois, un raisonnement analogue permettrait dobtenir lquation dvolution du produit form.

50

Modlisation dynamique de procds biologiques En se ramenant aux concentrations des composs, nous obtenons:

Q dX = X out X dt V Q dS = X + in (S in S ) dt YX / S V

(2.9) (2.10) (2.11)

dV = Qin Qout dt

Il est possible de retrouver les quations de fonctionnement des trois principaux modes opratoires des bioprocds :

pour un procd batch : Qin = Qout = 0 , la totalit des lments nutritifs est introduite ds le lancement de la fermentation et seules les conditions d'environnement du milieu fermentaire subissent une action de l'oprateur (pH, temprature, vitesse dagitation, dbit daration,) ; pour un procd semi-continu ou fed batch : Qin 0 et Qout = 0 , les lments nutritifs sont ici apports au fur et mesure des besoins des micro-organismes par action sur le dbit d'alimentation ; pour un procd continu : Qin = Qout 0 , dans ce cas, le procd se droule volume constant, les apports continus d'lments nutritifs tant balancs par un soutirage en tout point identique.

tel-00136382, version 1 - 13 Mar 2007

2.3. Influence du transfert de matire


Comme certains procds de dpollution fonctionnent en arobie, nous devons galement tablir l'expression de la variation de la concentration en oxygne dissous. Dans les racteurs conventionnels, cette concentration est assure par lutilisation des agitateurs. Lagitation possde 4 fonctions principales : 1. 2. 3. 4. assurer l'homognit du milieu de culture travers un macro-mlange, promouvoir le transfert de masse interfacial travers un micro-mlange, promouvoir le transfert de chaleur, assurer une aire interfaciale importante pour un bon transfert de matire entre gaz et liquide [DEM86].

Malgr la prsence des agitateurs au niveau industriel, les racteurs de grande chelle ne sont gnralement pas parfaitement mlangs. Les rendements de conversion et la croissance des micro-organismes peuvent donc diminuer par rapport des racteurs de plus petites dimensions. Des rgles - parfois empiriques - sont toutefois disponibles pour effectuer ces changements d'chelle et les simulations dynamiques peuvent tre bnfiques pour aider au dimensionnement des installations. Malheureusement, les dbits liquides et gazeux internes au racteur tant extrmement complexes, un modle mathmatique rigoureux du transport de l'oxygne est trs difficile dvelopper [STE98]. En ce qui concerne la modlisation de la dynamique de l'oxygne, elle est obtenue de faon identique au cas prcdent, partir de l'quation gnrale de bilan de masse de l'oxygne dissous :

Modlisation dynamique de procds biologiques


d (VO2 ) * = qO2 XV + K l aV (O2 O2 ) Qout O2 dt

51

(2.12)

avec

* O2 : concentration de saturation34 en oxygne dissous (gO2/L), qO2 : vitesse spcifique de consommation doxygne (gO2/gX/h),

K l a : coefficient global de transfert de matire (h-1).


Pour sa part, la vitesse spcifique de consommation d'oxygne est donne par lexpression :

qO2 =
avec

YX / O

+ mO2

(2.13)

Y X / O : rendement de conversion (gX/gO2), mO2 : coefficient de maintenance (gO2/gX/h).

tel-00136382, version 1 - 13 Mar 2007

Le coefficient de transfert de matire Kla dpend fortement des conditions de fonctionnement et en particulier de l'agitation, de la pression, du dbit d'aration, du milieu de culture.... Par exemple, dans le cas dune agitation assure par des turbines, une masse de travail considrable a t fournie par le pass pour modliser le transfert de matire de loxygne de la phase gazeuse la phase liquide. Lexpression du Kla est alors donne par une fonction de la puissance dissipe par unit de volume en prsence de gaz et de la vitesse ascensionnelle du gaz, dans laquelle interviennent plusieurs constantes lies la gomtrie du racteur et celle de l'agitateur. En rsum, la dtermination du paramtre Kla doit tre faite en fonction des conditions opratoires. C'est d'ailleurs ce problme qui fait que la mesure de l'oxygne a rarement t utilise des buts de contrle, bien qu'elle soit trs facile obtenir.

2.4. Quelques modles reprsentatifs


Sans vouloir faire une liste exhaustive, nous prsentons titre illustratif, quelques modles reprsentatifs des procds biologiques de dpollution bass sur lapproche de modlisation de bilan de matires [QUE00].

2.4.1.

Fermentations continues

Reprenons le modle (2.9) - (2.11) dcrivant la croissance d'une population de microorganismes X sur un substrat limitant S. On obtient directement, dans le cas de la fermentation continue, i.e., volume V constant, et en rajoutant l'quation relative un mtabolite P, le modle classique suivant :

dX = X DX dt dS = X + D(S in S ) dt YX / S dP = X DP dt Y X / P

(2.14) (2.15) (2.16)

34

Concentration qui dpend du milieu de culture (sels minraux) et de la temprature essentiellement.

52

Modlisation dynamique de procds biologiques

dans lequel D=Qin/V=Qout/V reprsente le taux de dilution (h-1), YX/P le rendement de conversion (g de biomasse/g de produit) et est dcrit par (2.3). L'quation correspondant la production du mtabolite est gnralement omise lorsque cette variable n'a pas d'influence sur la croissance ( ne dpend pas de P) et qu'elle n'est pas mesure (donc non utilise au niveau d'observateurs et/ou de contrleurs). Dautres phnomnes cellulaires tels que la respiration endogne et le besoin de maintenance peuvent tre pris en compte au niveau de la modlisation [EDE97] :

La respiration endogne, correspond lutilisation diffre des rserves par combustion de substrats endognes, par opposition aux autres substrats qui sont exognes. Le phnomne commence par la combustion dabord des rserves, puis de certains constituants cellulaires. Bien quil sagisse dune respiration endogne, il y a deux conceptions son propos, selon quon considre lensemble de la consommation doxygne associe la consommation des rserves et la lyse35 cellulaire, ou seulement cette dernire.
On appelle nergie de maintien celle qui est ncessaire pour la resynthse de certains composants cellulaires. Les besoins de maintenance des cellules correspondent une consommation de substrat externe non accompagn de croissance cellulaire, et fournissant la cellule le minimum dnergie dont elle a besoin pour remplacer ses dchets et conserver son intgrit.

tel-00136382, version 1 - 13 Mar 2007

Ces deux phnomnes sont reprsents sous la forme de termes supplmentaires dans les quations prcdents : b reprsente le taux de mortalit bactrienne (h-1) associ la respiration endogne et m le coefficient de maintenance (que l'on retrouve systmatiquement sur l'quation d'volution de l'oxygne (2.13)) de la manire suivante:

dX = X DX bX dt dS = X + D(S in S ) mX dt YX / S dP = X DP dt Y X / P

(2.17) (2.18) (2.19)

On peut tendre directement le type de modle (2.17) - (2.19) des ractions plus complexes comportant plusieurs populations de micro-organismes couples ou non, et/ou plusieurs ractions enchanes. Ainsi par exemple, nous prsenterons en dtail le modle dun traitement biologique des effluents de papeterie par lagunage ar comportant une croissance sur mlange bi-substrat avec activation/inhibition comptitive dans la section 2.5.
Nitrification

Dans une station de traitement biologique de l'azote des effluents urbains, le cycle de transformation de l'azote est le mme que dans la nature (Cf. Figure 2.4). La premire partie du traitement de la pollution azote est donc la nitrification, qui consiste transformer par voie biologique l'azote ammoniacal ( NH + 4 ) en en nitrate ( NO 3 ), en prsence d'oxygne [PRO90] [QUE98]. Cette raction comprend deux tapes. La premire, la nitritation met en
35

Dissolution ou destruction des cellules par rupture de leur membrane librant le contenu intrieur.

Modlisation dynamique de procds biologiques

53

jeu des bactries autotrophes de type Nitrosomonas (XNS), qui transforment l'azote ammoniacal en nitrite ( NO 2 ). La deuxime tape concerne, quant elle, la conversion du nitrite en nitrate par les bactries autotrophes Nitrobacter (XNB).

Figure 2.4. Cycle dlimination des pollutions azotes.

tel-00136382, version 1 - 13 Mar 2007

En racteur compltement mlang et aliment continment en azote ammoniacal NH + 4 in , la nitrification peut tre modlise par les quations diffrentielles issues des bilans de matires relatifs aux cinq variables principales de la raction, savoir, les deux populations bactriennes, l'azote ammoniacal, le nitrite et le nitrate :

dX NS = NS X NS DX NS dt dX NB = NB X NB DX NB dt
+ dNH 4 + + = NS X NS + D NH 4 in NH 4 dt YNS

(2.20) (2.21)

(2.22) (2.23) (2.24)

dNO2 = NS X NS NB X NB DNO2 dt YNS YNB

dNO3 NB = X NB DNO3 dt YNB

NS et NB sont dcrits par des termes de Monod relatifs aux substrats limitants des deux
populations, NH + 4 et NO 2 respectivement :

YNS et YNB reprsentent les rendements des deux tapes du procd. Les taux de croissance

NS = max

NS

+ NH 4 + K NH + + NH 4
4

(2.25) (2.26)

NB = max

NB

NO2 K NO + NO2
2

Cette reprsentation largement accepte dans la littrature sous-entend que les deux tapes de la nitrification sont indpendantes (pas de comptition entre les micro-organismes),

54

Modlisation dynamique de procds biologiques

le co-mtabolite de la premire devenant le substrat de la seconde. Il convient aussi de noter que le modle (2.20) - (2.24) n'explicite pas la prsence de l'oxygne, bien que celle-ci soit indispensable la croissance des deux populations autotrophes, partant du principe qu'il est apport en quantit suffisante pour ne pas limiter le phnomne d'oxydation biologique.
Digestion anarobie

tel-00136382, version 1 - 13 Mar 2007

La digestion anarobie est le procd de consommation de dchets solides composs de matire organique par voie biologique. La matire organique complexe (macromolcules) est transforme en biogaz (mthane et gaz carbonique) par une squence de ractions suivant quatre tapes principales : l'hydrolyse, l'acidognse, l'actognse et la mthanognse [DEN88]. Ces tapes sont schmatises sur la Figure 2.5. L'hydrolyse consiste en la transformation de matire organique particulaire lentement biodgradable Xs en matire organique solubilise facilement biodgradable Ss. Ces molcules peuvent servir de source de carbone aux biomasses htrotrophes intervenant en particulier lors de la dnitrification. Dans le cas contraire, elles sont transformes en diffrents acides organiques, ou acides gras volatils (AGV) par les deux tapes d'acidognse et d'actognse. Sachant que l'on ne mesure gnralement que l'ensemble de ces acides, et que c'est l'actate qui est dominant, certains modles court-circuitent l'actognse pour ramener la raction en un processus en trois tapes [CHA97] [MOL86]. Enfin, la dernire tape, ralise par les bactries mthanognes anarobies strictes transforment les AGV en mthane et en gaz carbonique. Le mthane peut alors tre rcupr et valoris comme source d'nergie.

Figure 2.5. Principales tapes de la digestion anarobie

En considrant donc la digestion anarobie comme un processus en trois tapes, comportant trois populations de micro-organismes, les bactries hydrolytiques Xh, les bactries acidognes Xa et les bactries mthanognes Xm, et leurs substrats respectifs, le dchet organique solide Xs, la matire organique solubilise Ss et les acides gras volatils A, le modle suivant est obtenu pour dcrire la croissance microbienne en racteur aliment en continu par les dchets solides X s [GER00] :
in

Modlisation dynamique de procds biologiques



dX h = h X h bh X h X h D dt dX a = a X a ba X a X a D dt dX m = m X m bm X m X m D dt dX s 1 = h X h + D X sin X s dt Yh

55

(2.27) (2.28) (2.29)

)
( )

(2.30) (2.31) (2.32) (2.33) (2.34)

dS s 1 Yh 1 1 f X I a X a + D S sin S s h X h = dt Yh Ya

1 dA 1 Ya 1 f SI X m X m + D( Ain A) = a a dt Ya Y m

tel-00136382, version 1 - 13 Mar 2007

1 Yh dX I h X h = f XI + D X I in X I dt Yh

1 Ya dS I = f SI X a a Y + D S I in S I dt a

XI et SI reprsentent respectivement les concentrations en matire inerte particulaire et solubilise. Les taux de croissance sont modliss par la loi de Monod relative aux substrats respectifs de chacune des populations. L'quation de production de mthane peut ventuellement tre rajoute si celui-ci est mesur et prsente donc un intrt au niveau des tapes d'observation et/ou de commande.
Des modles plus complexes peuvent tre proposs [GIR86] [DEN88] [KIE97], qui prennent en compte davantage de variables, mais cela pose beaucoup plus de problmes pour dterminer les valeurs numriques des nombreux paramtres associs.

2.4.2.

Fermentations semi-continues

L'extension du modle (2.9) - (2.11) au cas des fermentations semi-continues est obtenue directement en considrant Qout = 0. Cette stratgie est particulirement adapte au cas de polluants toxiques qui ne doivent pas se retrouver dans les effluents, et qui ne permettent pas d'obtenir des productivits leves en cultures discontinues [QUE00]. A titre illustratif, considrons le cas de la biodgradation du phnol. C'est un polluant toxique contenu dans les eaux uses de nombreuses industries chimiques, ptrochimiques et agrochimiques. Sa dgradation par des bactries l'acceptant comme seule source de carbone et d'nergie est fortement inhibe, mme de trs faibles concentrations. L'tude de la croissance de Ralstonia eutropha [LEO99] a permis d'tablir un modle bilans-matires dans lequel le taux de croissance est modlis par l'expression de Haldane (2.4) et est coupl la vitesse spcifique de dgradation du phnol. La croissance arobie peut ainsi tre dcrite par les quations suivantes :

56

Modlisation dynamique de procds biologiques

dX Q (2.35) = X in X dt V dS = X + Qin (S in S ) (2.36) dt Yx / s V dP Q = v p X in P (2.37) V dt dO Q * 2 = K l a O2 O2 qO2 X in O2 (2.38) dt V dV = Qin (2.39) dt P est un co-mtabolite de la croissance, l'acide 2-hydroxymuconique semialdhyde (not 2-hms). L'accumulation de 2-hms se traduit par une coloration jaune de plus en plus intense, corrle avec le taux de croissance :

tel-00136382, version 1 - 13 Mar 2007

v p = 0 + 1

(2.40)

o 1 reprsente un terme de rendement, alors que 0, qui n'a pas de relle signification physique, a t introduit pour assurer l'ajustement des donnes [LEO99]. Concernant la dynamique de l'oxygne, comme nous l'avons dit dans un paragraphe prcdent, elle n'a d'intrt que dans la mesure o l'on veut se servir de l'oxygne comme source d'information de la raction. La vitesse spcifique est donne par l'expression (2.13) et le coefficient de transfert de matire Kla doit tre dtermin en fonction des conditions opratoires [QUE00a].

2.4.3.

Procds boues actives

Les procds boues actives sont trs largement utiliss pour le traitement biologique des eaux uses. Traditionnellement, ils sont composs d'un racteur biologique et d'un dcanteur/clarificateur schmatiss sur la Figure 2.6. Leau pollue provenant dune source externe circule dans le bassin daration36 dans lequel la biomasse bactrienne dgrade la matire organique. Les micro-organismes sagglomrent en flocs et produisent les boues. La sortie du bassin daration comportant la liqueur mixte est ensuite envoye dans le dcanteur o la sparation de leau pure et des flocs bactriens est faite par gravit. Dans larateur se produit le processus dpuration de leau proprement dit. En pratique laration est ralise en utilisant des agitateurs superficiels ou diffuseurs, chargs dapporter loxygne ncessaire pour la raction. Le bassin daration est alors considr hypothtiquement comme infiniment mlang. La composition est suppose uniforme dans tout le bassin (le gradient de concentration est nul), autant en concentration de biomasse que de substrat rmanent et doxygne dissous. Une fraction des boues dcantes est recycle vers larateur pour maintenir sa capacit dpuration, lautre est limine. La recirculation permet de rinjecter une partie de la biomasse qui est plus concentr et en mme temps, de dcoupler

36

Le bassin daration est en fait, selon le cas, constitu de plusieurs bassins en srie privilgiant chacun le traitement dune pollution spcifique (organique, nitrification, dnitrification, phosphatation), ou dun seul bassin permettant de raliser les diffrentes ractions biologiques en mme temps [QUE00].

Modlisation dynamique de procds biologiques

57

le temps de sjour hydraulique du temps de sjour cellulaire (ge des boues). Leffluent pur est ainsi rcupr en sortie du dcanteur.

Figure 2.6. Schma typique dun procd dpuration par boues actives

tel-00136382, version 1 - 13 Mar 2007

Pour ce procd le substrat affluent a une concentration Sin (g/L) et un dbit Qin=Q (L/h). On doit ajouter au substrat affluent le dbit de recirculation Qr (L/h) provenant du dcanteur avec une concentration S (g/L). Le dbit de purge est reprsent par Qw (L/h). En appliquant les bilans-matire pour le procd, on arrive aux expressions prsentes ensuite. Pour le substrat, dans le bassin daration,

dS = QS in + Qr S (Q + Qr Qw ) S Qw S v s XV dt

(2.41)

o vsXV reprsente la consommation totale de substrat par des micro-organismes (g/h). Il faut remarquer que comme le bassin daration est suppos infiniment mlang, le substrat a la mme concentration tant dans le bassin que dans la sortie et dans la recirculation (en considrant quil ny a pas de raction dans le dcanteur). Aprs simplification, lexpression (2.41) peut sexprimer galement par :

dS = D( S in S ) X dt
dans laquelle D=Q/V reprsente le taux de dilution (h-1).

(2.42)

Pour la biomasse, le bilan de matire en considrant le procd complet (racteur et dcanteur) afin de prendre en compte les solides effluents Xe est donn par :

dX = (Q Qw ) X e Qw X + XV dt

(2.43)

expression dans laquelle XV reprsente la production de biomasse par la dgradation du substrat (g/h). En ce qui concerne lapplicabilit, les procds boues actives sont souvent utiliss une chelle pilote pour caractriser le comportement des micro-organismes pour lpuration dun affluent spcifique, ainsi que pour la slection et loptimisation des expriences du traitement, avant de passer une chelle industrielle. La Figure 2.7 montre une unit pilote typique dun procd boues actives implment au cours de la formation de Doctorat au

58

Modlisation dynamique de procds biologiques

Centre dInformatique et dAutomatisation pour la Production de lUniversit de los Andes (Colombie). Le pilote est utilis pour la caractrisation exprimentale et la mise au point dun procd de traitement des effluents dune industrie locale de boisons gazeuses. Le montage physique a permis dintgrer dans une seule structure le bassin daration ( gauche) et le dcanteur ( droite). Laration est assure par une batterie darateurs externes qui injectent de loxygne dans le racteur. La couleur plus claire de leffluent sur la partie suprieur du bassin de dcantation met en vidence le bon fonctionnement du procd.

tel-00136382, version 1 - 13 Mar 2007

Figure 2.7. Pilote exprimental dun procd boues actives implment lUniversit de los Andes

Le schma de base pour les procds boues actives montr dans la Figure 2.6 peut tre complt par d'autres racteurs en srie (permettant de favoriser les diffrentes populations de micro-organismes en optimisant les conditions opratoires de chaque racteur), par un dcanteur primaire et par des boucles de recirculation interne. Dautre part, afin de traiter les pollutions composes d'azote organique, le racteur biologique peut prendre en compte la fois des conditions arobies (pour la nitrification), et anoxies (pour la dnitrification en particulier). Ces oprations peuvent tre ralises soit dans deux bassins placs successivement, l'un ar, l'autre non, soit dans un seul bassin autorisant des priodes alternes d'aration et de non-aration [JUL97] [SPE98]. Mis part la modlisation des tapes de traitement des dchets (nitrification, dnitrification, digestion...), un lment cl de ces procds est la modlisation du dcanteur afin de grer au mieux la recirculation des boues [QUE00b] [TRA03]. Lintrt des procds boues actives a donn lieu des nombreuses tudes o la modlisation dynamique de ces procds a beaucoup avance. A ce propos, lIAWQ37 a dvelopp un modle qui a t valid sur de nombreux cas pratiques, servant de rfrence dans le domaine du traitement combin des matires organiques biodgradables (lentement et rapidement) et de lazote dans les effluents urbains [HEN87]. Dans sa deuxime version, lIAWQ a galement largie ce modle pour tenir compte du traitement biologique du phosphore [HEN94]. Le modle se prsente sous forme matricielle, les lignes correspondant aux diffrentes ractions biologiques et les colonnes aux variables mises en jeu dans ces ractions. De trs nombreux composants interviennent dans les schmas ractionnels et, au final, un "grand" modle est obtenu. Ainsi, le modle no 2 de lIAWQ fait intervenir 19 variables dtats et 65 paramtres et, mme si les auteurs de ce modle proposent des valeurs
37

IAWQ : International Association for Water Quality.

Modlisation dynamique de procds biologiques

59

pour ces paramtres, ils doivent souvent tre recalculs pour modliser le traitement dun effluent spcifique. Ceci tant, mme si ce modle ne constitue pas une rponse dfinitive au problme de la modlisation des procds biologiques de dpollution, il se rvle particulirement utile pour rpondre plusieurs besoins, telles que la slection des expriences pour la mise au point de procds ainsi que loptimisation, le diagnostic et lassistance au dimensionnement de procds lchelle industrielle [STE98].

2.5. Modlisation du bioprocd de traitement des eaux uses par lagunage are
Dans cette section nous dcrivons en dtail le procd considr dans le cadre de notre tude. Il sagit dun racteur biologique arobie multivariable en mode continu pour le traitement des eaux uses issues dune industrie papetire. Nous avons repris les travaux dvelopps par [BEN96], notamment ltude de caractrisation du procd qui a ncessit le montage dune unit pilote afin de reproduire les conditions opratoires dune lagune are pour le traitement de ces effluents. Le modle mathmatique ainsi obtenu t utilis comme prototype pour le dveloppement et le test de performance de diffrents algorithmes didentification et de commande dans le cadre du projet europen FAMIMO38 [ROU99]. Le modle que nous dveloppons est une version amliore du simulateur utilis lors du projet FAMIMO, en effet nous avons propose lajout dun terme de mortalit endogne au niveau de la dynamique bactrienne [GRI05]. Une caractristique particulire du procd considr - diffrence de la plupart des applications de synthse de produits exploites en bioindustrie qui utilisent des populations microbiennes composes d'une seule espce de micro-organismes - est la prsence dune culture mixte, comme c'est le cas de la plupart des procds d'puration devant traiter des effluents septiques situs en environnements naturels. Les micro-organismes s'y dveloppent gnralement en prsence de faibles concentrations en divers lments nutritifs servant leurs fonctions mtaboliques comme source carbone ou azote. Ces cosystmes naturels sont htrognes et les conditions de croissance peuvent changer constamment au cours du temps du fait de comptitions permanentes entre les diffrentes espces de bactries pour la digestion de substrats multiples. Ainsi, en traitement des eaux uses, les cultures mettant en jeu un seul type de micro-organisme et limites par un seul type de substrat sont trs rares. Ces cultures sont en fait caractrises par une grande diversit de micro-organismes ayant chacun une affinit diffrente pour de multiples substrats. De ce fait, la modlisation et la matrise des systmes multi-organismes sont plus difficiles, motivant les recherches fondamentales et appliques [BEN96]. Alors qu'en culture pure toute apparition de bactries trangres au procd est considre comme agent contaminant, paradoxalement, les interactions comptitives au sein de cultures mixtes conduisent, dans la plupart des cas, des systmes plus stables et plus flexibles. Il a t dmontr aussi pour certaines applications que de meilleurs rendements de production pouvaient tre obtenus en choisissant des cultures mixtes [LIN82]. Les avances ralises en matire d'cologie microbienne contribuent une meilleure comprhension de la stabilit et des interactions au sein des cultures mixtes. Le message le plus intressant rsultant de ces travaux est que les performances obtenues par les cultures mixtes sont plus qu'une simple addition des potentiels d'activit de chaque micro-organisme. En fait, les mcanismes qui
38

tel-00136382, version 1 - 13 Mar 2007

Waste-water Benchmark, in Fuzzy Algorithms for the Control of Multiple-Input, Multiple Output Processes (FAMIMO) project, funded by the European Comission (Esprit LTR 21911).

60

Modlisation dynamique de procds biologiques

gouvernent la vie d'une population mixte rsultent galement d'un large spectre d'interactions microbiennes, nommment, la comptition et la slection naturelle de micro-organismes sous limitation de substrats nutritifs.

2.5.1.

Traitement biologique des effluents de papeterie par lagunage are

Principe du lagunage ar

tel-00136382, version 1 - 13 Mar 2007

Le lagunage naturel est certainement la plus ancienne parmi les techniques dpuration deaux uses. Elle consiste dverser l'effluent dans un bassin ar naturellement (photosynthse et aration de surface) o sjourne une population mixte destine digrer la matire polluante (cf. section 1.2.4). Afin dintensifier le traitement et de le rendre plus performant, la lagune est quipe darateurs permettant une meilleure oxygnation des eaux. Cette technique, dite lagunage ar, est de tradition pour un certain nombre d'industries (secteurs de l'agro-alimentaire, de la sant, du papier, de la chimie fine, etc.). En comparaison avec les procds dits boues actives ou cultures fixes, le lagunage ar possde lavantage considrable dtre conomiquement plus intressant, notamment sur les plans investissement et fonctionnement. Il existe diffrentes configurations d'installation de lagunage ar suivant le type d'effluents purer (bassin unique ou association de bassins).
Caractristiques des effluents de papeterie

La production industrielle de ptes papier gnre une quantit varie de rsidus gazeux mis dans l'air ambiant et des effluents chargs en divers rsidus sous forme liquide et solide. Les impurets draines par les eaux uses proviennent de la matire premire (bois) et des procds chimiques utiliss pour la fabrication de la pte papier (produits ractifs). Aprs diffrents prtraitements physico-chimiques (cuisson, blanchiment), l'effluent industriel est trait dans une station d'puration. Trois exemples de composition d'effluent d'industrie papetire (Compagnie Saint Gobain, France) sont rpertoris sur le tableau suivant [ROL95] : Processus Produit Production (t/j) Dbit de l'effluent (m3/j) Charge en DCO (t/j) Charge en DBO5 (t/j) Sulfite d'ammonium Pte Fluff 400 24000 80 27 lignosulfonate Principaux constituants acides rsiniques cellulose, hmicellulose acides gras volatiles Kraft Papier Kraft
1 200

Fibres recycles Carton ondul 420 4300 15 7 amidon cellulose acides gras volatiles

60000 25 10 lignine hmicellulose mthanol

Tableau 2.1. Caractristiques d'effluents d'usines de papier et de pte papier

Bien que la composition de la plupart des effluents d'industries papetires soit assez complexe (Cf. Tableau 2.1), il est cependant possible de dfinir deux catgories de fraction de

Modlisation dynamique de procds biologiques

61

la DBO5 en fonction de leur niveau de forte/faible biodgradabilit. Cette distinction correspond la vitesse rapide/lente laquelle ces fractions sont dgrades. Dans les deux cas, les composs sont biodgradables. Le premier type de substrat, dit nergtique, correspond de la cellulose. Il est caractris par une forte biodgradabilit et constitue la principale source nergtique de croissance des micro-organismes. Le second type de substrat, dit xnobiotique (synthse issue de l'activit humaine), est caractris par une faible biodgradabilit. Principalement constitu d'un mlange de drivs ligneux et de lignosulfonates, il est considr comme le principal substrat polluant dgrader par voie microbienne. Le principe du lagunage ar peut tre appliqu efficacement ce type d'effluent si le comportement hydrodynamique gnral de la lagune est correctement adapt aux cintiques de la raction biologique. Dans ce contexte, ltude de loptimisation de la biodgradation des rsidus carbons peut tre mene en utilisant le concept des bioracteurs aliments en mode continu. Lamlioration des performances de biodgradation dpend alors du degr dadquation existant entre le type de polluant traiter, les micro-organismes et les caractristiques du milieu environnemental (temprature, pression doxygne dissous, pH).
Bioracteur continu pour la dgradation de composs xnobiotiques tel-00136382, version 1 - 13 Mar 2007

L'tude de caractrisation du procd a ncessit le montage d'une unit pilote permettant de reproduire le plus fidlement possible les conditions opratoires et la configuration gomtrique d'une lagune are pour le traitement des eaux uses d'industrie papetire. L'quipe de gnie microbiologique du dpartement de Gnie Biochimique et Alimentaire de l'INSA39 a mis en uvre l'chelle du laboratoire un bioracteur contenant une population mixte naturelle (prleve sur site) et aliment par un effluent comportant deux substrats carbons. Ce type d'effluent, dit bi-substrat, est compos de cellulose et de lignosulfonate. Le pilote est constitu d'un bioracteur homogne aliment en mode continu par une solution contenant un mlange bi-substrat (Cf. Figure 2.8). L'quipement de conduite du bioracteur est constitu d'une unit Stric, interface ralisant l'acquisition et/ou la rgulation des variables d'environnement. La temprature est mesure par une thermosonde semiconducteur, le pH par une sonde pH et l'oxygne dissous par une sonde O2. Un analyseur automatis pour la mesure en ligne de la concentration en substrat nergtique et de la concentration en biomasse est associ au bioracteur. L'aration du racteur est assure par un dispositif compos d'un dbitmtre massique et d'un filtre strilisable [BEN96]. La culture microbienne mixte prleve sur la lagune are permet la dgradation biologique dans des conditions opratoires dtermines par les valeurs des variables d'environnement du Tableau 2.2 : Variable Temprature (C) pH Volume (L) Agitation (tpm) Aration (vvm)40 Valeur 30 7 1,5 [400 ;800] [0,5 ;1]

Tableau 2.2. Valeurs des variables d'environnement

39 40

INSA : Institut National des Sciences Appliques de Toulouse. vvm : volume dair/volume de liquide/minute.

62

Modlisation dynamique de procds biologiques

Figure 2.8. Schma synoptique de l'installation du procd pilote

tel-00136382, version 1 - 13 Mar 2007

2.5.2.

Modlisation des cintiques de croissance et de dgradation

Le comportement des populations mixtes dans un mlange multi-substrat dpend des affinits de chaque micro-organisme vis--vis de chaque substrat. Les cintiques d'utilisation des substrats sont gouvernes par les concentrations et les types de substrat prsents dans le milieu mais galement par les interactions existant entre les diffrentes espces microbiennes. En ce qui concerne le procd d'puration des effluents de papeterie tudi, il est indispensable d'intgrer dans la modlisation les phnomnes de comptition et dactivation/inhibition microbiennes.
Comptition microbienne pour le mlange bi-substrat

La comptition reflette un conflit entre les diffrentes espces de micro-organismes pour la consommation des lments nutritifs et leur prolifration dans l'espace vital disponible. Le phnomne de comptition est li une limitation de croissance par le substrat. La modlisation du taux spcifique de croissance de la population mixte et des taux spcifiques de dgradation en substrats nergtique et xnobiotique est une tape d'autant plus complexe que la croissance s'effectue dans un mlange multi-substrat. La thorie de Monod, aboutissant des modles donns par l'quation (2.3), a t tendue pour inclure les cas o plusieurs substrats en concentration limitante sont prsents lors de la croissance d'un seul type de micro-organisme. Trois hypothses diffrentes ont t proposes pour dcrire l'effet d'une culture mixte sur le taux spcifique de croissance. 1. Certains types de culture traduisent une limitation de croissance par un seul des deux substrats suivant un point de fonctionnement prcis : la limitation est impose par le substrat dont la vitesse de dgradation est la plus faible [RYD72] [SYK73]. Ainsi, pour une croissance en prsence de deux substrats S1(t) et S2(t), le taux de croissance cellulaire X(t) rsultant est modlis par :

X (t ) =

S 1 (t ) si S1 (t ) < S 2 (t ) S 2 (t ) si S 1 (t ) > S 2 (t )

(2.44)

o S 1 (t ) et S 2 (t ) sont dcrits par le modle de Monod (2.3).

Modlisation dynamique de procds biologiques

63

2. Megee et coll. [MEG72] proposent, au contraire, un modle bi-substrat dans lequel les deux substrats affectent simultanment le taux spcifique de croissance. Le modle correspondant est donn par la relation :

X (t ) = S1 (t ) S 2 (t )
ce qui implique une croissance nulle en l'absence d'un des deux substrats.

(2.45)

3. Enfin, dans d'autres applications [YOO77] [GOT82], le taux spcifique de croissance de la biomasse est dfini comme tant la somme des deux taux de croissance lis chaque type de substrat :

X (t ) = S 1 (t ) + S 2 (t )

(2.46)

Ceci traduit le fait qu'en l'absence d'un des deux substrats limitants, par exemple S1(t), la biomasse continue crotre selon S2(t), c'est dire en utilisant le second substrat S2(t).
tel-00136382, version 1 - 13 Mar 2007

En tendant ce dernier modle au cas des cultures mixtes, il est montr que la coexistence de diverses espces en rgime permanent dans une culture continue est possible lorsque plus d'un substrat est disponible. Ceci est vrai mme si ces organismes ont une prfrence marque pour un de ces diffrents substrats. La diversit des sources de substrats dans un systme rel est donc un facteur cl pour le maintien d'une population htrogne. Lorsque l'volution de cette population est suivie par la concentration en biomasse totale X(t), le taux spcifique de croissance global (ou apparent) s'exprime alors par la somme des taux de croissance sur chaque substrat. Il semble que ce soit ce dernier type de mcanisme qui gre la croissance de la biomasse pour le procd d'puration des effluents de type bi-substrats [BEN96] ; la croissance de la population mixte en prsence des substrats xnobiotique S x (t ) et nergtique S e (t ) 41 est donc du type :

X (t ) = Sx (t ) + Se (t )

(2.47)

Cependant, ce modle ne dcrit pas compltement les diffrentes situations de croissance des micro-organismes. En effet, les premires observations relatives aux cintiques de dgradation des substrats de l'effluent de papeterie ont montr que, en prsence de fortes concentrations en substrat nergtique S e (t ) , la vitesse de dgradation du substrat xnobiotique S x (t ) est plus lente que celle qui devrait thoriquement tre obtenue par une loi de Monod classique (quation (2.3)). Pour prendre en compte ces effets croiss lis la prsence, dans l'effluent, de substrats de nature trs diffrente, Yoon et coll. [YOO77] ont fait appel au modle de Monod gnralis. Cette thorie permet d'intgrer l'effet inhibiteur ou activateur de la prsence d'un substrat sur la dgradation des autres substrats prsents dans le milieu de culture microbienne.
Phnomne d'activation/inhibition comptitive dans le mlange bi-substrat

En culture pure, un excs de substrat se traduit par une inhibition de la croissance microbienne. Ce type d'interaction peut tre reprsent par le modle de Haldane (Cf.
La notation originale utilise par [BEN96] a t volontairement modifie afin de la rendre plus conforme avec les pratiques internationales. Ainsi, les concentrations des substrats seront identifis par Si (o lindice i={e,x} reprsente soit le substrat nergtique, soit le substrat xnobiotique) et la concentration de biomasse par X.
41

64

Modlisation dynamique de procds biologiques

quation (2.4)) o l'inhibition est proportionnelle au carr du substrat limitant. Cependant, lorsque le milieu de culture comporte plusieurs substrats, ce modle ncessite une modification permettant de tenir compte des effets croiss de chaque substrat sur l'assimilation des autres. Ainsi, dans le mlange bi-substrat, les effets croiss dactivation ou inhibition des substrats nergtique S e (t ) et xnobiotique S x (t ) sur lvolution des taux spcifiques de croissance Sx (t ) et Se (t ) peut tre correctement reprsente par le modle de Monod gnralis de la forme [YOO77] :
max Sx (t ) = Sx

K Sx

S x (t ) + S x (t ) + a Se S e (t )

(2.48)

max Se (t ) = Se

S e (t ) K Se + S e (t ) + a Sx S x (t )

(2.49)

tel-00136382, version 1 - 13 Mar 2007

max max o Sx et Se correspondent aux taux spcifiques de croissance maximums. Les paramtres de Michalis-Menten, K Sx et K Se , permettent de tenir compte de l'effet de limitation de croissance par chaque substrat. La constante a Se permet de modliser l'effet inhibiteur du substrat nergtique S e (t ) sur la consommation du substrat xnobiotique S x (t ) (et rciproquement pour la constante a Sx ). Thoriquement, ces deux paramtres doivent vrifier la relation a Se = 1 / a Sx . Cependant, a Sx et a Se doivent tre considrs comme des paramtres indpendants ajuster en fonction des donnes exprimentales [YOO77]. Pour ltude dvelopp par [BEN96], la consommation prfrentielle du substrat nergtique par les micro-organismes se traduit par une faible valeur de a Sx et par consquent une forte valeur de a Se . Le terme d'inhibition est donc relatif l'effet du substrat nergtique sur la dgradation du substrat xnobiotique.

En conclusion, en tenant compte de la structure de Sx (t ) et Se (t ) ainsi dfinie, nous obtenons l'expression du taux spcifique de croissance X (t ) de la population mixte :

X (t ) = Sx (t ) + Se (t )
max = Sx

S x (t ) S e (t ) max + Se K Sx + S x (t ) + a Se S e (t ) K Se + S e (t ) + a Sx S x (t )

(2.50)

La Figure 2.9 permet la visualisation des phnomnes de comptition et d'activation/inhibition comptitive de la culture mixte en milieu bi-substrat. II s'agit d'une simulation du procd taux de dilution nul (culture discontinue ou batch). Dans la premire partie de cette courbe (zone 1), nous pouvons remarquer que la dgradation du substrat xnobiotique S x (t ) est presque compltement inhibe par la seule prsence du substrat nergtique S e (t ) . Lorsque le substrat S e (t ) est pratiquement consomm (zone 2), la croissance de la population mixte s'effectue plus lentement (pente p Sx plus faible que p Se ) mais en dgradant le substrat xnobiotique S x (t ) . Une consquence du phnomne d'inhibition comptitive est qu'il serait possible d'augmenter la dgradation du substrat xnobiotique en l'absence de substrat nergtique. En dehors du fait que la prsence du substrat nergtique dans leffluent de la lagune are est impose par la nature mme du procd de fabrication de la pte papier, celle-ci est

Modlisation dynamique de procds biologiques

65

indispensable pour assurer une croissance suffisante des micro-organismes. En effet, pour qu'un procd aliment en mode continu soit stable, il faut qu'il y ait au moins un substrat qui puisse supporter la croissance des micro-organismes. Ce rle de support est jou par le substrat nergtique qui, comme nous venons de le voir, est le substrat qui favorise le mieux la croissance de la population mixte l'intrieur de la lagune. Ainsi, la conversion du substrat nergtique en biomasse permet de maintenir un taux spcifique de croissance au moins suprieur au taux de dilution du racteur sans quoi celui-ci serait inexorablement lav42. La diminution du taux de dilution de la lagune, et par consquent de la charge de pollution, dans le but d'amliorer les vitesses de dgradation des deux substrats, n'est pas envisageable pour une station d'puration dont l'objectif est d'intensifier le traitement des eaux uses.

tel-00136382, version 1 - 13 Mar 2007

Figure 2.9. Les interactions microbiennes : comptition et activation/inhibition comptitive

2.5.3.

Equations dvolution du procd

A partir des quations de bilans matire tablis pour chaque lment macroscopique de la raction biologique, les dynamiques du procd de traitement des eaux rsiduaires dcrivant la croissance de la biomasse microbienne sur leffluent bi-polluant considr (substrats xnobiotique et nergtique), dans le cas dun racteur homogne alimentation et soutirage permanent (donc de volume constant) sont modlises par le systme d'quations diffrentielles suivant :

dX (t ) = X (t ) X (t ) D(t ) X (t ) dt dS x (t ) = v Sx (t ) X (t ) + D(t ) S xin (t ) D(t ) S x (t ) dt dS e (t ) = v Se (t ) X (t ) + D(t ) S ein (t ) D(t ) S e (t ) dt

(2.51) (2.52) (2.53)

42

Lavage : phnomne indsirable de perte de la biomasse qui se produit dans un bioracteur lorsque le taux de dilution est suprieur au taux de croissance maximum.

66

Modlisation dynamique de procds biologiques

o X (t ) , S x (t ) et S e (t ) reprsentent respectivement les concentrations en (g/L) de biomasse, de substrat xnobiotique et de substrat nergtique. X (t ) reprsente la vitesse spcifique de croissance de la biomasse. v Sx (t ) et v Se (t ) reprsentent respectivement les vitesses spcifiques de dgradation du substrat xnobiotique et du substrat nergtique. Le taux de dilution D(t) correspond au rapport entre le dbit d'alimentation et le volume (constant) du bioracteur. S xin (t ) et S ein (t ) sont respectivement les concentrations en substrat xnobiotique et nergtique du milieu d'alimentation. Gnralement, les vitesses de dgradation en substrats sont exprimes en fonction des rendements de conversions du substrat xnobiotique en biomasse Y X / Sx et du substrat nergtique en biomasse Y X / Se par :
v Sx (t ) =

Sx (t )
Y X / Sx

(2.54)

v Se (t ) =

Se (t )
Y X / Se

(2.55)

tel-00136382, version 1 - 13 Mar 2007

Dans ces expressions, Sx (t ) (respectivement Se (t ) ) reprsente le taux spcifique de croissance des micro-organismes provenant de la conversion du substrat xnobiotique (respectivement nergtique) en biomasse. Ces paramtres dpendent des conditions opratoires (pH, temprature, aration) ainsi que des concentrations en substrats S x (t ) et S e (t ) (cf. quations (2.48) et (2.49)). La complexit de modlisation de ces variables est nanmoins rduite par le fait que leur expression est tablie pour des conditions opratoires optimales fixes. Nous proposons damliorer le modle du procd biologique utilis par [BEN96] et qui a servi de benchmark dans le projet europen FAMIMO, en considrant la mortalit bactrienne due la respiration endogne (Cf. section 2.4.1). Ce phnomne peut tre reprsent sous la forme dun terme supplmentaire b (h-1) dans lquation (2.51) qui dcrit la dynamique du comportement de la population bactrienne dans le bioracteur :

dX (t ) = X (t ) X (t ) D(t ) X (t ) bX (t ) dt

(2.56)

En reprenant les quations (2.52) et (2.53) pour la dynamique de dgradation des substrats xnobiotique et nergtique ainsi que lquation (2.56) pour lvolution de la biomasse, nous visualisons sur la Figure 2.10 les phnomnes de comptition, dactivation/inhibition comptitive et de mortalit bactrienne endogne. Il sagit de nouveau dune simulation du procd en mode dopration discontinu et par consquence taux de dilution nul. Aprs la dgradation conscutive des substrats nergtique et xnobiotique avec une augmentation de la biomasse due la biotransformation de matires organiques (zones 1 et 2), on remarque la rduction de la concentration de la biomasse bactrienne une fois que les substrats sont presque puiss (zone 3). En effet, sans nutriments les bactries doivent faire appel une consommation des substances de rserves endognes et puis certains constituants cellulaires. Sil sagissait du mode continu de fonctionnement il faudrait apporter en permanence une quantit minimale de nutriments, afin de promouvoir la bonne performance du bioprocd tout en vitant les phnomnes de lavage du bioracteur (quand le soutirage est suprieur lapport pour la croissance de la biomasse) et/ou de mortalit totale de la biomasse (quand lapport de nutriments ne suffit pas

Modlisation dynamique de procds biologiques

67

compenser la mortalit microbienne). Nous avons retenu, pour notre tude de modlisation et de commande floues du bioprocd, le modle plus complet qui prend en compte ce phnomne de mortalit bactrienne endogne.

tel-00136382, version 1 - 13 Mar 2007

Figure 2.10. Phnomnes dinteractions microbiennes et mortalit bactrienne endogne

2.5.4.

Variables de commande du procd

En technologie d'puration d'eaux uses, le premier objectif est videmment de dgrader biologiquement un maximum de polluant tout en assurant de bonnes conditions de croissance des micro-organismes. La dtermination des matires en suspension (MES) en sortie du racteur permet d'estimer grossirement la biomasse bactrienne, la fraction minrale tant relativement constante pour un type d'effluent. La surveillance des MES en sortie d'un racteur permet d'valuer l'excs de biomasse vacue ou de dtecter un ventuel lavage du racteur d par exemple une surcharge accidentelle (toxicit, taux de dilution suprieur au taux de croissance maximum des micro-organismes). Pour le procd de traitement des effluents de papeterie, l'excs de biomasse est considr comme un facteur de pollution pour le milieu rcepteur. Le double objectif de conduite de ce type de systme est donc de maximiser la dgradation de substrat xnobiotique tout en contrlant la concentration en biomasse la sortie du procd biologique. Pour notre cas dtude, lentre du systme est dfinie en fonction des objectifs de commande mono-variable ou multi-variable que l'on dsire se fixer. Dans le cas monovariable la grandeur de commande correspond au taux de dilution D(t ) du racteur. Nous nous sommes intresss au cas multi-variable, o il est ncessaire de disposer d'une autre commande pour mener bien la stratgie de conduite. Gnralement, on prend la concentration en substrats xnobiotique et nergtique du milieu d'alimentation S xin (t ) et S ein (t ) . En pratique, il suffit de dissocier l'alimentation classique en deux alimentations, l'une apportant de l'eau et lautre le milieu contenant les deux sources de carbone aux max max concentrations maximales S x in (t ) et S ein (t ) . Les relations qui lient D (t ) , S xin (t ) et S ein (t ) aux variables de commande auxiliaires sont donnes par :

68

Modlisation dynamique de procds biologiques

D(t ) = u (t ) + u (t ) (2.57) 1 2 u 2 (t ) S xmax S xin (t ) = (2.58) in u1 (t ) + u 2 (t ) u 2 (t ) S ein (t ) = S emax in (2.59) u1 (t ) + u 2 (t ) Dans cette expression nous avons deux variables de commande : u1 (t ) qui correspond au taux de dilution en eau et u 2 (t ) qui correspond au taux de dilution en substrats. Au niveau laboratoire, le bidon dalimentation initial est remplac par deux bidons, lun contenant une solution d'eau et l'autre contenant une solution de substrat suivant le schma d'alimentation reprsent sur la Figure 2.11.

tel-00136382, version 1 - 13 Mar 2007

Figure 2.11. Alimentation du bioracteur dans le cas multi-variable

En combinant les expressions de la dynamique du bioprocd (2.56), (2.52) et (2.53) avec l'expression (2.50) du taux spcifique de croissance X (t ) de la population mixte et les quations (2.57) - (2.59) concernant les variables de commande u1 (t ) et u 2 (t ) , nous obtenons le modle complet du procd biologique de dpollution des eaux uses considr :
S x (t ) S e (t ) dX (t ) max max = Sx + Se X (t ) (u1 (t ) + u 2 (t ) )X (t ) bX (t ) dt K Sx + S x (t ) + a Se S e (t ) K Se + S e (t ) + a Sx S x (t )

(2.60)

dS x (t ) S x (t ) max = Sx X (t ) u1 (t ) S x (t ) + S xmax in S xin (t ) u 2 (t ) dt Y X / Sx K Sx + S x (t ) + a Se S e (t )

(2.61)

dS e (t ) S e (t ) max = Se X (t ) u1 (t ) S e (t ) + S emax in S ein (t ) u 2 (t ) dt Y X / Se K Se + S e (t ) + a Sx S x (t )

(2.62)

Nous reprendrons ce modle dans le chapitre 5, qui concerne lapplication de la modlisation floue de type Takagi-Sugeno (TS) ainsi que la commande floue TS base sur le modle flou du bioprocd.

Modlisation dynamique de procds biologiques

69

2.6. Conclusions
Comme nous lavons soulign, les phnomnes mis en jeu dans les procds biologiques possdent une dimension particulire par rapport aux exemples habituels de modlisation car ils relvent du vivant. Le dveloppement et la disponibilit dun modle mathmatique dcrivant les diffrents phnomnes biochimiques sur lesquels se basent les procds biologiques dpuration est une tche dlicate ncessitant des connaissances issues de domaines divers allant de la microbiologie aux mathmatiques et l'informatique. Il est bien connu que les processus mtaboliques qui ont lieu dans les units biologiques de dpollution, sont trs nombreux et complexes. En effet, contrairement la physique o il existe des lois connues depuis des sicles, la plupart des modles en biologie reposent sur des lois empiriques. Toutefois, les recherches menes dans ce domaine ont cependant permis de mettre en vidence certains mcanismes biochimiques, du moins les plus influents. Loin dtre exhaustif, ce chapitre avait simplement pour objectif de prsenter une introduction la modlisation dynamique des procds biologiques de traitement des eaux rsiduaires en utilisant lapproche des bilans de matire. Nous avons vu dans ce chapitre que, quel que soit le procd biologique et son mode de fonctionnement (batch, fed-batch ou continu), le principe de modlisation, bas sur les bilans de matire, reste le mme. Cette approche met en vidence, au moins du point de vue macroscopique (phnomnes globaux de bioconversion), le fonctionnement interne du systme au cours duquel le bilan global des ractions est modlis. Le comportement dynamique du bioprocd est ainsi reprsent par des quations diffrentielles non linaires qui expriment la variation au cours du temps de la quantit de matire des principaux composants du procd (biomasse, substrats, produits). En gnral deux types de termes sont prsents dans ces modles, reprsentant respectivement la conversion et le transport. La conversion, qui correspond la cintique laquelle se droulent les diverses ractions biochimiques conduisant la conversion des divers substrats en biomasse (et produits) et la dynamique de transport, qui regroupe le transit de la matire au sein du procd. En utilisant lapproche de modlisation base sur des bilans de matire, nous avons dcrit quelques procds biologiques reprsentatifs tels que les fermentations continues (e.g. croissance dune population des micro-organismes dgradant un substrat limitant, nitrification, digestion anarobie), les fermentations semi-continues et les procds boues actives. La complexit de ces modles dpend essentiellement du nombre de ractions internes considres et de la structure choisie pour dcrire le taux de croissance microbienne. Finalement, nous avons dcrit le procd considr au niveau de lapplication dans notre tude, qui est un bioracteur arobie multivariable en mode continu pour le traitement des eaux uses issues dune industrie papetire. Ce procd est aliment par un mlange bipolluant (substrats nergtique et xnobiotique), dans lequel les micro-organismes exhibent des interactions telles que la comptition et lactivation/inhibition comptitive. Le modle que nous avons retenu, dvelopp sous Matlab, est une version amliore de celui utilis lors du projet europen FAMIMO, pour lequel nous avons ajout un terme de mortalit endogne bactrienne. Comme nous lavons indiqu prcdemment, ce modle de connaissance nous servira de base pour comparer en simulation la performance dun modle flou pour reprsenter le comportement dynamique non-linaire entre-sortie du systme. Nous abordons maintenant la deuxime partie des travaux, concernant la modlisation, lidentification et la commande floues de type Takagi-Sugeno. Nous dvelopperons lapplication de ces techniques sur notre bioprocd dpuration dans le chapitre 5.
tel-00136382, version 1 - 13 Mar 2007

70

Modlisation dynamique de procds biologiques

tel-00136382, version 1 - 13 Mar 2007

71

tel-00136382, version 1 - 13 Mar 2007

PART II. IDENTIFICATION - COMMANDE FLOUES ET APPLICATION AU BIOPROCD DE TRAITEMENT DES EAUX USES

tel-00136382, version 1 - 13 Mar 2007

72

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

73

___________________________________________________________________________

Chapitre 3

3. Identification de modles flous TakagiSugeno (TS) partir de donnes


___________________________________________________________________________

tel-00136382, version 1 - 13 Mar 2007

Dans ce chapitre, nous traitons du problme didentification (construction) des modles flous partir de donnes entre-sortie. Nous introduisons dabord la modlisation floue de systmes, en nous focalisant particulirement sur le modle de type Takagi-Sugeno. En utilisant ce formalisme, nous reprsentons le comportement non linaire dun systme par une composition de rgles du type Si-Alors , concatnant un ensemble de sous-modles localement linaires. Pour la construction de tels modles nous abordons dune part, diffrentes mthodes de classification floue et, dautre part, nous proposons lapplication dune mthodologie d agglomration comptitive , robuste en prsence de bruit : il sagit des algorithmes FER43 et RoFER44. Les mthodes considres appartiennent aux mthodes de coalescence floue (clustering) bases sur la minimisation dune fonction objectif. Enfin aprs avoir considr la mthodologie gnrale pour la construction de modles flous TakagiSugeno partir de donnes, nous prsentons quelques exemples illustratifs dapplication.

43 44

FER : Fuzzy Ellipsoidal Regression. RoFER : Robust Fuzzy Ellipsoidal Regression.

74

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

Sommaire ___________________________________________________________________________

tel-00136382, version 1 - 13 Mar 2007

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

75

Le dveloppement de modles mathmatiques des systmes est un sujet central dans plusieurs disciplines des sciences et de lingnierie. Traditionnellement, la modlisation est vue comme la double conjonction entre la comprhension de la nature et du comportement dun systme ainsi que le traitement mathmatique appropri qui conduise lobtention dun modle utilisable. Nanmoins, le besoin dune forte comprhension des lments physiques de base - comme cest le cas dans lapproche de type bote blanche - constitue une grande restriction au niveau pratique quand on est confront aux systmes complexes et/ou pauvrement compris. Il est remarquer que les procds chimiques et biologiques font souvent partie de ces systmes. Dun autre ct, dans lapproche de type bote noire, il est suppos que le procd tudi peut tre reprsent en utilisant une structure gnrale qui approxime le comportement du systme. Dans ce cas, le problme de modlisation consiste alors proposer la structure approprie pour lapproximateur et destimer les paramtres du modle, en utilisant habituellement des donnes entre-sortie reprsentatives du comportement, afin de capturer correctement les dynamiques et la non linarit du systme. Le fait que les humains puissent souvent grer diffrents types de situations complexes en utilisant des informations dont beaucoup sont subjectives et imprcises a stimul la recherche de paradigmes alternatifs de modlisation et de commande. Ainsi, le concept de la modlisation dite floue a trouv ses origines dans la thorie des ensembles flous propose en 1965 par Zadeh [ZAD65], comme une manire de traiter lincertitude, fonde sur lide de dfinir des ensembles pouvant contenir des lments de faon graduelle. Cette thorie a introduit une manire de formaliser les mthodes humaines de raisonnement en utilisant des bases de rgles et variables linguistiques pour la reprsentation de connaissances [ZAD73]. Comme nous lavons dj soulign dans le chapitre 1, bien que la commande floue ait t une des grandes applications de la logique floue, la plupart des applications dveloppes dans les annes 80-90 avaient pour cadre une dmarche base connaissance reposant sur lexpertise dun oprateur pour un problme de commande donn, de complexit limite (contrleurs dits de type Mamdani). Lorsquon a voulu passer des problmes plus complexes, il tait difficile dcrire (mme pour un expert) des bases de rgles volumineuses et lapproche base connaissance ntait plus approprie. Pour pallier la croissance des rgles, des approches tels que la fusion des variables et la structuration de la commande ont t proposes [LAC03]. Dans le but de faire face un problme de commande complexe, on peut tirer profit de diffrents types de connaissance [BOR03] :
de lexpertise sur certains points limits, de modles locaux validit restreinte, de nombreuses donnes entres-sorties sur le procd.

tel-00136382, version 1 - 13 Mar 2007

Pour prendre en compte toutes ces connaissances, lapproche base connaissance/expertise, qui consistait crire directement un contrleur, ntait plus adapte et lon sest tourn vers une approche plus gnrale, rejoignant la dmarche classique de lautomatique qui est une dmarche base modle , grce notamment aux ides de modlisation floue de Sugeno [SUG88]. Cette dmarche amne manipuler des modles dits flous pour faire la synthse de commandes dites floues - mme si laspect flou est de moins en moins prsent dans ces nouveaux formalismes, rejoignant des formalismes utiliss par ailleurs, hors de la communaut du flou , par exemple ceux de commandes supervises, de systmes linaires variant avec le temps, de reprsentations polytopiques, etc. Comme on le verra, cette approche de conception de systmes flous base modle est en gnral plus systmatique, du point de vue des performance numriques, que celle base

76

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

connaissance/expertise, malgr le fait que plusieurs problmes thoriques restent encore ouverts [SAL05]. Dans ce chapitre nous prsentons les lments de base concernant lidentification de modles flous partir des donnes entre-sortie du procd. Nous nous intressons particulirement aux modles de type Takagi-Sugeno et leur construction en utilisant des techniques de coalescence floue (clustering). Une grande partie de ce chapitre est base sur les ouvrages [BAB98a] [FOU03a] [FOU03b]. Pour une tude plus vaste concernant les diverses aspects lis au domaine de la logique floue applique la modlisation et lidentification des systmes, nous suggrons les documents suivants : [YAG94] qui prsente une introduction complte et bien dveloppe au sujet de la modlisation et de la commande floues classiques ainsi que ses applications ; [MUR97] qui aborde tout un panorama de paradigmes existants, bases sur lapproche multi-modle, pour leur application en identification, modlisation et commande non linaires ; [HEL97] qui traite diffrentes approches pour lidentification de modles flous tels que les mthodes de clustering flou, les rseaux de neurones et les algorithmes gntiques ; [NGU98] qui considre divers aspects sur lutilisation de la logique floue pour la commande de systmes (techniques dapprentissage et de rglage) ainsi que des mthodes de synthse et des relations avec la commande linaire.
tel-00136382, version 1 - 13 Mar 2007

3.1. Modlisation floue de systmes


Les modles flous peuvent tre considrs comme des modles logiques qui utilisent des rgles du type SiAlors pour tablir des relations qualitatives entre les variables du modle. Ils reposent sur une dualit linguistique/numrique dans laquelle les ensembles flous servent dinterfaces entre les variables qualitatives (linguistiques) impliques dans les rgles et les valeurs numriques prsentes dans les donnes entres/sorties du modle. La nature des modles flous, base sur des rgles, permet lutilisation dinformation sous la forme des expressions du langage naturel, ce qui facilite la formalisation de la connaissance des experts ainsi que la transparence et linterprtabilit du modle. De plus, les modles flous ont une structure mathmatique flexible capable dapproximer un grand nombre de systmes non linaires complexes avec une bonne prcision [KOS94] [WAN94] [ZEN95]. Les algorithmes dapprentissage sont aussi utiliss pour la modlisation floue, ils peuvent mme tre combins avec des techniques conventionnelles de rgression [TAK85] [LIN94] [BAB98a]. Dans cette section nous introduisons dabord dune manire trs succincte la structure gnrale ainsi que diffrentes types de modles flous. Ensuite nous nous focalisons en particulier sur une description du modle flou de type Takagi-Sugeno. Enfin nous abordons le but et les diffrentes approches pour lidentification de modles flous en mettant laccent sur lapproche de construction de modles partir de donnes.

3.1.1.

Structure gnrale et diffrents types de modles flous

En gnral les systmes flous sappuient sur une reprsentation de la connaissance sous forme de rgles Si-Alors qui permettent de reprsenter les relations entre les variables dentre et de sortie dont lexpression gnrique est de la forme :
Si antcdent Alors consquent

Dans un premier temps et afin de faciliter linterprtation, on peut considrer lantcdent (prmisse) comme une description linguistique qui indique les conditions de validit du phnomne reprsent. Pour sa part, le consquent (conclusion) reprsente le comportement associ aux conditions de validit dcrites par lantcdent.

Identification de modles flous Takagi-Sugeno (TS) partir de donnes Considrons titre illustratif la rgle suivante :
Si concentration de polluant est leve Alors temps de dgradation est long

77

Les rgles floues tablissent des relations logiques entre les variables du systme en associant valeurs qualitatives dune variable (la concentration de polluant est leve) avec celles dune autre variable (le temps de dgradation est long). Les valeurs qualitatives ont typiquement une interprtation linguistique, elles sont nommes termes linguistiques (tiquettes). La signification des termes linguistiques par rapport aux variables dentre/sortie numriques (concentration de polluant, temps de dgradation) est dfinie par des ensembles flous appropris. Dans ce sens, les ensembles flous, ou plus prcisment leurs fonctions dappartenance, fournissent une interface entre les variables numriques dentre/sortie et les valeurs linguistiques qualitatives dans les rgles. Selon la structure particulire de la proposition consquent, on peut distinguer trois types de modles flous bass sur des rgles [BAB98a] :

tel-00136382, version 1 - 13 Mar 2007

Modle flou linguistique (ou modle Mamdani), dans lequel lantcdent et le consquent sont tout les deux des propositions floues qui utilisent des variables linguistiques [ZAD73] [MAM77]. Modle flou relationnel, qui peut tre considr comme une gnralisation du modle linguistique dans lequel il est possible dassocier une proposition antcdent spcifique avec plusieurs propositions consquents diffrentes via une relation floue. Cette relation floue reprsente des associations entre les ensembles flous individuels dfinis dans les domaines dentre/sortie du modle [PED84] [YI93]. Modle flou Takagi-Sugeno (TS), dans lequel le consquent utilise des variables numriques plutt que des variables linguistiques, sous la forme dune constante, dun polynme ou de manire plus gnrale dune fonction ou dune quation diffrentielle dpendant des variables associes la proposition antcdent [TAK85].

Dans le cadre des applications de la logique floue en commande des systmes, les types de modles les plus souvent utiliss sont ceux de Mamdani et de Takagi-Sugeno (not TS). Les exemples suivants correspondent ces deux types de rgles :
Si polluant est leve et biomasse est faible Alors temps de dgradation est long Si polluant est leve et biomasse est faible Alors t = 30 P + 50 B + 10

La premire rgle est celle dun modle de type Mamdani utilisant les variables linguistiques associes aux concentrations de polluant, biomasse et le temps de dgradation tandis que la seconde est celle dun modle de type Takagi-Sugeno o la variable t du consquent (temps de dgradation) est numrique sous la forme dune fonction des variables associes lantcdent. Ici P et B reprsentent respectivement les valeurs numriques des concentrations de polluant et de biomasse. Dans un cadre plus formel, la reprsentation dun modle flou demande souvent lutilisation de plusieurs rgles et comporte diverses oprations mathmatiques pour le traitement dinformations symboliques, hors de la porte de ce document. Dans la suite nous abordons dune manire succincte les notions de base de la logique floue applique la modlisation et la commande. Nous supposons que le lecteur a une connaissance pralable dans ce domaine. Nous recommandons aux personnes intresses de se rfrer, entre autres, aux ouvrages [DUB80] [BOU95] [YAG94] [BAB98a] pour un traitement plus approfondi.

78

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

Afin dtablir quelques lments de base de la logique floue ncessaires dans le cadre de nos travaux, reprenons une rgle linguistique Ri de la forme gnrale suivante :

Ri :

Si x est Ai Alors y est Bi,

i = 1,K , r

(3.1)

o r dnote le nombre de rgles du modle. x X p est la variable de lantcdent, qui reprsente lentre du systme et y Y q est la variable du consquent, qui reprsente la sortie du systme flou. Habituellement la dimension de lespace du consquent est prise comme q = 1 . X et Y correspondent respectivement aux domaines (univers de discours) des variables dentre et de sortie. Ai et Bi sont des termes linguistiques qui correspondent aux valeurs qualitatives associes aux variables de base x et y . Ces termes linguistiques sont dcrits par des ensembles flous dfinis par des fonctions dappartenance , qui tablissent une correspondance de chacun des univers de discours vers lintervalle [0,1], ainsi :

A (x) : X [0, 1] , B (y ) : Y [0, 1]


i i

(3.2)

tel-00136382, version 1 - 13 Mar 2007

La thorie des ensembles flous [ZAD65] permet une appartenance partielle dun lment un ensemble. Prenons titre dexemple Ai (x) , qui symbolise la valeur de la fonction dappartenance (nomm le degr dappartenance) de x lensemble caractris par Ai. Si le degr dappartenance est gal un, alors llment x appartient compltement lensemble. Si celui-ci est gal zro, alors llment x nappartient pas cet ensemble. Si le degr dappartenance se trouve entre zro et un, alors x appartient partiellement lensemble flou. Le degr dappartenance permet alors une gradation du degr de constatation des faits. Les ensembles flous Ai dfinissent des rgions floue dans lespace de lantcdent pour lequel la prmisse du consquent est valable. Le niveau de prcision avec lequel peut tre reprsent un systme donn par un modle flou est associ avec la granularit du traitement de linformation, qui dpend entre autres, du nombre de termes linguistiques ainsi que de la forme particulire et du degr de chevauchement (overlaping) des fonctions dappartenance utilises dans le modle. Typiquement plusieurs formes de fonctions dappartenance sont utilises dans les applications. La Figure 3.1 montre un aperu des fonctions dappartenance les plus usuelles :

Figure 3.1. Formes typiques reprsentatives des fonctions dappartenance

Les fonctions dappartenance peuvent tre dfinies par le dveloppeur du modle (lexpert) en utilisant la connaissance pralable ou bien lexprimentation. Cette dernire approche est typique de la commande floue base sur la connaissance [DRI93]. Dans ce cas,

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

79

les fonctions dappartenance sont conues de telle manire quelles reprsentent la signification des termes linguistiques dans le contexte donn. Quand des donnes entre-sortie du procd sont disponibles, il est alors possible dappliquer des mthodes pour lobtention ou ladaptation des fonctions dappartenance. Nous donnons un aperu de cette approche dans la section 3.2. Dans les univers de discours continus, les ensembles flous sont dfinis analytiquement par des fonctions dappartenance. Afin de faciliter les calculs, elles sont souvent paramtres [BAB98a]. Voyons deux cas assez gnraux :

Fonction dappartenance trapzodale :

( x; a, b, c, d ) = max 0, min

d x xa , 1, d c ba

(3.3)

o a, b, c, d sont les coordonnes des sommets du trapze (voir Figure 3.1). Il faut remarquer que quand b = c on obtient une fonction dappartenance triangulaire.
tel-00136382, version 1 - 13 Mar 2007

Fonction dappartenance exponentielle par morceaux :


xc l exp w 2 l xc r ( x; cl , c r , wl , wr ) = exp w 2 r 1 si 2 si
2

x < cl x > cr
(3.4)

les autres cas

o les paramtres { wl , wr , cl et c r } correspondent aux points dfinis sur la Figure 3.1. Pour les conditions cl = c r et wl = wr , on obtient la fonction dappartenance Gaussienne. En revenant sur la rgle linguistique gnrale dcrite par lexpression (3.1), les systmes flous bass sur des rgles du type SiAlors ont des antcdents et des consquents qui sont spcifis de manire symbolique. Dans le cadre de la modlisation et la commande de systmes, lexploitation dune telle connaissance ncessite en gnral la mise en place dinterfaces numrique/symbolique (N/S) et symbolique/numrique (S/N). Ces dernires sont en effet des passerelles indispensables ltablissement dun lien entre lensemble de rgles (base de rgles) qui interfacent le systme flou et le procd, sur lequel seules des mesures et des actions numriques sont envisageables. De manire classique, le fonctionnement interne des systmes flous repose sur une structure, reprsente sur la Figure 3.2 [BAB98a] [GAL01], qui inclut : - la fuzzification des variables dentre, avec ventuellement un prtraitement45 de linformation ; - linfrence partir dune base de connaissance, - la dfuzzification, avec ventuellement un post-traitement dinformation.
45

Dans la plupart des applications dingnierie, les entres et les sorties sont des valeurs numriques. Dans ce cas, les ventuels prtraitement et post-traitement dinformation peuvent inclure des oprations telles que le filtrage dynamique et la normalisation/dnormalisation des donnes.

80

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

Figure 3.2. Reprsentation interne dun systme flou

tel-00136382, version 1 - 13 Mar 2007

Ltape de fuzzification consiste transformer les entres numriques disponibles en parties floues. Celles-ci alimentent alors le mcanisme dinfrence qui partir dune valeur dentre et selon la connaissance fournie par la basse de connaissance, dtermine la valeur correspondante de la sortie. Cette base de connaissance est compose par la base de rgles et par la base de donnes, qui stocke les fonctions dappartenance associes aux termes linguistiques employs dans le systme flou. Cela constitue le fondement du raisonnement approch du systme, car la combinaison des entres avec les rgles floues permet de tirer des conclusions. Enfin, la dfuzzification est lopration inverse de la fuzzification, en convertissant les parties floues relatives aux sorties du mcanisme dinfrence en sorties numriques.

Remarque
R 3.1

Bien que nous ayons associ - titre illustratif - une interprtation de conversion numrique/symbolique pour ltape de fuzzification et inversement pour celle de dfuzzification, il doit tre soulign que des tudes approfondie [FOU95] ont montr quil sagit dun cas particulier. En effet, en considrant la nature numrique ou symbolique des donnes entrant et sortant du bloc dinfrence, il est possible de mettre en vidence diffrentes implantations possibles sous la forme dune typologie des systmes flous. Ainsi, limplantation montr sur la Figure 3.2 est dite linguistique, ce sont les blocs de fuzzification et de dfuzzification qui ralisent les interfaces N/S et S/N. Elle permet de mener bien linfrence directement au niveau symbolique et autorise ainsi lexploitation de rgles linguistiques pondres [GAL01].

Prmisses de lantcdent et composition de la base de rgles


La proposition de lantcdent peut contenir des ensembles flous dfinis directement dans le domaine du vecteur x X p , comme dans le cas de la rgle (3.1), ce qui correspond aux ensembles flous multidimensionnels. Nanmoins, plus habituellement les rgles sont reprsentes sous sa forme dcompose, dans laquelle lantcdent est dfini comme une combinaison de propositions floues simples, dfinies sur les composants individuels xi de x . Les oprateurs logiques de conjonction (intersection), disjonction (union) et ngation (complment) peuvent tre utiliss afin de construire une proposition floue compose, par exemple :

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

81

Ri :

Si x1 est Ai1 et x 2 est Ai 2 ou x3 nest pas Ai 3 Alors y est Bi

(3.5)

dans laquelle des ensembles flous unidimensionnels sont dfinis pour chaque composant du vecteur antcdent. Le degr daccomplissement i (degree of fulfillment) de la rgle est alors calcul en employant les oprateurs dintersection, dunion et de complment appropris, par exemple : i = Ai1 ( x1 ) Ai 2 ( x 2 ) (1 Ai 3 ( x3 )) (3.6) o loprateur minimum ( ) reprsente dans ce cas la conjonction (et), loperateur maximum ( ) reprsente la disjonction (ou), et 1 est le complment (ngation : nest pas). Nanmoins, la gnralisation des oprations dunion et dintersection ensembliste classique aux sous-ensembles flous nest pas dfinie de manire unique. Il existe, en fait, une multitude doprateurs de disjonction et de conjonction utiliss dans les propositions floues. Ces operateurs sont regroups en deux familles : les normes triangulaires, notes t-normes, qui dfinissent les oprateurs dintersection ou de conjonction et les conormes triangulaires, notes t-conormes, qui dfinissent les oprateurs dunion ou de disjonction. De manire gnrale ces operateurs sont des fonctions dfinies dans lespace [0, 1] x [0, 1] [0, 1], mais elles ont des proprits distinctes qui vont influencer le type de raisonnement approch qui va en dcouler [BOU95]. En prenant comme les oprandes x, y [0, 1] , le Tableau 3.1 regroupe quelques dfinitions de t-normes ( t ( x, y ) ) et t-conormes46 ( s ( x, y ) ) duales utilises frquemment [BAB98a] [TRA03]. Pour plus de dtails sur les diffrents oprateurs le lecteur peut consulter, par exemple, [KLI95] [LEE90a] [LEE90b]. t-norme : t ( x, y ) (intersection floue) t-conorme : s ( x, y ) (union floue) Nom min et max de Zadeh Produit et somme algbrique (Bandler) Produit et somme borns (Lukasiewicz)

tel-00136382, version 1 - 13 Mar 2007

min ( x, y )

max ( x, y )
x+ y x y

x y max (0 , x + y 1)

min (1, x + y )

Tableau 3.1. Principales t-normes et t-conormes

Les systmes dinfrence floue (SIF) sont composs par une collection de plusieurs rgles. Dans le cas des SIF avec une structure Mamdani conventionnelle (modle linguistique), la forme la plus commune de ces rgles est la forme dite conjonctive47 donne par :

Ri :

Si x1 est Ai1 et x 2 est Ai 2 et et x p est Aip Alors y est Bi

(3.7)

Pour li-me rgle Ri du systme, les p variables ( x1 x p ) de lantcdent sont associes aux ensembles flous ( Ai1 Aip ) et le consquent y est associ un autre ensemble flou Bi . Les termes linguistiques reprsents par Ai et Bi sont dfinis par des ensembles flous
46 47

Dans la littrature anglaise les t-conormes sont souvent appeles aussi s-normes. La base de rgles est suppose tacitement reli par loprateur ou (union) : R1 ou R2 ou ou Rr.

82

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

caractriss par des fonctions dappartenance Ai (x) : p [0, 1] et Bi ( y ) : [0, 1] . Dans ce cas on peut voir le systme flou comme une reprsentation qualitative qui dcrit le comportement du systme en utilisant une description linguistique.

Infrence et dfuzzification dans le modle linguistique


Linfrence dans les systmes flous bass sur des rgles, est le processus consistant obtenir un ensemble flou de sortie tant donn une collection de rgles et les entres du systme. Le mcanisme dinfrence dans le modle linguistique est bas sur la rgle compositionnelle dinfrence [ZAD73]. Lide de base consiste driver un ensemble flou de sortie qui reprsente une conclusion globale issue de lvaluation de lensemble des rgles (agrgation) et du constat dun certain fait dentre. Par simplicit, considrons ici une seule rgle avec antcdent et consquent scalaires de la forme "Si x est A Alors y est B " ainsi que le fait ( x est A ' ), qui signifie que le sous-ensemble flou dentre A ' est en un certain degr diffrent du sous-ensemble A de la prmisse. Le raisonnement men dans le mcanisme dinfrence est bas sur le modus ponens gnralis, illustr de la manire suivante :
tel-00136382, version 1 - 13 Mar 2007

Rgle : Fait : Conclusion :

Si x est A Alors y est B x est A ' y est B '

Le raisonnement approch est reprsent dans ce cas par la proposition floue ( y est B ' ), qui met en vidence que la conclusion B ' driv est "moins certaine" que B , le sousensemble flou du consquent. Pour le cas des entres numriques prcises (crisp) et en utilisant la t-norme, le schma de raisonnement peu tre simplifi, aboutissant celui bien connu dans la littrature appel le max-min ou infrence de Mamdani [KLI95]. Pour le cas de la rgle compose dfinie par lexpression (3.7), linfrence de Mamdani peut tre rsume comme suit [BAB98a] : Pas 1 : Pour chaque rgle Ri daccomplissement i de lantcdent :
i1 i2

du

systme

( i = 1,K , r ),

calculer

le

degr

i = A ( x1 ) A ( x 2 ) K A ( x p )
ip

(3.8)

Pas 2 : Lensemble flou de sortie Bi ' est driv pour chaque rgle, en utilisant la t-norme du minimum : B ' ( y ) = i Bi ( y ), y Y (3.9)
i

Pas 3 : Lensemble flou de sortie agrg B ' est calcul en prenant le maximum (union) des conclusions individuelles Bi ' :

B ( y ) = max B ( y ),
'

i =1, 2 ,K, r

' i

y Y

(3.10)

Lexpression (3.32) peut tre gnralise en introduisant des oprateurs quelconques de type t-norme/t-conorme (voir par exemple [DUB87] [BOU93]). Le sous-ensemble flou de sortie B ' peut alors tre obtenu par lexpression :

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

83

B' ( y) =

i =1, 2 ,K, r

T ( A' ( x), I ( A ( x), B ( y )) ),

y Y

(3.11)

o reprsente une t-conorme, T est une t-norme et I reprsente limplication floue. Cette dfinition gnrale tient compte de laspect graduel des sous-ensembles flous : ainsi la conclusion ( y est B ' ) est dautant plus proche de la conclusion de la rgle ( y est B ) que la donne ( x est A ' ) est proche du prmisse de la rgle ( x est A ). Dans les SIF le traitement des informations fait intervenir les oprateurs logiques et et ou pour lier les variables floues dentre au niveau des conditions de chaque rgle. Le terme Alors, introduisant la conclusion de chaque rgle, est ralise partir de lexpression (3.11). Limplication floue (I) et la t-norme de cette expression permettent de former des fonctions dappartenance partielles (par rgle) qui sont ensuite combins au cours de la phase dagrgation de rgles, pour fournir en sortie, la fonction dappartenance globale rsultante B ' ( y ) qui caractrise le sous-ensemble flou B ' . Nous lavons dj soulign, il existe plusieurs mthodes de ralisation des oprateurs et ou ou, dont les noms sont associs au choix des mthodes dagrgation des rgles et dimplication. On utilise gnralement lune des trois mthodes dinfrence suivantes : max-min (Mamdani), max-prod et somme-prod, o le terme somme correspond au calcul de la valeur moyenne et prod au produit. Comme on vient de le voir, le rsultat de linfrence floue est le sous-ensemble flou B ' . Cet ensemble flou est caractris par la fonction dappartenance globale rsultante pour la variable de sortie y Y dfinie sur un univers de discours, disons, [a, b] . Comme nous lavons remarqu dans la Figure 3.2 pour le bloc de fuzzification, ici aussi il faudra envisager lopration inverse permettant de transformer les grandeurs floues en grandeurs numriques pour les transmettre lextrieur du systme. La dfuzzification consiste alors en une transformation qui remplace le sous-ensemble flou de sortie de linfrence par une valeur numrique unique reprsentative de cet ensemble. Il existe plusieurs techniques de dfuzzification mais la plus utilise est la mthode par centre de gravit. Il sagit de dterminer la coordonne en y du centre de gravit (not COG48) du sous-ensemble flou B ' rsultant de linfrence :
cog ( B' ) =

tel-00136382, version 1 - 13 Mar 2007

y B ' ( y )dy
a

B ' ( y )dy
a

(3.12)

Le numrateur correspond au moment et, le dnominateur, la surface. La dfuzzification peut aussi tre ralise par dautres mthodes, par exemple en prenant la valeur maximale de la fonction dappartenance rsultante ou bien la moyenne des abscisses du maximum (en anglais MOM49). A partir dune interprtation gomtrique de cette dernire, la mthode MOM peut tre utilise par exemple dans des applications de prise de dcisions pour privilgier la sortie la "plus plausible". La mthode du centre de gravit (COG) est utilise avec linfrence max-min de Mamdani, dans la mesure quelle fournit une interpolation proportionnelle la taille des sous-ensembles flous individuels des consquents. Cela est ncessaire, car la mthode dinfrence de Mamdani na pas deffet interpolateur, et lutilisation de la mthode MOM dans ce cas-ci, fournit une sortie abrupte avec des changements par morceaux [BAB98a].
48 49

COG : Center of Gravity MOM : Mean of Maxima

84

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

3.1.2.

Le modle flou de type Takagi-Sugeno

Un autre type de modle flou, appropri pour lapproximation dune classe gnrale de systmes non linaires est celui propos par Takagi et Sugeno [TAK85]. Ce type de modle est, comme celui de Mamdani, construit partir dune base de rgles "SiAlors", dans laquelle si la prmisse est toujours exprime linguistiquement, le consquent utilise des variables numriques plutt que des variables linguistiques. Le consquent peut sexprimer par exemple, sous la forme dune constante, dun polynme ou de manire plus gnrale dune fonction ou dune quation diffrentielle dpendant des variables associes lantcdent. Dune manire gnrale, un modle de type Takagi-Sugeno (TS) est bas sur une collection des rgles Ri du type : Ri : Si x est Ai Alors y i = f i (x) , i = 1,K, r (3.13) o Ri dnote la i-me rgle du modle est r est le nombre de rgles que contient la base de rgles. x p est la variable dentre (antcdent) et y est la variable de sortie (consquent). Ai est le sous-ensemble flou de lantcdent de li-me rgle, dfinie, dans ce cas, par une fonction dappartenance (multivariable) de la forme :
tel-00136382, version 1 - 13 Mar 2007

A (x) : p [0, 1]
i

(3.14)

Comme dans le modle linguistique, la proposition de lantcdent " x est Ai " est normalement exprime comme une combinaison logique de propositions simples avec des sous-ensembles flous unidimensionnels dfinis pour les composants individuels du vecteur x , usuellement dans la forme conjonctive suivante :

Ri :

Si x1 est Ai1 et x 2 est Ai 2 et et x p est Aip Alors y i = f i (x) ,

i = 1,K , r

(3.15)

Typiquement les fonctions fi sont choisies comme des fonctions paramtres appropries, avec la mme structure pour chaque rgle o seuls les paramtres varient. Une forme de paramtrisation souvent utilise est la forme affine, donne par :

yi = a T i x + di

(3.16)

o a i p est un vecteur de paramtres et d i est un scalaire. Ce modle est appel le modle affine Takagi-Sugeno. Les conclusions des rgles dans ce modle sont alors des hyperplans (sous-espaces linaires p-dimensionnels) dans lespace p +1 . Ainsi, en modlisation floue des systmes, lantcdent de chaque rgle dfinit une rgion (floue) de validit pour le sous-modle correspondant du consquent. Le modle global est compos par la concatnation des modles locaux (linaires) et peut tre vue comme une approximation par morceaux dune surface non linaire correspondant la sortie du systme. Un cas particulier de la fonction du consquent sobtient quand d i = 0, i = 1,K, r . Dans ce cas, le modle est appel modle homogne Takagi-Sugeno [BAB98a], de la forme :

Ri :

Si x est Ai Alors y i = a T i x,

i = 1, K, r

(3.17)

Ce modle a des proprits dapproximation plus limites que le modle affine TS [FAN96] [ROV96]. Cependant, dans le cadre de la commande des systmes, labsence du terme scalaire d i 50 (biais) facilite la synthse du contrleur ainsi que lanalyse de la stabilit
50

Terme de dplacement (En anglais : offset term ou bias term).

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

85

bas sur des systmes homognes TS parce que le modle peut tre trait comme un modle quasi-linaire [TAN92] [WAN95] [ZHA97]. Dans le cas o a i = 0, pour i = 1,K, r , les consquents dans le modle (3.16) prennent la forme dune constante. Dans ce cas, le modle, appel singleton, est obtenu par :

Ri :

Si x est Ai Alors y i = d i ,

i = 1,K , r

(3.18)

Ce modle peut aussi tre vu comme un cas particulier du modle flou linguistique, dans lequel les sous-ensembles flous des consquents se rduisent aux singletons.

Infrence dans le modle Takagi-Sugeno

i (x) de lantcdent. Pour les rgles avec des sous-ensembles flous multivariables dans

Avant de pouvoir infrer la sortie, il faut calculer dabord le degr daccomplissement

tel-00136382, version 1 - 13 Mar 2007

lantcdent (cf. expressions (3.13) et (3.14)), le degr daccomplissement est simplement gal au degr dappartenance de lentre multidimensionnelle x ; cest--dire i = A i (x) . Quand des connectives logiques sont utilises, le degr daccomplissement de lantcdent est calcul comme une combinaison des degrs dappartenance des propositions individuelles en utilisant les oprateurs de la logique floue. Dans la modlisation Takagi-Sugeno, lobtention de la sortie du modle est ralise partir dune combinaison des oprations dinfrence et de dfuzzification [GAL01]. La sortie finale se calcule comme la moyenne des sorties correspondants aux rgles Ri , pondres par le degr daccomplissement normalis, selon lexpression [TAK85] :
y=

i ( x) y i
i =1

i ( x)
i =1

(3.19)

En notant i le degr normalis daccomplissement conformment lexpression :

i =

i ( x)

i (x)
i =1

(3.20)

le modle affine Takagi-Sugeno, avec une structure commune du consquent, peut tre exprim comme un modle pseudo-linaire avec des paramtres dpendants des entres :
T y = ( i (x)a T i ) x + i ( x ) d i = a ( x ) x + d ( x ) i =1 i =1 r r

(3.21)

Les paramtres a(x) et d (x) sont des combinaisons linaires convexes des paramtres des consquents a i et d i , de la forme :
a(x) = i (x)a i , d (x) = i (x) d i
i =1 i =1 r r

(3.22)

De cette faon, le modle TS peut tre vu comme une correspondance (mapping) entre lespace de lantcdent (entre) et une rgion convexe (polytope) dans lespace des paramtres dun systme quasi-linaire. Cette proprit a certains avantages qui facilitent lanalyse des systmes flous TS dans le cadre des systmes polytopiques [BOY94].

86

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

Cependant, cette reprsentation a aussi des proprits indsirables dinterpolation qui affectent la capacit dapproximation des systmes. En effet, une amlioration du mcanisme dinfrence du modle TS a t propose [BAB96a]. Lide centrale consiste, partir de lanalyse des proprits du mcanisme dinfrence/interpolation conventionnel du modle TS, remplacer lexpression de la moyenne pondre (3.19) afin dadoucir linterpolation. Dans le cadre de lidentification des systmes, un systme flou approxime typiquement un modle de rgression dynamique non linaire de la forme :

y (k + 1) = f NL (x(k ))

(3.23)

o f NL reprsente la fonction non linaire et le vecteur de rgression x(k ) linstant k contient une collection des entres u et des sorties y prcdentes du systme. Bien que les modles de Mamdani et de Takagi-Sugeno soient les plus utiliss, dans le contexte des systmes dynamiques le modle TS lest plus frquemment51 car il est mieux adapt pour le traitement et lexploitation numrique des systmes entres/sorties multiples. Les rgles du modle dynamique TS prennent alors la forme gnrale suivante :
tel-00136382, version 1 - 13 Mar 2007

Ri :

Si z (k ) est Ai Alors y i (k + 1) = T i w (k ) ,

i = 1, K, r

(3.24)

o les variables de lantcdent z (k ) et du consquent w (k ) sont usuellement choisies partir du vecteur de rgression x(k ) . Le modle a deux jeux de paramtres, les paramtres i des consquents et les paramtres dfinissant les fonctions dappartenance pour les sousensembles flous Ai . Ainsi, le modle flou de type Takagi-Sugeno peut approximer les systmes non linaires avec des non linarits douces et abruptes ( travers la structure des consquents et la forme des fonctions dappartenance). Il permet de faire un choix spcifique des variables de lantcdent et du consquent (e.g., systmes Wiener et Hammerstein) [ABO03] et de modliser des structures dynamiques qui changent en fonction de variables connues (systmes commuts, modes de dfaillance, etc.) [SAL05]. Dans le cadre de nos travaux, nous nous sommes particulirement intresss aux modles dynamiques affines Takagi-Sugeno en temps discret sous la forme Non Linaire AutoRgressive avec entre eXogne (NARX). Ce type de modle tabli une relation entre les , de la manire suivante : valeurs prcdents des entres et sorties avec la sortie prdite y (k + 1) = f NL ( y (k ),K , y (k n y + 1), u (k ),K, u (k nu + 1)) y (3.25)

o k dnote linstant dchantillonnage, ny et nu sont des entiers lis lordre (structure) du systme. Une fois que la structure approprie est tablie, la fonction fNL peut tre approxime en utilisant une rgression statique non linaire, correspondant dans notre cas au modle flou de type TS. Dans le modle NARX, le vecteur de rgression est compos par un certain nombre dentres et de sorties prcdentes, x = [y(k),,y(k-ny+1), u(k),,u(k-nu+1)]T (k + 1) est la sortie prdite. Le cas des systmes avec retard pur entre lentre et la sortie et y peut tre directement incorpor sur le vecteur de rgression sous la forme donne par x = [y(k),,y(k-ny+1), u(k-nd+1),,u(k-nd-nu+2)]T, o nd est une valeur entire du retard en nombre dchantillons. Par simplicit, nous prenons par la suite nd = 1.
51

En effet, les modles flous de type TS sont souvent associs une recherche de performance numrique alors que ceux de Mamdani sont orients vers une possible prise en compte des connaissances expertes [GAL01]. Cependant, lorsquil sagit de systmes complexes avec un grand nombre de variables en entre et sortie, le nombre de rgles dvient prohibitif. Lapproche TS est alors mieux adapte pour diminuer le nombre de rgles.

Identification de modles flous Takagi-Sugeno (TS) partir de donnes Dans ce cas les rgles du modle dynamique affine TS prennent la forme :

87

Ri :

Si y (k ) est Ai1 et y (k 1) est Ai 2 et et y (k n y + 1) est Ain y et u (k ) est Bi1 et u (k 1) est Bi 2 et et u (k nu + 1) est Bin u Alors y i (k + 1) = aij y (k j + 1) + bij u (k j + 1) + d i ,
j =1 j =1 ny nu

(3.26)

i = 1, K, r

La sortie globale du modle est calcule partir de lexpression :


y (k + 1) = i (k ) y i (k + 1)
i =1 r

(3.27)

Dans laquelle i (k ) [0 , 1] est le degr normalis daccomplissement conformment lexpression (3.136) et

i =1 i (k ) = 1 .
r

tel-00136382, version 1 - 13 Mar 2007

Il faut remarquer que le modle flou dynamique Takagi-Sugeno reprsent par les rgles de la forme (3.26) inclut aussi le cas di = 0 dit homogne [BAB98a] ou linaire [ZHA97]. Cependant, il convient galement de souligner que le terme "linaire" signifie tout simplement que la sortie individuelle de chaque rgle est une combinaison linaire des rgresseurs. En effet, le modle dynamique reprsent par lexpression (3.26) est en ralit non linaire car les coefficients du modle dpendent non linairement des entres et sorties du systme via le degr normalis daccomplissement. Le fait que le terme indpendant di ne soit pas considr dans le modle homogne limite ces capacits dapproximation par rapport au modle affine, mais dautre part, facilite normment la synthse de la commande ainsi que lanalyse de la stabilit. En effet, certaines mthodes ont t dvelopps pour la synthse de contrleurs avec des caractristiques de performance dsir en boucle ferm [FIL96] [ZHA97] ainsi que pour lanalyse de la stabilit [TAN92] [TAN96]. Dans le cadre de la modlisation de systmes, le modle flou dynamique de type TakagiSugeno permet aussi la reprsentation dautres structures non linaires entre-sortie utiliss frquemment, telles que les formes NOE52 et NARMAX53. Cependant, dans une approche didentification partir des donnes entre-sortie, le problme de rgression dans ces structures doit tre rsolu itrativement car le vecteur de rgression ne peut pas tre construit directement partir des donnes puisque il contient les valeurs prcdentes de la sortie du modle. En principe, les mthodes didentification par clustering, que nous aborderons dans la section 3.3, peuvent tre appliques ces structures, mais comme ces mthodes de clustering flou sont itratives, cela amne un problme doptimisation plutt complexe [BAB98a]. Par la suite nous nous sommes intresss aux modles dynamiques affines TS du type NARX. Dautre part, dans le modle dynamique reprsent par (3.26)-(3.27) il est suppos que y est un scalaire, cest--dire, le systme tudi est un systme de type MISO54. Avec les modles entre-sortie, les systmes MIMO55 peuvent tre reprsents de deux manires : soit la fonction non linaire fNL est une fonction vectorielle, soit le systme MIMO est dcompos dans un ensemble de systmes MISO coupls. En modlisation flou lapproche de
52 53 54 55

NOE : Nonlinear Output Error. NARMAX : Nonlinear AutoRegressive Moving Average with eXogenenous inputs. MISO : Multiple-Input Single-Output. MIMO : Multiple-Input Multiple-Output.

88

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

dcomposition est la plus adopte. La raison est quil y a plus de flexibilit si chaque sortie est associe diffrent type de non linarit pour la mme rgion de lespace de lantcdent [BAB98a]. En dcomposant le systme MIMO en plusieurs sous-systmes MISO, le nombre de fonctions dappartenance et de rgles peut tre rduit. Dans la suite de ce mmoire nous utilisons cette dernire approche. En plus de la reprsentation des structures entre-sortie les plus frquentes, les modles flou dynamiques de type Takagi-Sugeno peuvent aussi reprsenter les systmes non linaires sous la forme despace dtat :

x(k + 1) = g (x(k ), u(k ))

y (k ) = f (x(k ))

(3.28)

tel-00136382, version 1 - 13 Mar 2007

o g et h sont des fonctions statiques. La fonction g , nomme la fonction de transition dtat, tablie la correspondance entre ltat actuel x(k ) et lentre u(k ) avec le nouveau tat x(k + 1) . Quant elle, la fonction f tablie la correspondance entre ltat actuel x(k ) et la sortie du systme y (k ) . Un exemple dune reprsentation base sur des rgles dun systme non linaire dans lespace dtat est le modle dynamique Takagi-Sugeno suivant : Ri :
x(k + 1) = A i x(k ) + B i u(k ) Si x(k ) est Ai et u(k ) est Bi Alors , y ( k ) = C i x(k )

i = 1,K, r

(3.29)

Le modle comporte r rgles dans lesquelles Ai et Bi reprsentent des sous-ensembles flous, les matrices A i , B i et C i sont des matrices de dimensions appropris associs la reprsentation de la dynamique du systme. La sortie globale du modle est dtermine en utilisant le mme principe de calcul (moyenne pondre) prsent dans lquation (3.27). Comme nous lavons vu, le modle dynamique flou de type Takagi-Sugeno comporte les paramtres de lantcdent et du consquent pour chacune des rgles. Dans la section suivante nous donnons un aperu gnral sur la construction des modles flous. Nous nous sommes plus spcialement intresss lidentification de modles dynamiques TS en utilisant des donnes entre-sortie du procd. Nous dvelopperons lapproche didentification base sur des mthodes de clustering flou dans la section 3.3.

3.2. Identification (Construction) de modles flous


Typiquement, la construction de modles flous peut se faire partir de deux sources dinformation diffrentes, telles que la connaissance pralable et les donnes (mesures du procd). La connaissance pralable peut tre plutt dune nature qualitative ou heuristique, issue de la connaissance des "experts", i.e., des designers de processus, des oprateurs. Dans ce sens, les modles flous peuvent tre vus comme des systmes experts flous [ZIM87]. Dun autre ct, pour certains procds, des donnes sont disponibles sous forme denregistrements de lopration du procd ou bien il est possible de raliser des expriences didentification afin dobtenir les donnes appropris du comportement du systme. La construction de modles flous partir de donnes implique des mthodes bases sur la logique floue et le raisonnement approch, mais aussi des ides issues du domaine des

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

89

rseaux de neurones, de lanalyses de donnes et de lidentification conventionnelle de systmes [HEL97]. Lutilisation des techniques et dalgorithmes pour la construction de modles flous partir de donnes est habituellement appele identification floue [BAB98a]. Deux approches principales pour lintgration de la connaissance et des donnes dans un modle flou peuvent tre distingues : 1. La connaissance experte exprime sous une forme verbale est traduite dans une collection de rgles du type "Si-Alors". De cette faon, une certaine structure du modle est cre. Les paramtres dans cette structure (fonctions dappartenance, paramtres des consquents) peuvent tre rgls avec prcision en utilisant les donnes entre-sortie. Les algorithmes particuliers dajustement exploitent le fait quau niveau du calcul, le modle flou peut tre vu comme une structure par couches (rseaux), similaire aux rseaux artificiels de neurones, pour laquelle des algorithmes standard dapprentissage peuvent tre appliqus. Cette approche est habituellement nomme modlisation neurofloue [JAN93] [PED95]. Aucune connaissance antrieure nest initialement utilise pour formuler les rgles et le modle flou est construit partir des donnes. On sattend ce que les rgles extraites puissent fournir une interprtation postrieure sur le comportement du systme. Un expert peut confronter cette information avec sa propre connaissance, peut modifier les rgles ou fournir de nouvelles rgles et peut concevoir de nouvelles expriences additionnelles afin dobtenir plus de donns informatives.

tel-00136382, version 1 - 13 Mar 2007

2.

Ces techniques peuvent, videmment, tre combines selon lapplication particulire. Dans la suite, nous dcrivons les tapes principales pour la slection de la structure dun modle flou ainsi que pour la dtermination de paramtres partir de donnes entre-sortie.

3.2.1.

Structure du modle flou

En modlisation floue des systmes, la slection de la structure implique habituellement les choix suivants :

Variables dentre et de sortie. Dans les systmes complexes, il nest pas toujours facile de dterminer quelles variables devraient tre employes comme entres du modle. Dans le cas des systmes dynamiques, on doit galement estimer lordre du systme. Pour le modle entre-sortie NARX reprsent par lexpression (3.25) cela signifie quil faut dfinir le nombre de retards, dentre et de sortie, nu et ny. Plusieurs sources dinformation typiques permettent de faciliter ce choix, tels que la connaissance pralable (e.g., connaissance sur le comportement du systme). Parfois, des mthodes de slection automatique de structure (lordre du systme) bases sur des donnes peuvent tre utilises pour comparer diffrents choix en termes de critres de performance [HE93] [BOM98] [RHO98] [HAD02] [FEI04] [SIN04] [UNR07]. Structure des rgles. Ce choix implique le type de modle (linguistique, singleton, Takagi-Sugeno) et la forme de lantcdent (fonctions dappartenance multivariables ou dans la forme compose). Nombre et type de fonctions dappartenance pour chaque variable. Ce choix dtermine le niveau de dtail (granularit) du modle. De nouveau, le but de la

90

Identification de modles flous Takagi-Sugeno (TS) partir de donnes modlisation ainsi que la connaissance disponible vont influencer cette slection. Des mthodes automatiques bases sur des donnes peuvent tre utiliss pour ajouter ou supprimer des fonctions dappartenance dans le modle.

Type de mcanisme dinfrence, oprateurs logiques, mthode de dfuzzification. Ces choix sont restreints par le type de modle flou choisi (Mamdani ou TS), ainsi que par les oprateurs flous slectionns. Pour faciliter loptimisation des modles flous base sur les donnes (apprentissage), des operateurs diffrentiables (produit, somme) sont souvent prfrs aux oprateurs standard min et max.

tel-00136382, version 1 - 13 Mar 2007

Une fois que la structure est fixe, la performance de la mthode de modlisation peut tre rgle avec prcision en ajustant les paramtres. Les termes ajustables des modles linguistiques sont les paramtres des fonctions dappartenance de lantcdent et du consquent (dtermination de sa forme et de sa position) ainsi que les rgles (dtermination de la correspondance entre les rgions floues de lantcdent et du consquent). Pour leurs parts, les modles flous Takagi-Sugeno ont des paramtres tant dans les fonctions dappartenance de lantcdent que dans les fonctions du consquent (paramtres a i , b i , d i pour le modle dynamique affine TS (3.26)). Un aperu gnral du problme didentification et donn dans le paragraphe suivant.

3.2.2.

Le problme didentification et ses solutions

Les deux tapes de base en identification des systmes sont la dtermination de la structure et lestimation des paramtres. Le choix de la structure du modle (variables, fonctions dappartenance, etc,) est trs important, car elle dtermine la flexibilit du modle dans lapproximation des systmes. Un modle avec une structure riche peut approximer des fonctions plus compliques, mais, en mme temps, il aura des proprits de gnralisation plus mauvaises. Le problme destimation de paramtres peut tre formul comme la minimisation dun critre non linaire des moindres carrs, de la faon suivante : T { 1 ,K, r , 1 ,K, r } = arg min y k i ( z k , i ) i w k
n r k =1 2

i =1

(3.30)

o les variables de lantcdent z et du consquent w sont choisies partir du vecteur de rgression x , et n correspond au nombre disponible de paires de donnes (x k , y k ) , pour k = 1,K , n . Les paramtres libres sont les vecteurs des paramtres de lantcdent et du consquent ( i et T i ). i ( z ) reprsente le degr normalis daccomplissement pour li-me rgle, tant donne une base de r rgles. Les techniques doptimisation gnralement utilises peuvent tre divises en deux principales catgories [SAL05] : (1) Mthodes bases sur loptimisation globale de tous les paramtres, tels que les algorithmes gntiques, les techniques dapprentissage neurofloue (rtropropagation du gradient et ses variantes), clustering flou dans lespace produit entre-sortie, etc. (2) Mthodes qui exploitent le fait que lexpression (3.30) est non linaire en i (du la paramtrisation non linaire des fonctions dappartenance) et quelle est linaire en i. Typiquement, le problme destimation linaire est rsolu comme un problme local chaque itration du problme doptimisation des paramtres de lantcdent. Comme en principe toutes les mthodes de rgression non linaire peuvent tre adoptes pour la modlisation floue, alors lventail des techniques disponibles est vaste. Nanmoins, la construction des modles flous implique un compromis entre plusieurs caractristiques,

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

91

telles que la prcision, la transparence et linterprtabilit du modle [JIN00] [GUI01]. Beaucoup de recherches ont t aussi consacres aux mthodes de rduction de la complexit de systmes flous, par exemple en utilisant des mesures de similarit [SET98], transformations orthogonales [YEN99] ou bien fusion de variables ainsi que des mthodes de structuration (hirarchisation, dcentralisation) [LAC03]. Parmi lventail des mthodes, nous nous intressons en particulier, aux mthodes de construction de modles flous de type Takagi-Sugeno partir des donnes entre-sortie du procd en utilisant des techniques de clustering flou. Le paragraphe suivant donne une vue gnrale ce propos.

3.2.3.

Lidentification base sur des donnes entre-sortie

On se propose donc dobtenir un modle flou directement partir des donnes numriques issues du systme modliser ; ces donnes peuvent tre bruites. Lobjectif des entres appliques au systme (en boucle ouverte ou ferme) est de parcourir lensemble de lespace dans lequel on recherche modliser le comportement du systme. Le modle flou obtenu offre une faible capacit dextrapolation en dehors de cet espace [BOR03].
tel-00136382, version 1 - 13 Mar 2007

Parmi la gamme dapproches de modlisation floue partir des donnes entre-sortie, les suivantes sont dignes dtre mentionnes :

Modlisation base sur des prototypes (template-based), dans laquelle les domaines des variables de lantcdent sont simplement partitionns dans un nombre spcifi de fonctions dappartenance avec la mme forme et distribution dans lespace. Modlisation base sur lajout progressif de fonctions dappartenance, dans laquelle est gnre une partition de lespace avec une base de rgles complexit contrle. Modlisation base sur des techniques de coalescence floue (fuzzy clustering), dans laquelle les rgles du modle flou peuvent tre extraites partir de la conformation de groupes de donnes (classes) dans lespace produit dentre-sortie.

Nous abordons par la suite ces approches de manire plus approfondi, en mettant particulirement laccent sur les mthodes de coalescence floue que nous dvelopperons dans la section 3.3.

Modlisation base sur des prototypes (template-based)


Dans cette approche il est suppos que lexpert peut fournir initialement les fonctions dappartenance et les rgles. Nanmoins, pour divers systmes, une connaissance particulire sur la partition de lespace dopration nest pas disponible. Dans ce cas, les domaines des variables de lantcdent peuvent tre simplement partitionns dans un nombre spcifi de fonctions dappartenance avec la mme forme et distribution dans lespace. La base de rgles peut tre tablie afin de couvrir toutes les combinaisons des termes de lantcdent. La procdure didentification consiste alors estimer, partir des donnes, les paramtres restants dans le modle flou. Sil ny a pas de connaissance disponible sur quelles variables gnrent la non linarit du systme, alors toutes les variables de lantcdent sont partitionnes uniformment, ce qui conduit une croissance exponentielle du nombre de rgles [KOS91].

92

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

Modlisation base sur lajout progressif de fonctions dappartenance


Lobjectif de cette modlisation est de gnrer automatiquement une partition floue de lespace dtat ou de lespace des entres du processus. A chaque rgle floue de type TakagiSugeno est associ un modle linaire calcul partir des donnes mesures sur le systme rel. La prcision du modle peut tre accrue par ajouts successifs de fonctions dappartenance (et donc de rgles) dans lespace de chaque entre du modle, par ajout de fonctions dappartenance unidimensionnelles ou, dans lespace des entres, par ajout de fonctions dappartenance multidimensionnelles. Typiquement ces mthodes utilisent une procdure itrative pour la construction du modle, en effet, le modle flou est augment jusqu atteindre une partition optimale et une base de rgles qui satisfassent un certain critre de performance [NAK97a] [NAK97b]. Par exemple, la mthode itrative sarrte quand lerreur entre le modle et le systme rel est inferieur une valeur prdefinie [BOR99] [BOR03].

Modlisation base sur des techniques de coalescence floue


Les mthodes didentification bases sur la coalescence floue (fuzzy clustering) sont des mthodes qui ont des liens avec les domaines de lanalyse des donnes et de la reconnaissance des formes. Dans ces domaines, le concept dune appartenance partielle est utilis pour reprsenter le degr avec lequel un certain objet, reprsent comme un vecteur dans un espace de caractristiques (vecteur caractristiques), est similaire un certain objet prototype. Le degr de similitude est habituellement calcul en utilisant une mesure approprie de distance. Bas sur la similitude, les vecteurs caractristiques peuvent tre regroups de manire que les vecteurs dun mme groupe (cluster) soient aussi semblables que possible, de telle manire que des vecteurs de groupes diffrents soient aussi dissemblables que possible. La mesure de distance quantifie la distance entre les donnes, reprsentes comme des points dans lespace caractristique, et les objets prototype. Lide de base du clustering flou est reprsente sur la Figure 3.3a [BAB98a], dans laquelle les donnes sont regroupes dans deux groupes avec des prototypes v1 et v2, en utilisant une mesure Euclidienne de distance dans un espace caractristique 2. La partition des donnes est reprsente dans la matrice de partition floue, U=[ik], dont les lments ik sont les degrs dappartenance des points [xk,yk] dans des clusters flous avec prototypes vi.

tel-00136382, version 1 - 13 Mar 2007

(a) Interprtation des clusters flous base sur des rgles

(b) Clusters flous hyperellipsodaux

Figure 3.3. Identification par clustering flou (adaptation daprs [BAB98a])

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

93

Des rgles floues de type "Si-Alors" peuvent tre extraites en projetant les clusters sur les axes des coordonnes. La Figure 3.3a montre un ensemble de donnes avec deux clusters apparents et deux rgles floues associes. Le concept de similarit des donnes par rapport un prototype permet denvisager plusieurs formes possibles pour la dfinition dune mesure de distance approprie et le caractre du prototype. Par exemple, les prototypes peuvent tre dfinis comme des sous-espaces linaires (lignes, plans et hyperplans) [BEZ81] ou bien comme des hyperellipsodes avec une mesure adaptative de distance [GUS79] (voir Figure 3.3b). Pour de tels clusters, les fonctions dappartenance et les paramtres des consquents dun modle de type Takagi-Sugeno peuvent tre extraits [BAB95] :

Si x est A1 Alors y1 = a1 x + d1 , Si x est A2 Alors y 2 = a 2 x + d 2

(3.31)

tel-00136382, version 1 - 13 Mar 2007

Chaque cluster est reprsent par une rgle dans le modle Takagi-Sugeno. Les fonctions dappartenance pour les ensembles flous A1 et A2 sont gnres par la projection point par point de la matrice de partition sur les variables des antcdents. Ces ensembles flous dfinis point par point peuvent alors tre approxims par des fonctions paramtriques appropries (cf. expressions (3.3) et (3.4)). Les paramtres du consquent pour chaque rgle peuvent tre obtenus par lintermdiaire dune estimation de type moindres carrs, que nous aborderons plus tard dans les sections suivantes.

3.3. Mthodes de coalescence floue (clustering flou)


Comme nous lavons dj indiqu, les modles flous (en particulier ceux de type TakagiSugeno) sont considrs sous loptique dune approche de modlisation multi-linaire, qui essai de rsoudre un problme complexe de modlisation en le dcomposant en plusieurs sous-problmes plus simples. La thorie des ensembles flous offre alors un excellent outil pour reprsenter lincertitude associe la tche de dcomposition, en fournissant des transitions douces entre les sous-modles linaires et pour intgrer divers types de connaissance dans un mme cadre. Dans ce cas, lidentification floue peut tre vue comme une recherche de la dcomposition du systme, en exploitant le fait quen gnral la complexit des systmes nest pas uniforme. Puisquil nest pas possible de prvoir lavance quil y ait suffisamment de connaissance concernant cette tche, nous considrons alors des mthodes de gnration automatique de la dcomposition, principalement partir des donnes du systme. Dans cette section nous abordons une classe approprie dalgorithmes de coalescence floue (clustering) utilise ce propos.

3.3.1.

Notation et Concepts de base

Les techniques de classification sont un outil important qui a trouve des applications varies, telles que l'exploitation des donnes, la recherche documentaire, la compression de signal, la reconnaissance de la parole et des caractres manuscrits, la segmentation d'image, la modlisation des systmes, la dtection des dfaillances et le diagnostic. Dun point de vue gnral, les mthodes de classification ont pour but de regrouper les lments dun ensemble Z = { z 1 , z 2 ,K , z N } en un nombre optimal de classes selon leurs ressemblances. Il existe un grand nombre de typologies de mthodes de classification que lon peut regrouper en plusieurs catgories. Une premire distinction consiste sparer les

94

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

techniques en trois grandes familles, selon le type dapprentissage56 sous-jacent, utilis lors du classement. Dune faon trs succincte, ces types dapprentissage sont : Lapprentissage supervis, appel aussi apprentissage avec un matre , dans lequel on dispose dun ensemble de donnes dont on connat a priori la classe dappartenance. Pour chaque vecteur dentre, la sortie dsire correspondante est connue tout moment. Le but de la classification supervise consiste alors ajuster les paramtres du classifieur pour classer le plus correctement les donnes en utilisant la diffrence entre sa sortie et la sortie de rfrence. Un exemple largement connu associ ce type dapprentissage est la technique de rtropropagation du gradient, souvent utilise dans les systmes neuroflous. Lapprentissage par renforcement, contrairement lapprentissage supervis, il cherche faire merger des comportements permettant datteindre un objectif, sans autre information quun signal scalaire, le renforcement. Dans ce type dapprentissage, un agent analyse en permanence les consquences de ses actions, an ayant tendance reproduire prfrentiellement celles qui, dans les mmes circonstances, ont conduit des succs. Lagent est un terme trs gnral qui dsigne ici un systme sous apprentissage : un programme informatique, un rseau de neurones, un systme dinfrence floue, etc. [GLO03] [CER03]. Lapprentissage non supervis, qui consiste tablir des relations dentre/sortie en cherchant la formation de classes dans un ensemble dobservations sur lesquelles on ne dispose pas dinformations quant leur appartenance aux ventuelles classes. Les mthodes de classification non supervise permettent le regroupement des lments ayant des proprits statistiques, gomtriques ou linguistiques semblables. Les mthodes de coalescence floue (regroupement ou clustering) font partie de ces mthodes, car elles n'utilisent pas des tiquettes prexistantes pour les classes57. Elles peuvent tre utilises comme un outil pour obtenir une partition des donnes quand les transitions entre les classes sont plutt "douces" que "fortes" [BAB98a].

tel-00136382, version 1 - 13 Mar 2007

Une autre distinction peut tre faite en considrant le principe de reprsentation ou de construction du classement. De son cot [BIE99] prsente cinq catgories de mthodes : les mthodes statistiques, les mthodes hirarchiques, les mthodes par graphes, les mthodes itratives et les mthodes connexionnistes. Pour sa part [BEZ81] prsente une distinction en se basant sur l'approche algorithmique des diffrentes techniques. Ainsi par exemple, les mthodes hirarchiques forment de nouveaux groupes (clusters) en redistribuant les appartenances d'un point la fois, bas sur une certaine mesure convenable de similitude. Dans les mthodes par graphes, lensemble Z, est considr comme un ensemble de nuds. Les poids des liaisons entre paires de nuds sont bass sur une mesure de similitude entre ces nuds. Par ailleurs, la dfinition des classes et des relations entre celles-ci dpend de la structure de classification utilise. La plupart des algorithmes de clustering prsents dans la littrature appartiennent une des deux catgories suivantes : clustering hirarchique et clustering par partition [JAI88]. Les algorithmes de clustering hirarchique considrent seulement des
56

Malgr la complexit quimplique une dfinition tendue du concept dapprentissage, nous considrons ici dune faon trs modeste, une dfinition assez limit mais approprie nos recherches : on peut considrer lapprentissage comme le processus par lequel un utilisateur fournit des donnes (dans notre cas numriques) un logiciel dans le but que celui sen serve comme modle pour pouvoir ensuite les reconnatre. 57 Nanmoins, il faut dire que pour la plupart des algorithmes conventionnels de coalescence floue le nombre de classes est tabli a priori.

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

95

voisins locaux et crent une dcomposition hirarchique des donnes, en gnrant une squence de partitions arborescentes. Ces algorithmes peuvent tre diviss en mthodes agglomratives (bottom-up) et mthodes par division (top-down) : Les algorithmes agglomratifs commencent en considrant un grand nombre de clusters individuels et successivement les fusionnent selon une mesure de distance. Le clustering peut sarrter quand toutes les donnes sont dans un seul groupe ou bien nimporte quel point intermdiaire dsir. Ces mthodes suivent une stratgie de fusion de clusters de type constructive. Les algorithmes par division suivent la stratgie oppose. Ils commencent par un groupe qui contient toutes les donnes et progressivement le groupe est divis en groupes plus petits jusqu atteindre la situation limite dans laquelle chaque donne constitue un groupe, ou bien avant cette limite, selon ce que lon dsire.

Les algorithmes hirarchiques sont, en principe, plus efficaces dans le traitement du bruit et des points aberrants (outliers). Cependant, ces techniques hirarchiques souffrent du fait quune fois quune fusion ou quune division est faite, elle ne peut pas tre dfaite ou raffine.
tel-00136382, version 1 - 13 Mar 2007

Concernant les algorithmes de clustering par partition, ces algorithmes diffrent des techniques hirarchiques dans le fait quils admettent la relocation dans les classes (dans le processus itratif les donnes peuvent se dplacer dun cluster un autre). Cela permet quune partition initiale pauvre, puisse tre corrige une tape postrieure. Ils diffrent aussi parce que leurs solutions nexpriment pas ncessairement un rapport hirarchique entre les classes. Ces algorithmes gnrent une partition unique des donnes et peuvent incorporer la connaissance de la forme ou de la taille des clusters en utilisant des prototypes et des mesures de distance (mesure de similitude) adquats dans leur formulation. Le clustering en utilisant une mesure de similitude permet la dfinition des classes dcrivant des rgions distinctes dans lespace de reprsentation. Le terme de similitude est typiquement dfini au moyen dune norme de distance. La distance peut tre mesure parmi les vecteurs de donnes, ou bien comme une distance d'un vecteur de donnes un certain objet prototypique du groupe. Les prototypes peuvent tre des vecteurs de la mme dimension que les objets de donnes, mais ils peuvent galement tre dfinis en tant qu'objets gomtriques "de plus haut niveau", tels que des sous-espaces ou des fonctions linaires ou non linaires. En particulier, la formulation de ces algorithmes est base sur lutilisation dune fonction objectif (critre de classification) pour tablir itrativement une partition floue approprie dun ensemble de donnes. Des algorithmes doptimisation non linaires sont utiliss pour chercher lextremum local dune telle fonction. Dans ces mthodes la fonction objectif est diffrentiable, ce qui constitue une proprit utile pour l'optimisation. Les principaux inconvnients de lapproche par partition sont la difficult pour estimer le nombre de clusters, ainsi que la sensibilit par rapport linitialisation, le bruit et les points aberrants [FRI96]. Dans la suite de ce chapitre nous nous focalisons sur les techniques de clustering flou bases sur une fonction objectif. Nous verrons comment, en utilisant de telles techniques, il est possible de construire des modles flous de type Takagi-Sugeno partir des donnes entre-sortie du procd.

Notation
Dans les mthodes de clustering flou, les donnes sont typiquement des observations (mesures) issues d'un certain processus physique. Chaque k-ime observation constitue un

96

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

vecteur not par z k = [ z1k , z 2 k ,L , z nk ]T , avec 1 k N , z k n , o N reprsente le nombre des observations et n correspond au nombre de variables mesures, attributs ou caractristiques dans lespace de reprsentation n . Un ensemble de N observations est dnot par Z = { z k k = 1,2, L , N } et il est reprsent comme une matrice sous la forme :
z11 z Z = 21 M z n1 z12 z 22 M z n2 L L M L z1 N z2N M z nN

(3.32)

tel-00136382, version 1 - 13 Mar 2007

Dans la littrature sur la reconnaissance des formes, les colonnes de cette matrice sont appeles les objets ou patrons et Z est appele la matrice patronne ou matrice des donnes. Quand le clustering est appliqu pour la modlisation et lidentification des systmes dynamiques, les colonnes de Z contiennent les chantillons des signaux observs au cours du temps, et les lignes sont, par exemple, les variables physiques mesurs dans le systme (e.g. temprature, pH, etc.). Afin de reprsenter la dynamique du systme, il est ncessaire dinclure typiquement les valeurs passes des variables dans la matrice Z. Par exemple, pour le cas dun systme non linaire reprsent par un modle NARX de deuxime ordre y(k+1) = fNL (y(k), y(k-1), u(k), u(k-1)), les rgles Ri dun modle dynamique affine Takagi-Sugeno ont la forme suivante :

Ri :

Si y (k ) est Ai1 et y (k 1) est Ai 2 et u (k ) est Bi1 et u (k 1) est Bi 2 Alors y (k + 1) = ai1 y (k ) + ai 2 y (k 1) + bi1u (k ) + bi 2 u (k 1) + d i

(3.33)

Dans ce cas, la matrice des donnes prend la forme :


y ( 2) u (1) u ( 2) y (3) y (1) y ( 2) y (3) u ( 2) u (3) y ( 4) ZT = M M M M M y ( N 2) y ( N 1) u ( N 2) u ( N 1) y ( N )

(3.34)

Les algorithmes de clustering flou visent raliser une classification dun ensemble de donnes en tablissant une partition floue des observations en un certain nombre de classes. La notion de partition floue, qui sest avr dune grande utilit pour le dveloppement des techniques floues de classification, a t introduite par Ruspini [RUS69]. Au sens de Ruspini (partition floue stricte), une c-partition floue dun ensemble Z peut tre obtenue en dfinissant des c sous-ensembles flous de Z tel que la somme des degrs dappartenance pour chaque observation de Z soit unitaire. En fait, on associe chaque observation z k Z un vecteur de degrs dappartenance aux diffrentes classes. La juxtaposition de ces vecteurs pour lensemble des N observations de Z amne la dfinition dune matrice dappartenance U (de dimension c N ) o llment ik reprsente le coefficient dappartenance58 de lobservation z k la classe c. Cette matrice tablit une relation dordre floue et traduit lide dune partition floue en c classes.

58

Afin de simplifier la notation, nous utilisons dans cette section i au lieu de la forme usuelle A i . De plus,

pour faciliter la notation matricielle, ik est not i ( z k ) .

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

97

La matrice dappartenance U = [ ik ] est galement appele matrice de partition floue et respecte les proprits suivantes :

ik [ 0, 1],
0 < ik < N ,
k =1 N

1 i c, 1 i c.

1 k N ,

(3.35) (3.36) (3.37)

ik = 1 ,
i =1

1 k N ,

Lexpression (3.37) traduit une condition de normalisation dinspiration probabiliste. Cependant, bien que cette approche de la dfinition dune partition floue soit la plus utilise, diffrents auteurs [KRI93] [KHO97] prsentent des approches o cette contrainte est relaxe. Il sagit dapproches qui conduisent une partition dite possibiliste59, dans laquelle en plus de respecter les expressions (3.35) et (3.36), la contrainte exprime par (3.37) est remplace par une autre moins restrictive : i, ik > 0 ,
tel-00136382, version 1 - 13 Mar 2007
1 k N

(3.38)

Cette expression est drive du fait que la contrainte (3.37) ne peut pas tre compltement enleve, afin dassurer que chaque point soit assign au moins un des sous-ensembles flous avec une appartenance suprieur zro. Dans la suite nous nous intressons aux techniques qui conduisent une partition floue des donnes dfinie par lensemble des expressions (3.35) (3.37).

Algorithmes de coalescence floue


Comme nous lavons indiqu prcdemment, les algorithmes de clustering flou optimisent itrativement un critre de classification afin dtablir une partition floue dun ensemble de donnes en un certain nombre de classes (clusters). Le groupement des donnes est fait partir dune phase d"apprentissage" en utilisant une mesure de similitude par lintermdiaire de techniques de classification. Au niveau de la modlisation, chaque cluster correspond thoriquement un fonctionnement homogne du systme qui peut se prsenter sous la forme dun modle linaire local. Le nombre de modles linaires locaux est gal au nombre de rgles du modle. Cela permet le recours la thorie de lAutomatique linaire pour la dfinition du contrleur. Dans les paragraphes suivants, un ensemble non exhaustif dalgorithmes de coalescence floue est prsent, bass sur la minimisation dune fonction objectif. Parmi ceux-ci, le plus connu est lalgorithme des c-moyennes floues, en anglais Fuzzy c-Means (FCM) ainsi quune de ses extensions, lalgorithme de Gustafson-Kessel (GK). Le premier permet la dtection de classes hypersphriques, tandis que le deuxime, dtecte des classes hyperellipsodales, typiquement mieux adaptes la gomtrie des observations. Dans la gamme des algorithmes de clustering avec prototypes linaires utiles nos propos de modlisation floue des systmes, nous prsentons lalgorithme Fuzzy c-Regression Models (FCRM). Ensuite, nous introduisons lalgorithme Fuzzy Ellipsoidal Regression (FER), utilis pour favoriser linterprtabilit du modle flou rsultant. Ces quatre algorithmes de coalescence floue ncessitent la connaissance pralable du nombre de clusters. Pour finir, nous prsentons lalgorithme Fuzzy Robust Ellipsoidal Regression (RoFER), sur la base dune approche d agglomration
59

Le terme "possibiliste" (partition, clustering, etc.) a t introduit par Krishnapuram et Keller [KRI93]. Dans la littrature, les termes "partition floue contrainte" et "partition floue non contrainte" sont utiliss aussi pour dnoter les partitions qui impliquent respectivement les expressions (3.37) et (3.38) [BAB98a].

98

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

comptitive , qui non seulement permet dtablir "automatiquement" le nombre de clusters linaires, mais aussi qui est robuste en prsence de bruit et de points aberrants60 (outliers).

3.3.2.

Groupage c-moyennes floues (algorithme FCM)

Lalgorithme Fuzzy c-Means (FCM), issu des travaux de Dunn [DUN74] et amlior plus tard par Bezdek [BEZ81], constitue une rfrence parmi les diffrentes mthodes de coalescence floue bass sur la minimisation de la fonction objectif c-mean, de la forme :
J FCM ( Z ; U, V ) =
i =1 c 2 ( ik ) m Dik A k =1 N

(3.39)

Z est lensemble des donnes, U = [ ik ] est la matrice de partition floue (de dimension c N ), V = [ v 1 , v 2 , K, v c ] est un vecteur de prototypes de clusters (centres) qui doit tre
dtermin, avec v i n centre de la i-me classe, 1 i c .
2 Dik A = z k vi 2

= (z k v i ) T A (z k v i ) ,

1 i c,

1 k N

(3.40)

tel-00136382, version 1 - 13 Mar 2007

est un norme de distance quadratique dans lespace considr, qui dfinit la mesure de distance entre lobservation z k et le centre v i au sens de la mtrique induite par A . m [1, ) est un facteur qui dsigne le degr de flou61 de la partition. Le paramtre m influence directement la forme des clusters dans lespace des donnes du systme. Quand le facteur m sapproche de la valeur 1, la forme de la fonction dappartenance pour chaque cluster est presque boolenne (ik {0,1}) et vi sont les moyennes ordinaires des clusters. De lautre ct, plus m est grand, plus la partition est floue. Quand m, la partition devient floue au maximum (ik = 1/c) et les moyennes des clusters sont toutes gales la moyenne de Z. Ces proprits limites sont indpendantes de la mthode doptimisation slectionne [PAL95]. Bien que le choix de m dpend des donnes [YU04], habituellement ce paramtre est initialis une valeur entre 1,5 et 2,5. Dans lquation (3.39), la mesure de non-similarit exprime par le terme JFCM (Z;U,V) est la somme des carrs des distances entre chaque vecteur de donnes z k et le prototype (centre) du cluster correspondant v i . Leffet de cette distance est pondr par le degr dactivation du cluster (ik)m correspondant au vecteur de donnes z k . La valeur de la fonction cot JFCM(Z;U,V) peut tre vue comme une mesure de la variance totale de z k par rapport aux prototypes v i . La minimisation de la fonction objectif JFCM (Z;U,V) est un problme doptimisation non linaire qui peut tre rsolu par diffrentes mthodes, parmi lesquelles la plus utilise est base sur litration de Picard travers les conditions du premier ordre pour les points stationnaires [BEZ80]. Cette mthode est connue comme lalgorithme Fuzzy c-Means (FCM). Les points stationnaires de la fonction objectif (3.39) peuvent tre trouvs en ajoutant la contrainte de normalisation (3.37) au critre J FCM au moyen des multiplicateurs de Lagrange :
60 61

Outlier : Dans un ensemble dobservations, cest la donne qui scarte nettement de cet ensemble. m : fuzziness weighting exponent.

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

99

J FCM ( Z ; U, V, ) =
i =1

N c 2 m + ( ) D ik k ik 1 ikA k =1 k =1 i =1 N

(3.41)

o les termes k sont les coefficients multiplicateurs de Lagrange. La minimisation du critre J FCM sobtient alors en annulant le gradient de J FCM 62 par rapport U, V et . Si
2 Dik A > 0, i , k et m > 1 , alors on obtient les relations de mise jour suivantes :

Pour les coefficients ik de la matrice de partition floue : 1 ik = c , 1 i c, 1 k N . 1 /( m 1) 2 2 DikA / D jkA


j =1

(3.42)

Pour les prototypes (centres) v i des clusters :


vi =

( ik ) m z k
k =1

tel-00136382, version 1 - 13 Mar 2007

( ik )
k =1

1 i c.

(3.43)

Cette solution satisfait aussi les contraintes (3.35) et (3.36). Il faut remarquer que lexpression (3.43) exprime v i comme la moyenne pondre des donnes qui appartiennent un cluster, o le facteur de pondration est associ aux degrs dappartenance floue. Cest pourquoi lalgorithme est appel "c-moyennes" (c-means). Le processus itratif sarrte lorsque la partition devient stable, cest--dire lorsquelle nvolue plus significativement, entre deux itrations successives. Ceci sexprime de manire gnrale par la vrification de lexpression (3.44) o le terme de gauche traduit une norme matricielle et le coefficient dfinit le seuil de convergence :

U ( t ) U ( t 1) <
Lexpression U (t ) reprsente la matrice de partition floue litration (t). Lalgorithme gnral de rsolution fuzzy c-mean (FCM) peut se formuler ainsi :

(3.44)

Algorithme FCM - Fuzzy c-means


Etant donn un ensemble de vecteurs de donnes Z : 2 Dfinir la matrice A de mtrique de la distance Dik A Fixer le nombre de clusters 1 < c < N Fixer le degr de flou m > 1 et la tolrance de fin dalgorithme > 0 Initialiser la matrice U = [ ik ] de partition floue Rpter Pas 1. Calculer les prototypes (centres) des clusters (Eq. (3.43)) Pas 2. Calculer les distances pour chaque cluster (Eq. (3.40)) Pas 3. Mettre jour la matrice U de partition floue (Eq. (3.42)) Jusqu obtenir la stabilit de la partition (Eq. (3.44))
62

Pour la suite du chapitre, remarquons que par rapport la fonctionnelle J , la notation J comprend les contraintes dgalit pour la minimisation.

100

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

Remarques
R 3.2

Une singularit dans lalgorithme FCM se produit au Pas 3 quand DisA = 0 pour un certain z k et un ou plusieurs prototypes de groupe v s , s S {1,2,K, c }. Dans ce cas, le degr dappartenance dans lexpression (3.42) ne peut pas tre calcul. Quand cela arrive, la valeur zro est assigne chaque ik , i S et lappartenance est distribue arbitrairement parmi sj soumis la contrainte sS sj = 1, k [BAB98a]. Les quations (3.42), (3.43) sont seulement des conditions ncessaires du premier ordre pour les points stationnaires de la fonctionnelle (3.39). La suffisance de ces conditions et la convergence de lalgorithme a t aborde par Bezdek [BEZ80]. Nanmoins, la minimisation du critre J FCM nest pas simple cause des minima locaux63. En effet, lexistence de "points selle" a t dmontre [TUC87] dans plusieurs contre-exemples au suppos thorme de convergence. Les contre-exemples sont expliqus plus en dtail dans larticle de Bezdeck [BEZ87]. La procdure doptimisation alternative utilise par lalgorithme FCM itre travers les estimations U(t-1) V(t) U(t) et se termine aussitt que ||U(t) - U(t-1)|| <. Un autre choix, consiste linitialiser avec V(0), itrer aprs travers V(t-1) U(t) V(t) et finir quand ||V(t)-V(t-1)|| <. La norme derreur dans le critre de terminaison est usuellement choisie comme maxik ( |ik(t)-ik(t-1)| ). Des rsultats diffrents peuvent tre obtenus avec la mme valeur de , puisque le critre de terminaison utilis dans lalgorithme FCM exige que les valeurs de plusieurs paramtres sapprochent les uns des autres. La valeur usuelle pour le seuil de terminaison est = 0.001, bien quune valeur de = 0.01 convienne dans la plupart des cas [BAB98a].

R 3.3

R 3.4

tel-00136382, version 1 - 13 Mar 2007

Lalgorithme FCM ralise une partition floue dun ensemble dobservations en un nombre connu a priori de classes. Comme on vient de lindiquer, cet algorithme converge en gnral vers un minimum local de la fonction objectif. Le rsultat obtenu dpend aussi de linitialisation des prototypes (centres) des classes, ainsi que du choix de la mtrique employe et des diffrents paramtres de lalgorithme (c, m, ). Le nombre de clusters c est le paramtre le plus important, les autres paramtres ont une influence mineure au niveau de la partition, en comparaison avec les effets du nombre de clusters. Ceci implique habituellement de ritrer plusieurs fois lalgorithme avec des valeurs diffrentes, puis de slectionner ultrieurement la meilleure partition au cours dune phase de validation, sujet qui sera abord dans le paragraphe 3.4.1. Dautre part, la forme des clusters dans lalgorithme FCM est dtermine par le choix de 2 la matrice de norme induite A et par la mesure de distance Dik A (cf. expression (3.40)). Un choix simple consiste slectionner A comme la matrice didentit, A = I nn , ce qui correspond la norme standard Euclidienne :
2 Dik = (z k v i ) T (z k v i )

(3.45)

63

Il serait souhaitable que deux points quidistants du centre de la classe laquelle ils appartiennent aient le mme degr dappartenance cette classe. Ce nest pas le cas avec lalgorithme FCM. On peut avoir des points quidistants qui nont pas le mme degr dappartenance, cela est d lquation (3.42) qui est fonction de la distance du point la classe, mais aussi du point toutes les autres classes. De ce fait des singularits se produisent car deux points bien ququidistants une classe ne le sont pas par rapport aux autres [ATI05].

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

101

Notons quavec ce choix de la matrice A, lexpression (3.45) mesure la distance en pondrant toutes les observations par gale par rapport au prototype (centres) des clusters. Linterprtation gomtrique de lalgorithme FCM en utilisant une mesure de distance Euclidienne, donne alors des clusters de forme hypersphrique, cest--dire, des clusters dont les surfaces des fonctions dappartenance constantes (surfaces de niveau) sont des hypersphres dans lespace de reprsentation n . Nous abordons par la suite deux algorithmes qui reprsentent des extensions de lalgorithme FCM. Lalgorithme de Gustafson-Kessel (GK), qui utilise une mesure adaptative de distance permettant la dtection des classes hyperellipsodales, et lalgorithme Fuzzy cRegression Models (FCRM), bas sur des prototypes hyperplanaires.

3.3.3.

Groupage avec matrice de covariance floue (algorithme GK)

tel-00136382, version 1 - 13 Mar 2007

Lextension de lalgorithme FCM propose par Gustafson et Kessel [GUS79] a lavantage de tenir compte de la forme propre de chacune des classes. En particulier, il permet la dtection des classes hyperellipsodales, typiquement mieux adaptes la gomtrie des observations. Pour cela, pour chaque cluster, la mesure de distance est dfinie laide dune mtrique A i :
2 T Dik Ai = (z k v i ) A i (z k v i )

(3.46)

o la matrice de norme induite A i est propre chaque cluster, avec 1 i c . Les matrices A i sont utilises comme variables doptimisation dans la fonctionnelle c-means, permettant ainsi chaque cluster dadapter la norme de distance la structure des donnes. Soit A qui reprsente un c-uplet de matrices de norme induite dfinies positives A = ( A 1 , A 2 ,K, A c ) . La fonction objectif de lalgorithme GK est dfinie par :
J GK ( Z ; U, V, A) =
i =1 c

2 ( ik ) m Dik Ai
k =1

(3.47)

o U c N , V nc et A nn correspondent aux solutions de la minimisation (points stationnaires) de la fonctionnelle J GK . Pour A fixe, les conditions (3.42) et (3.43) peuvent tre appliques. Nanmoins, la fonction objectif (3.47) ne peut pas tre minimise directement par rapport Ai puisque elle est linaire en Ai. Pour obtenir une solution ralisable, Ai doit tre contrainte dune certaine faon, pour cela, il suffit dimposer une contrainte sur le dterminant de Ai [BAB98a]. En permettant la matrice Ai de varier alors que son dterminant reste fixe, cela correspond optimiser la forme du cluster tandis que son volume reste constant. Cest pourquoi on considre lalgorithme GK comme une mthode de clustering avec une mesure adaptative de la distance. La contrainte sur le volume se traduit par lexpression : Ai = i (3.48) Nous avons la possibilit daffecter des volumes diffrents pour chaque cluster par lintermdiaire de i , initialis par dfaut la valeur 1. En utilisant la mthode des multiplicateurs de Lagrange [GUS79], la minimisation du critre doptimisation conduit lexpression de A i suivante :

102

Identification de modles flous Takagi-Sugeno (TS) partir de donnes


A i = ( i det (Fi ))
1/ n

Fi1

(3.49)

o Fi est la matrice de covariance floue du i- me cluster, dfinie par lexpression :


Fi =
N k =1 ( ik ) m (z k v i )(z k v i ) T N k =1 ( ik ) m

(3.50)

La structure propre de la matrice de covariance floue Fi nn fournit une information prcieuse sur la forme et lorientation des clusters hyperellipsodaux. En effet, la racine carre de chacune de ses valeurs propres j , j = 1, K, n reprsente les longueurs des axes dans lhyperespace. Les directions des axes sont donnes par les vecteurs propres j . Cela est illustr sur la Figure 3.4 pour un espace de dimension n = 2 :

tel-00136382, version 1 - 13 Mar 2007

Figure 3.4. Interprtation gomtrique de la matrice de covariance floue (daprs [BAB98a]) Lquation (z-v)T F-1 (z-v) = 1 dfinit un hyperellipsode dans n.

La substitution des quations (3.49) et (3.50) dans lexpression (3.46) donne une norme quadratique de distance Mahalonobis gnralise entre le vecteur z k et la moyenne (centre) du cluster v i , o la covariance est pondre par les degrs dappartenance en U . La mesure de distance pour lalgorithme GK est dfinie alors comme :
2 T Dik A i = ( z k v i ) i det (Fi )

1/ n

Fi1 (z k v i )

(3.51)

Lalgorithme de clustering de Gustafson-Kessel (GK) peut se formuler ainsi :


Algorithme GK - Gustafson-Kessel

Etant donn un ensemble de vecteurs de donnes Z : Fixer le nombre de clusters 1 < c < N Fixer le degr de flou m > 1 , le volume i des clusters et la tolrance de fin dalgorithme > 0 Initialiser la matrice U = [ ik ] de partition floue Rpter Pas 1. Calculer les prototypes (centres) des clusters (Eq. (3.43)) Pas 2. Calculer les matrices de covariance de cluster (Eq. (3.50)) Pas 3. Calculer les distances pour chaque cluster (Eq. (3.51)) Pas 4. Mettre jour la matrice U de partition floue (Eq. (3.42)) Jusqu obtenir la stabilit de la partition (Eq. (3.44))

Identification de modles flous Takagi-Sugeno (TS) partir de donnes


Remarques
R 3.5

103

En utilisant la structure propre de la matrice de covariance floue Fi , il est possible de driver des sous-espaces linaires de donnes. En effet, ceux-ci peuvent tre reprsents par des hyperellipsodes plats, que lon peut voir comme des hyperplans. Le vecteur propre qui correspond la valeur propre la plus petite dtermine la normale lhyperplan et peut aussi tre utilis pour calculer les sous modles locaux linaires. Cette approche sera dveloppe dans la section 3.4 [BAB98a]. Une avantage de lalgorithme GK sur le FCM consiste en ce que lalgorithme GK peut dtecter des clusters de formes et dorientations diffrentes pour un ensemble de donnes dans lespace de reprsentation. Cependant, il est plus lourd en temps de calcul, car linverse et le dterminant de la matrice de covariance floue de cluster doivent tre calculs chaque itration.

R 3.6

tel-00136382, version 1 - 13 Mar 2007

Les deux algorithmes dcrits jusqu prsent se caractrisent par une reprsentation des clusters par lintermdiaire des points prototypes (centres), vin : ce sont des structures gomtriques du mme "type" que les vecteurs de donnes. Lalgorithme FCM utilise une norme de distance fixe et prfre ainsi fortement les clusters dune forme gomtrique induite par cette norme. Lalgorithme GK remdie cet inconvnient en adaptant localement la norme de distance. Une autre approche conceptuellement diffrente consiste dfinir les prototypes comme des sous-espaces r-dimensionnels linaires64 ou non linaires dans lespace de reprsentation n, o 1 r n . Nous abordons cette approche dans le paragraphe suivant, en prsentant lalgorithme FCRM.

3.3.4.

Groupage avec prototypes linaires (algorithme FCRM)

Lalgorithme Fuzzy c-Regression Models (FCRM), propos par Hathaway et Bezdek [HAT93] appartient la gamme des algorithmes de clustering avec prototypes linaires. Contrairement aux deux mthodes exposes prcdemment, les prototypes des clusters ne sont pas des objets gomtriques dans lespace des donnes, mais ils sont dfinis explicitement par des relations fonctionnelles en termes dquations de rgression. Cet algorithme estime les paramtres du c modles de rgression conjointement avec une cpartition floue de lensemble des donnes. Les modles de rgression prennent la forme gnrale donne par : y k = f i (x k ; i ) (3.52) o les fonctions f i sont paramtres par i p i . Le degr dappartenance ik U est interprt comme une pondration qui reprsente le domaine pour lequel la valeur prdite par le modle f i (x k ; i ) correspond la sortie y k . Lerreur de prdiction peut tre dfinie par :

Eik ( i ) = ( y k f i (x k ; i )) 2

(3.53)

La famille des fonctions objectif dfinie pour les c modles flous de rgression, avec 1 i c , et le jeu de donnes Z = { (x1 , y1 ),K , (x N , y N )}, est donne par lexpression :
E (Z ; U, { i }) =
i =1 c

( ik ) m Eik ( i )
k =1

(3.54)

64

Cest--dire : lignes (r = 1), plans (r = 2) et hyperplans (2 < r < n).

104

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

Une approche possible pour la minimisation de la fonction objectif (3.54) est la mthode de minimisation de coordonne groupe [HAT91], dans laquelle la mise jour de la matrice de partition floue est donne par lexpression :

ik =

c j =1

( Eik / E jk ) 2 /( m 1)

1 i c,

1 k N

(3.55)

Lalgorithme gnral FCRM est alors formul comme :


Algorithme FCRM - Fuzzy c-Regression Models

tel-00136382, version 1 - 13 Mar 2007

Etant donn un ensemble de donnes Z = { (x1 , y1 ),K , (x N , y N )} : Fixer le nombre de clusters 1 < c < N Fixer la structure des modles de rgression (Eq. (3.52)) et la mesure de lerreur de prdiction (Eq. (3.53)) Fixer le degr de flou m > 1 et la tolrance de fin dalgorithme > 0 Initialiser la matrice U = [ ik ] de partition floue Rpter Pas 1. Calculer des valeurs pour les paramtres du modle i qui minimisent globalement lexpression E(Z ;U,{i}) (Eq. (3.54)) Pas 2. Mettre jour la matrice U de partition floue (Eq. (3.55)) Jusqu obtenir la stabilit de la partition (Eq. (3.44)) Lalgorithme FCRM prsente linconvnient que les clusters ne sont pas limits dans leur taille, ce qui gnre une tendance connecter des clusters qui peuvent tre bien spars. Par consquent, lalgorithme est plutt sensible linitialisation. Lavantage de cet algorithme est quil peut aussi ajuster des modles locaux non linaires aux donnes, comme des polynmes, qui sont toujours linaires en leurs paramtres. Cela conduit un problme destimation linaire dans le Pas 1 de lalgorithme [BAB98a]. En fait, quand les fonctions de rgression fi dans lexpression (3.52) sont linaires par rapport aux paramtres i, i.e., f i (x k ; i ) = a T i x + d i , ceux-ci peuvent tre obtenus alors comme une solution dun problme des moindres carrs pondrs o les degrs dappartenance de la matrice de partition floue U servent comme facteurs de pondration (cf. paragraphe 3.4.3, concernant lobtention des paramtres des consquents du modle TakagiSugeno). En choisissant la matrice et le vecteur de donnes (entre et sortie, respectivement) X N p et y N , ainsi que la matrice de pondration Wi N N tel que :
T x1 T x X= 2, M T x N

y1 y y= 2, M yN

i1 0 Wi = M 0

i2
M 0

0 0 O M L iN L L

(3.56)

Alors les paramtres optimaux pour chacun des sous modles linaires sont calculs par lexpression : 1 (3.57) i = XT XT e Wi X e e Wi y

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

105

3.3.5.

Groupage avec rgression ellipsodale (algorithme FER)

Dans ce paragraphe nous introduisons lalgorithme de groupage avec rgression ellipsodale, en anglais Fuzzy Ellipsoidal Regression (FER65) [BAR03] [GRI04], dans lequel la mesure de distance est dfinie comme une combinaison de la version daxes parallles de lalgorithme GK et de lalgorithme FCRM. Dans le cadre de la modlisation des systmes, lalgorithme propos est orient afin de favoriser linterprtabilit du modle flou rsultant. Dans lalgorithme GK conventionnel, les clusters hyperellipsodaux obtenus permettent de tenir compte de la forme propre chacune des classes par rapport aux clusters hypersphriques issus de lutilisation de lalgorithme FCM. Il y a des amliorations possibles en relation avec linterprtabilit des rgles du modle flou Takagi-Sugeno associ. En effet, une fois que les donnes sont regroupes au niveau des clusters, il faut procder la construction du modle flou correspondant, en gnrant les rgles constitutives de lantcdent et du consquent (voir le paragraphe 3.4.2). Si lon souhaite, exprimer les rgles sous une forme conjonctive, une erreur de dcomposition apparat lors dune utilisation du mcanisme de projection compte tenu de la rotation naturelle des clusters par rapport aux axes des entres, partir des ensembles flous multidimensionnelles. Cette rotation des clusters est tout fait en concordance avec la dfinition de la matrice Ai de norme induite dans lexpression (3.49), car cette matrice fait intervenir la matrice Fi de covariance floue (3.50), qui est une matrice symtrique avec des coefficients hors de la diagonale principale. Pour pallier cet inconvnient et rduire lerreur de dcomposition, une possibilit consiste imposer des clusters hyperellipsodaux parallles aux axes des entres dans lespace de reprsentation. Cela ce traduit par une matrice Ai diagonale, note Aid et exprime par convenance sous la forme suivante : 0 A A id = ixd (3.58) i 0 dans laquelle la matrice A ixd et le terme i correspondent respectivement aux composants de lespace dentre et de sortie. Ainsi, la fonction objectif pour lalgorithme GK avec des axes parallles (GKP) peut se exprimer par :
J GKP ( Z ; U, V, A) =
i =1 c

tel-00136382, version 1 - 13 Mar 2007

( ik ) m (z k v i ) T A id (z k v i )
k =1

(3.59)

ou, en tenant compte des composants dentre et sortie, par :


J GKP ( Z ; U, V, A) =
i =1 c

( ik ) m ((x k v ix ) T A ixd (x k v ix ) + i ( y k viy ) 2 )


N k =1

(3.60)

T Lensemble des donnes est vu sous la forme z k = [ x T k , y k ] , dans laquelle x k et y k sont un vecteur et une constante qui contiennent respectivement les composants dentre et de T sortie. Dune faon analogue, v i = [ v T ix , v iy ] , o v ix et v iy sont un vecteur et une constante

contenant les composants dentre et de sortie du centre de li-me cluster.


65

Le nom FER (Fuzzy Ellipsoidal Regression) introduit par Grisales et utilis pour la premire fois dans le cadre de cette thse, fait appel la double interprtation gomtrique de lalgorithme : les clusters hyperellipsodaux parallles dans lespace dentre obtenus avec la mesure de distance de lalgorithme GK et dautre part, la prise en compte de prototypes hyperplanaires au niveau du calcul des consquents, dune manire similaire lalgorithme FCRM. En rsum, FER = GK Parallle dans p + FCRM dans p+1.

106

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

Dans la fonctionnelle donne par lexpression (3.60) apparaissent des clusters hyperellipsodaux daxes parallles par rapport aux variables dentre. Afin de gnrer des sous modles linaires, le terme associ la sortie est modifi, ce qui donne comme fonction objectif pour lalgorithme FER, la forme suivante :
J FER ( Z ; U, V, A, ) =
i =1 c

( ik ) m ((x k v ix ) T A ixd (x k v ix ) + i ( y k f i (x k ; i ) 2 )
N k =1

(3.61)

p+1 o f i (x k ; i ) = a T . i x + d i reprsente chacun des i-me sous modles linaires dans Notons que le terme associ la variable de sortie a la mme forme que celui correspondant lerreur de prdiction dans lalgorithme FCRM (cf. expression (3.53)). Dautre part, la contrainte (3.48) associe lhypervolume du cluster sexprime comme :

A id = A ixd i = i

(3.62)

Autrement lalgorithme conduirait la solution vidente Aixd = 0 et i =0. La fonctionnelle est galement soumise la contrainte de partition floue stricte donne par (3.37).
tel-00136382, version 1 - 13 Mar 2007

Dans la suite, afin de simplifier la notation dans la procdure de minimisation, nous rcrivons lexpression de la fonctionnelle JFER propose, de la manire suivante :
J FER ( Z ; U, V, A, ) =
i =1 c 2 ( ik ) m d ik k =1 N

(3.63)

avec
2 d ik = ([x k , y k ]T [ v ix , f i (x k ; i )]) A id ([x k , y k ]T [ v ix , f i (x k ; i )]) T

(3.64)

Pour minimiser la fonctionnelle (3.63) on utilise une procdure itrative similaire celle dcrite pour lalgorithme FCM travers les conditions du premier ordre. Les points stationnaires de la fonction objectif peuvent tre trouvs en ajoutant les contraintes dgalit (3.37) et (3.62) J FER au moyen des multiplicateurs de Lagrange, et lon obtient : J FER ( Z ; U, P, , ) =
i =1 c

2 + k ik 1 + i [ A id i ] ( ik ) m d ik k =1 k =1 i =1 i =1
N N c c

(3.65)

o P = [V , A, ] reprsente lensemble des matrices associes aux paramtres qui caractrisent les clusters et les termes k , i sont les coefficients multiplicateurs de Lagrange. La minimisation du critre J FER sobtient alors en annulant le gradient de J FER par rapport U, P, et . Etant donne que les colonnes de la matrice de partition floue U sont indpendants les unes des autres, on peut rduire le problme de minimisation chacune des observations (colonnes), i.e., N problmes doptimisation indpendants. Ainsi, en annulant initialement le gradient de J FER par rapport aux termes correspondants en U et on obtient respectivement les expressions :

J FER 2 = m ( ik ) m 1 d ik + k = 0 , i, k ik
c J FER = ik 1 = 0 , k k i =1

(3.66)

(3.67)

Identification de modles flous Takagi-Sugeno (TS) partir de donnes Lexpression (3.66) permet alors dexprimer le terme ik de la manire suivante :
k ik = m d 2 ik
1 /( m 1)

107

(3.68)

en le remplaant dans lquation (3.67) on arrive :

k m

1 /( m 1)

1 2 j =1 d jk
c

1 /( m 1)

(3.69)

et donc en combinant les expressions (3.68) et (3.69) on obtient :

ik

(1 / d ) = (1 / d )
c j =1

2 1 /( m 1) ik 2 1 /( m 1) jk

(3.70)

tel-00136382, version 1 - 13 Mar 2007

Cette expression traduit ainsi la relation de mise jour des coefficients dappartenance * ) de la matrice de partition floue, qui peut encore sexprimer sous la forme : optimales ( ik
* ik =

(d / d
c j =1 2 ik

2 1 /( m 1) jk

1 i c,

1 k N .

(3.71)

Pour trouver lensemble optimal des paramtres P = [V, A, ] qui caractrisent chacun des clusters, il faut galement calculer et annuler le gradient de J FER par rapport P :
2 N J FER * m d ik = ( ik ) = 0 , i Pi Pi k =1

(3.72)

Pour les centres des clusters dans lespace dentre p, lapplication de la condition ncessaire reprsente par (3.72) conduit lexpression :
N J FER * m = 2 ( ik ) A id (x k v * i ix ) = 0 , Vi k =1

(3.73)

et donc on obtient
v* ix =
* m ) xk ( ik k =1 N

( )
k =1 * ik

1 i c.

(3.74)

Cette expression permet lactualisation des centres des clusters hyperellipsodaux dans lespace dentre de dimension p. A partir de lexpression (3.72), en annulant le gradient de J FER par rapport la matrice A id , la minimisation du critre J FER conduit lexpression suivante :

108

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

J FER T N * = diag ( ij ) m [x k , y k ]T [ v ix , f i (x k ; i )] [x k , y k ]T [ v ix , f i (x k ; i )] + i A * id A id A id k =1

)(

( )

=0

(3.75) dans laquelle nous avons utilises les proprits suivantes [GUS79] :
xT A x = xT A x , A

A A

= A A 1

(3.76)

valables pour des matrices A non singulires et tout vecteur compatible x. Notons galement que pour notre cas particulier, la matrice A id est une matrice diagonale. Ainsi, partir de lexpression (3.75), on obtient alors :

(A )
tel-00136382, version 1 - 13 Mar 2007

* 1 id

i A* id

T N diag ( ik ) m [x k , y k ]T [ v ix , f i (x k ; i )] [x k , y k ]T [ v ix , f i (x k ; i )] k =1

)(

(3.77)

Dautre part, il est vident que pour chaque cluster, J FER = A id i = 0 i Si maintenant on dfinie une matrice diagonale de la forme
T N diag ( ik ) m [x k , y k ]T [ v ix , f i (x k ; i )] [x k , y k ]T [ v ix , f i (x k ; i )] k =1 Fid = N ( ik ) m k =1

(3.78)

)(

(3.79)

alors en remplaant cette expression et la condition (3.78) dans lquation (3.77), on arrive finalement :

(A )

* 1 id

1 = F i id

1/ n

Fid

(3.80)

En dcomposant la matrice dcrite par lquation (3.79) sous la forme diagonale donne par lexpression (3.58) on obtient la matrice de covariance dans lespace dentre :
N T m ( ik ) (x k v ix ) (x k v ix ) = diag k =1 N ( ik ) m k =1
N

Fixd

(3.81)

et la composante de sortie de la matrice de covariance :


f iy =

( ik ) m ( y k f i (x k ; i )) 2
k =1

( ik ) m
k =1

(3.82)

En remplaant les quations (3.81) et (3.82) dans lexpression (3.80) on obtient alors :

Identification de modles flous Takagi-Sugeno (TS) partir de donnes A* ixd = ( i f iy Fixd

109

) (F )
1/ n ixd

(3.83)

et
i = i f iy Fixd
*

) (f )
1/ n iy

(3.84)

Finalement, pour minimiser la fonction objectif J FER par rapport aux paramtres T i = [a T correspondants aux sous modles linaires associs aux clusters, on arrive i , di ] une formulation de type moindres carrs pondrs (WLS) (cf. paragraphe 3.3.4) dont la solution est donne par lexpression (3.57). Dans ce cas, la matrice diagonale de pondration est donne par lexpression suivante :
i1 0 Wi = M 0

i2
M 0

0 L 0 O M L iN
L

(3.85)

tel-00136382, version 1 - 13 Mar 2007

Lalgorithme de clustering avec rgression floue ellipsodale (FER) peut se formuler de la manire suivante :
Algorithme FER - Fuzzy Ellipsoidal Regression

Etant donn un ensemble de donnes Z = { (x1 , y1 ),K , (x N , y N )} : Fixer le nombre de clusters 1 < c < N Fixer la structure des modles de rgression f i (x k ; i ) = a T i x + di Fixer le degr de flou m > 1 et la tolrance de fin dalgorithme > 0 Initialiser la matrice U = [ ik ] de partition floue Rpter Pas 1. Calculer les centres des clusters v ix dans lespace dentre (Eq. (3.74)) Pas 2. Calculer les matrices de covariance de cluster Fixd dans lespace dentre en utilisant (Eq. (3.81)) Pas 3. Calculer les matrices de pondration Wi (Eq. (3.85)) et les paramtres
T des sous modles linaires i = [a T i , d i ] pour chaque cluster (Eq. (3.57)) Pas 4. Calculer les facteurs f iy (composants de la matrice Fid ) associes chacune des sorties (Eq. (3.82)) Pas 5. Calculer les matrices diagonales de norme induite A id par lintermdiaire des expressions A ixd (Eq. (3.83)) et i (Eq. (3.84))

2 Pas 6. Calculer les distances d ik pour 1 i c et 1 k N (Eq. (3.64))

Pas 7. Mettre jour la matrice U de partition floue (Eq. (3.71)) Jusqu obtenir la stabilit de la partition (Eq. (3.44))

110

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

3.3.6.

Groupage robuste en prsence de bruit (algorithme RoFER)

Jusqu prsent, nous avons considr des algorithmes de clustering flou qui dune part, ncessitent ltablissement lavance du nombre de clusters et dautre part, qui sont orients pour le traitement des donnes non bruites dans lespace de reprsentation. Ces aspects constituent deux problmes majeurs du "monde rel" dans le cadre des mthodes de coalescence floue par partition. Dans ce paragraphe nous prsentons une version amliore de lalgorithme FER, nomm algorithme robuste de groupage flou avec rgression ellipsodale, en anglais Robust Fuzzy Ellipsoidal Regression (RoFER) [BAR03] [GRI04]. Lalgorithme est bas sur lapproche robuste dagglomration comptitive (RCA) utilise en vision artificielle et reconnaissance de formes [FRI99] et combine la dfinition de la mesure de distance utilise pour lalgorithme FER. Lalgorithme RoFER permet non seulement dtablir "automatiquement" le nombre de clusters linaires dans un but de modlisation floue, mais aussi davoir des caractristiques de robustesse par rapport au bruit et aux points aberrants (outliers). Dans cette approche on surestime initialement le nombre de clusters puis lalgorithme tend vers la valeur "optimale" de ce nombre lors de son processus itratif. Lalgorithme de clustering Robust Competitive Agglomeration (RCA), propos par Frigui et Krishnapuram [FRI96b] [FRI96a] [FRI99], minimise une fonction objectif base sur des prototypes flous et incorpore le concept de fonctions de poids de la statistique robuste [HUB81] pour rduire les effets des points aberrants ainsi que le concept dagglomration comptitive [FRI97] afin de dterminer un nombre appropri de clusters pour la partition. Lalgorithme combine les avantages des techniques de coalescence floue hirarchique et par partition. La fonction objectif inclut un composant dagglomration afin dincorporer les bnfices du clustering hirarchique, ainsi quune contrainte sur les degrs dappartenance afin de favoriser la comptition parmi les clusters. Lalgorithme gnre ainsi une squence de partitions avec un nombre de clusters qui diminue progressivement. Quand lalgorithme se termine on obtient une partition finale qui possde le nombre "optimal" de clusters. Lalgorithme commence par un grand nombre de petits clusters, comparativement dautres algorithmes traditionnels de clustering par partition, il a t montr que le rsultat final est moins sensible linitialisation et aux minimum locaux [FRI97]. Dautre part, tant donn que lalgorithme RCA est seulement un algorithme de clustering, il nas pas la capacit de rgression pour la dtermination directe des paramtres des fonctions dans les termes consquents du modles flous TS. Dans le cadre de la modlisation floue des systmes, diffrentes propositions ont t dvelopps afin de pallier cet inconvnient [CHU01] [REN03]. Pour sa part, lalgorithme RoFER66 permet, en incorporant la mesure de distance propose dans lalgorithme FER, de dterminer simultanment avec une approche robuste dagglomration comptitive, une partition floue pour lespace des antcdents et en mme temps, les paramtres des fonctions linaires dans les termes consquents des modles flous affines du type Takagi-Sugeno. Etant donn un ensemble de donnes Z = { (x1 , y1 ),K , (x N , y N )}, lalgorithme RoFER minimise la fonction objectif dfinie par lexpression :

tel-00136382, version 1 - 13 Mar 2007

66

Antrieurement, lalgorithme a t initialement cit sous le nom RPCA (Robust Parallel Competitive Agglomerative) [GRI05]. Le nom RoFER (Robust Fuzzy Ellipsoidal Regression) a t introduit par Grisales dans le cadre de cette thse et cest en fait, le nom retenu au cours du dveloppement de la bote outils graphique FMIDg sous Matlab pour la modlisation et lidentification floue TS de systmes [GRI07].

Identification de modles flous Takagi-Sugeno (TS) partir de donnes


c

111

J RoFER ( Z ; U, P) =
i =1

N ( ik ) i (d ) wik ik k =1 i =1 k =1
N 2 2 ik c

(3.86)
c i =1 ik = 1 donn

Soumisse la contrainte de normalisation dinspiration probabiliste

2 correspond celle de par lexpression (3.37) et dans laquelle la mesure de distance d ik lalgorithme FER (GKP+FCRM) tablie par lquation (3.64). Ici, P = [V, A, ] reprsente lensemble des matrices associes aux paramtres qui caractrisent chacun des clusters (centres de clusters dans p, matrices de norme induite et jeu des paramtres des sous modles linaires associ dans p+1). Notons galement que grce au processus dagglomration, le nombre de clusters c dans la fonction objectif (3.86) est mise jour dynamiquement dans lalgorithme RoFER.

tel-00136382, version 1 - 13 Mar 2007

De la mme faon que dans lalgorithme RCA67, lalgorithme RoFER prsente la particularit dutiliser simultanment deux ensembles de poids ayant deux interprtations en termes dappartenance aux classes. Le premier est constitu des coefficients dappartenance classiques ik (approche probabiliste) qui traduisent le degr dappartenance des observations aux classes. Le second est form des possibilits dappartenance wik (approche possibiliste) [KRI93] [DAV91] qui traduisent la "typicit" des observations aux classes. Les coefficients ik permettent de forcer la partition en un nombre c de classes dans lespace de reprsentation, alors que les coefficients wik visent amliorer la modlisation de celles-ci en confrant aux observations loignes une pondration rduite qui dpend de la distance ( wik = 0 pour les observations aberrantes). Lide fondamentale dincorporer des fonctions de la statistique robuste68 au niveau de la dfinition de la fonctionnelle au lieu de faire le calcul en utilisant directement la mesure de distance quadratique, a pour but de rduire les effets nocifs du bruit et des points aberrants en permettant une estimation robuste des paramtres. Pour cela, le critre doptimisation J RoFER est dfini en utilisant une fonction de perte i propre chaque cluster c, avec 1 i c , ainsi quune fonction de poids associe, dfinie comme :
2 2 2 wik = wi (d ik ) = i (d ik ) / d ik

(3.87)

o wik reprsente la typicit dun point z k = (x k , y k ) , 1 k N , par rapport au cluster i. La fonction objectif (3.86) dpend de deux termes, le premier terme est associ la fonction de perte i . Le minimum global de ce terme est atteint quand le nombre de clusters c est gal au nombre de "bons" points chantillon (i.e., chaque cluster contient un seul bon point de donnes). Les degrs dappartenance ik sont utiliss dans ce terme pour gnrer la partition floue des donnes. De plus, la contrainte de normalisation permet que les clusters partagent les points, en favorisant en mme temps un environnement de comptition [FRI96b]. Le second terme du critre dans lexpression (3.86) est utilis pour maximiser le nombre de "bons" points dans chaque cluster. Les poids wik ( dterminer) reprsentent les degrs daffinit ou de typicit des points par rapport aux prototypes des clusters et ils sont
67 68

Inspir de lalgorithme Robust c-Prototypes (RCP) [FRI96a]. Dans lexpression (3.86) le terme i(.) correspond la fonction de perte utilise dans les M-estimateurs de la statistique robuste et wi(.) reprsente la fonction de poids (influence) correspondante [FRI99] [HUB81].

112

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

utiliss pour gnrer des estimations robustes des paramtres des clusters. La fonction de poids wi rduit leffet des points aberrants au moyen du calcul des cardinalits69 robustes. Le minimum global de ce terme (en incluant le signe moins) est atteint quand tous les points sont concentrs dans un cluster et tous les autres clusters sont vides. Ce terme est associ alors lagglomration des clusters. Quand les deux termes sont combins avec un choix appropri du paramtre dagglomration , la partition finale minimisera la somme des distances intracluster en obtenant une partition floue de lensemble des donnes avec un nombre rduit de clusters [FRI96b].
Choix des fonctions robustes i et wi

tel-00136382, version 1 - 13 Mar 2007

Diverses fonctions robustes de perte ( i ) et de poids ( wi ) ont t utilises pour des algorithmes robustes de clustering dans la littrature [DAV97]. Pour lapproximation de courbes ou dans le cas de la rgression linaire, il est raisonnable de supposer que les rsidus ont une distribution symtrique autour de zro. Nanmoins, quand des distances positives sont utilises (plutt que des rsidus), cette supposition nest plus valable. Dans ce cas, des auteurs comme Frigui et Krishnapuram [FRI99] ont propos lutilisation dune fonction de perte i et des pondrations wik qui traduisent pour chaque classe c une fonction de pondration
wi (d 2 ) : + [ 0, 1] qui dcrot avec la distance au prototype des classes jusqu' atteindre la valeur zro partir dun certain seuil. Cette fonction de poids est dfinie de faon respecter les proprits suivantes : wi (d 2 ) est monotone dcroissante, wi (d 2 ) = 0 pour d 2 > Ti + S i , wi (0) = 1 , wi (Ti ) = 0,5 et wi (0) = 0 .

Dans les expressions prcdentes est un facteur constant et les termes Ti et Si correspondent respectivement deux estimateurs couramment employs : la valeur mdiane (Med) et lcart moyen absolu (MAD70) des distances entre les observations affectes chaque cluster et son prototype respectif, selon les expressions :
2 ) Ti = Med (d ik i

(3.88)

2 2 S i = MAD d ik = Med d ik Med i i i

( )

(3.89)

A chaque itration du processus dapprentissage, lestimation des valeurs de Ti et Si pour chaque cluster c conditionne lallure des fonctions de pondration. Un exemple de couple de fonctions robustes de perte
2 ) et de poids i (d ik

2 2 2 wi (d ik ) = i (d ik ) / d ik remplissant les diffrentes contraintes cites ci-dessus est dfini au travers des expressions suivantes [FRI99] :

Rappelons que la cardinalit dun ensemble flou A={A(xj)/xj | j=1,,n}, note par A est dfinie comme la . somme de ses degrs dappartenance respectifs : A = n j =1 A ( x j )
69 70

MAD : Mean Absolute Deviation. Moyenne arithmtique de la valeur absolue des carts de chacune des donnes dune srie dobservations par rapport aux prvisions.

Identification de modles flous Takagi-Sugeno (TS) partir de donnes Pour la fonction de poids on a :
d4 1 2 2Ti 2 d (Ti + S i wi (d 2 ) = 2 2 S i2 0 si d 2 [ 0 , Ti ]

113

si d 2 (Ti , Ti + S i ] si d 2 > Ti + S i

(3.90)

Il est simple de dmontrer que la fonction de perte associe est dfinie par : d6 2 d 2 6Ti 2 3 5T + S i d (Ti + S i 2 + i i (d ) = 2 2 6 6 Si 5Ti + S i + Ki 6 si d 2 [ 0 , Ti ] si d 2 (Ti , Ti + S i ] si d 2 > Ti + S i (3.91)

tel-00136382, version 1 - 13 Mar 2007

Dans lexpression (3.91) le facteur K i est une constante dintgration dfinie pour chaque i-me cluster et calcule selon lexpression :
5T j + S j 5Ti + S i , K i = max 1 j c 6 6

1 i c

(3.92)

Cette constante permet dviter laffectation dobservations bruites une classe particulire en forant chaque fonction i a la mme valeur maximale. La Figure 3.5 montre de telles fonctions robustes de poids wi et de perte i associes chacun des clusters [FRI99] :

Figure 3.5. Illustration des fonctions robustes wi et i associes chacun des clusters.

114

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

Les trois zones repres sur la Figure 3.5 correspondent respectivement une zone de "donnes typiques" o les poids (possibilits) wik dappartenance au i-me cluster sont suprieures 0,5, une zone intermdiaire de doute o les possibilits dappartenance au cluster sont infrieures 0,5 et une zone de rejet qui pnalise les observations trop loignes du prototype du cluster. Il est clair que pour les points aberrants ce poids est wik = 0 . Par ailleurs, le coefficient dans les expressions (3.90) (3.92) est un facteur de rglage qui permet dagir sur la zone dinfluence des fonctions de pondration. Celui-ci prend gnralement une valeur entre 4 et 12. Si est trop grand, les fonctions de pondration wi ont une rgion intermdiaire plus dilate, cest--dire que les observations loignes ont des poids faibles mais non nuls ce qui perturbe lestimation des paramtres des classes. Dun autre cot, si est trop petit, peu dobservations sont considres au niveau du processus destimation des paramtres et lalgorithme risque de converger prmaturment vers un minimum local. Pour pallier cette difficult, [FRI99] considre quil faut tablir un compromis, en initialisant avec une valeur importante puis faire dcroitre ce facteur lors des itrations suivantes. Ceci a pour effet de permettre une plus forte mobilit lors des premires itrations, puis au cours des dernires itrations de stabiliser les estimations des paramtres des clusters. La fonction de dcroissance du coefficient entre deux itrations conscutives est alors tablie de la faon suivante :

(t )

tel-00136382, version 1 - 13 Mar 2007

= max ( min , (t 1) )

(3.93)

avec { ( 0 ) = 12 , min = 4 , = 1 }.
Mise jour du paramtre dagglomration

Comme nous lavons dj indiqu, le paramtre permet dtablir une balance entre les deux termes qui constituent la fonction objectif donne par (3.86). Daprs [FRI96b], le processus dagglomration contrl par devrait tre lent au dbut pour encourager la formation de petits clusters. Ensuite, ce paramtre devrait tre augment graduellement afin de favoriser lagglomration. Aprs quelques itrations, quand le nombre de clusters devient proche dune valeur approprie (idalement l"optimale"), la valeur de devrait de nouveau diminuer lentement pour permettre lalgorithme datteindre la convergence. Donc, un choix approprie de litration (t) est donne par lexpression suivante [FRI99] :

(t ) = (t )

( t 1) 2 2 (t ) ) i (d ik ) ( ik

i =1

k =1 c

N ( t ) ( t 1) ik wik i =1 k =1

(3.94)

dans laquelle le facteur ( t ) est donne par :

(t ) =

0 e _ t0 t / 0

si t > 0 si t = 0

(3.95)

o 0 est la valeur initiale, est une constante de temps et t 0 est le nombre ditration partir duquel le facteur commence diminuer. Typiquement les valeurs pour ces paramtres sont 0 = 1 , = 10 et t 0 = 5 . Avec une initialisation approprie de lalgorithme, ces valeurs sont raisonnablement indpendantes de lapplication [FRI99].

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

115

Dautre part, il faut remarquer que les valeurs utilises dans lexpression (3.94) sont toutes connues litration (t). En consquence, est une valeur fixe, qui est vue comme une constante lors de la procdure doptimisation suivante.
Obtention des paramtres des prototypes des clusters

Pour minimiser la fonctionnelle J RoFER donne par lexpression (3.86) soumise la contrainte de normalisation (3.37), nous utilisons le mme type de procdure itrative que celle dcrite pour lalgorithme FER travers les conditions du premier ordre. En appliquant les multiplicateurs de Lagrange on obtient : J RoFER ( Z ; U, P, ) =
i =1 c N N c ( ik ) i (d ) wik ik k ik 1 k =1 i =1 k =1 k =1 i =1 N
2 2 ik

(3.96)

o P = [V, A, ] reprsente lensemble des matrices associes aux paramtres qui caractrisent les clusters et les termes k correspondent aux multiplicateurs de Lagrange. Les conditions ncessaires pour la minimisation de J RoFER sont alors :
tel-00136382, version 1 - 13 Mar 2007
N J RoFER 2 = 2 ik i (d ik ) 2 wij ij k = 0 , i, k ik j =1
2 N J RoFER d ik 2 = ( ik ) wik = 0 , i Pi Pi k =1

(3.97) (3.98) (3.99)

c J RoFER = ik 1 = 0 , k k i =1

Lquation (3.97) et la contrainte de normalisation (3.37) reprsentent un ensemble de N c + N quations linaires avec N c + N inconnues ( ik et k ). Une simplification du calcul est obtenue en considrant que les degrs dappartenance ik ne changent pas significativement entre deux itrations conscutives. Ds lors, le terme

j =1 wij ij
N

dans

lexpression (3.97) est calcul en utilisant la valeur du degr dappartenance de litration prcdente. On obtient alors lexpression suivante :

ik =

2 i + k 2 2 i (d ik )
N

(3.100)

o la cardinalit robuste du i-me cluster, note i , est donne par lexpression : i = j =1 wij ij (3.101)

Cette variable est dune grande importance pour le processus dagglomration, car elle va dterminer si le cluster considr peut tre fusionn avec son cluster adjacent ou si le cluster va disparatre. En effet, quand la cardinalit robuste i est plus petite quun certain seuil prtabli dans lalgorithme, le cluster respectif est alors cart et le nombre de clusters est mise jour. La valeur est une constante que nous appelons le seuil de cardinalit robuste. En utilisant lexpression (3.100) et la contrainte (3.37) on obtient :
2 2 k = 2 1 i / i (d ik ) 1 / j (d jk )

i =1

j =1

(3.102)

116

Identification de modles flous Takagi-Sugeno (TS) partir de donnes Et en remplaant cette expression dans (3.100) on obtient finalement :

ik =

2 1 / i (d ik )

1 / j (d 2 jk )
j =1 c j =1

2 i (d ik )

k )

(3.103)

o le terme k = j / j (d 2 jk )
j =1

1 / j (d 2 jk )

est la moyenne pondre des cardinalits.

Le premier terme de lexpression (3.103) indique le degr avec lequel le cluster i partage la donne z k = (x k , y k ) (en utilisant des distances robustes) ; le deuxime terme dpend de la diffrence entre la cardinalit robuste du cluster dintrt et la moyenne pondre des cardinalits. Le fonctionnement de lalgorithme est alors tabli sur un principe dagglomration comptitive entre clusters, bas sur des cardinalits robustes. Par ailleurs, en ce qui concerne lactualisation des paramtres des prototypes des clusters P = [V, A, ] , on retrouve les mmes types dexpressions que celles de lalgorithme FER, sauf quelles sont affectes par le facteur robuste de poids wik correspondant. En considrant la contrainte dhypervolume du cluster (3.62), partir de lexpression (3.98) et de la dfinition de la mesure de distance (3.64), les quations de mise jour des paramtres caractristiques des clusters pour chaque itration (t) sont donnes par les expressions suivantes : Centres des clusters hyperellipsodaux dans lespace dentre de dimension p :
v ix
(t )

tel-00136382, version 1 - 13 Mar 2007

wik
k =1 N k =1

(t )

( ik ) m x k
(t ) (t ) (t )

wik ( ik ) m

1 i c.

(3.104)

Matrice (robuste) de poids pour lestimation des paramtres des sous modles linaires :
Wi
(t )

= diag ( i1 ) m wi1 , ( i 2 ) m wi 2 , K , ( iN ) m wiN


(t ) (t ) (t ) (t ) (t )

(t )

(3.105)

Vecteur des paramtres du sous modle linaire associ chaque cluster :


i
(t )

= XT e Wi X e

(t )

XT e Wi y

(t )

(3.106)

Matrice de covariance (robuste) dans lespace dentre :


(t ) (t ) m (t ) (t ) (t ) T N ( ik ) wik (x k v ix ) (x k v ix ) = diag k =1 N (t ) (t ) ( ik ) m wik k =1

Fixd

(3.107)

Composante de sortie de la matrice de covariance :


f iy
(t )

( ik
k =1

(t ) m

) wik ( y k f i (x k ; i )) 2

(t )

(t )

( ik ) m wik
(t ) k =1

(t )

(3.108)

Identification de modles flous Takagi-Sugeno (TS) partir de donnes Matrice de norme induite dans lespace dentre :
A ixd
(t )

117

= i f iy

(t )

Fixd

(t ) 1 / n

) (F )
ixd ( t ) 1 iy

( t ) 1

(3.109)

Composante de sortie de la matrice de norme induite :


i
(t )

= i f iy

(t )

Fixd

(t ) 1 / n

) (f )

(3.110)

Lalgorithme de clustering robuste avec rgression floue ellipsodale (RoFER) peut se formuler de la manire suivante :
Algorithme RoFER Robust Fuzzy Ellipsoidal Regression

Etant donn un ensemble de donnes Z = { (x1 , y1 ),K , (x N , y N )} : Fixer le nombre maximal de clusters c max
tel-00136382, version 1 - 13 Mar 2007

Fixer le seuil de cardinalit robuste et le coefficient ( 0 ) Fixer le degr de flou m > 1 et la tolrance de fin dalgorithme > 0 Initialiser les prototypes des clusters [V, A, ] et la matrice U = [ ik ] de partition floue avec un algorithme appropri (e.g. avec lalgorithme FER)
Rpter
2 Pas 1. Calculer les distances d ik pour 1 i c et 1 k N (Eq. (3.64))

Pas 2. Calculer les paramtres Ti (Eq. (3.88)) et S i (Eq. (3.89)) Pas 3. Mettre jour les fonctions robustes wi (Eq. (3.90)) et i (Eq. (3.91)) Pas 4. Mettre jour le paramtre dagglomration (Eq. (3.94)) Pas 5. Calculer la cardinalit robuste i (Eq. (3.101)) Pas 6. Mettre jour la matrice U de partition floue (Eq. (3.103)) Pas 7. Comparer la cardinalit robuste i de chaque cluster avec le seuil de cardinalit robuste dfini lors de linitialisation de lalgorithme Si i < alors carter li-me cluster, i , avec 1 i c Pas 8. Mettre jour le nombre de clusters c , avec coptimal c c max Pas 9. Mettre jour les paramtres des prototypes des clusters : Les centres des clusters v ix dans lespace dentre (Eq. (3.104)) Les matrices de pondration Wi (Eq. (3.105)) pour lestimation des paramtres
T des sous modles linaires i = [a T i , d i ] pour chaque cluster (Eq. (3.106)) Les matrices de covariance de cluster Fixd dans lespace dentre (Eq. (3.107)), ainsi que la composante de sortie f iy (Eq. (3.108))

Les matrices diagonales de norme induite A id par lintermdiaire des expressions A ixd (Eq. (3.109)) et i (Eq. (3.110)) Pas 10. Mettre jour le coefficient de rglage (Eq. (3.93))
Jusqu obtenir la stabilit de la partition (Eq. (3.44))

118
Remarques
R 3.7

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

Comparativement aux algorithmes classiques de clustering (e.g. FCM, GK, FCRM), lalgorithme RoFER peut impliquer un temps de calcul suprieur d aux diffrentes quations mettre jour lors de chaque itration. Cependant, comme nous le verrons dans des exemples ultrieurs, lalgorithme considr peut avoir une performance suprieur dans la mesure quil fournit directement une estimation des paramtres des sous modles linaires avec des caractristiques de robustesse vis--vis du bruit et des points aberrants. De plus, avec une slection approprie du seuil de cardinalit robuste, il est possible dobtenir "automatiquement" un nombre convenable de clusters pour la partition floue. Nous considrons que ces deux caractristiques sont intressantes dans le cadre de la modlisation floue de systmes, compte tenu quun tel processus est ralis hors ligne, o le temps de calcul nest pas un facteur critique. Comme nous lavons dj fait remarquer, dans lalgorithme RoFER le seuil de cardinalit robuste , est un paramtre qui doit tre fix par lutilisateur. Ce paramtre a une importance majeure dans le nombre final de clusters obtenus au niveau de la partition floue des donnes. En effet, ce seuil est une valeur constante qui conditionne la possibilit de survivre des clusters lors du processus dagglomration comptitive. Pour des algorithmes similaires trouves dans la littrature [CHU01], cette valeur est ajuste en fonction de lapplication vise, comportant normalement des valeurs basses (e.g., < 10 ) pour des applications de petite taille (e.g., N 400 ). Grisales au cours de ces travaux de thse a dvelopp une expression exprimentale lors de la modlisation floue de type Takagi-Sugeno pour diverses fonctions non linaires. La valeur initiale propose est alors donn par lexpression : =

R 3.8

tel-00136382, version 1 - 13 Mar 2007

N
6 c max

(3.111)

o la variable N est le nombre de donnes (paires entre-sortie) disponibles pour la modlisation et cmax est la valeur dinitialisation (la valeur maximale) du nombre de clusters dans lalgorithme. Nous abordons maintenant une description de la mthodologie gnrale pour la construction de modles flous Takagi-Sugeno partir des donnes entre-sortie des systmes.

3.4. Construction de modles mthodologie gnrale

TS

partir

de

donnes :

Nous lavons vu, les techniques de clustering flou sont des outils puissants pour la reconnaissance des formes partir des donnes. Dans le cadre de la modlisation floue des systmes, notre intrt porte sur lobtention des modles Takagi-Sugeno qui permettent une dcomposition automatique dun systme non linaire dans un ensemble de rgions linaires (clusters). Pour cela, nous appliquons des techniques de clustering flou dans lespace produit dentre-sortie des donnes. Les algorithmes prsents prcdemment ont tous des caractristiques particulires qui peuvent tre runies dans une seule vue densemble. Nous abordons ainsi une description dune mthodologie gnrale pour la construction des modles flous du type TS, en mettant laccent sur les besoins communs qui sont : la validation du nombre de clusters, la gnration des fonctions dappartenance des antcdents, lobtention des paramtres des consquents et la validation numrique du modle final. Ces aspects seront

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

119

prsents dans les paragraphes qui suivent, avant daborder quelques exemples illustratifs la fin du chapitre. La Figure 3.6 illustre la procdure de construction des modles flous de type TakagiSugeno partir de donnes, en utilisant des techniques de clustering. La procdure est itrative, dans la mesure o, dans une mme session de modlisation, on peut rpter certains pas afin de tester diffrents choix pour plusieurs paramtres.

tel-00136382, version 1 - 13 Mar 2007

Figure 3.6. Vue gnrale de la mthodologie didentification non linaire base sur lapproche de clustering flou

Nous allons dcrire chaque tape de la mthodologie pour la construction de modles flous du type Takagi-Sugeno.
Conception de lexprience didentification et acquisition des donnes

Cest ltape initiale de nimporte quelle mthode didentification, puisquelle dtermine le contenu dinformation des donnes didentification. Contrairement aux techniques linaires, les signaux du type squence binaire pseudo-alatoire (PRBS71) ne sont pas appropris en gnral pour lidentification non linaire et en particulier pour le clustering flou [BAB98a]. Bien que le choix du signal dexcitation puisse tre dpendant du problme, le signal dentre devrait de prfrence exciter le systme dans toute la gamme de fonctionnement, tant en amplitude quen frquence, pour les variables considres. Le signal PRBS nest pas appropri puisquil contient seulement deux valeurs damplitude. Des choix typiques sont des signaux multi-sinusodaux ou bien des signaux multi-chelon avec
71

PRBS : Pseudo-Random Binary Sequence.

120

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

amplitude et largueur alatoires [GOD93]. Un bruit blanc de petite amplitude est souvent ajout ces signaux pour garantir lexcitation approprie de la dynamique du procd. Le choix dune priode dchantillonnage ainsi que la dure des expriences sont aussi des aspects importants pour la conception de lexprience.
Slection de la structure entre-sortie

Le propos de cette tape est la dtermination des entres et sorties prpondrantes par rapport au but final de la modlisation. Quand il sagit de lidentification des systmes dynamiques, il faut choisir la structure et lordre du modle dynamique. Par exemple, pour le cas des modles dynamiques non linaires du type NARX (cf. expression (3.25)), cela se traduit par la dfinition des rgresseurs et des valeurs pour les constantes ny, nu et nd associes lordre du systme. Une fois les rgresseurs tablis, le choix de la structure permet de traduire lidentification dun systme dynamique en un problme de rgression qui peut tre rsolu dune faon statique72 [LEO85]. Cest pourquoi les modles flous de type TakagiSugeno, caractriss par leurs capacits dapproximation des fonctions non linaires ainsi que de reprsentation en utilisant des rgles, sont des structures candidates flexibles pour la modlisation.
tel-00136382, version 1 - 13 Mar 2007

A laide des donnes, la structure peut tre choisie de faon automatique, en comparant diffrentes structures potentielles en termes dune certaine mesure de performance [HE93] [BOM98] [RHO98] [HAD02] [FEI04] [SIN04] [UNR07]. Dans la plupart des cas, un choix raisonnable peut tre fait par lutilisateur, en se basant sur la connaissance pralable du procd et/ou le but mme de la modlisation73. Dans la pratique, un compromis entre lexactitude et la complexit est recherch. Ainsi par exemple, dans un but de prdiction, usuellement le modle peut contenir plus de paramtres afin de chercher une excellente performance numrique. Dun autre ct, dans le cas de la commande floue base sur un modle, et en particulier dans lapproche du type PDC (cf. Chapitre 4), lobjectif de la modlisation consistera plutt trouver un compromis entre la complexit du modle et sa performance numrique au niveau de la reprsentation du systme dynamique. En effet, la complexit du contrleur est directement associe celle du modle flou tudi.
Clustering flou

La slection de la structure conduit un problme de rgression non linaire statique, qui est alors approxim par une collection de sous modles linaires locaux. La localisation et les paramtres des sous modles sont tablis en partitionnant les donnes disponibles en clusters hyperplanaires (cas des algorithmes FCRM, FER et RoFER) ou hyperellipsodaux (cas de lalgorithme GK). Chacun des clusters dfinit une rgion floue (par lintermdiaire des antcdents) dans laquelle le systme peut tre approxim localement par un sous modle linaire (au moyen des consquents). Dans le cas des trois premiers algorithmes qui possdent des clusters hyperplanaires dans lespace de sortie, lestimation des paramtres des sous modles linaires affines fait parti du processus de clustering. Par contre, dans le cas de lalgorithme de clustering GK, lobtention des paramtres des consquents du modle TS correspondant est faite lors dune tape postrieure au processus de clustering.
72

Cela signifie que la sortie du systme dynamique non linaire peut tre vue comme une hypersurface statique dans lespace produit dentre-sortie, qui est le mme espace que celui des rgresseurs-sortie. Du point de vue gomtrique, le concept garde une certaine analogie avec celui de la "surface de commande" associ aux modles flous destins la commande. 73 Typiquement, le choix dune structure pauvre (trop peu de rgresseurs) entrane une modlisation inexacte des non linarits et de la dynamique du procd. Par contre, le choix dune structure plus riche que ncessaire (trop de rgresseurs), amne des problmes destimation mal conditionns et une surestimation des donnes.

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

121

Dautre part, il faut remarquer aussi que pour les algorithmes GK, FCRM et FER, lutilisateur doit dfinir lavance le nombre c de clusters (nombre souhait des rgions linaires). Ce nombre reste constant pendant toute lexcution de lalgorithme. Pour lalgorithme RoFER, le nombre initial de clusters doit tre surdimensionn ; il correspond au nombre maximal de clusters, qui au cours des itrations va diminuer progressivement jusqu' atteindre (idalement) la valeur optimale.
Validation du nombre de clusters

tel-00136382, version 1 - 13 Mar 2007

Le nombre appropri de clusters peut tre influenc par le but mme de la modlisation (e.g., contrle de la complexit,). Pour lalgorithme RoFER, grce au surdimensionnement du nombre de clusters et lapproche dagglomration comptitive, il est suppos que le nombre attendu des clusters corresponde celui qui permet dtablir le meilleur compromis entre le nombre de classes et la partition floue obtenue pour les donnes. Pour les algorithmes GK, FCRM et FER, il est plutt conseill dappliquer des mesures de validation du nombre de clusters (cf. paragraphe 3.4.1) [BAB98a] et/ou de fusion de clusters [KAY95] afin de dterminer le nombre de clusters appropri pour une application particulire. Typiquement cet tape du processus de modlisation implique plusieurs rptitions de ltape prcdente (clustering flou) afin dvaluer les rsultats pour un nombre diffrent de clusters ainsi que pour diffrentes initialisations des paramtres dans les algorithmes respectifs.
Obtention du modle flou Takagi-Sugeno

Le clustering flou divise les donnes disponibles dans des groupes o des relations linaires existent entre les entres et la sortie. Afin dobtenir un modle appropri pour des propos de prdiction ou de synthse dun contrleur, un modle flou (de structure dfinie) bas sur des rgles est extrait de la matrice de partition floue disponible ainsi que des prototypes des clusters. Les rgles, les fonctions dappartenance et dautres paramtres qui constituent le modle flou sont obtenus de faon automatique. Des mesures de similarit floue [SET98] peuvent tre employes afin de rduire la base de rgles initiale ou bien pour amliorer linterprtation linguistique des fonctions dappartenance. La procdure dobtention du modle flou TS correspondant passe typiquement par la gnration des fonctions dappartenance des antcdents (cf. paragraphe 3.4.2) et dans certains cas (e.g., pour lalgorithme GK), par lobtention des paramtres des consquents (cf. paragraphe 3.4.3).
Validation du modle flou TS

Par intermdiaire de la validation, le modle flou obtenu est considr comme appropri pour le propos donn ou bien, il est rejet. Dans ce dernier cas, certaines tapes de la mthodologie gnrale didentification prsent sur la Figure 3.6 peuvent tre rpts ; cette dmarche est usuelle aussi dans dautres approches didentification linaire et non linaire des systmes [LJU87] [MUR97]. En plus de la validation numrique habituelle au moyen de la simulation, linterprtation des modles flous joue un rle important dans ltape de validation. La couverture de lespace dentre par les rgles peut tre analyse, et pour une base de rgles incomplte, des rgles supplmentaires peuvent tre fournies en se basant sur la connaissance pralable (linarisation locale ou par des modles issus des principes ou lois physiques). Pour terminer cette vue densemble de la construction des modles flous de type TakagiSugeno, nous abordons plus en dtail les aspects concernant la validation du nombre de clusters, lobtention de la base de rgles (i.e., la gnration des fonctions dappartenance des antcdents et lobtention des paramtres des consquents) et la validation finale du modle.

122

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

3.4.1.

Validation du nombre de clusters

Lutilisation des mesures de validation des clusters est une approche standard pour la dtermination dun nombre appropri de clusters dans un ensemble de donnes. Cette approche savre utile spcialement pour les mthodes de clustering qui ncessitent la slection a priori du nombre de classes. Lanalyse de validit des clusters est ralise en excutant lalgorithme de clustering pour diffrents valeurs de c74, plusieurs reprises pour chaque c avec une initialisation diffrente. La mesure de validit est calcule pour chaque excution et le nombre de clusters qui optimise la mesure est alors choisi comme tant le nombre "convenable" de clusters pour lensemble des donnes. Les mesures de validit peuvent tre aussi values pour diffrentes structures du modle (diffrent choix des entres et de lordre du modle). Il faut noter que lutilisation des mesures de validit est lourde en temps de calcul car le processus de clustering doit tre rpt plusieurs fois. La plupart des mesures de validit sont conues pour quantifier la sparation et la compacit des clusters. Nanmoins, comme le souligne Bezdek [BEZ81], le concept de validit de clusters est ouvert linterprtation et peut tre formul de faons diffrentes. En consquence, plusieurs mesures de validit ont t introduites dans la littrature (voir par exemple [BEZ81] [GAT89] [PAL95]). Nous prsentons par la suite quelques mesures de validit des clusters couramment utiliss. Chaque critre est suppos atteindre sa valeur optimale lorsque la valeur de c correspond au nombre de clusters rels. Cependant, la recherche dune partition optimale nest pas du tout une tche simple parce que, bien que disposant du meilleur critre possible, il reste un bon nombre de partitions envisageables pour le mme jeu de donnes. En plus, en gnral elles sont sensibles au bruit. En pratique, ces critres permettent lutilisateur davoir un guide pour le choix convenable du nombre de clusters pour son application particulire.

tel-00136382, version 1 - 13 Mar 2007

Hypervolume flou (CHF75) Il est associ aux matrices Fi de covariance floue des clusters. Une bonne partition est indique par des valeurs petites du critre, dfini par lexpression (3.112) :
C HF (c) = [det(Fi ]1 / 2
i =1 c

(3.112)

Coefficient de partition (CCP) Propos par Bezdek [BEZ81], il mesure la quantit de "chevauchement" (overlapping) entre clusters. Le principal inconvnient du critre CCP est le manque de rapport direct avec certaine proprit des donnes. La valeur optimale du nombre de clusters correspond au maximum du critre ; il est dfini comme : 1 c N C CP (c) = ( ik ) 2 (3.113) N i =1 k =1 Entropie de classification (CEC) Elle est similaire au coefficient de partition prcdent dans le sens que cette mesure est associe au degr de "flou" (fuzzyness) de la partition. Le critre est donn par lexpression suivante :
74 75

Dans le cas de lalgorithme RoFER, pour diffrentes valeurs du seuil de cardinalit robuste . Dans cette notation, la lettre C correspond au mot critre. Le petit c correspond (comme toujours dans notre notation) au nombre de clusters.

Identification de modles flous Takagi-Sugeno (TS) partir de donnes


C EC (c) =
1 N

123

ik log ( ik )
i =1 k =1

(3.114)

Index de partition (CIP) Ce critre tient compte du rapport de la compacit et la sparation des clusters. Il correspond la somme des mesures de validit individuelles, normalises par la division de la cardinalit floue i de chaque cluster, selon lexpression donn par [BENS96] :
( ik ) m x k v i k =1 C IP (c) = 2 c i =1 i j =1 v j v i
c N 2

(3.115)

Ce critre est utile aussi pour la comparaison de diffrentes partitions avec le mme nombre de clusters. Une valeur basse du critre CIP indique une meilleure partition.

Index de sparation (CIS) A linverse du critre prcdent, cet index utilise une sparation de distance minimale pour la validation de la partition [BENS96]. Le critre CIS est donn par :
tel-00136382, version 1 - 13 Mar 2007
C IP (c) =
i =1 c N k =1 ( ik ) m x k v i 2 2

i min i ,k v k v i

(3.116)

Nous abordons par la suite lobtention de la base de rgles du modle flou Takagi-Sugeno (TS). Cela implique la gnration des fonctions dappartenance des antcdents et lobtention des paramtres des consquents.
Obtention de la base de rgles du modle flou Takagi-Sugeno

En gnral, pour les algorithmes de coalescence floue prsents dans la section prcdente (cf. section 3.3) except lalgorithme FCM76, chaque cluster obtenu dans lespace produit dentre-sortie77 des donnes peut tre vu comme une approximation locale linaire de lhypersurface de rgression. Le modle flou global peut tre reprsent convenablement comme une collection de rgles du type Takagi-Sugeno affines (cf. paragraphe 3.1.2), de la forme donne par lexpression suivante :

Ri :

Si x est Ai Alors y i = a T i x + di ,

i = 1, K, r

(3.117)

o le nombre r de rgles correspond au nombre c de classes (clusters) issu du processus de clustering, x p est le vecteur dentre correspondant une observation et y est la variable de sortie. Ai est le sous-ensemble flou de lantcdent de li-me rgle, dfinie, dans ce cas, par une fonction dappartenance multidimensionnelle. Pour sa part, le consquent de chacune des rgles est form par le vecteur des paramtres a i p et le scalaire d i . Les conclusions des rgles dans ce modle sont alors des hyperplans dans lespace p+1. Les ensembles flous Ai peuvent tre dcrits dans leur forme naturelle multidimensionnelle, ou bien dans leur forme dcompose, en projetant la partition floue sur les variables de lantcdent. Les paramtres a i et d i des consquents sont estims partir des donnes en utilisant des mthodes des moindres carrs (cas des algorithmes FCRM, FER et RoFER), ou bien ils peuvent tre extraits partir de la structure propre des matrices de covariance des clusters (cas de lalgorithme GK), comme on le verra par la suite.
76 77

Ce nest pas exactement le cas avec lalgorithme FCM, car il conduit des clusters hypersphriques. Espace dentre-sortie de dimension p+1.

124

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

3.4.2.

Gnration des fonctions dappartenance des antcdents

Les fonctions dappartenance des antcdents peuvent tre obtenues en calculant les degrs dappartenance directement dans lespace produit des variables de lantcdent. Elles peuvent aussi tre extraites partir de la matrice de partition floue U en appliquant le mcanisme de projection sur ces variables. Nous dcrivons ces mthodes par la suite.
Fonctions dappartenance multidimensionnelles des antcdents

Dans cette approche, les fonctions dappartenance des antcdents sont reprsentes analytiquement en calculant linverse de la distance par rapport au prototype du cluster. Le degr dappartenance est calcul directement pour la totalit du vecteur dentre x p, il ny a pas de dcomposition. Les antcdents des rgles du modle flou TS sont alors des propositions simples avec des ensembles flous multidimensionnels (cf. expression (3.117)), dans lesquels le degr daccomplissement des rgles est donn par i (x) = A i (x) . Quand les donnes ont une partition floue stricte, le degr daccomplissement pour chaque rgle est dtermin en utilisant lexpression [BAB98a] :
tel-00136382, version 1 - 13 Mar 2007

i ( x) =

c j =1

1 (D A ix (x, v ix ) D A ix (x, v jx ))2 /( m1)

(3.118)

Gnration des fonctions dappartenance des antcdents par projection

Le principe de cette mthode est de projeter pour chaque rgle, les ensembles flous multidimensionnels78 dfinis point par point dans la matrice de partition floue U sur les variables individuelles des antcdents. Dans le cas o ces variables sont les entres utilises pour faire le clustering, il sagit dune projection orthogonale des donnes. On projette donc la matrice de partition floue sur chacun des axes des variables (i.e., sur les rgresseurs) de lantcdent x j , avec 1 j p . Les rgles correspondantes du modle flou TS sont alors exprimes sous la forme conjonctive suivante :
Ri :
Si x1 est Ai1 et et x p est Aip Alors y i = a T i x + di ,

i = 1,K, r

(3.119)

Pour obtenir les fonctions dappartenance des sous-ensembles flous Aij de lantcdent, lensemble flou multidimensionnel dfini point par point par li-me ligne de la matrice de partition est projet sur les rgresseurs x j . Cette opration de projection est reprsente par lexpression suivante puis illustr sur la Figure 3.7a : A ij ( x jk ) = proj j ( ik ) (3.120)

Dfinition (projection) : Soit un sous-ensemble flou A dfini sur un univers X 1 X 2 , produit cartsien de deux univers X 1 et X 2 . On dfinit la projection de A sur X 1 comme le sous-ensemble flou de X 1 , not proj X 1 ( A) , de fonction dappartenance :

proj X ( A ) ( x1 ) = sup x X A ((x1 , x 2 )), x1 X 1


1 2 2

(3.121)

On dfinit de manire analogue la projection de A sur X 2 . Pour des raisons de simplicit on a dfini cette projection sur deux univers, mais de la mme faon on peut le faire sur p univers.
78

Un ensemble flou dfini sur un univers de discours multidimensionnel est appel un ensemble flou multidimensionnel.

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

125

Comme nous lavons dj dit, le degr daccomplissement i (x) = A i (x) pour li-me rgle doit tre calcul comme une combinaison des degrs dappartenance de chaque proposition individuelle en utilisant des oprateurs logiques flous. On reconstruit donc le cluster dans lespace des entres en appliquant loprateur intersection79 dans lespace Cartsien des variables de lantcdent, de la faon suivante : i = A ( x1 ) A ( x 2 ) K A ( x p ) (3.122)
i1 i2 ip

tel-00136382, version 1 - 13 Mar 2007

Il faut noter que cette reconstruction nest en gnral pas exacte. En effet, elle peut entraner une erreur de dcomposition dans le cas o les clusters sont obliques par rapport aux axes de projection (voir Figure 3.7b, adapte daprs [GAW02]). Lerreur de dcomposition est reprsente dans cette figure par la diffrence des surfaces entre le rectangle et lellipse dans le support de lensemble flou dnot A1. Cette erreur peut tre partiellement compens par une estimation des paramtres des consquents en utilisant la mthode des moindres carrs globales [BAB98a]. Si lerreur est trop importante, on peut galement envisager un changement de variables et donc de repre en faisant une projection des p premiers vecteurs propres de la matrice de covariances des clusters. partir de cette matrice on peut dans ce cas profiter de linformation sur lorientation des clusters afin de rduire lerreur de dcomposition.

(a) Mcanisme de projection

(b) Erreur de dcomposition correspondante

Figure 3.7. (a) Illustration du mcanisme de projection et (b) de lerreur de dcomposition au moment de la recomposition (intersection floue) dans lespace de lantcdent.

Paramtrisation des fonctions dappartenance

modle dans un but de prdiction ou de commande, les fonctions dappartenance de lantcdent doivent tre exprimes sous une forme qui permet le calcul des degrs dappartenance, mme pour des donnes dentre non contenues dans lensemble des donnes Z. Cela est ralis en approximant la fonction dappartenance dfinie point par point par une fonction paramtrique approprie (e.g., les expressions (3.3) et (3.4)), comme illustr sur la Figure 3.8 (daprs [BAB98a]) :
79

i de la matrice de partition floue U sur la variable xj de lantcdent. Afin dobtenir un

Une dfinition point par point de lensemble flou Aij est obtenue en projetant li-me ligne

On peut utiliser dautres t-normes, cest--dire des oprateurs dintersection, comme le produit au lieu de loprateur min ().

126

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

Figure 3.8. Approximation des donnes projetes par une fonction dappartenance paramtrique.

tel-00136382, version 1 - 13 Mar 2007

La fonction dappartenance est adapte lenveloppe des donnes projetes en optimisant numriquement ses paramtres. Un avantage de cette mthode par rapport aux fonctions dappartenance multidimensionnelles vient du fait que les fonctions dappartenance projetes peuvent toujours tre approximes par des ensembles flous convexes. De plus, des fonctions dappartenance asymtriques peuvent tre utilises pour reflter la partition relle du problme de rgression non linaire considr. Nous trouverons ce type de fonctions dappartenance dans le chapitre 5, lors de lapplication des techniques floues pour lidentification et la commande du bioracteur arobie considr dans le cadre de nos travaux.
Remarque
R 3.9

Mme si par la projection orthogonale sur les axes on peut perdre une certaine information, cette mthode de gnration des fonctions dappartenance des antcdents savre trs utile, car elle donne la possibilit dinterprter le modle flou en utilisant directement les rgresseurs sous la forme dcompos de rgles. Dans ce sens, il faut rappeler que les algorithmes FER et RoFER prsents la fin de la section 3.3, partagent la caractristique davoir une mesure de distance avec une matrice diagonale de norme induite, ce qui conduit une rduction de lerreur de dcomposition car les clusters obtenus sont forcment parallles aux axes des variables de lantcdent. Cette caractristique contribue lamlioration de linterprtabilit du modle flou de la part de lutilisateur. De plus, ces deux algorithmes dterminent simultanment les paramtres des consquents et la partition floue des donnes.

3.4.3.

Obtention des paramtres des consquents

Les paramtres a i p et d i du modle TS donn par lexpression (3.119) peuvent tre dtermins partir de la structure gomtrique des clusters (cas de lalgorithme GK) ou bien en gnral, par des techniques destimation de type moindres carrs. Nous abordons ces approches dans les paragraphes suivants.
Obtention des paramtres des consquents par interprtation gomtrique

Dans le cas de lalgorithme GK, caractris par lutilisation dune matrice de covariance floue dans lespace dentre-sortie (de dimension p+1), on peut se baser sur linterprtation

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

127

gomtrique des clusters80 afin dobtenir les paramtres des consquents dans le modle affine Takagi-Sugeno. Pour illustrer la procdure, supposons quune collection de c clusters approxime la surface de rgression qui tablie la correspondance entre lentre (multivariable) et la sortie du systme. Ces clusters peuvent tres vus comme des sous-espaces linaires pdimensionnels de lespace de rgression. Le vecteur propre in , correspondant la plus petite valeur propre in de la matrice de covariance floue, dtermine le vecteur normal lhyperplan travers par les vecteurs restants de ce i-me cluster. Ceci est illustr par la Figure 3.9 :

Figure 3.9. Interprtation gomtrique de lorientation du cluster partir de la matrice de covariance floue (cas de lalgorithme GK).

tel-00136382, version 1 - 13 Mar 2007

Afin de simplifier la notation, le plus petit vecteur propre de li-me cluster sera dnot i , en omettant lindice n. Rappelons que z T = [ x T , y ] est le vecteur des donnes et v i est le prototype (centre) de li-me cluster. La forme normale implicite de lhyperplan du consquent est donne alors par lexpression :

iT (z v i ) = 0

(3.123)

Cette expression tablie que le produit intrieur du vecteur normal i avec nimporte quel vecteur appartenant lhyperplan est nul. Pour continuer le dveloppement, il convient de diviser le prototype v i en un vecteur v ix correspondant au rgresseur x , et un scalaire viy
T correspondant la sortie y , cest--dire, v T i = [ ( v ix ) , v iy ] . Le plus petit vecteur propre est

aussi divis de la mme faon, i.e., iT = [ (ix ) T , iy ] . Lquation (3.123) peut scrire maintenant de la faon suivante :
[ ( ix ) T , iy ] [x T , y ]T [ ( v ix ) T , viy ]T

)=

(3.124)

En ralisant le produit intrieur, on obtient lgalit suivante :


( ix ) T (x v ix ) + iy ( y viy ) = 0

(3.125)

Expression partir de laquelle, par une manipulation algbrique simple, on obtient lquation explicite de lhyperplan [BAB98a] :
y =
1 (ix ) T x + iT v i iy iy 1 4 24 3 1 4 24 3 di aT i 1

(3.126)

En comparant cette expression avec le consquent de la i-me rgle du modle affine TS reprsent par lquation (3.119), on obtient directement les expressions pour les paramtres a i p et le scalaire d i de la faon suivante :
80

Cependant, cette interprtation est trs lie lestimation laide des moindres carrs. En fait, la solution issue de linterprtation gomtrique correspond la solution des moindres carrs totaux pondrs avec la linarisation locale autour du centre du cluster, comme la fait remarquer Babuka [BAB98a].

128

Identification de modles flous Takagi-Sugeno (TS) partir de donnes


1 1

ai =

iy
1

ix = iT v i

ip +1

[ i1 , i 2 , K , ip ]T

(3.127) (3.128)

di =

iy

Obtention des paramtres des consquents par la mthode des moindres carrs

Les paramtres des consquents peuvent tre tablis par la technique des moindres carrs (en particulier pour les algorithmes FCRM, FER et RoFER), en utilisant comme facteurs de pondration des donnes, les degrs dappartenance de la matrice de partition floue U issus du processus de clustering. Cette approche conduit une formulation de c problmes indpendants de type moindres carrs pondrs (WLS81) dans laquelle les degrs dappartenance expriment limportance de la paire de donnes (x k , y k ) par rapport chaque i-me sous-modle linaire local, avec 1 i c .
T Les donnes didentification entre-sortie z k = [ x T k , y k ] , avec 1 k N , et les degrs dappartenance ik de la matrice de partition floue sont regroups dans les matrices suivantes : T x1 T x X= 2, M T x N

tel-00136382, version 1 - 13 Mar 2007

y1 y y= 2, M yN

i1 0 Wi = M 0

i2
M
0

0 0 O M L iN

L L

(3.129)

Les paramtres des consquents a i et d i appartenant la rgle correspondant li-me cluster sont concatns dans un seul vecteur de paramtres i , donn par :
T i = [ aT i , di ]

(3.130)

Afin de faciliter le calcul, la matrice de rgression X est augmente en ajoutant un vecteur-colonne unitaire, selon lexpression : X e = [ X, 1 ] (3.131) Si les colonnes de X e sont linairement indpendantes et ik > 0 pour 1 k N , alors la solution des moindres carrs de y = X e + o la k-ime paire de donnes (x k , y k ) est pondre par ik , est donne finalement par lexpression :
i = XT e Wi X e

XT e Wi y

(3.132)

Les paramtres a i et d i sont donns respectivement par :


a i = [ 1 , 2 , K, p ] , d i = p +1

(3.133)

3.4.4.

Validation numrique du modle flou

Pour valuer la qualit de lapproximation (performance numrique) obtenue par les modles flous Takagi-Sugeno, nous utilisons les critres suivants :
81

WLS :Weighted Least Squares.

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

129

RMSE, Erreur quadratique moyenne (en anglais Root Mean Square Error) : cest une mesure globale sur le nombre total de points de lcart par rapport la valeur attendue. Sa valeur optimale est zro; ce critre est dfini par lexpression (3.134) :

RMSE =

1 N

k )2 ( yk y
k =1

(3.134)

o 1 k N est le nombre de points considrs pour la modlisation, y est la sortie est la sortie du modle. mesure et y
VAF, Comptabilisation en pourcentage de la variance (en anglais Variance Accounting For) : introduit par Babuka et al. [BAB98b], ce critre permet dvaluer en pourcentage la qualit d'un modle en mesurant lcart normalis de la variance entre deux signaux. Sa valeur optimale est 100% quand les deux signaux sont gaux, sils sont diffrents, le VAF est infrieur. Le critre VAF est donn par lexpression (3.135) :
) var( y y VAF = 100% 1 var( y )

(3.135)

tel-00136382, version 1 - 13 Mar 2007

Tcal, Temps de calcul : correspond au temps machine82 requis pour les calculs de construction du modle flou partir des donnes.

3.4.5.

Outil logiciel pour la modlisation-identification floue de type TS

Dans le cadre du dveloppement de nos travaux de thse et grce aux relations avec le laboratoire LAMIC83 de lUniversit Distrital en Colombie, nous avons dvelopp le logiciel FMIDgraph [GRI07] [ORO07]. Cest une bote outils graphique sous MATLAB pour lidentification floue de type Takagi-Sugeno partir des donnes entr-sortie des systmes. Elle est base sur le logiciel FMID84 dvelopp lUniversit Technologique de Delft [BAB02] que nous avons amlior par diverses fonctionnalits. Cet outil intgre dans un environnement graphique facile utiliser, plusieurs outils de la mthodologie de modlisation aborde dans ce chapitre. Cinq catgories de fonctions peuvent tre distingues :
Algorithmes de clustering : FCM, GK, FER et RoFER, (cf. section 3.3). Slection de la structure (ordre) du modle [GRI07] [UNR07], (cf. section 3.4). Visualisation 2D et 3D du processus de modlisation (fonctions dappartenance "en ligne" et approximation de systmes non linaires par des sous-modles linaires. Validation de la partition floue et du modle Takagi-Sugeno, (cf. sections 3.4.1 et 3.4.4). Exemples de modlisation et identification floue de type TS de systmes non linaires statiques (cf. section 3.4.6) et dynamiques (cf. Chapitre 5).

Pour finaliser ce chapitre, nous prsentons quelques exemples illustratifs que nous avons intgrs sous la bote outils FMIDgraph.
82 83

Disponible grce la commande etime sous MATLAB v.6.5 LAMIC : Laboratorio de Automtica, Microelectrnica e Inteligencia Computacional, Universidad Distrital "Francisco Jos de Caldas", Facultad de Ingeniera, Bogot, Colombie. 84 FMID : Fuzzy Modeling and Identification Toolbox for use with Matlab.

130

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

3.4.6.

Exemples

Afin dillustrer la procdure de modlisation Takagi-Sugeno (TS) et les rsultats obtenus pour les algorithmes GK et RoFER en prsence de bruit et de points aberrants, nous considrons ici deux exemples qui sont des fonctions non linaires statiques sur des espaces deux et trois dimensions. La modlisation des systmes dynamiques sera aborde dans le chapitre 5 en considrant lapplication au bioprocd de traitement des eaux uses.
Exemple 3.1. Modlisation TS de la fonction "sinus cardinal" Le premier exemple considre est une fonction non linaire y ( x ) = f ( x ) une entre et une sortie laquelle a t ajout du bruit et des points aberrants : y ( x ) = f ( x ) + . Pour cet exemple nous avons choisi la fonction sinus cardinal, f ( x ) = sinusc( x ) reprsent sur la Figure 3.10 et dfinie par (3.136) :
1.5

tel-00136382, version 1 - 13 Mar 2007

y = sinusc(x)

0.5

-0.5 -10

-5

0 x

10

Figure 3.10. Fonction y ( x ) = sinusc( x )

f ( x ) = sinusc( x ) =

sin( x ) x 1 si

si

x0

(3.136)
x=0

La prsence de bruit et de points hors tendance est reprsente par le modle derreur grossire , dfinie par lexpression suivante (3.137) :
= (1 )G + H
2 G ~ N (0, 1 ) 2 H ~ N (0, 2 )

(3.137)

G et H sont des distributions de bruit blanc gaussien, ayant des carts types 2 > 1 . Le terme G permet de reprsenter la prsence de bruit et le terme H la prsence de points aberrants. Le paramtre permet dajuster la proportion de points aberrants dans lensemble

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

131

de la distribution. Pour cet exemple les valeurs des paramtres sont 1 = 0,07 , 2 = 5 1 et = 0,15 .
y ( x ) = sinusc( x ) + . Dans ce contexte, lobjectif de la modlisation floue Takagi-Sugeno est dapproximer la fonction originale y ( x ) = sinusc( x ) en minimisant les effets perturbateurs

En prsence de bruit et de points hors tendance on considre alors lexpression

introduits par le modle derreur grossire . Pour la modlisation une base de donnes de 300 points quidistants a t considre avec x [ 10,10] , parmi lesquelles 30 points sont considrs comme des points aberrants. Daprs la Figure 3.10 nous avons considr une approximation de la fonction originale non linaire par 6 rgions linaires, ce qui correspond au nombre de clusters pour lalgorithme GK. Pour sa part, lalgorithme RoFER a t initialis avec 20 clusters. Avec un seuil de cardinalit de 15,5 nous avons obtenu un nombre final de clusters de 6, ce qui correspond au mme nombre de clusters que celui fix pour lalgorithme GK. La Figure 3.11 illustre lensemble des donnes disponibles pour la modlisation TakagiSugeno. Les points considrs comme aberrants sont entours par des cercles.
1.5

tel-00136382, version 1 - 13 Mar 2007

y = sinusc(x)

0.5

-0.5 -10

-5

0 x

10

Figure 3.11. Fonction y ( x ) = sinusc( x ) avec bruit et points aberrants (cercles)

Les rsultats obtenus pour la modlisation floue Takagi-Sugeno en utilisant les algorithmes GK et RoFER sont rsums ci-dessous. Nous prsentons lapproximation rsultante pour la fonction originale (Figure 3.10) et celle avec bruit et points aberrants (Figure 3.11), les fonctions dappartenance correspondantes, ainsi que les bases de rgles obtenues et le positionnement des centres pour chacun des modles (cf. Tableaux 3.2 3.5).

132

Identification de modles flous Takagi-Sugeno (TS) partir de donnes


Algorithme GK
1.5
1.5

Algorithme RoFER

y(x)=sinusc(x)

0.5

0.5

-0.5 -10

-5

10

-0.5 -10

-5

10

(a) Approximation de la fonction y ( x ) = sinusc( x ) originale


1 0.8 0.6 0.4 0.2 0 -10
1 0.8 0.6 0.4 0.2 0 -10

tel-00136382, version 1 - 13 Mar 2007

(x)

-5

10

-5

10

(b) Fonctions dappartenance correspondants

Figure 3.12. Approximation TS de la fonction y ( x ) = sinusc( x ) - algorithmes GK et RoFER

Tableau 3.2. Rgles du modle flou TS pour la fonction y ( x ) = sinusc( x ) algorithmes GK et RoFER cluster 1
2 3 4 5 6

Antcdent Si x est A1 Si x est A2 Si x est A3 Si x est A4 Si x est A5 Si x est A6

Alors Alors Alors Alors Alors Alors

Consquent GK y ( x ) = 4.75 10 2 x + 4.64 10 1

Consquent RoFER y ( x ) = 9.60 10 2 x + 9.04 10 1

y ( x ) = 8.77 10 2 x 5.69 10 1 y ( x ) = 3.28 10 1 x + 1.10 10 0 y ( x ) = 3.18 10 1 x + 1.08 10 0 y ( x ) = 8.88 10 2 x 5.73 10 1 y ( x ) = 6.84 10 2 x + 6.53 10 1

y ( x ) = 1.21 10 1 x 7.69 10 1 y ( x ) = 3.62 10 1 x + 1.17 10 0 y ( x ) = 3.68 10 1 x + 1.19 10 0 y ( x ) = 1.16 10 1 x 7.42 10 1 y ( x ) = 1.06 10 1 x + 9.97 10 1

Tableau 3.3. Centres des clusters du modle flou y ( x ) = sinusc( x ) algorithmes GK et RoFER GK vx -7,99 -6,00 -2,30 2,18 5,86 8,85 RoFER vx -8,85 -5,86 -2,18 2,30 6,00 7,98

Identification de modles flous Takagi-Sugeno (TS) partir de donnes


Algorithme GK
1.5
1.5

133

Algorithme RoFER

y(x)=sinusc(x)+

0.5

0.5

-0.5 -10

-5

10

-0.5 -10

-5

10

(a) Approximation de la fonction y ( x ) = sinusc( x ) en prsence de bruit et de points aberrants


1 0.8

1 0.8 0.6 0.4 0.2 0 -10

tel-00136382, version 1 - 13 Mar 2007

(x)

0.6 0.4 0.2 0 -10

-5

10

-5

10

(b) Fonctions dappartenance correspondants

Figure 3.13. Approximation TS de la fonction y ( x ) = sinusc( x ) + - algorithmes GK et RoFER Tableau 3.4. Rgles du modle flou TS pour la fonction y ( x ) = sinusc( x ) + algorithmes GK et RoFER cluster 1
2 3 4 5 6

Antcdent Si x est A1 Si x est A2 Si x est A3 Si x est A4 Si x est A5 Si x est A6

Alors Alors Alors Alors Alors Alors

Consquent GK y ( x ) = 7.82 10 4 x + 4.14 10 2

Consquent RoFER y ( x ) = 4.92 10 2 x + 4.73 10 1

y ( x ) = 2.85 10 4 x 8.05 10 2 y ( x ) = 2.87 10 1 x + 1.06 10 0 y ( x ) = 3.14 10 1 x + 1.06 10 0 y ( x ) = 5.64 10 2 x 3.84 10 1 y ( x ) = 2.41 10 3 x + 5.29 10 2

y ( x ) = 1.03 10 3 x 1.45 10 1 y ( x ) = 3.31 10 1 x + 1.15 10 0 y ( x ) = 3.86 10 1 x + 1.21 10 0 y ( x ) = 6.92 10 2 x 4.75 10 1 y ( x ) = 6.27 10 2 x + 6.11 10 1

Tableau 3.5. Centres des clusters du modle flou y ( x ) = sinusc( x ) + algorithmes GK et RoFER GK vx -8,24 -5,04 -1,55 1,83 5,25 8,40 RoFER vx -8,25 -5,10 -1,61 1,83 5,29 8,44

134

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

Pour valuer la qualit de lapproximation obtenue par les modles flous Takagi-Sugeno, nous utilisons les critres dfinis dans la section 3.4.4. Les rsultats obtenus pour lvaluation de lapproximation de la fonction y ( x ) = sinusc( x ) sans et en prsence de bruit et de points aberrants sont dtaills dans le Tableau 3.6.
Tableau 3.6. Evaluation de la qualit de lapproximation de la fonction y ( x ) = sinusc( x ) Critre RMSE (x10-2) VAF Tcal 85 [s]

y ( x ) = sinusc( x ) GK RoFER 3,47 4,57 99,03% 98,33% 0,621 10,785

y ( x ) = sinusc( x ) + GK RoFER 6,01 5,49 97,17% 97,64% 0,621 10,785

tel-00136382, version 1 - 13 Mar 2007

En considrant les rsultats prcdents, on peut noter quen prsence de bruit et de points aberrants, lalgorithme RoFER donne de meilleurs rsultats au niveau numrique, mais aussi au niveau de linterprtabilit locale, garantissant ainsi une meilleure qualit de lapproximation. En effet, comme on peut le constater aux extrmits droite et gauche de la Figure 3.13 (a) et (b)), les sous-modles locaux obtenus en utilisant lalgorithme GK sont fortement biaiss par rapport la fonction originale y ( x ) = sinusc( x ) . Par contre, les rsultats obtenus en utilisant lalgorithme RoFER dmontrent une sensibilit moindre. En contre partie, le temps de calcul requis pour la convergence de l'algorithme RoFER est considrablement plus grand que celui de l'algorithme GK (de lordre de 15 fois).
Remarques
R 3.10

Dans la Figure 3.12 (a) on peut sapercevoir que pour les deux algorithmes il y a un dpassement considrable de lapproximation sur les rgions courbes. Ce dpassement est toutefois normal, il est d au mcanisme standard dinfrence de la sortie globale dans le modle Takagi-Sugeno. Si bien quune amlioration sur le mcanisme dinfrence/interpolation a t propose [BAB96a] (en remplaant le calcul de la moyenne pondre par une fonction maximum adoucie), cette mthode demande lajustement des certains paramtres associs. Dans le but de simplifier les calculs et travailler dans des conditions standards, nous utilisons le mcanisme classique dinfrence pour le calcul de la sortie globale du modle Takagi-Sugeno. Si la mthode dinfrence a une influence sur lapproximation obtenue, il faut noter aussi leffet dautres facteurs sur la qualit de lapproximation. Le mcanisme de projection, commun aux 2 mthodes de clustering, introduit un biais sur les sousmodles linaires. La paramtrisation des fonctions dappartenance afin dobtenir des ensembles flous unidimensionnels sur les variables dentre peut entraner un changement de forme, gnralement avec une couverture plus grande sur lunivers de discours que les ensembles multidimensionnels correspondants. Leffet final est une partition qui nest pas forcment du type Ruspini (en effet, dans certains cas la somme des degrs dappartenance peut tre suprieure 1). Cela peut se traduire par des biais sur les valeurs attendues des paramtres des consquents. Voir par exemple la Figure 3.13 (b) pour le cas x = 5 .

R 3.11

85

Pour les rsultats reports dans ce manuscrit nous avons utilis une machine Pentium 4 3,02 GHz avec 256 Mo de mmoire RAM et systme dexploitation Windows XP.

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

135

Exemple 3.2. Modlisation TS de la fonction "valle de Rosenbrock" Le deuxime exemple considre est une fonction non linaire dans un espace trois dimensions z ( x, y ) = f ( x, y ) + laquelle a t ajout du bruit et des points hors tendance symboliss par . Pour cet exemple nous avons choisi la fonction valle de Rosenbrock, f ( x, y ) = rosenbrock ( x, y ) reprsent sur la Figure 3.14 et dfinie par (3.138) :

tel-00136382, version 1 - 13 Mar 2007

Figure 3.14. Fonction valle de Rosenbrock

100 ( y x 2 ) 2 + (1 x) 2 f ( x, y ) = rosenbrock ( x, y ) = scale * 2509

(3.138)

avec scale = 10 , x [2, 2] et y [1, 3] . Le facteur 2509 permet la normalisation de lexpression (3.138) dans lespace dentre-sortie XxY choisi. La prsence de bruit et de points aberrants est reprsente par le modle derreur grossire , dfinie par lexpression (3.137). Pour cet exemple les valeurs des paramtres sont 1 = 0,5 , 2 = 5 1 et = 0,2 . Pour la modlisation une base de donnes de 225 points quidistants sur (x,y) avec 25 points aberrants a t considre. Lalgorithme RoFER a t excut avec un nombre initial de clusters de 15. Avec un seuil de cardinalit de 4,9 nous avons obtenu un nombre final de clusters de 6, qui correspond au mme nombre de clusters que dans lalgorithme GK. La Figure 3.15 illustre lensemble des donnes disponibles pour la modlisation Takagi-Sugeno. Les points considrs comme aberrants sont entours par des cercles.

Figure 3.15. Fonction valle de Rosenbrock avec bruit et points aberrants (cercles)

Les rsultats obtenus pour la modlisation floue Takagi-Sugeno sans et avec bruit et points aberrants en utilisant les algorithmes GK et RoFER sont rsums ci-dessous.

136

Identification de modles flous Takagi-Sugeno (TS) partir de donnes


Algorithme GK Algorithme RoFER

f(x,y)=rosenbrock(x,y)

(a) Approximation de la fonction valle de Rosenbrock

tel-00136382, version 1 - 13 Mar 2007

(x)

(b) Fonctions dappartenance correspondants

erreur

(c) Surface derreur de lapproximation

Centres des clusters

(d) Centres des clusters

Figure 3.16. Approximation TS de la fonction valle de Rosenbrock

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

137

Tableau 3.7. Rgles du modle flou TS pour la fonction valle de Rosenbrock algorithme GK cluster 1 Antcdent Si x est A11 et y est A12 Si x est A21 et y est A22 Si x est A31 et y est A32 Si x est A41 et y est A42 Si x est A51 et y est A52 Si x est A61 et y est A62 Consquent GK z ( x, y ) = 7.37 10 0 x 2.09 10 0 y 8.47 10 0

Alors Alors Alors Alors Alors Alors

2 3 4 5 6

z ( x, y ) = 2.14 10 1 x + 2.48 10 1 y + 5.72 10 1 z ( x, y ) = 1.83 10 1 x 3.95 10 1 y + 4.62 10 1 z ( x, y ) = 2.75 10 1 x + 1.58 10 0 y 1.85 10 0 z ( x, y ) = 2.91 10 1 x 6.11 10 2 y + 7.12 10 1 z ( x, y ) = 5.77 10 0 x 1.88 10 0 y 5.73 10 0

Tableau 3.8. Rgles du modle flou TS pour la fonction valle de Rosenbrock algorithme RoFER cluster 1 Antcdent Si x est A11 et y est A12 Si x est A21 et y est A22 Si x est A31 et y est A32 Si x est A41 et y est A42 Si x est A51 et y est A52 Si x est A61 et y est A62 Consquent ROFER z ( x, y ) = 8.25 10 0 x 2.40 10 0 y 1.01 101

Alors Alors Alors Alors Alors Alors

tel-00136382, version 1 - 13 Mar 2007

2 3 4 5 6

z ( x, y ) = 1.49 10 0 x + 1.12 10 0 y 2.48 10 1 z ( x, y ) = 1.79 10 1 x 1.47 10 1 y + 1.64 10 1 z ( x, y ) = 1.61 10 0 x + 1.20 10 0 y 3.69 10 1 z ( x, y ) = 1.67 10 0 x 7.10 10 1 y 1.02 10 0 z ( x, y ) = 9.71 10 0 x 2.63 10 0 y 1.29 101

Tableau 3.9. Centres des clusters du modle flou pour la fonction valle de Rosenbrock sans bruit GK RoFER

vx

vy
0

vx
-1

vy
0

-1,76.10 -1,06.100 -5,25.10-2 1,27.10-2 1,08.100 1,75.100

1,12.10 1,85.100 -1,70.10-1 2,51.100 1,81.100 1,11.10-1

-1,76.10 -8,47.10-1 -4,15.10-1 7,12.10-1 1,17.100 1,84.100

2,18.10-1 2,29.100 1,59.10-1 2,23.100 4,96.10-1 1,36.10-1

obtenus pour lvaluation de lapproximation z ( x, y ) = rosenbrock ( x, y ) sans bruit sont dtaills dans le Tableau 3.10 :

Les

rsultats

de

la

fonction

Tableau 3.10. Evaluation de la qualit de lapproximation de la fonction z ( x, y ) = rosenbrock ( x, y ) Critre RMSE (x10-1) VAF Tcal [s]

z ( x, y ) = rosenbrock ( x, y ) GK RoFER 5,24 5,66 92,60% 95,48% 0,661 19,98

138

Identification de modles flous Takagi-Sugeno (TS) partir de donnes


Algorithme GK Algorithme RoFER

f(x,y)=rosenbrock(x,y)+

(a) Approximation de la fonction valle de Rosenbrock

tel-00136382, version 1 - 13 Mar 2007

(x)

(b) Fonctions dappartenance correspondants

erreur

(c) Surface derreur de lapproximation

Centres des clusters

(d) Centres des clusters

Figure 3.17. Approximation TS de la fonction valle de Rosenbrock avec bruit et points aberrants

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

139

Tableau 3.11. Rgles du modle flou TS pour la fonction valle de Rosenbrock avec bruit et points aberrants algorithme GK cluster 1 Antcdent Si x est A11 et y est A12 Si x est A21 et y est A22 Si x est A31 et y est A32 Si x est A41 et y est A42 Si x est A51 et y est A52 Si x est A61 et y est A62 Alors Alors Alors Alors Alors Alors Consquent GK z ( x, y ) = 5.81 10 0 x 1.69 10 0 y 5.91 10 0

2 3 4 5 6

z ( x, y ) = 1.86 10 1 x + 2.54 10 1 y + 8.16 10 1 z ( x, y ) = 2.21 10 1 x 1.22 10 1 y + 3.89 10 1 z ( x, y ) = 7.20 10 1 x + 1.18 10 0 y 8.31 10 1 z ( x, y ) = 4.17 10 1 x 1.88 10 1 y + 6.91 10 1 z ( x, y ) = 7.17 10 0 x 2.36 10 0 y 8.14 10 0

Tableau 3.12. Rgles du modle flou TS pour la fonction valle de Rosenbrock avec bruit et points aberrants algorithme RoFER cluster 1 Antcdent Si x est A11 et y est A12 Si x est A21 et y est A22 Si x est A31 et y est A32 Si x est A41 et y est A42 Si x est A51 et y est A52 Si x est A61 et y est A62 Alors Alors Alors Alors Alors Alors Consquent ROFER z ( x, y ) = 7.70 10 0 x 2.25 10 0 y 9.25 10 0

tel-00136382, version 1 - 13 Mar 2007

2 3 4 5 6

z ( x, y ) = 1.71 10 0 x + 1.15 10 0 y + 7.04 10 2 z ( x, y ) = 1.15 10 1 x 2.71 10 2 y + 2.75 10 1 z ( x, y ) = 1.60 10 0 x + 9.03 10 1 y + 4.28 10 1 z ( x, y ) = 1.66 10 0 x 7.86 10 1 y 9.71 10 1 z ( x, y ) = 8.39 10 0 x 2.56 10 0 y 1.01 101

Tableau 3.13. Centres des clusters du modle flou pour la fonction valle de Rosenbrock avec bruit et points aberrants GK RoFER

vx
-1,76.10 -1,06.100 -5,25.10-2 1,27.10-2 1,08.100 1,75.100
0

vy

vx
-1

vy
0

1,12.10 1,85.100 -1,70.10-1 2,51.100 1,81.100 1,11.10-1

-1,74.10 -8,91.10-1 -4,85.10-1 6,83.10-1 8,17.10-1 1,84.100

1,88.10-1 2,34.100 3,32.10-1 2,22.100 1,30.10-1 2,79.10-1

z ( x, y ) = rosenbrock ( x, y ) + avec bruit et points aberrants sont dtaills dans le Tableau 3.14 :
Tableau 3.14. Evaluation de la qualit de lapproximation de la fonction z ( x, y ) = rosenbrock ( x, y ) + Critre RMSE (x10-1) VAF Tcal [s]

Les

rsultats

obtenus

pour

lvaluation

de

lapproximation

de

la

fonction

z ( x, y ) = rosenbrock ( x, y ) + GK RoFER 6,02 4,89 90,23% 95,64% 0,661 19,98

140

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

3.5. Conclusions
Ce chapitre nous a permis de faire le tour dhorizon des principes thoriques ncessaires la comprhension de la modlisation et de lidentification floues de systmes en utilisant lapproche par clustering partir des donnes entre-sortie. Aprs davoir introduit des concepts de base concernant la structure gnrale et les diffrentes types de modles flous, nous avons tudi plus particulirement le modle de type Takagi-Sugeno (TS). En effet, au cours des dix dernires annes la discipline a volu dune faon graduelle mais dcide, vers une utilisation pratiquement exclusif des systmes flous dans lesquels le consquent des rgles utilise des variables numriques sous la forme des fonctions (modle de type TS) plutt que des variables linguistiques (modle de type Mamdani) [GAL01] [SAL05]. Ces modles conservent les caractristiques de transparence et dinterprtabilit linguistique qui distinguent les modles flous dautres approches similaires de type bote noire. Dans le cas de lidentification floue des systmes, le formalisme TakagiSugeno est mieux adapt une dmarche plus systmatique pour la construction de modles non linaires multivariables, grce leur bonne capacit dinterpolation numrique et d"aprentissage" partir de donnes. Dans le cadre de nos travaux, les modles flous de type TS sont considrs sous loptique dune approche de modlisation multi-linaire, qui essai de rsoudre un problme complexe de modlisation en le dcomposant en plusieurs sous-problmes plus simples. La thorie des ensembles flous offre alors un excellent outil pour reprsenter lincertitude associe la tche de dcomposition, en fournissant des transitions douces entre les sous-modles linaires et afin dintgrer divers types de connaissance dans un mme cadre. A ce propos, nous avons considr des mthodes de coalescence floue (clustering) bases sur la minimisation itrative dune fonction objectif (critre de classification), afin de gnrer automatiquement la dcomposition partir des donnes entre-sortie du systme. Dans cette approche, le nombre de clusters correspond celui des sous-modles linaires dans le modle TS. En ce qui concerne les mthodes de clustering, afin de trouver une partition floue approprie, nous avons abord plusieurs algorithmes avec prototypes :
o vectoriels (centres) de la mme dimension que les objets de donnes (algorithmes FCM (clusters hypersphriques) et GK (clusters hyperellipsodaux)), o des objets gomtriques "de plus haut niveau", tels que des sous-espaces linaires (algorithme FCRM), o ou bien des prototypes "mixtes", tels que lalgorithme de rgression floue ellipsodal (FER) qui combine les mesures de distance des algorithmes GK des axes parallles (GKP) et FCRM, ainsi que sa version robuste en prsence de bruit et de points aberrants (algorithme RoFER) [BAR03] [GRI04].

tel-00136382, version 1 - 13 Mar 2007

Ce dernier est caractris par lutilisation dune mthode d"agglomration comptitive" [FRI99] qui partir dun nombre surestim de clusters linitialisation et la dfinition dun certain seuil de cardinalit robuste, permet de trouver "automatiquement" un nombre convenable de clusters pour la partition. En mme temps lalgorithme fournit les paramtres des consquents des rgles du modle floue affine TS. Ensuite, nous avons abord la mthodologie gnrale didentification de modles TS partir des donnes, en dcrivant les diffrentes tapes depuis la conception de lexprience et

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

141

lacquisition des donnes jusqu la validation du modle final. En particulier nous avons mit laccent sur quelques aspects gnraux et communs aux algorithmes traits, afin de passer de lapplication des techniques de clustering lobtention du modle flou. Ces aspects comprennent les pas suivants :
Validation du nombre de clusters, en utilisant les mesures de validit de la partition. Gnration des fonctions dappartenance des antcdents, qui permet lobtention des rgles avec des ensembles flous multidimensionnels, ou bien des rgles dans leur forme dcompose en utilisant le mcanisme de projection sur les axes dentre. Obtention des paramtres des consquents, partir de la structure propre de la matrice de covariance floue (cas de lalgorithme GK) ou en gnral, en utilisant des techniques de type moindres carrs. Validation numrique du modle flou.

tel-00136382, version 1 - 13 Mar 2007

Dans le cadre de nos recherches et en se basant sur le logiciel FMID [BAB02], nous avons dvelopp FMIDgraph [GRI07] [ORO07] [UNR07], une bote outils graphique sous MATLAB pour lidentification floue de type TS, qui intgre dans un environnement graphique facile utiliser, plusieurs lments et fonctionnalits (e.g. visualisation 2D et 3D) concernant la mthodologie de modlisation aborde dans ce chapitre. Finalement, nous avons prsent quelques exemples de simulation qui ont permis dillustrer lapproche suivi pour la modlisation floue TS de systmes non linaires en utilisant des mthodes de clustering partir des donnes entr-sortie des systmes. Les rsultats ont montr lapplicabilit des algorithmes de clustering comme GK et RoFER, avec une meilleure qualit de lapproximation locale du systme pour ce dernier en prsence de bruits et de points aberrants, malgr le temps de calcul requis pour la convergence (de lordre de 15 fois plus lev). Nous considrons que lutilisation de tels algorithmes pourrait tre intressante pour des applications de modlisation hors-ligne o le temps de calcul ne constitue pas un facteur critique. Sans vouloir gnraliser les rsultats exprimentaux obtenus, il parat raisonnable de considrer que la caractrisation dun systme non linaire par une approche multimodle est un chemin prometteur pour un rapprochement entre la thorie mathmatique et la pratique industrielle de la commande automatique. En effet, en obtenant une reprsentation simple par zones dopration dfinies par les fonctions dappartenance dans les antcdents, le modle flou TS permet la reprsentation des systmes non linaires statiques ou dynamiques par une concatnation de sous-modles linaires associs aux consquents des rgles. Cette approche savre intressante du point de vue de la commande et sera exploite ce propos, comme nous le verrons dans le chapitre suivant.

142

Identification de modles flous Takagi-Sugeno (TS) partir de donnes

tel-00136382, version 1 - 13 Mar 2007

Commande floue TS base sur modle

143

___________________________________________________________________________

Chapitre 4

4. Commande floue TS base sur modle


___________________________________________________________________________

tel-00136382, version 1 - 13 Mar 2007

Dans ce chapitre, nous considrons diffrentes possibilits quoffrent les modles flous de type Takagi-Sugeno pour la commande des systmes non linaires en utilisant la philosophie de commande du type compensation parallle distribue (PDC). Nous commenons par un aperu gnral sur la synthse (stabilisation) des contrleurs flous base sur un modle flou homogne TS du systme. Ensuite nous dveloppons spcifiquement une commande sousoptimale linaire quadratique par retour dtat base sur un modle affine TS en temps discret. Pour cela, nous proposons trois lois de commande qui tiennent compte du terme indpendant caractristique du modle affine. Les lois de commande sont de type rgulateur, rgulateur avec compensation de gain statique et rgulateur avec action intgrale, ce qui permet lannulation des erreurs stationnaires de poursuite par rapport des rfrences de type chelon dans la commande.

144

Commande floue TS base sur modle

Sommaire ___________________________________________________________________________

tel-00136382, version 1 - 13 Mar 2007

Commande floue TS base sur modle

145

tel-00136382, version 1 - 13 Mar 2007

A partir de la disponibilit dun modle flou, celui-ci peut tre utilis pour la synthse dun contrler de deux manires [SAL05]. En premier lieu, nimporte quelle technique (non linaire) base sur un modle peut tre applique. Parmi les techniques les plus frquemment utilises dans cette approche, on trouve la linarisation entre-sortie [BOU03] et par rtroaction, la commande prdictive et les techniques bases sur linversion du modle [BAB98a]. Deuximement, le contrler lui-mme peut tre un systme flou dont la structure correspond la structure du modle flou du procd. Cette ide, appele dans le cas de systmes flous de type TS "compensation parallle distribue" (PDC)86 [WAN95], est trs fructueuse. En fait, le plus grand nombre de rsultats, concernant la stabilit des modles Takagi-Sugeno tant en temps continu que dans le cas discret, sont bass sur des commandes de type PDC. Dans ce chapitre nous donnons dans la premire partie, largement base sur louvrage [GUE03], un bref aperu gnral sur la stabilisation des contrleurs flous base sur un modle flou TS du systme. Les dveloppements mathmatiques rapports correspondent aux modles flous homognes TS, tant en temps continu quen temps discret. Dans la seconde partie, en utilisant lapproche PDC, nous laborons une commande sous-optimale linaire quadratique par retour dtat base sur des modles affines TS en temps discret. Nous proposons le dveloppement de trois lois de commande qui prennent en compte explicitement le terme indpendant dans le consquent du modle. Pour une tude plus vaste concernant la commande floue de systmes, nous invitons le lecteur se rfrer sur les ouvrages suivantes : [DRI93] [WAN94] [BAB98a] [FOU03a]. La philosophie de la commande de type compensation parallle distribue (PDC), consiste calculer une loi de commande linaire par retour dtat, pour chaque sous modle du modle flou. La dtermination dune loi de commande revient dterminer pour chaque modle local des gains matriciels, par exemple en utilisant une synthse quadratique ou des LMI. La Figure 4.1 illustre le concept de ce type de commande :

Figure 4.1. Reprsentation du concept de compensation parallle distribue (PDC)

La commande de type PDC a pour but dintgrer dans une seule loi de commande globale les lois de commande individuelles issues de lapproche multi-modle. La partie antcdent des rgles reste la mme que pour le modle flou Takagi-Sugeno tandis que la partie consquent est remplace par une loi de commande par retour dtat. Dans ce contexte,
86

PDC: Parallel Distributed Compensation.

146

Commande floue TS base sur modle

chaque sous modle du modle flou de type Takagi-Sugeno est stabilis localement par une loi linaire. La loi de commande globale, qui en gnral est non linaire, est une fusion floue des lois de commande linaires. Pour lapplication de la commande de type PDC il est ncessaire que tous les sous modles linaires soient stabilisables ; cette hypothse est suppose vrifi dans toute la suite de manuscrit.

4.1. Stabilit et stabilisation partir de modles flous


La stabilit de systmes de type Takagi-Sugeno a t tudie partir de plusieurs points de vue : approche de type Lyapunov [TAN92], analogie avec des systmes linaires variant dans le temps [THA97], mise sous la forme dun systme linaire avec des incertitudes de modlisation [KIR98], etc. Les conditions de stabilit obtenues dans ces travaux ne sont que suffisantes, puisquelles ne prennent pas en compte la partie antcdent des rgles. Des travaux proposent de prendre en compte cette partie antcdent pour aboutir des rsultats moins conservatifs [KIM95] [MAR95]. Dans le cas de la stabilit quadratique, des conditions ncessaires et suffisantes on t proposes [MAR95]. La plupart des travaux font appel, pour vrifier les conditions de stabilit, aux outils LMI (Linear Matrix Inequalities) [BOY94].
tel-00136382, version 1 - 13 Mar 2007

Dans tous les cas, le problme est de pouvoir dterminer une loi de commande stabilisante. On peut faire la synthse dune loi de commande linaire [KIM95] [KIR98], mais, trs souvent une approche de type PDC (Parallel Distributed Compensation) est utilise pour calculer une loi de commande sur ces systmes [MA98] [TAN95] [TAN98] [ZHA96]. Elle consiste utiliser la mme partie antcdent des rgles que celle du systme flou de type TS, et, dans la partie conclusion, des commandes locales par retour dtat. Dans ce contexte, chaque sous-systme dun systme flou de type TS est stabilis localement par une loi linaire [TAN95]. Des approches utilisant la reprsentation dtat et des observateurs flous ont galement t proposes [FEN97] [TAN94] et, dans le cas o les prmisses de rgles utilisent des variables mesurables, un principe de sparation a galement t dmontr [MA98]. Nous allons faire un bref rappel sur les modles flous continus et discrets afin de faciliter la formulation des thormes de stabilit.

4.1.1.

Modeles flous dynamiques de type Takagi Sugeno (TS)

Avec les notations Ri : (i=1,2,,r) la i-me rgle, r tant le nombre de rgles sialors , Fij : (j=1,2,,r) les sous-ensembles flous des prmisses, x(t ) R n le vecteur dtat,
u (t ) R m

le

vecteur

des

entres,

y (t ) R q

le

vecteur

des

sorties,

Ai R n n , Bi R n m , Ci R q n et z1 (t ) ~ z p (t ) les variables des prmisses (variables dpendant

de ltat et/ou des entres), les modles flous TS sont reprsents sous la forme suivante, o MFC et MFD indiquent, respectivement, les modles flous continus et les modles flous discrets.
Modles flous continus (MFC)

Rgle R i du modle :
& (t ) = Ai x(t ) + Biu (t ) x Si z1 (t ) est F1i et ...et z p (t ) est F pi alors i= 1, 2,,r y (t ) = Ci x(t )

(4.1)

Commande floue TS base sur modle

147

Chaque consquent de rgle reprsente par des relations dans lespace dtat x(t ) = Ai x(t ) + Biu (t ) est appele un sous- modle . A chaque rgle R i est attribu un poids wi ( z (t )) qui dpend de la valeur de vrit (ou degr dappartenance) des z j (t ) aux sousensembles flous Fji , note F ji ( z j (t )) , et du choix de la modlisation du connecteur (oprateur) et reliant les prmisses. Le connecteur et est souvent choisi comme tant le produit, d o :
wi ( z (t )) = F ji ( z j (t )), i = 1,2,.....r avec wi ( z (t )) 0, pour tout t
j =1 p

(4.2)

puisque les fonctions dappartenance prennent leur valeur dans lintervalle [0,1]. A partir des poids attribus chaque rgle, les sorties finales des modles flous sont infres de la manire suivante, qui correspond une dfuzzification barycentrique :
& (t ) = x
tel-00136382, version 1 - 13 Mar 2007

ir=1 w( z (t ))( Ai x(t ) + Bi u (t ))

i =1

wi ( z (t ))

y (t ) =

ir=1 wi ( z (t ))C i x(t )

r i =1

wi ( z (t ))

(4.3)

qui peuvent tre rcrites :

& (t ) = hi ( z (t ))( Ai x(t ) + Bi u (t )) , x


i =1

y (t ) = hi ( z (t ))C i x(t )
i =1

(4.4)

avec :

w ( z (t )) wi ( z (t ))
i r i =1

vrifiant une proprit de somme convexe, cest--dire :

ir=1 hi ( z (t )) = 1 et wi ( z (t )) 0, pour tout t. De faon tout fait analogue, les modles flous TS discrets sont dfinis comme suit.
Modles flous discrets (MFD)

Rgle R i , i = 1,2,.......r , du modle :


x(t + 1) = Ai x(t ) + Bi u (t ) Si z i (t ) est F1i et et z p (t ) est F pi alors y (t ) = C i x(t )

(4.5)

ou, de faon plus compacte, avec la mme dfinition des hi ( z (t )) :


x(t + 1) = hi ( z (t ))( Ai x(t ) + Bi u (t )) , y (t ) = hi (z (t ))C i x(t )
i =1 i =1 r r

(4.6)

Une extension possible du modle flou prsent ci-dessus permet de prendre en compte des incertitudes dans les paramtres des prmisses [TAN94], dans le cas discret. De plus, il est galement utilis pour les modles non linaires incertains, en introduisant les incertitudes du modle dans les parties conclusion des rgles floues. Le potentiel offert par ce type de reprsentation permet lutilisation de toutes les techniques associes. Elle permet, notamment, de traiter les problmes multivariables et daborder le problme de la stabilit laide de la mthode de Lyapunov.

148

Commande floue TS base sur modle

4.1.2.

Stabilit des modles flous

On sintresse la stabilit et la stabilisation quadratique des modles flous TS, cest-dire en utilisant la fonction de Lyapunov V ( x(t )) = xT (t ) Px(t ) avec P > 0 [BOY94]. Les thormes suivants bass sur la seconde mthode de Lyapunov donnent les conditions suffisantes permettant de garantir la stabilit de modles flous continus et discrets dcrits respectivement par les expressions (4.4) et (4.6). THEOREME 4.1 (MFC) [TAN92].- Lquilibre dun modle flou, continu, dcrit par (4.4) (en boucle ouverte), est asymptotiquement stable sil existe une matrice P commune dfinie positive telle que :
AiT P + PAi < 0, i = 1,2,..., r

(4.7)

THEOREME 4.2 (MFD) [TAN92].- Lquilibre dun modle flou, discret, dcrit par (4.6), est asymptotiquement stable sil existe une matrice P commune dfinie positive telle que :
AiT PAi P < 0, i = 1,2,..., r
tel-00136382, version 1 - 13 Mar 2007

(4.8)

Les conditions de stabilit obtenues sont videmment conservatives puisque la partie la partie prmisse des rgles nest pas prise en compte. Dautres voies ont t explores, certaines sont reprises dans la suite. Lapproche utilise dans [KIM95] considre un modle flou comme un systme linaire avec des incertitudes de modlisation. Toutes les paires ( Ai , Bi ) intervenant dans les rgles peuvent tre rcrites en fonction dune paire ( A0 , B0 ) unique : i , Ai = A0 + Ai , Bi = B0 + Bi dou (4.1) peut se rcrire avec

i =1 hi ( z (t )) = 1 :
r r x ( t ) B + + 0 hi ( z )Bi i =1

r x(t + 1) = A0 + hi ( z )Ai i =1

u (t )

(4.9)

Le modle ( A0 , B0 ) doit tre choisi avec attention pour que les normes de Ai et Bi soient faibles. On peut envisager, par exemple, de prendre le modle obtenu par moyennage des autres modles. Le modle ( A0 , B0 ) est suppos stable ; il existe, donc deux matrices P>0 et Q>0 telles
T que : A0 PA0 P = Q Dfinissons les matrices symtriques : T T Di = ( A0 + Ai ) T P( A0 + Ai ) P = AiT PAi + A0 PA0 + A0 PAi Q .

De plus, chaque partie antcdent dune rgle R i peut scrire Si x(t) est F i , o F i est considr comme un ensemble flou multidimensionnel pour le rgle, cest--dire, x(t ) Supp ( F i ) signifie que j {1,..., n}, x j (t ) Supp ( F ji ). THEOREME 4.3 (MFD) [KIM95.- Le modle TS (4.1) autonome (u=0) est stable si pour une matrice A0 Hurwitz, il existe une matrice Q>0 telle que, pour toutes les rgles i, x(t ) T Di x(t ) < 0 pour tout x(t ) 0, x(t ) {x(t ) / x(t ) Supp ( F i )}. Afin de dterminer une matrice Q>0 vrifiant les conditions du thorme 4.3, les auteurs proposent un algorithme bas sur la descente du gradient. En ce qui concerne la partie

Commande floue TS base sur modle

149

commande, les auteurs se sont limits travailler avec un retour dtat linaire u(t)= -Fx(t). Lintrt de cette approche est de rduire la conservativit des rsultats qui ne sont bass que sur la partie consquence des rgles. Les auteurs donnent un exemple o il est possible de prouver la stabilit dun modle flou comprenant deux matrices A i non Hurwitz. Le fait dutiliser un support sans proprits particulires ne permet pas une formulation sous la forme de LMI du problme. Il est alors possible de remdier ce problme en utilisant des proprits sur ce support. Dans le cas o le modle contient des termes constants (4.10), il est possible dutiliser les travaux de [MAR95]. Considrons un modle flou, discret, autonome qui admet dans sa partie conclusion des termes constants. Rgle Ri du modle :
Si x(t ) est F i alors x(t + 1) = Ai x(t ) + bi , i = 1,2,K, r

(4.10)

En utilisant la connaissance des supports des fonctions dappartenance qui peuvent tre dcrits par des contraintes de type quadratique :
tel-00136382, version 1 - 13 Mar 2007
x Supp ( F i ) Fji ( x) = xT T ji x + 2 xT u ij + v ij 0, j = 1,..., ni

on peut dfinir la P-Stabilit-Quadratique dune rgle de la faon suivante. DFINITION 4.1 [MAR95].- La rgle R i est P-Quadratiquement Stable si, et seulement si, il existe une matrice P>0, et un rel i >0 tel que : x(t ) Supp( F i ), x(t ) 0 : Vi ( x(t )) i x(t ) et Vi ( x(t )) = 0 si 0 Supp( F i ) avec : Vi ( x ) = x T Px et VI ( x ) = x T ( AiT PAi P ) x + 2 x T AiT Pbi + biT Pbi . Et par lutilisation de la S- procdure [BOY94], on peut dduire le thorme suivant. THEOREME 4.4 [MAR95].- Si ij 0, j = 1,..., ni , i > 0 et P > 0 tels que : T ji AiT PAi P + i I AiT Pbi i j i T T biT Pbi j bi Ai u j alors la rgle R i est P- Quadratiquement Stable. Enfin le thorme 4.5 pour le modle flou complet. THEOREME 4.5 (MFD) [MAR95].- Le modle flou dcrit par lquation (4.10) est quadratiquement stable sil existe une matrice P = P T > 0 telle que toutes les rgles soient P- quadratiquement stables. Les conditions (4.11) du thorme 4.4 sont des LMI. Notons que si bi = 0 et que le support contient 0, alors obligatoirement, les conditions deviennent celles de Tanaka. Aprs avoir prsent diffrentes approches permettant dtudier la stabilit de modles flous, la partie suivante traite de la stabilisation de modles flous.
u ij 0 v ij
2

(4.11)

150

Commande floue TS base sur modle

4.1.3.

Stabilisation des modles flous TS

La ralisation dun rgulateur flou est base sur le modle flou TS reprsentant le systme non linaire. A partir du concept PDC (Parallel Distributed Compensation), la dtermination dune loi de commande revient dterminer pour chaque modle local une matrice de gains, par exemple en utilisant une synthse quadratique ou des LMI. Lide principale de ce concept est de calculer une loi de commande linaire par retour dtat, pour chaque sousmodle du modle flou. Dans toute la suite, on suppose que les sous- modles sont commandables et observables.
Construction dun rgulateur flou

Le rgulateur flou PDC partage les mmes ensembles flous que le modle, donc, il garde les mmes parties prmisses ainsi que les mmes fonctions dappartenance. Pour les modles flous continus (4.1) et discrets (4.5), la ralisation du rgulateur se fait de la faon suivante [TAN95]. Rgle R i du rgulateur :
Si zi (t ) est F1i et...et zp (t ) est Fpi alors u (t ) = Fi x(t ), i = 1,2,..., r

(4.12)

tel-00136382, version 1 - 13 Mar 2007

La sortie finale du rgulateur flou est infre de la manire suivante :


u (t ) = hi ( z (t )) Fi x(t ) avec hi ( z (t )) =
i =1 r

wi ( z (t ))
r i =1

wi ( z (t ))

(4.13)

vrifiant toujours la mme proprit de somme convexe. La ralisation du rgulateur flou consiste dterminer les gains de contre-raction Fi dans les parties conclusions.
Conditions de stabilit

Pour obtenir lexpression de la boucle ferme, il suffit de substituer (4.13) (4.4) (cas continu) et (4.13) (4.6) (cas discret). Ainsi les expressions sont les suivantes : (MFC)
r r & (t ) = hi ( z (t )) x A x ( t ) B h ( z ( t )) F x ( t ) i i j j i =1 j =1

= hi ( z (t ))h j ( z (t ))( Ai Bi F j ) x(t )


i =1 j =1 r

(4.14)
Gij + G ji x(t )

= hi2 ( z (t ))Gii x(t ) + 2 hi ( z (t ))h j ( z (t ))


i =1 i< j

avec Gij = Ai Bi F j (MFD)


x(t + 1) = hi2 ( z (t ))Gii x(t ) + 2 hi ( z (t ))h j ( z (t ))
i =1 i< j r r

Gij + G ji
2

x(t )

(4.15)

En appliquant les thormes 4.1 et 4.2 respectivement (4.14) et (4.15), il est possible de tirer des conditions de stabilit pour les MFC et MFD. La dmonstration du thorme 4.6 (respectivement 4.7) provient directement du thorme 4.1 (respectivement 4.2).

Commande floue TS base sur modle

151

THEOREME 4.6 (MFC).- Lquilibre du modle flou continu (4.14) est asymptotiquement stable sil existe une matrice P > 0 telle que :
T Gii P + PGii < 0,

Gij + G ji 2

P+P

Gij + G ji 2

< 0, i < j

(4.16)

pour tout i, j= 1,2,, r , exceptes les paires (i, j) telles que hi ( z (t ))h j ( z (t )) = 0, t. THEOREME 4.7. (MFD).- Lquilibre du modle flou discret (4.15) est asymptotiquement stable sil existe une matrice P > 0 telle que
T Gii PGii P < 0,

Gij + G ji 2
tel-00136382, version 1 - 13 Mar 2007

Gij + G ji P 2

P < 0, i < j

(4.17)

pour tout i, j= 1,2,, r, exceptes les paires (i, j) telles que hi ( z (t ))h j ( z (t )) = 0, t. Le fait dutiliser la condition (4.16) pour les MFC, (4.17) pour les MFD, avec i<j permet de rduire un peu la conservativit des rsultats puisquil nest pas obligatoire davoir tous les sous- modles croiss Gij = Ai Bi F j stables. Lobtention du rgulateur flou PDC consiste donc dterminer les matrices de gains de retour dtat F j ( j = 1,2,..., r ) satisfaisant les conditions du thorme 4.6 (cas MFC) ou thorme 4.7 (cas MFD) pour une matrice P dfinie positive. Pour calculer les matrices de retour dtat, il est possible dutiliser une synthse quadratique et vrifier ensuite quil existe une matrice P>0 commune. Il est galement possible dutiliser un placement de ples pour assurer que les valeurs propres de Gij = Ai Bi F j avec i {1,...r} tombent dans un domaine prspcifi. On peut, alors, raisonnablement penser que si les ples sont proches pour les modles boucls Gij = Ai Bi Fi , il y a de fortes chances que les quations (4.16) dans le cas MFC et (4.17) dans le cas MFD, soient galement vrifies. Nanmoins, des exemples o les paires ( Ai , Bi ) nont pas la mme forme montrent que ce rsultat nest pas garanti. Il est galement possible dutiliser les thormes de [TAN94] donnant des conditions moins conservatives en tenant compte dune proprit particulire sur le poids des rgles, ces thormes tant tirs des thormes 4.6 et 4.7. Une autre faon de dterminer la matrice P et les gains de commande F j ( j = 1,2,..., r ) simultanment est lutilisation des outils issus de loptimisation convexe, et plus particulirement des LMI (Linear Matrix Inequalities) [ELG97]. Certains outils LMI sont utilisables laide du logiciel MATLAB et de la boite outils LMI Control Toolbox [GAH95].

152

Commande floue TS base sur modle

Par exemple, dans le cas de la synthse dune loi de commande de type PDC pour des modles flous MFD, thorme 4.7, la premire partie de lquation (4.17), non linaire en P et F j , scrit, aprs le changement de variables X = P 1 et M i = Fi P 1 :
( XAiT M iT BiT ) X 1 ( Ai X Bi M i ) + X > 0 et, en utilisant le lemme de Schur [ELG97], on arrive au problme suivant. Trouver X>0 et M i tels que : X XAit M i Bit i {1,.......r}, 0 Ai X Bi M i X

(4.18)

De mme, la seconde partie des quations (4.17) peut se rcrire. Trouver X>0 et M i , M j tels que i, j {1,..., r}, i < j :
1 ( XAit + XA tj M j B tj M i B tj ) X 2 1 ( Ai X + A j X Bi M j B j M i ) X 2 0

(4.19)

tel-00136382, version 1 - 13 Mar 2007

puis : P = X 1 , Fi = M i P . Plusieurs problmes sous forme de LMI appliques des modles flous de type TS peuvent tre trouves dans [TAN98] [ZHA95] [ZHA96]. On peut, de faon additionnelle, rajouter des contraintes de type degr de stabilit prspecifi, contraintes de saturation sur le commande, contraintes de saturation sur la sortie [ELG97] [TAN98]. Enfin, dautres travaux traitant de la stabilisation de modles flous de type TS existent. Parmi eux, nous allons en prsenter un certain nombre. [THA97] : leurs travaux utilisent la similitude des modles flous MFD de type TS avec les modles LTV (linaires variant dans le temps). En termes de stabilit, ils ont montr lquivalence entre les modles flous de type TS et une classe particulire de modles LTV. Une condition suffisante pour la stabilit asymptotique, globale, base sur le systme LTV quivalent, est donne. Un cas particulier de cette condition suffisante, bas sur une normalisation simultane des matrices, est galement abord, ainsi quune procdure de construction permettant, dans certains cas, dobtenir cette normalisation. Il ny a pas de discussions ayant trait la commande partir de ces modles. [KIR98] : ils se placent dans le mme type dapproche que [KIM95], cest--dire, le modle flou MFD est lanalyse comme un modle linaire soumis une classe de perturbations non linaires (4.9); les termes constants du type (4.10) sont galement pris en compte. Ils obtiennent un test de stabilit sous la forme de LMI qui rduit la complexit des LMI du type (4.18). Pour la partie commande, les auteurs se sont limits travailler avec un retour dtat linaire u (t ) = Fx(t ). [FEN97] : ces travaux concernent la stabilit des modles flous MFC de type (4.1) et une commande qui nutilise que le sous-modle dominant, cest--dire dont la valeur dappartenance hi ( z (t )), i { 1,..., r} est la plus leve. A chaque instant :
u (t ) = Fk x(t ) avec k = arg max i{1,......r } {hi ( z (t ))}. Cette commande ne pouvant satisfaire tous

les cas, une commande additionnelle est rajoute qui sapparente une commande grand

Commande floue TS base sur modle gain qui utilise une division par quand cette quantit es nulle.

153

r i =1 hi ( z ) BiT Px , sans garantir que cette loi est continue

[GUE99] : cette approche sinspire de la stabilisation quadratique, simultane, dune famille de systmes linaires SIMO [PET87] et est appele SSF (stabilisation simultan pour modles flous). Des conditions suffisantes dexistence dune loi, pour des systmes flous de type SIMO, sont donnes.

1,......., r }k i > 0, Bi = k i B1 il est possible de rduire la linairement dpendants i { conservativit des rsultats prcdents. Pour ce faire, une loi de commande dnomme CDF (compensation et division pour systmes flous) est utilise. La proprit remarquable de cette loi de commande vient du fait quelle conserve un modle en boucle ferme r rgles, cest-dire les modles croiss ne sont plus prsents.
[BLA01] : Plusieurs approches nouvelles sont testes. Parmi celles-ci on peut citer : des nouvelles conditions permettant de rduire la conservativit dans le cas o les hi(z(t)) natteignent pas leurs bornes; des rsultats concernant galement des observateurs dans le cas de variables de prmisse non mesures, et une intressante liaison avec les modes glissants. [FEN01] [JOH99] : Ils utilisent une fonction de Lyapunov par morceaux, lide tant de stabiliser chaque sous-modle et de construire un rgulateur global de manire garantir la stabilit globale du systme en boucle ferme. Lutilisation dune telle fonction de Lyapunov impose le rajout de conditions restrictives aux frontires. [GUE01b] [GUE01c] : dans le cas discret, une approche de type fonction de Lyapunov non quadratique permet, par lintermdiaire de lois de commande diffrentes et de nouvelles transformations, de rduire la conservatitivit des rsultats du cas quadratique. Aprs cette tude bibliographique sur la stabilit des modles flous, nous allons prsenter une loi de commande de type PDC par minimisation dun critre quadratique.

[GUE01a] : dans le cas particulier des modles floues MIMO dont les vecteurs Bi sont

tel-00136382, version 1 - 13 Mar 2007

4.2. Commande PDC sous optimale par retour dtat


La philosophie de la commande de type compensation parallle distribue (PDC), consiste calculer une loi de commande linaire par retour dtat, pour chaque sous modle du modle flou. La dtermination dune loi de commande revient dterminer pour chaque modle local des gains matriciels, par exemple en utilisant une synthse sous la forme de LMI ou par minimisation dun critre quadratique. Nous nous sommes intresss ici cette dernire approche. La minimisation dun critre quadratique constitue lun des moyens de parvenir la dtermination dune structure de commande par retour dtat pour les systmes linaires multidimensionnels. En utilisant cette approche, il semble intressant dlargir les rsultats classiques de la commande optimale pour les sous modles qui constituent le modle affine Takagi-Sugeno, comme on le dveloppera par la suite. On parle dans cette section de commande sous optimale par retour dtat car la loi de commande nest optimale que pour chacun des sous modles linaires.

154

Commande floue TS base sur modle

4.2.1.

Commande LQR pour des modles affines temps discret

On considre ici un modle sous forme dtat qui reprsente un systme non linaire en temps discret87 dcrit par lquation (4.20) :
x k +1 = f k ( x k , uk )

(4.20)

o lindexe k = 0,1,K, N indique linstant dchantillonnage, x k est le vecteur dtat linstant k ( xk n ), uk est le vecteur de commande linstant k ( uk m ) et x0 est la condition initiale. Le systme reprsent par (4.20) est approxim par un modle flou affine Takagi-Sugeno compos par la concatnation de sous modles linaires discrets de la forme :
x k +1 = Ak x k + Bk uk + d k y k = Ck xk

(4.21)

o y k p reprsente le vecteur de sortie, Ak nn , Bk nm , C k pn et d k n est un vecteur constant, propre au modle affine.


tel-00136382, version 1 - 13 Mar 2007

La dtermination de la commande optimale des sous modles linaires par minimisation dun critre quadratique peut tre traite en utilisant plusieurs thories, comme la programmation dynamique [BEL57] et le Principe du Maximum de Pontryagin bas sur des mthodes variationnelles [PON62]. Dans ce document nous nous sommes focaliss sur cette deuxime approche. Afin davoir plus de dtail sur la premire approche, le lecteur peut se reporter la rfrence [FOU79] qui considre divers cas avec systmes linaires affines. Dans ce contexte, la position du problme du rgulateur linaire quadratique (LQR)88, consiste trouver la loi de commande permettant de faire voluer le sous-systme linaire affine dcrit par (4.21) partir de ltat initial x0 en minimisant le critre quadratique suivant [NAI03]:
J= 1 T 1 N 1 T T x N S N x N + ( xk Qk x k +u k Rk u k ) 2 2 k =0

(4.22)

o S k n n , Qk n n sont des matrices symtriques semi dfinies positives et


Rk m m est symtrique dfinie positive. La matrice S k pondre ltat final, Qk pondre lvolution de ltat et Rk pondre lnergie de commande. Afin doptimiser le critre, J doit converger. Pour cela, le sous-systme (4.21) doit tre stable. Le but de loptimisation est dobtenir la squence de commande u0 , u1 ,K, u N 1 qui minimise (4.22). Dans ce cas, le Hamiltonien est donn par :
T T H ( x k , uk , k +1 ) = ( x k Qk x k + u k Rk u k ) + T k +1 ( Ak x k + Bk u k + d k )

1 2

(4.23)

En suivant la thorie de la commande optimale base sur le calcul des variations, on considre les expressions suivantes :

87 88

Dans cette section, la notation a t change par simplicit : x(k) a t remplace par xk. LQR: Linear Quadratic Regulator.

Commande floue TS base sur modle


Equation dtat
x k +1 = H = Ak x k + Bk uk + d k k +1 H
* x k * T * = Qk x k + Ak k +1

155

(4.24)

Equation de co-tat
* k =

(4.25)

Equation de stationnarit
0= H
* uk * T * = Rk u k + Bk k + 1

(4.26)

daprs (4.26), la loi de commande optimale en boucle ouverte est donne par :
* 1 T * uk = Rk Bk k +1

(4.27)

* Comme Rk est dfinie positive, ceci assure son inversibilit. En remplaant uk dans lquation dtat (4.24) on obtient :

tel-00136382, version 1 - 13 Mar 2007

* * 1 T * xk +1 = Ak x k Bk Rk Bk k +1 + d k

(4.28)

Condition de contour On considre ici le cas o ltat final xN est libre. Par consquent, la condition correspondante de contour est donne par :
N =
1 T xN SN xN = SN xN x N 2

(4.29)

Afin dobtenir une loi de commande optimale en boucle ferme, il est ncessaire dexprimer la fonction de co-tat * k +1 dans la commande optimale (4.27) en termes de la * fonction dtat x k . La condition finale ainsi que la prsence du terme affine dans lquation dtat (4.24), nous amne proposer pour le terme * k lexpression suivante :
* * k = Pk x k + qk

(4.30)

o la matrice Pk nn et le vecteur qk n doivent tre dtermins. En utilisant lexpression (4.30) dans les quations dtat (4.28) et de co-tat (4.25), on obtient :
* * T * Pk x k + qk = Qk x k + Ak ( Pk +1 x k +1 + qk +1 )

(4.31)

et
* * 1 T * xk +1 = Ak x k Bk Rk Bk ( Pk +1 x k +1 + qk +1 ) + d k * en rsolvant x k +1 daprs (4.32), * 1 T xk +1 = I + Bk Rk Bk Pk +1

(4.32)

) (A x
1

* k k

1 T Bk Rk Bk qk +1 + d k

) )

(4.33)

o I nxn est la matrice identit. En remplaant (4.33) dans (4.31) on obtient :


* * T 1 T * 1 T T Pk x k + qk = Qk x k + Ak Pk +1 ( I + Bk Rk Bk Pk +1 ) 1 ( Ak x k Bk Rk Bk qk +1 + d k ) + Ak qk +1

(4.34)

la vrification de cette expression pour tout xk impose les deux relations suivantes :

156

Commande floue TS base sur modle


1 T T Pk = Qk + Ak Pk +1 ( I + Bk Rk Bk Pk +1 ) 1 Ak

(4.35)

et
T 1 T 1 T T qk = Ak Pk +1 ( I + Bk Rk Bk Pk +1 ) 1 ( d k Bk Rk Bk qk +1 ) + Ak qk +1

(4.36)

Lexpression (4.35) correspond une quation matricielle aux diffrences de type Riccati (DRE)89. La condition terminale pour rsoudre lquation matricielle DRE (4.35) est obtenue partir de (4.29) et (4.30) comme suit :
PN = S N , q N = 0

(4.37)

tel-00136382, version 1 - 13 Mar 2007

Dans lquation matricielle DRE (4.35), le terme Pk se trouve du ct gauche et Pk +1 est du ct droit, ce qui ncessite une rsolution itrative en remontant le temps partir de la condition finale (4.37). Une procdure similaire sapplique pour le calcul de qk . Puisque les relations de rcurrence sont dfinies en temps inverse, une ralisation pratique de la commande telle quelle a t prcdemment dfinie par (4.27) et (4.30), ncessite de prcalculer la matrice Pk et le vecteur qk pour tous les instants de lhorizon considr. Cela supposerait donc de reprendre les calculs et den mmoriser tous les rsultats avant chaque changement de consigne. Il est vident que cela peut constituer une contrainte importante pour limplmentation dans un ordinateur coupl au procd. Il est donc particulirement intressant, pour la majorit des applications pratiques en milieu industriel, de considrer lhorizon doptimisation comme infini, ou tout au moins comme trs grand par rapport lchelle de temps des phnomnes physiques considrs. Le critre minimiser est alors de la forme :
J= 1 T T ( x k Qk x k +uk Rk u k ) 2 k =0

(4.38)

Dans le cas particulier dun systme stationnaire ( Ak = A, Bk = B, d k = d , Ck = C ) et avec les conditions imposes aux matrices Q et R , lorsque N tend vers linfini, il est montr que les quations rcurrentes (4.35) et (4.36) convergent vers des solutions limites uniques P et q , respectivement, lorsque le sous modle est commandable. Dans ce cas, il vient alors:
P = Q + AT P ( I + BR 1 B T P ) 1 A

(4.39) (4.40)

en utilisant le lemme dinversion matricielle90 :


1 1 1 1 1 ( M 1 + M 2 M 3 M 4 ) 1 = M 1 M1 M 2 (M 3 + M 4 M1 M 2 ) 1 M 4 M 1

avec M 1 = I , M 2 = B, M 3 = R 1 et M 4 = B T P discrte de Riccati (DARE)91:

on obtient lquation algbrique (4.41)

AT PA P ( AT PB )( R + B T PB ) 1 ( B T PA) + Q = 0

Pour le cas du vecteur q , daprs (4.36) et en utilisant la solution P de lquation (4.41), il vient :
q = I + AT P( I + BR 1 B T P ) 1 BR 1 B T AT
89 90

( AT P( I + BR 1 B T P ) 1 ) d

(4.42)

DRE: Difference Riccati Equation. Si la dcomposition est judicieuse, elle permet de calculer linverse dune matrice laide dune matrice plus facilement calculable (M1-1) et de linverse dune matrice ventuellement plus petite (M3-1+M4M1-1M2). 91 DARE: Discrete Algebraic Riccati Equation.

Commande floue TS base sur modle cette expression est de la forme


q = (G + FE ) 1 F d , avec

157

E = BR 1 B T 1 1 1 T T F = A P ( I + EP ) = A ( P + E ) G = I AT

(4.43)

daprs la commande optimale (4.27) et lexpression (4.30), il vient :


1 T 1 * * * * uk = R 1 B T ( P x k +1 + q ) = R B P ( Ax k + Bu k + d ) + (G + FE ) F d

(4.44)

ce qui conduit la commande optimale en boucle ferme suivante :


K = ( R + B T PB ) 1 B T PA * uk = ( K x k + N d ) , avec T 1 T 1 N = ( R + B PB ) B ( P + (G + FE ) F )

(4.45)

o la matrice N mn , K mn et le vecteur constant d n . Compte tenu que le rgulateur flou PDC (Figure 4.1) partage les mmes ensembles flous que le modle Takagi-Sugeno, il garde donc les mmes parties prmisses ainsi que les mmes fonctions dappartenance. Pour un modle flou affine Takagi-Sugeno discret, la ralisation du rgulateur flou PDC consiste dterminer pour les i = 1,2,K, r rgles du modle, les gains de contre-raction K i et de biais N i dans les parties conclusions selon lexpression (4.45), en utilisant des rgles R i sous la forme :
i Si z1 ( k ) est M 1 et L et z p ( k ) est M ip

tel-00136382, version 1 - 13 Mar 2007

alors u( k ) = ( K i x ( k ) + N i d ) , i = 1,2,K, r

(4.46)

o r est le nombre de rgles. La sortie du rgulateur flou est infre de la faon suivante :
u( k ) =

hi ( z(k )) ( Ki x(k ) + N i d ) ,
i =1

avec hi ( z (k )) =

i =1 wi ( z(k ))
r

wi ( z ( k ))

(4.47)

vrifiant pour tout k , les proprits de somme convexe et dactivation des fonctions dappartenance :

i=1 hi ( z(k )) = 1
r

et wi ( z ( k )) 0

(4.48)

Le schma gnral de la commande de type rgulateur PDC, pour les sous modles linaires affines, ainsi obtenu est reprsent par la Figure 4.2.

Figure 4.2. Schma gnral de la commande du type rgulateur PDC pour des sous modles affines

158
Remarques
R 4.1 R 4.2

Commande floue TS base sur modle

Compte tenu des proprits des matrices S , Q et R , la solution Pk de lquation de Riccati est symtrique. Il faut noter que lexpression (4.45) constitue une gnralisation de la solution de la commande optimale LQR pour des systmes linaires affines sous la forme (4.21). En effet, dans le cas o le terme de biais d = 0 , on retrouve naturellement lquation algbrique de Riccati standard temps discret. Les rsultats prcdents permettent de calculer la loi de commande optimale pour chacun des sous modles locaux du modle affine Takagi-Sugeno. La loi globale de commande, sous la forme du type commande PDC, est obtenue partir de la dfuzzification du modle flou. Dans ce cas, bien que la procdure pour calculer les lois locales de commande soit systmatique, il faut souligner quon ne peut pas garantir loptimalit des rsultats pour la commande globale du modle. Cet aspect est susceptible dtre dvelopp dans le futur pour le cas de modles flous affines Takagi-Sugeno.

R 4.3

tel-00136382, version 1 - 13 Mar 2007

Jusqu'ici, on a considr le cas gnral dune loi de commande du type rgulateur, pour les sous modles linaires affines. Linconvnient majeur de cette structure de commande est de ne pas assurer des erreurs stationnaires gales zro lorsque les consignes imposes au procd ne sont pas nulles. Cette caractristique se rvle assez gnante pour une application industrielle, pour laquelle on dsire gnralement que les consignes fixes soient effectivement atteintes. Cet important problme dutilisation pratique peut cependant tre rsolu de manire satisfaisante par diffrentes techniques. Nous allons aborder en premier lieu le cas de pr compensation du gain statique et ensuite, de lajout au systme dun certain nombre dintgrateurs numriques.

4.2.2.

Commande PDC avec compensation de gain statique

Une premire technique envisage, pour annuler les erreurs en rgime permanent quand les consignes appliques au procd sont constantes, consiste utiliser un pr compensateur qui impose un gain statique pour les sous modles. A partir des rsultats obtenus pour la loi de commande optimale (4.45) et en ajoutant un terme pour lentre de consigne, il vient alors
uk = L rk ( K x k + N d )

(4.49)

o rk m reprsente les entres ou consignes, L m m est une matrice de gain dite de pr compensation et N m n est la matrice associe au vecteur de biais d . En remplaant (4.49) dans lexpression de la dynamique du sous modles (4.21) et en calculant la transforme en Z partir des conditions initiales nulles, on obtient lexpression suivante pour la sortie du sous modle :
Y ( z ) = C ( zI A + BK ) 1 BL r ( z ) + Cz 1 d

(4.50)

A partir de cette expression il est clair que pour obtenir un erreur nulle pour une consigne constante il faut compenser le terme due au biais d . Pour cela, on propose dajouter un terme matriciel V dans lexpression de la commande (4.49), il vient alors :

Commande floue TS base sur modle


uk = L rk ( K xk + ( N + V ) d )

159 (4.51)

Dans ce cas, lapplication de la transforme en Z partir des conditions initiales nulles, conduit lexpression suivante pour la sortie du sous modle :
Y ( z ) = C ( zI A + BK ) 1 ( BL r ( z ) ( BN + BV I ) d )

(4.52)

Pour une consigne constante rk = r , le but est dobtenir un erreur stationnaire nulle : lim y k = lim( z 1)Y ( z ) = r
t z 1

(4.53)

daprs (4.52), lvaluation de la limite conduit lexpression


rz dz lim y k = r = lim( z 1)C ( zI A + BK ) 1 BL ) ( BN + BV I t z 1 z 1 z 1

(4.54)

qui vaut r = C ( I A + BK ) 1 ( BL r ( BN + BV I ) d )
tel-00136382, version 1 - 13 Mar 2007

(4.55)

afin dobtenir une erreur stationnaire nulle, lvaluation de lexpression (4.55) impose alors les deux conditions suivantes
L = ( MB ) 1 , avec M = C ( I A + BK ) 1 M ( BN + BV I ) d = 0

(4.56)

o la matrice M p n . Compte tenu des dimensions des matrices A n n , B n m , C p n et K m n , la matrice MB est inversible condition que les sous modles aient les mmes dimensions dentres que de sorties ( p = m ) et que la matrice rsultante ne soit pas singulire. Puisque la structure de commande considre assure la stabilit du sous modle boucle, la validit de cette condition est donc toujours implicitement suppose ce qui permet de faire les calculs partir des expressions matricielles (4.56). Concernant la deuxime condition de (4.56) , elle conduit lexpression matricielle
V = LM N

(4.57) (4.58)

en remplaant (4.57) dans (4.51) lquation de la loi de commande devient alors


uk = L rk ( K x k + T d ) , avec T = LM = ( MB ) 1 M

o la matrice K m n , T m n et le vecteur constant d n . Pour un modle flou Takagi-Sugeno affine discret, la ralisation du rgulateur flou PDC avec pr compensateur du gain statique, consiste dterminer pour les i = 1,2,K, r rgles du modle, les gains de compensation Li , de contre-raction K i et de biais Ti dans les parties conclusions selon lexpression (4.58), en utilisant des rgles R i sous la forme :
i Si z1 ( k ) est M 1 et L et z p ( k ) est M ip

alors u ( k ) = Li r ( k ) ( K i x ( k ) + Ti d ) , i = 1,2,K, r

(4.59)

o r est le nombre des rgles. La sortie finale du rgulateur flou est infre comme suit :

160
r

Commande floue TS base sur modle

u( k ) =

hi ( z(k )) (Li r(k ) ( K i x(k ) + Ti d )) ,


i =1

avec hi ( z ( k )) =

i =1 wi ( z(k ))
r

wi ( z ( k ))

(4.60)

vrifiant pour tout k , les proprits de somme convexe et dactivation des fonctions dappartenance (cf. expression (4.48)). En tenant compte de lexpression (4.58), le schma gnral de la structure de commande PDC avec pr compensation de gain statique, pour les sous modles linaires affines, ainsi obtenu peut se reprsenter par la Figure 4.3.

tel-00136382, version 1 - 13 Mar 2007

Figure 4.3. Schma gnral de la commande du type rgulateur PDC avec pr compensateur

Lexpression (4.58) permet de calculer une loi de commande optimale pour annuler les erreurs en rgime permanent quand les consignes appliques au procd sont constantes. Cependant, la principale limitation de la technique de pr compensation par gain statique est le manque de robustesse vis--vis des variations paramtriques dans le modle, ce qui peut empcher lannulation totale de lerreur en rgime permanent. Une solution mieux adapte est dveloppe par la suite.

4.2.3.

Commande PDC avec ajout dintgrateurs

Une deuxime approche pour traiter le problme de poursuite des rfrences constantes, consiste ajouter au systme un certain nombre dintgrateurs numriques et puis, calculer les gains associs pour chacun des sous modles affines. La dynamique peut alors sexprimer partir dune reprsentation augmente, dans laquelle les intgrateurs ont pour entres respectives les carts entre consignes et mesures correspondants. En utilisant lapproximation dune intgrale par la mthode des rectangles, les intgrateurs numriques sont de la forme :
v k +1 = v k + Te ek = v k + Te (rk y k )

(4.61)

o le vecteur v k p , Te est la priode dchantillonnage et ek p est le vecteur dcart entre le vecteur de consignes rk m et de mesures y k p . Daprs lexpression (4.61), on peut noter que si le systme commander possde un nombre dentres m et de sorties p , alors la poursuite des consignes constantes ne se fera pour les p sorties que dans le cas p m . Dans ces conditions, les dveloppements mathmatiques prsents ici supposent

Commande floue TS base sur modle

161

que chaque sortie est associe un intgrateur92 et que le vecteur de consignes a une dimension correspondante celui de mesures, cest--dire, on considrera ici rk p . En prenant en compte la dfinition du vecteur vk , alors le systme augment associ chacun des sous modles a ainsi pour quations dtat :
x k +1 A v = C k +1
[nxn ] [ pxn ]

d x k B [nxm ] uk + + I [ pxp ] v k 0 [ pxm ] rk


[nxp ] [ pxp ]

[ y k ] = [C

[ pxn ]

x ] v

k
k

C = Te C , avec rk = Te rk

(4.62)

o les indices des matrices indiquent leur dimensions correspondantes, les vecteurs dtat, de sortie, de termes indpendants et dentres ont pour dimensions respectivement x k n ,
v k p , y k p , d n , u k m et rk p .
tel-00136382, version 1 - 13 Mar 2007

En considrant lexpression (4.62), cette reprsentation peut tre mise sous la forme condense suivante :
~ ~ + B uk + d , avec ~ A 0 ~ B ~ d ~ A= , B = 0 , d = r , C = [C 0] C I k x ~ x k = k , ~ yk = [yk ] vk

~ ~ x k +1 = A ~ xk ~~ ~ y k = C xk

(4.63)

~ o les lments matriciels ont respectivement pour dimensions A ( n + p ) ( n + p ) , ~ ~ ~ B ( n + p ) m , d ( n + p ) et C ( p ) ( n + p ) . De leur ct, les nouveaux vecteurs dtat, dentre, de termes constantes et de sortie pour le systme augment ont pour dimensions ~ respectivement ~ x k n + p , u k m , d n + p et ~ yk p .

Si on considre un horizon infini, le critre quadratique minimiser a alors pour expression :


~ 1 T ~~ T J = (~ xk Q x k +uk R uk ) 2 k =0

(4.64)

~ o Q ( n + p ) ( n + p ) est une matrice symtrique semidfinie positive et R m m est ~ symtrique dfinie positive. Afin doptimiser le critre, J doit converger, pour cela, le sous~ systme (4.63) doit tre stable. La matrice Q est dfinie de la faon suivante :

92

Sil nen est pas ainsi, la mthode propose demeure bien sr valable, en prenant soin simplement de constituer correctement les matrices dtat du sous systme global sur lequel seffectue la dtermination des divers lments de la structure de commande.

162

Commande floue TS base sur modle


~ Q [nxn ] 0 [nxp ] Q= 0 [ pxn ] Qv [ pxp ]

(4.65)
~

Le critre J peut donc encore scrire en utilisant la dfinition prcdente de la matrice Q


~ 1 T T T J = ( xk Q xk + vk Qv v k +uk R uk ) 2 k =0

(4.66)

Il est alors possible de calculer pour le systme augment (4.63) la commande optimale ~ minimisant le critre quadratique J en suivant une procdure similaire celle dveloppe * en boucle prcdemment pour lobtention de lexpression (4.45). La commande optimale uk ferme ainsi dtermine pour chacun des sous modles est de la forme : ) ) ) ) ~ ~~ * uk = K~ x k + N d = L rk ( K x k + K v v k + N d ) (4.67)
* uk

tel-00136382, version 1 - 13 Mar 2007

et le vecteur li aux entres et aux termes de biais est d = [d rk ]T n + p .

Il convient de remarquer que dans lexpression (4.67) les matrices K et N ne sont pas les mmes que les matrices K et N obtenues dans lexpression (4.45) lors de la synthse de la commande du systme ne comportant pas les intgrateurs additionnels. Cest pourquoi la ~ notation a t change en consquence. Dautre part, les matrices K m ( n + p ) et ) ) ) ) ~ ~ N m ( n + p ) ont t dcomposes en K = [K K v ] o K m n et K v m p , et en ) ) ) ) ~ N = [N L ] o N m n et L m p . Le vecteur dtat augment est ~ x k = [x k v k ]T n + p
~

* Pour calculer la commande optimale uk qui annule lerreur stationnaire (entre consigne et mesure) pour chacun des sous modles partir de la reprsentation dtat augment (4.63), la mthodologie dveloppe pralablement consiste suivre la procdure suivante :

~ 1. Trouver la matrice P ( n + p ) ( n + p ) solution de lquation DARE de Riccati :


~ ~~ ~ ~ ~ ~ ~ ~~ ~ ~~ ~ AT P A P ( AT PB )( R + B T PB ) 1 ( B T P A) + Q = 0

(4.68)

~ ~ ~ 2. Calculer les matrices E , F et G ( n + p ) ( n + p ) suivantes :


~ ~ ~ E = BR 1 B T ~ ~ ~ ~ ~ ~~ ~ F = A T P ( I + EP ) 1 = A T ( P 1 + E ) 1 ~ ~ G = I AT

(4.69)

o la matrice identit I ( n + p ) ( n + p ) . 3. Daprs les rsultats (4.68) et (4.69), calculer la loi de commande en dterminant les ~ ~ matrices K m ( n + p ) et N m ( n + p ) selon les expressions :
* uk

~ ~~ (K ~ x k + N d ),

~ ~ ~ ~ ~ ~~ K = ( R + B T P B ) 1 B T P A avec ~ ~ ~ ~ 1 ~ ~ T ~ ~ 1 ~ T ~ N = ( R + B PB ) B ( P + (G + FE ) F )

(4.70)

En reprenant lexpression (4.67), on peut noter que la loi de commande optimale obtenue ) pour les sous modles linaires affines consiste en un retour dtat K x k , une compensation

Commande floue TS base sur modle


) )

163

du terme de biais N d , un terme danticipation li la consigne L rk et une action intgrale ) K v v k agissant sur lerreur entre consignes et mesures. Par analogie avec les rgulateurs classiques comportant une action proportionnelle et une action intgrale , le rsultat obtenu peut tre vue comme une loi de commande multidimensionnelle du type P.I. avec compensation du terme de biais. Pour un modle flou affine Takagi-Sugeno discret, la ralisation du rgulateur flou PDC avec action intgrale, consiste dterminer pour les i = 1,2,K, r rgles du modle, les gains ~ ~ K i et N i du systme augment (4.67), dans les parties conclusions selon lexpression (4.70), en utilisant des rgles R i sous la forme :
i Si z1 ( k ) est M 1 et L et z p ( k ) est M ip

~ ~ ~ alors u( k ) = K i ~ x ( k ) + N i d , i = 1,2K, r

(4.71)

o r est le nombre des rgles. La sortie finale du rgulateur flou est infre comme suit :
u( k ) = x (k ) + N i d )), hi ( z(k )) (K i ~
r

~ ~

avec hi ( z (k )) =

i =1

i =1 wi ( z(k ))
r

wi ( z ( k ))

(4.72)

tel-00136382, version 1 - 13 Mar 2007

vrifiant pour tout k , les proprits de somme convexe et dactivation des fonctions dappartenance (cf. expression (4.48)). En prenant en compte lexpression (4.67), le schma gnral de la structure de commande PDC avec action intgrale, pour les sous modles linaires affines, ainsi obtenu est reprsent par la Figure 4.4.

Figure 4.4. Schma gnral de la commande PDC avec action intgrale pour des sous modles affines

4.2.4.

Choix des matrices de pondration Q et R


~ ~

Il est clair que les valeurs des matrices K et N dans la loi de commande (4.70) ~ dpendent du choix des matrices Q et R qui doit tre fait a priori. Afin de pondrer ltat largie ~ x k et lentre uk , ces deux matrices doivent tre dfinies positives.

164

Commande floue TS base sur modle

Pour simplifier le test de positivit, on pourra ventuellement se limiter au choix de deux matrices diagonales, avec tous les lments de la diagonale principale positifs, de la forme :
Q = diag ( q1 , q2 ,K, qn ) , R = diag ( r1 , r2 ,K, rm )

(4.73)

Dans ces conditions : Plus qi est grand, plus le retour vers zro de la variable ~ xi correspondante sera rapide. Plus r j est grand, plus la commande u j correspondante sera de faible amplitude.

Si le i-me lment de ~ x k et le j-me lment de uk ont un maximum permit, ~ respectivement max( xi ) et max(u j ) , alors on peut adopter le choix initial suivant [BRY69]:
qi = (1 max( ~ xi ) )2

r j = 1 max(u j )

)2

(4.74)

tel-00136382, version 1 - 13 Mar 2007

Il faut remarquer que la mthode propose pour calculer la structure de commande suppose en effet que les changements de consignes sont effectus sous forme dchelons. Pour des applications industrielles, il savre quun rglage fin des matrices de pondration est souhaitable pour confrer au systme, lors des changements de consignes, une volution dynamique correcte en mme temps que des amplitudes dactions compatibles avec une utilisation pratique. Dans ce cas, les tudes en simulation se montrent un outil prcieux pour valuer et amliorer le comportement attendu du systme. Lorsque la loi de commande doit tre utilise pour une fonction dasservissement (avec des modifications imposes au vecteur de consignes), il semble probable que la matrise du ~ systme dans ces conditions soit beaucoup plus difficile. Un ajustement des matrices Q et R intervenant dans le critre quadratique pourrait sappliquer dans certains cas, mais il faut noter que le rglage des ces matrices doit satisfaire un compromis entre les amplitudes supports par les actionneurs et la performance globale de la boucle. Ainsi par exemple, une ~ augmentation des valeurs des coefficients de la matrice R par rapport ceux de la matrice Q , pnaliserait les entres, mais en mme temps cela pourrait donner une faible pondration des carts entre consignes et mesures. A ce moment, la compensation des perturbations pourrait devenir trs lente par rapport aux performances potentielles de la structure de commande choisie. Pour conserver un fonctionnement correct dans les diffrents cas envisags, une solution intressante consiste introduire dans la structure de commande un modle de rfrence ayant pour entres le vecteur de consignes rk et pour sorties la forme dvolution rellement souhaite pour le vecteur des sorties y k du procd [FOU79]. Linclusion dun modle de rfrence dans la structure de commande permet une bonne sparation entre le problme du choix des boucles de raction et le problme des performances en asservissement.

Commande floue TS base sur modle

165

4.3. Conclusions
Le but de ce chapitre ntait pas dtre exhaustif, mais dexposer quelques principes de base concernant les diffrentes possibilits quoffrent les modles flous de type TakagiSugeno pour la commande des systmes non linaires multivariables en utilisant la philosophie de commande du type compensation parallle distribue (PDC). Cette approche consiste utiliser la mme partie antcdent des rgles que celle du modle flou de type Takagi-Sugeno, et, dans la partie conclusion, des commandes locales, par retour dtat. Dans ce contexte, chaque sous modle du modle flou de type Takagi-Sugeno est stabilis localement par une loi linaire. Dans la premire partie du chapitre, nous avons donn un aperu gnral en considrant les problmes de la stabilit (analyse) et de la stabilisation quadratique (synthse dun rgulateur flou) des modles flous homognes de type TS. La plupart des travaux font appel, pour vrifier les conditions de stabilit, la mthode de Lyapunov. Au niveau de la synthse, la dtermination de la loi de commande revient dterminer pour chaque sous modle local une matrice de gains de retour dtat. Lun des aspects intressants de ce type de problmes consiste en ce que sa formulation peut se faire sous une forme de LMI (Linear Matrix Inequalities), qui peuvent tre rsolues dune faon efficace par des algorithmes93 doptimisation convexe sous contraintes. Dans la deuxime partie du chapitre, nous avons abord le problme de synthse quadratique de la commande. En utilisant lapproche PDC, nous avons dvelopp une commande sous-optimale linaire quadratique par retour dtat base sur un modle affine TS en temps discret. Pour cela, nous avons propos trois lois de commande qui tiennent compte du terme indpendant caractristique (biais) dans la partie consquent du modle affine. Les lois de commande sont de type rgulateur, rgulateur avec compensation de gain statique et rgulateur avec action intgrale, ce qui permet lannulation des erreurs stationnaires de poursuite par rapport des rfrences de type chelon dans la commande. Lapproche retenu permet de calculer dune faon analytique, la loi de commande multivariable pour des modles flous affines TS issus de lapplication des mthodes didentification par clustering flou que nous avons abord dans le chapitre prcdent. La suite de ce rapport est ddie lapplication de nos travaux de recherche concernant la modlisation et la commande floue de type Takagi-Sugeno, sur le bioprocd de traitement des eaux uses considr.

tel-00136382, version 1 - 13 Mar 2007

93

Par exemple, la bote outils LMI Toolbox de Matlab ou des interfaces LMI telles que SeDuMi (dveloppe au LAAS) ou YALMIP. Pour plus dinformation sur des outils logiciels pour loptimisation en commande, voir par exemple la page Web du projet OLOCEP du LAAS : http://www.laas.fr/OLOCEP/logiciels.htm.

166

Commande floue TS base sur modle

tel-00136382, version 1 - 13 Mar 2007

Identification et Commande floues TS du bioracteur

167

___________________________________________________________________________

Chapitre 5

5.

Identification et Commande floues TS du bioracteur

___________________________________________________________________________

tel-00136382, version 1 - 13 Mar 2007

Dans ce chapitre, nous dveloppons lapplication des mthodes floues didentification et de commande au bioprocd considr : un bioracteur arobie multivariable en mode continu pour le traitement des eaux uses issues dune industrie papetire. Aprs avoir reprcis le modle obtenu partir des bilans de matire, nous dveloppons un modle flou TakagiSugeno pour le bioracteur bas sur des donnes exprimentales entre-sortie en appliquant les techniques abordes dans le chapitre 3. Le systme dynamique multi-variable est ainsi reprsente comme un modle base de rgles qui approxime la dynamique non linaire comme une concatnation dun ensemble de sous modles localement linaires sous la forme dauto-rgression non-linaire (NARX) dans lespace dtat. En appliquant la philosophie de commande du type PDC base sur un modle, prsente dans le chapitre 4, nous faisons la synthse de la loi de commande la mieux adapte au bioprocd. Nous nous sommes intresss, en particulier, la commande sous-optimale linaire quadratique par retour dtat pour les modles TS affines en temps discret, afin de rguler les concentrations de biomasse et de substrat xnobiotique du bioprocd.

168

Identification et Commande floues TS du bioracteur

Sommaire ___________________________________________________________________________

tel-00136382, version 1 - 13 Mar 2007

Identification et Commande floues TS du bioracteur

169

5.1. Description entre-sortie du bioprocd de traitement des eaux uses


Dans cette section nous reprenons le bioprocd de dpollution des eaux rsiduaires par lagunage are dvelopp dans la section 2.5, en nous focalisant sur une reprsentation du comportement dynamique non linaire entr-sortie du procd.

5.1.1.

Le modle de bilan matire

tel-00136382, version 1 - 13 Mar 2007

Comme nous lavons dj indiqu, le modle considr dans le cadre de notre tude est un bioracteur arobie multivariable en mode continu pour le traitement des eaux uses issues dune industrie papetire. Ce procd est aliment par un mlange bi-polluant compos par des substrats nergtique et xnobiotique, dans lequel la biomasse, constitue par une population mixte de bactries qui dgrade les polluants, exhibe des phnomnes tels que la mortalit endogne et des interactions microbiennes (lactivation/inhibition comptitive dans le mlange bi-substrat (cf. paragraphe 2.5.2)). Le substrat nergtique compos principalement de cellulose est caractris par une forte biodgradabilit alors que le substrat xnobiotique constitu dun mlange de drivs ligneux et de lignosulfonates, est trs peu biodgradable. Ce substrat est considr comme le principal polluant. Le schma de principe du bioprocd est prsent sur la Figure 5.1.

Figure 5.1. Schma de principe entre-sortie du bioprocd de traitement des eaux uses.

Le systme comporte deux entres (variables de commande) : u1 (t ) , le taux de dilution en eau et u 2 (t ) , le taux de dilution en substrats et trois variables de sorties qui correspondent aux concentrations de biomasse X (t ) et de substrats xnobiotique S x (t ) et nergtique S e (t ) . Nous rappelons que le modle mathmatique que nous avons retenu, dvelopp sous Matlab, est une version amliore par rapport celui du projet europen FAMIMO, pour lequel nous avons propos lajout du terme de mortalit endogne au niveau de la dynamique bactrienne. En tablissant le bilan de matire pour les principaux composants (cf. section 2.5.4), nous obtenons lensemble des quations diffrentielles (5.1) (5.3), qui dcrivent le comportement dynamique du bioprocd :

170

Identification et Commande floues TS du bioracteur

S x (t ) S e (t ) dX (t ) max max = Sx + Se X (t ) (u1 (t ) + u 2 (t ) )X (t ) bX (t ) dt K Sx + S x (t ) + a Se S e (t ) K Se + S e (t ) + a Sx S x (t )

(5.1) dS x (t ) S x (t ) max = Sx X (t ) u1 (t ) S x (t ) + S xmax in S xin (t ) u 2 (t ) dt Y X / Sx K Sx + S x (t ) + a Se S e (t )

(5.2)

dS e (t ) S e (t ) max = Se X (t ) u1 (t ) S e (t ) + S emax in S ein (t ) u 2 (t ) dt Y X / Se K Se + S e (t ) + a Sx S x (t )

(5.3)

Comme nous lavons indiqu prcdemment, ce modle de connaissance nous servira de base pour comparer dans la section 5.2, les performances dun modle flou reprsentant le comportement dynamique non-linaire entre-sortie du systme. En utilisant la technique de compensation parallle distribue, nous aborderons galement dans la section 5.3 la synthse dun contrleur flou de type Takagi-Sugeno bas sur ce modle.
tel-00136382, version 1 - 13 Mar 2007

5.1.2.

Les paramtres du modle

Les diffrents paramtres et variables qui interviennent dans les quations diffrentielles (5.1) (5.3) et qui dcrivent la dynamique du bioprocd ont t explicits dans le chapitre 2. Ces paramtres et variables sont: X (t ) S x (t ) S e (t )
max Sx max Se

concentration en (g/L) de biomasse concentration en (g/L) de substrat xnobiotique concentration en (g/L) de substrat nergtique taux spcifique de croissance maximal du au substrat xnobiotique taux spcifique de croissance maximal du au substrat nergtique rendement de conversion du substrat xnobiotique en biomasse rendement de conversion du substrat nergtique en biomasse constantes de Michalis-Menten pour les substrats xnobiotique, nergtique94 constante dinhibition du substrat nergtique sur le substrat xnobiotique constante dinhibition du substrat xnobiotique sur le substrat nergtique terme de mortalit bactrienne du la respiration endogne taux de dilution deau dalimentation (eau propre) taux de dilution de substrats dalimentation (eau rsiduaire)95 concentration en substrat xnobiotique du milieu d'alimentation concentration en substrat nergtique du milieu d'alimentation

Y X / Sx Y X / Se K Sx , K Se a Sx a Se b u1 (t ) u 2 (t ) S xin (t ) S ein (t )

max S xmax in (t ) , S ein (t ) concentrations maximums en substrats dans le milieu d'alimentation

Les valeurs des diffrents paramtres du bioprocd sont donnes dans le Tableau 5.1.

Ces constantes correspondent laffinit de la population bactrienne mixte pour chaque substrat polluant. Le taux de dilution D(t)=u1(t)+u2(t) correspondant au rapport entre le dbit dalimentation et le volume (constant) du bioracteur qui napparait pas explicitement dans le modle. A sa place interviennent u1(t) et u2(t).
95

94

Identification et Commande floues TS du bioracteur Description Rendements de conversion des substrats en biomasse Taux spcifiques maximums de croissance Mortalit bactrienne endogne Constantes daffinit de Michalis-Menten Constantes dinhibition/activation Paramtre Y X / Sx Y X / Se
max Sx max Se

171 Valeur 0,7 0,2 0,1 0,2 0,005 1,5 1 0,1 10 Units g/g g/g h-1 h-1 h-1 g/L g/L g/g g/g

b K Sx

K Se a Sx a Se

Tableau 5.1. Paramtres stchiomtriques et cintiques du bioprocd

5.1.3.
tel-00136382, version 1 - 13 Mar 2007

Les objectifs de conduite du procd

Traditionnellement lobjectif principal en traitement deaux uses par voie biologique est la dgradation dun maximum de polluants. Ainsi, laugmentation de lactivit de biodgradation en assurant des conditions pour avoir une bonne croissance de la biomasse est une solution attrayante et naturelle. Nanmoins, le besoin de contrler la prolifration de micro-organismes est devenu une ncessit pour prserver lcosystme des nuisances bactriologiques. Cest en particulier le cas des industries papetires qui, malheureusement, affectent srieusement lquilibre naturel dans lenvironnement proche du lieu du traitement. Ainsi, la synthse du contrleur pour le bioprocd est multivariable : il doit rguler la concentration de biomasse (afin dviter la prolifration de micro-organismes) et celle du substrat xnobiotique (afin de dgrader le substrat polluant) sur des consignes pre-spcifies. Les valeurs des concentrations de rfrence sont fixes en tenant compte des effets toxiques des bactries et du substrat polluant sur le milieu rcepteur naturel. Ainsi, nous avons retenu le scnario de commande tabli dans le benchmark de Ben Youssef [BEN97], utilis lors du projet FAMIMO. Le scnario consiste en les consignes * suivantes sur le substrat xnobiotique S x (t ) et la biomasse X * (t ) suivantes :
* S x (t ) = 0,3 g / L t , 0 h t < 180 h * S x (t ) = 0,2 g / L t , 180 h t 300 h

(5.4)

X * (t ) = 0,6 g / L t , 0 h t < 80 h * X (t ) = 0,7 g / L t , 80 h t < 220 h * X (t ) = 0,6 g / L t , 220 h t 300 h

(5.5)

Remarque
R 5.1

Si le bioracteur volue dans des conditions normales, telles que celles dcrites dans le scnario ci-dessus, la concentration du substrat nergtique est rsiduelle du fait de sa haute biodgradabilit. Ceci explique pourquoi on ne tient pas compte de la rgulation du substrat nergtique au niveau du contrleur.

172

Identification et Commande floues TS du bioracteur

5.1.4.

Les contraintes sur les actionneurs

Quand le taux de dilution D(t) est nul ou trs faible et en absence du terme b de mortalit endogne, la biomasse suit une trajectoire de croissance exponentielle, qui est caractristique dun comportement instable. Pour les procds biologiques fonctionnant en mode continu, lobjectif de commande est bas sur la rgulation du procd, la diffrence des bioprocds fed batch dans lesquels le but est gnralement laccumulation dun produit de la raction. En consquence, limposition de valeurs minimales de taux de dilution et de concentrations dans les substrats dalimentation donne une marge apprciable de sret pour viter un comportement potentiellement instable du bioprocd [BEN97]. De plus, une priode relativement longue sans alimentation des micro-organismes pourrait aussi entraner la mortalit microbienne car leur fragile coexistence dpend dinteractions complexes pour la consommation des substrats. Dautre part, on a un phnomne de lavage de la biomasse du bioracteur si le taux de dilution D(t) est beaucoup plus grand que le taux spcifique de croissance des microorganismes u X (t ) . Ainsi, les deux entres (variables de commande) u1 (t ) et u 2 (t ) sont soumisses aux limitations suprieures dentre dues aux limitations mcaniques des pompes. Les valeurs numriques des variables qui interviennent dans le systme dalimentation du modle du bioprocd sont regroupes dans le Tableau 5.2. Description Limite suprieur dentre du taux de dilution Limite infrieur dentre du taux de dilution Concentrations maximums de substrats dalimentation Paramtre u max u min S xmax in (t ) S emax in (t ) Valeur 0,04 0,0001 6 6 Units h-1 h-1 g/L g/L

tel-00136382, version 1 - 13 Mar 2007

Tableau 5.2. Bornes des variables dans le systme dalimentation du bioprocd

5.2. Modlisation et identification floue du bioprocd partir des donnes


Comme nous lavons dj indiqu, le modle complet du bioprocd reprsent par des quations diffrentielles (5.1) (5.3) nous servira de rfrence pour la modlisation floue de type Takagi-Sugeno. Le modle flou est construit partir des donnes entre-sortie du systme obtenues en simulation en utilisant le logiciel Matlab. Le systme dynamique multi-variable est ainsi reprsente comme un modle base de rgles qui approxime le comportement dynamique non linaire comme une concatnation dun ensemble de sous modles localement linaires sous la forme dauto-rgression non-linaire (NARX). Nous considrons par la suite llaboration du jeu des donnes ainsi que lutilisation du clustering flou Gustafson-Kessel et RoFER pour la construction du modle Takagi-Sugeno du systme. Nous abordons galement lobtention dun modle flou final avec une base commune de rgles (partition unique) pour les trois sorties, afin dutiliser le modle pour la dtermination de la commande dans lespace dtat.

Identification et Commande floues TS du bioracteur

173

5.2.1.

Elaboration du jeu des donnes entre-sortie

Le premier pas vers la construction du modle flou de type Takagi-Sugeno en utilisant les techniques de clustering flou consiste en la conception exprimentale de lessai pour produire et acqurir les donnes entre-sortie du procd. Pour gnrer le jeu de donnes, nous supposons que toutes les variables sont accessibles la mesure (mesure de ltat complet). En ralit dans le benchmark initial propos par [BEN97], le substrat xnobiotique nest pas accessible directement. Un observateur asymptotique ralis par Ben Youssef a t utilis lors du projet FAMIMO. Compte tenu de la prsence du terme de mortalit endogne ajout la dynamique bactrienne, cet observateur nest plus valable avec la mme performance destimation. Bien que nous considrions les trois variables de sortie disponibles pour la mesure, il est tout fait envisageable de dvelopper un observateur flou bas sur ce modle, en profitant de la structure de type Takagi-Sugeno obtenue. Afin de disposer dun jeu de donnes appropri pour lidentification non linaire, il est prfrable dexciter le systme dans toute la gamme des variables considrs tant en amplitude quen frquence. En mme temps, afin de rester dans lespace dfini par les rfrences souhaites, on est oblig de restreindre la commande u 2 (t ) . Normalement du fait de la modlisation des actionneurs, on est oblig de restreindre les variations des variables de commande entre 0,0001 et 0,04 h-1. Un choix convenable de la gamme de u 2 (t ) est de la restreindre de 0,0001 0,01 h-1. On applique alors au processus des signaux multisinusodal ayant ces bornes. Un bruit blanc de petite taille est ajout afin de garantir une excitation correcte de la dynamique du procd pour les diffrents points de fonctionnement. On choisira une priode dchantillonnage Te = 2 heures, avec un horizon de temps de 2000 h. On obtient le jeu de donnes suivant
0.04

tel-00136382, version 1 - 13 Mar 2007

0.03 u1(t) [1/h]

0.02

0.01

250

500

750

1000

1250

1500

1750

2000

0.015

u2(t) [1/h]

0.01

0.005

250

500

750

1000 temps [h]

1250

1500

1750

2000

Figure 5.2. Signaux dentre u1(t) et u2(t) pour lidentification du bioprocd

La rpartition du jeu de donnes peut aussi tre visualis dans lespace des entres : les taux de dilution deau et de substrats dalimentation - u1xu2 (voir Figure 5.3).

174

Identification et Commande floues TS du bioracteur

tel-00136382, version 1 - 13 Mar 2007

Figure 5.3. Rpartition des donnes dans lespace des entres du procd.

On peut noter que les entres sont relativement bien distribues dans la plage des variations possibles. Toutefois, il faut rappeler que lobtention dun jeu de donnes assez gnral pour lidentification nest pas vidente. En effet, la conception de lexprience didentification doit tenir compte du niveau de lexcitation et des variations frquentielles dans la gamme de rponse du procd. De plus il faut tre certain, avec ce jeu de valeurs, datteindre les diffrents points de fonctionnement. Le temps de rponse typique des bioprocds ainsi que le modle de connaissance nous ont aids dimensionner les signaux appropris notre cas dtude. Il est intressant de souligner ici limportance de la comprhension des phnomnes reprsents par le modle et sa relation avec les conditions de simulation. En effet, bien que la concentration de biomasse puisse atteindre une valeur nulle, il est vident que cette condition doit tre imprativement vite car sans biomasse, aucune dgradation ne peut continuer se produire. Le respect de cette condition a t alors pris en compte au niveau de notre exprience didentification. Le jeu des donnes didentification a t obtenu avec [X (0) S x (0) S e (0)]T = [0,01 0,3 0,3]T afin de tenir compte des situations relles du comportement du bioracteur, par exemple, partir dune phase de dmarrage. Les donnes ont t prises en mode de fonctionnement continu, elles couvrent toute la rgion dintrt de notre application. La Figure 5.4 montre la rpartition correspondante des donnes dans lespace des sorties des variables commander, les concentrations de biomasse et du substrat xnobiotique :

Identification et Commande floues TS du bioracteur

175

Figure 5.4. Rpartition des donnes dans lespace des sorties du procd

tel-00136382, version 1 - 13 Mar 2007

Il est important de noter quun nombre important de points relativement bien distribus se trouve autour de la zone de contrle dintrt. Le comportement des variables de sortie du bioprocd pour lexprience didentification est visualise sur la Figure 5.5.
X(t) (g/L) Se(t) (g/L) Sx(t) (g/L)

temps (h)

Figure 5.5. Evolution des sorties du procd donnes didentification

Laugmentation de la concentration des substrats xnobiotique et nergtique dans les premires heures de lexprience sexplique par la faible concentration de biomasse lors du dmarrage. Ensuite, la concentration de biomasse est suffisante pour parvenir au processus de biodgradation. Les variations des taux de dilution dentre influencent le processus en faisant varier les variables de sortie du bioprocd dans toute la gamme dintrt. La haute biodgradabilit du substrat nergtique par rapport au substrat xnobiotique est vidente en rapport aux faibles concentrations que ce premier atteint. Une valeur minimale de concentration de la biomasse est aussi respecte tout au long de lexprience.

176

Identification et Commande floues TS du bioracteur

5.2.2.

Utilisation du clustering flou Gustafson-Kessel et RoFER

Avec les donnes entre-sortie du bioprocd et afin de modliser le comportement dynamique du systme en appliquant les techniques de clustering flou [GRI05], on dcompose le systme MIMO deux entres (u1 (k ) et (u 2 (k ) ) et trois sorties ( X (k ) , S x (k ) et S e (k ) ) en trois modles flous MISO de type Takagi-Sugeno qui conservent le mme type de structure au niveau de leurs rgles. partir de la connaissance pralable du bioprocd, nous avons choisi une dynamique pour les modles flous TS telle que chaque sortie linstant k+1 dpende des trois sorties et des deux entres linstant k. Ce choix est d dun ct, la structure des variables couples dans le modle de bilan de matires donn par les expressions (5.1)-(5.3) (on peut supposer que le systme est coupl) et dautre part, afin de maintenir un compromis entre une complexit rduite du modle et une bonne capacit dapproximation. Dans ces conditions, lordre du systme, li aux constantes (cf. expression (3.25) et paragraphe subsquent) n y (ordre de la sortie), nu (ordre de lentre) et nd (retard pur), est exprim alors par les structures suivantes :
tel-00136382, version 1 - 13 Mar 2007
1 1 1 1 1 1 1 n y = 1 1 1 , nu = 1 1 , n d = 1 1 1 1 1 1 1 1 1

(5.6)

o les facteurs '1' indiquent la prsence dune dpendance fonctionnelle entre les variables. Ainsi, les quations dynamiques du type NARX pour chaque rgle Ri , avec
1 i c , associe chaque sortie y j (k ) linstant k, avec j = {1,2,3}, - (notes ici Ri
y j (k )

dans les trois modles flous prennent alors la forme gnrale suivante : Ri j : Si y1 (k ) est Ai1 et y 2 (k ) est Ai 2 et y 3 (k ) est Ai 3 et u1 (k ) est Ai 4 et u 2 (k ) est Ai 5
y (k )

Alors y (k ) y (k ) y (k ) y (k ) y (k ) y (k ) y (k + 1) = ai1 j y1 (k ) + ai 2j y 2 (k ) + ai 3j y 3 (k ) + ai 4j u1 (k ) + ai 5j u 2 (k ) + d i j

(5.7)

O y j (k ) reprsente nimporte laquelle des sorties dintrt : X (k ) , S x (k ) ou S e (k ) ). Au niveau du processus de clustering, parmi les algorithmes prsents au Chapitre 3, on a dcid dutiliser les algorithmes qui nous on sembl les plus reprsentatifs et les mieux adapts pour la tche de modlisation : les algorithmes GK et RoFER. Cela nous permettra de faire des comparaisons pour lobtention des modles en utilisant dun ct des clusters hyperellipsodaux avec obtention a posteriori des paramtres des consquents (algorithme GK) et dautre part, des clusters hyperplanaires avec estimation directe (simultane avec la partition) des paramtres des consquents (algorithme RoFER). Cela nous permettra aussi dlargir le champ dapplication montr dans les exemples la fin du Chapitre 3, sur le bioprocd actuellement considr. Rappelons que le nombre de rgles dans le modle flou de type Takagi-Sugeno correspond au nombre de clusters dfini (cas de lalgorithme GK) ou obtenu (cas de lalgorithme RoFER). En utilisant les critres de validit du nombre de clusters rapports dans

Identification et Commande floues TS du bioracteur

177

la section 3.4.1, on divise lespace de reprsentation96 en quatre clusters ( c = 4 ) pour chaque sortie et le paramtre flou de la partition m est pris gal 2. Pour lalgorithme RoFER le nombre initial (nombre maximal) de clusters a t fix en 10. Avec un seuil de cardinalit robuste proche de 21 pour chacune des trois sorties, nous avons obtenu le mme nombre de clusters quavec lalgorithme GK. En utilisant le mcanisme de projection et la paramtrisation des fonctions dappartenance exponentielles par morceaux, on extrait aussi les fonctions dappartenance des ensembles flous multidimensionnels (clusters), de faon avoir directement une interprtation du modle par rapport aux variables des rgresseurs, et donc celles des prmisses. On obtient alors des rgles sur la forme dcompose. Nous avons gnr deux jeux de N = 500 donnes de validation, afin de tester la performance de prdiction du modle flou TS dans des diverses scenarios [GRI05]. Un bruit blanc damplitude 5% a t ajout a chaque sortie. Le premier jeu de donnes, illustr sur la Figure 5.6, correspond un mode dopration que nous avons appel "mixte", dans la mesure quil possde des donnes dentre pour les modes dopration batch (e.g. entre 0-180 h et 900-1000 h), mode continu (e.g., entre 180-400 h et 500-900 h), ainsi quune courte priode de prdominance du taux spcifique de dilution de leau propre u1 (t ) (e.g., 400-450 h). Pour le mode batch, nous avons fait cette considration en prenant en compte des cas o les deux taux de dilution u1 (t ) et u 2 (t ) sont nuls, par exemple, lors dune action de commande impose ou lors dune procdure de dmarrage du bioracteur. Les conditions initiales pour ce test sont [ X (0) S x (0) S e (0)]T = [ 0,5 0,45 0,2]T (g/L). Cette exprience de validation est orient afin de tester les capacits de gnralisation du modle. Les jeux des donnes ainsi que les rponses obtenues sur les sorties du bioprocd sont illustres dans les figures suivantes :

tel-00136382, version 1 - 13 Mar 2007

u2(t)

(h )

-1

u1(t)

(h )

-1

temps (h)

Figure 5.6. Signaux dentre u1(t) et u2(t) pour le premier test de validation du bioprocd

Les rsultats du premier test de validation (mode "mixte") du modle flou TS pour chacune des sorties sont montrs sur la figure suivante :

96

Espace de reprsentation de dimension 5, correspondant au nombre choisi de rgresseurs dans le modle dynamique : y1(k), y2(k), y3(k), u1(k) et u2(k).

178
1.5 1 0.5 0 1

Identification et Commande floues TS du bioracteur

X(t) (g/L)

100

200

300

400

500

600

700

800

900

1000

Sx(t) (g/L)

0.5

0 0.3

100

200

300

400

500

600

700

800

900

1000

tel-00136382, version 1 - 13 Mar 2007

Se(t) (g/L)

0.2 0.1 0

100

200

300

400

500
temps (h)

600

700

800

900

1000

Figure 5.7. Premier test de validation du modle flou TS du bioprocd avec donnes dopration en mode "mixte" (batch/continu). Sortie du procd (ligne en trait plein), sortie du modle avec clustering GK (ligne pleine) et sortie du modle avec clustering RoFER (ligne pointille).

Comme on peut le voir sur la Figure 5.7, pour les donnes du mode "mixte" de validation (batch/continu) en gnral la dynamique pour chacune des trois sorties du bioprocd est raisonnablement bien approxim. Cependant, les capacits de gnralisation du modle hors des conditions tablis lors du processus didentification (ralis en mode continu) sont assez limites, en particulier pour reproduire la dynamique propre du systme dans le mode batch pour de longues priodes. Dans notre cas, cela ne constitue en gnral pas un problme, car lopration du bioracteur pour le traitement des eaux uses se droule en mode continu. Nanmoins, si le mode batch tait envisage, il vaudrait mieux proposer un modle flou TS plus appropri que celui propos actuellement, cest--dire, en supprimant directement les rgresseurs correspondants aux entres u1 (t ) et u 2 (t ) pour viter des divergences numriques quand le mcanisme de projection est utilis pour lobtention des fonctions dappartenance des rgles. Si les deux modes dopration taient envisags pour une application particulire, nous considrons quune solution ce problme de modlisation pourrait tre la conception dun modle hybride qui utilise des modles flous dynamiques Takagi-Sugeno pour dcrire le fonctionnement pour chacun des modes dopration du bioprocd. Cette perspective est explorer dans une cadre plus gnral dapplication de la modlisation flou de type TakagiSugeno aux procds biotechnologiques.

Identification et Commande floues TS du bioracteur

179

Remarque
R 5.2

Pour le mode dopration batch les taux de dilution u1 (t ) et u 2 (t ) doivent tre gaux zro, cependant en pratique, il est ncessaire dimposer une valeur trs faible au niveau de la simulation pour viter des divergences numriques. Pour le cas du benchmark du projet FAMIMO, la valeur tablie exprimentalement partir de plusieurs simulations est de 0,0001 h-1, ce qui correspond aussi la limite infrieure dentre du taux de dilution dans le systme dalimentation du bioracteur.

Un deuxime jeu de donns est utilis pour un deuxime test de validation du modle. Dans ce cas, le jeu des donnes correspond au mode dopration continu du bioprocd, pour lequel nous avons utiliss les mmes conditions initiales que dans le cas prcdent. Cette exprience de validation est faite pour tester les capacits de prdiction du modle dans le mode continu, qui est le mode dopration du bioprocd de dpollution. Les rsultats du second test de validation (mode continu) du modle flou TS pour chacune des sorties sont montrs sur la Figure 5.8 :
tel-00136382, version 1 - 13 Mar 2007
1.5
X(t) (g/L)

1 0.5 0 1

100

200

300

400

500

600

700

800

900

1000

Sx(t) (g/L)

0.5

0 0.3
Se(t) (g/L)

100

200

300

400

500

600

700

800

900

1000

0.2 0.1 0

100

200

300

400

500 [h] temps (h)

600

700

800

900

1000

Figure 5.8. Deuxime test de validation du modle flou TS du bioprocd avec donnes dopration en mode continue. Sortie du procd (ligne en trait plein), sortie du modle avec groupement GK (ligne pleine) et sortie du modle avec groupement RoFER (ligne pointille).

La qualit numrique de lapproximation est mesur en utilisant les critres RMSE et VAF dcrits dans la section 3.4.4. Les valeurs idales pour ces deux critres sont

180

Identification et Commande floues TS du bioracteur

respectivement 0% et 100%. La performance numrique comparative des deux approximations est regroupe dans les Tableaux suivants :

Variable X (k ) S x (k ) S e (k )

Test en mode "mixte" RMSE 0,4902 0,4888 0,5000 VAF 77,35% 95,55% 87,29%

Test en mode continu RMSE 0,4902 0,4760 0,4695 VAF 91,31% 96,11% 84,58%

Tableau 5.3. Performance numrique de la validation du modle flou TS pour le bioracteur rsultats avec lalgorithme GK

Variable
tel-00136382, version 1 - 13 Mar 2007

Test en mode "mixte" RMSE 0,4902 0,4902 0,4987 VAF 79,29% 95,52% 92,71%

Test en mode continu RMSE 0,4902 0,4778 0,4687 VAF 91,87% 95,12% 95,26%

X (k ) S x (k ) S e (k )

Tableau 5.4. Performance numrique de la validation du modle flou TS pour le bioracteur rsultats avec lalgorithme RoFER

En prsence du bruit ajout lalgorithme RoFER est lgrement meilleur que lalgorithme GK. Nanmoins, il faut rappeler que dans le premier algorithme lestimation des paramtres se fait simultanment avec la partition des donnes, ce qui conduit une meilleure approximation locale, utile pour notre propos de commande base sur le modle. En contrepartie, lalgorithme GK est beaucoup plus performant au niveau temps de calcul.

Remarque
R 5.3

Les donnes exprimentales (dans de milieu industriel) sont entaches de bruit et ventuellement de points hors tendance. Dans ce contexte lalgorithme RoFER aurait montr un des avantages qui est la robustesse au bruit et points aberrants.

Nous donnons prsent les fonctions dappartenance obtenues avec chacun des deux algorithmes pour le cas du test de validation du modle flou TS du bioprocd avec donnes dopration en mode continue. Les Figures 5.9 5.11 correspondent aux rsultats avec lalgorithme GK et les Figures 5.12 5.14 aux rsultats avec lalgorithme RoFER.

Identification et Commande floues TS du bioracteur

181

tel-00136382, version 1 - 13 Mar 2007

Figure 5.9. Partition X(k) avec GK donnes dopration en mode continue

Figure 5.10. Partition Sx(k) avec GK donnes dopration en mode continue

182

Identification et Commande floues TS du bioracteur

tel-00136382, version 1 - 13 Mar 2007

Figure 5.11. Partition Se(k) avec GK donnes dopration en mode continue

Figure 5.12. Partition X(k) avec RoFER donnes dopration en mode continue

Identification et Commande floues TS du bioracteur

183

tel-00136382, version 1 - 13 Mar 2007

Figure 5.13. Partition Sx(k) avec RoFER donnes dopration en mode continue

Figure 5.14. Partition Se(k) avec RoFER donnes dopration en mode continue

184

Identification et Commande floues TS du bioracteur

Maintenant nous allons prsenter les rgles obtenues pour chacune des trois sorties des modles flous Takagi-Sugeno. La forme des rgles pour la sortie concentration de biomasse X (k ) tant en utilisant lalgorithme GK quen utilisant lalgorithme RoFER, est donne par les expressions suivantes : R1X ( k ) : Si X (k ) est A11 et S x (k ) est A12 et S e (k ) est A13 et u1 (k ) est A14 et u 2 (k ) est A15
X (k ) X (k ) X (k ) X (k ) X (k ) Alors X (k + 1) = a11 X (k ) + a12 S x (k ) + a13 S e (k ) + a14 u1 (k ) + a15 u 2 (k ) + d1X ( k )

R2X ( k ) : Si X (k ) est A21 et S x (k ) est A22 et S e (k ) est A23 et u1 (k ) est A24 et u 2 (k ) est A25
X (k ) X (k ) X (k ) X (k ) X (k ) Alors X (k + 1) = a 21 X (k ) + a 22 S x (k ) + a 23 S e (k ) + a 24 u1 (k ) + a 25 u 2 (k ) + d 2X ( k )

R3X ( k ) :
tel-00136382, version 1 - 13 Mar 2007

Si X (k ) est A31 et S x (k ) est A32 et S e (k ) est A33 et u1 (k ) est A34 et u 2 (k ) est A35
X (k ) X (k ) X (k ) X (k ) X (k ) Alors X (k + 1) = a31 X (k ) + a 32 S x (k ) + a33 S e (k ) + a34 u1 (k ) + a35 u 2 (k ) + d 3X ( k )

R4X ( k ) : Si X (k ) est A41 et S x (k ) est A42 et S e (k ) est A43 et u1 (k ) est A44 et u 2 (k ) est A45
X (k ) X (k ) X (k ) X (k ) X (k ) Alors X (k + 1) = a 41 X (k ) + a 42 S x (k ) + a 43 S e (k ) + a 44 u1 (k ) + a 45 u 2 (k ) + d 4X ( k )

Les coefficients respectifs ail du modle de rgression, avec l = {1,2, K ,5} , en utilisant lalgorithme GK sont regroups dans le Tableau 5.5 :
Tableau 5.5. Paramtres des consquents du modle flou TS pour X (k + 1) - algorithme GK

rgle
R1X ( k ) R2X ( k ) R3X ( k ) R4X ( k )

X (k ) 1,06100 9,5810-1 9,7010-1 9,8210-1

S x (k ) 5,2210-3 2,5310-2 3,8410-2 7,6910-2

S e (k ) -2,6310-3 -1,5810-2 -7,3910-2 3,1110-1

u1 (k )

u 2 (k )

biais 3,5010-3 -1,5810-3 1,8910-2 1,1110-2

-1,6110-1 -5,3310-1 -9,5410-1 -1,70100

-2,7810-1 2,10100 9,9610-1 -3,59100

Les centres des clusters dans lespace des rgresseurs en utilisant lalgorithme GK sont indiqus dans le Tableau 5.6 :
Tableau 5.6. Centres des clusters du modle flou TS pour X (k + 1) - algorithme GK

rgle
R1X ( k ) R2X ( k ) R3X ( k ) R4X ( k )

X (k ) 1,3110-1 3,4410-1 4,2810-1 7,2910-1

S x (k ) 6,8610-1 5,8110-1 5,4110-1 2,9410-1

S e (k ) 3,5010-1 1,1610-1 7,1610-2 1,5810-2

u1 (k )

u 2 (k )

1,9010-2 1,8810-2 1,9110-2 1,6510-2

4,7210-3 4,7710-3 3,7410-3 1,6210-3

Identification et Commande floues TS du bioracteur

185

Les coefficients respectifs ail du modle de rgression, avec l = {1,2, K ,5} , en utilisant lalgorithme RoFER sont regroups dans le Tableau 5.7 :
Tableau 5.7. Paramtres des consquents du modle flou TS pour X (k + 1) - algorithme RoFER

rgle
R R R
X (k ) 1 X (k ) 2 X (k ) 3

X (k )
9,6110
-1

S x (k ) 2,5110
-2

S e (k ) -2,4410
-2

u1 (k )

u 2 (k )
-1

biais
-1

-1,7110

2,7810

2,9810-3 1,5610-2 1,0210-2 1,2610-2

9,7210-1 9,6810-1 9,7810-1

2,5210-2 3,4310-2 5,2010-2

-4,8410-2 -3,0510-2 -6,2310-2

-8,8810-1 -7,8410-1 -1,15100

1,15100 1,18100 5,8010-1

R4X ( k )

Les centres des clusters dans lespace des rgresseurs en utilisant lalgorithme RoFER sont indiqus dans le Tableau 5.8 :
Tableau 5.8. Centres des clusters du modle flou TS pour X (k + 1) - algorithme RoFER

tel-00136382, version 1 - 13 Mar 2007

rgle
R1X ( k ) R2X ( k ) R3X ( k ) R4X ( k )

X (k )
1,4410-1 3,9210-1 3,9810-1 4,7610-1

S x (k ) 5,4910-1 7,0010-1 4,6910-1 2,6410-1

S e (k ) 2,7110-1 1,2910-1 5,9710-2 9,7410-3

u1 (k )

u 2 (k )

2,2210-2 1,8510-2 2,0210-2 1,9810-2

4,6810-3 5,8110-3 3,1010-3 6,0310-4

La forme des rgles pour la sortie concentration de substrat xnobiotique S x (k ) tant en utilisant lalgorithme GK quen utilisant lalgorithme RoFER, est donne par les expressions suivantes : R1S x ( k ) : Si X (k ) est A11 et S x (k ) est A12 et S e (k ) est A13 et u1 (k ) est A14 et u 2 (k ) est A15
Sx (k ) Sx (k ) Sx (k ) Sx (k ) Sx (k ) Alors X (k + 1) = a11 X (k ) + a12 S x (k ) + a13 S e (k ) + a14 u1 (k ) + a15 u 2 (k ) + d1S x ( k )

R2S x ( k ) : Si X (k ) est A21 et S x (k ) est A22 et S e (k ) est A23 et u1 (k ) est A24 et u 2 (k ) est A25
Sx (k ) Sx (k ) Sx (k ) Sx (k ) Sx (k ) Alors X (k + 1) = a 21 X (k ) + a 22 S x (k ) + a 23 S e (k ) + a 24 u1 (k ) + a 25 u 2 (k ) + d 2S x ( k )

R3S x ( k ) : Si X (k ) est A31 et S x (k ) est A32 et S e (k ) est A33 et u1 (k ) est A34 et u 2 (k ) est A35
Sx (k ) Sx (k ) Sx (k ) Sx (k ) Sx (k ) Alors X (k + 1) = a31 X (k ) + a32 S x (k ) + a33 S e (k ) + a34 u1 (k ) + a35 u 2 (k ) + d 3S x ( k )

R4S x ( k ) : Si X (k ) est A41 et S x (k ) est A42 et S e (k ) est A43 et u1 (k ) est A44 et u 2 (k ) est A45
Sx (k ) Sx (k ) Sx (k ) Sx (k ) Sx (k ) Alors X (k + 1) = a 41 X (k ) + a 42 S x (k ) + a 43 S e (k ) + a 44 u1 (k ) + a 45 u 2 (k ) + d 4S x ( k )

186

Identification et Commande floues TS du bioracteur

Les coefficients respectifs ail du modle de rgression, avec l = {1,2, K ,5} , en utilisant lalgorithme GK sont regroups dans le Tableau 5.9 :
Tableau 5.9. Paramtres des consquents du modle flou TS pour S x (k + 1) - algorithme GK

rgle
R1S x ( k ) R2S x ( k ) R3S x ( k ) R4S x ( k )

X (k ) 1,25100 2,2910-2 -5,8710-2 -2,7210-2

S x (k ) 6,4510-1 9,1810-1 8,9510-1 8,8210-1

S e (k ) 3,9210-1 5,4410-2 7,1010-2 -5,7210-1

u1 (k )

u 2 (k )

biais 2,0010-2 3,2310-2 4,9910-2 2,0010-2

-1,59100 -2,05100 -8,2010-1 -2,1510-1

4,61100 1,04101 1,08101 1,47101

Les centres des clusters dans lespace des rgresseurs en utilisant lalgorithme GK sont indiqus dans le Tableau 5.10 :
Tableau 5.10. Centres des clusters du modle flou TS pour S x (k + 1) - algorithme GK

tel-00136382, version 1 - 13 Mar 2007

rgle
R1S x ( k ) R2S x ( k ) R3S x ( k ) R4S x ( k )

X (k ) 1,2010-1 3,3510-1 4,2510-1 6,6210-1

S x (k ) 7,1510-1 6,0910-1 5,6910-1 2,7910-1

S e (k ) 3,8410-1 1,2610-1 8,1010-2 1,6710-2

u1 (k )

u 2 (k )

1,7910-2 1,8510-2 1,9210-2 1,7810-2

4,7710-3 4,8410-3 4,1010-3 1,5910-3

Les coefficients respectifs ail du modle de rgression, avec l = {1,2, K ,5} , en utilisant lalgorithme RoFER sont regroups dans le Tableau 5.13 :
Tableau 5.11. Paramtres des consquents du modle flou TS pour S x (k + 1) - algorithme RoFER

rgle
R1S x ( k ) R2S x ( k ) R3S x ( k ) R4S x ( k )

X (k )
-4,05100 -4,3810-2 -7,0610-2 -3,0410-2

S x (k ) 9,1510-1 9,0110-1 9,1010-1 8,9210-1

S e (k ) 1,2810-2 -8,1310-2 2,5610-2 8,8810-2

u1 (k )

u 2 (k )

biais 4,5410-2 3,3110-2 6,1410-2 2,1810-2

-1,29100 -5,7910-1 -1,55100 -3,5610-1

1,13101 1,24101 1,16101 1,17101

Les centres des clusters dans lespace des rgresseurs en utilisant lalgorithme RoFER sont indiqus dans le Tableau 5.12 :
Tableau 5.12. Centres des clusters du modle flou TS pour S x (k + 1) - algorithme RoFER

rgle
R R R
Sx (k ) 1 Sx (k ) 2 Sx (k ) 3

X (k ) 3,1110
-1

S x (k ) 6,2010
-1

S e (k ) 1,5410
-1

u1 (k )

u 2 (k )
-2

1,9710

5,7610-3 2,7010-3 4,8810-3 4,9010-4

4,1210-1 4,3310-1 4,9310-1

3,2310-1 6,7810-1 2,4710-1

4,5010-2 9,9710-2 8,0110-3

2,2310-2 1,7810-2 1,9410-2

R4S x ( k )

Identification et Commande floues TS du bioracteur

187

La forme des rgles pour la sortie concentration de substrat nergtique S e (k ) tant en utilisant lalgorithme GK quen utilisant lalgorithme RoFER, est donne par les expressions suivantes : R1Se ( k ) : Si X (k ) est A11 et S x (k ) est A12 et S e (k ) est A13 et u1 (k ) est A14 et u 2 (k ) est A15
Se ( k ) Se ( k ) Se ( k ) Se ( k ) Se ( k ) Alors X (k + 1) = a11 X (k ) + a12 S x (k ) + a13 S e (k ) + a14 u1 (k ) + a15 u 2 (k ) + d1Se ( k )
Se ( k ) R2 : Si X (k ) est A21 et S x (k ) est A22 et S e (k ) est A23 et u1 (k ) est A24 et u 2 (k ) est A25 Se ( k ) Se ( k ) Se ( k ) Se ( k ) Se ( k ) Alors X (k + 1) = a 21 X (k ) + a 22 S x (k ) + a 23 S e (k ) + a 24 u1 (k ) + a 25 u 2 (k ) + d 2Se ( k )

R3Se ( k ) : Si X (k ) est A31 et S x (k ) est A32 et S e (k ) est A33 et u1 (k ) est A34 et u 2 (k ) est A35
tel-00136382, version 1 - 13 Mar 2007
Se ( k ) Se ( k ) Se ( k ) Se ( k ) Se ( k ) Alors X (k + 1) = a31 X (k ) + a32 S x (k ) + a33 S e (k ) + a34 u1 (k ) + a35 u 2 (k ) + d 3Se ( k )
Se ( k ) R4 : Si X (k ) est A41 et S x (k ) est A42 et S e (k ) est A43 et u1 (k ) est A44 et u 2 (k ) est A45 Se ( k ) Se ( k ) Se ( k ) Se ( k ) Se ( k ) Alors X (k + 1) = a 41 X (k ) + a 42 S x (k ) + a 43 S e (k ) + a 44 u1 (k ) + a 45 u 2 (k ) + d 4Se ( k )

Les coefficients respectifs ail du modle de rgression, avec l = {1,2, K ,5} , en utilisant lalgorithme GK sont regroups dans le Tableau 5.13 :
Tableau 5.13. Paramtres des consquents du modle flou TS pour S e (k + 1) - algorithme GK

rgle
R1Se ( k )
Se ( k ) R2

X (k ) -7,1810-1 -2,1610-1 -9,1110-2 -8,1010-3

S x (k ) 6,7010-2 -4,1910-4 6,3810-3 7,2010-3

S e (k ) 7,6910-1 -8,2710-1 4,4510-1 6,9710-3

u1 (k )

u 2 (k )

biais 7,8110-2 3,7010-2 4,8610-2 5,5410-3

-1,09100 -3,2010-1 -1,3410-1 -1,7710-2

1,10101 1,01101 9,38100 7,83100

R3Se ( k )
Se ( k ) R4

Les centres des clusters dans lespace des rgresseurs en utilisant lalgorithme GK sont indiqus dans le Tableau 5.14 :
Tableau 5.14. Centres des clusters du modle flou TS pour S e (k + 1) - algorithme GK

rgle
R1Se ( k )
Se ( k ) R2

X (k )
1,0110-1 3,1310-1 4,3310-1 6,8010-1

S x (k ) 7,1310-1 5,6910-1 5,85 10-1 3,0510-1

S e (k ) 4,0010-1 1,2310-1 8,1910-2 1,4110-2

u1 (k )

u 2 (k )

1,8910-2 1,8510-2 1,9610-2 1,6910-2

5,0210-3 4,8910-3 4,3310-3 1,3510-3

R3Se ( k )
Se ( k ) R4

188

Identification et Commande floues TS du bioracteur

Les coefficients respectifs ail du modle de rgression, avec l = {1,2, K ,5} , en utilisant lalgorithme RoFER sont regroups dans le Tableau 5.15 :
Tableau 5.15. Paramtres des consquents du modle flou TS pour S e (k + 1) - algorithme RoFER

rgle
R1Se ( k )
Se ( k ) R2

X (k ) -9,7710-2 -1,0910-1 -6,2110-2 -6,3010-3

S x (k ) -5,7210-2 -7,4710-4 -1,3110-3 -1,8810-3

S e (k ) 9,7010-1 6,3510-1 5,2810-1 5,6810-1

u1 (k )

u 2 (k )

biais 3,8710-2 4,2610-2 2,7410-2 4,6010-3

-5,5410-1 -3,1410-1 -1,2210-1 -8,7810-3

6,74100 8,82100 9,13100 5,10100

R3Se ( k )
Se ( k ) R4

Les centres des clusters dans lespace des rgresseurs en utilisant lalgorithme RoFER sont indiqus dans le Tableau 5.16 :
Tableau 5.16. Centres des clusters du modle flou TS pour S e (k + 1) - algorithme RoFER

tel-00136382, version 1 - 13 Mar 2007

rgle
R1Se ( k )
Se ( k ) R2

X (k ) 1,6210-1 3,9710-1 3,9810-1 5,6410-1

S x (k ) 5,3910-1 7,0810-1 4,5510-1 2,7810-1

S e (k ) 2,3710-1 1,2710-1 5,6310-2 8,2010-3

u1 (k )

u 2 (k )

2,2610-2 1,8310-2 2,0610-2 1,7910-2

4,9010-3 5,8410-3 3,0310-3 5,6410-4

R3Se ( k )
Se ( k ) R4

Remarque
R 5.4

Bien que les rsultats obtenus lors de la modlisation floue du bioprocd sont encourageants, il faut dire que la gnration des donnes didentification non linaire en parcourant toute la gamme des variables dentre reste une contrainte pour lapplicabilit de la technique sur des procds biologiques industriels. En pratique on doit se contenter dutiliser les donnes disponibles. Si elles ont t obtenues correctement, on trouvera un modle plus performante.

5.3. Commande floue de type TS du bioprocd base sur le modle flou


Dans le cas de notre bioracteur pour le traitement des eaux rsiduaires, lorsque l'objectif fix est uniquement la rgulation des variables de sortie, la synthse d'un rgulateur de type "boite noire" utilisant une caractrisation du comportement entre/sortie du systme suffit. La complexit des dynamiques internes de ce type de procd ne permettent pas en gnral d'atteindre des objectifs de commande satisfaisants en considrant une relation linaire entre/sortie. L'exprience a montr que l'application de rgulateurs classiques linaires de type PID ces systmes complexes est limite [DAH92a] [DAH92b]. Il est par consquent ncessaire de s'intresser des techniques de commande plus sophistiques tenant compte par exemple des caractristiques non-linaires et non-stationnaires de systmes.

Identification et Commande floues TS du bioracteur

189

Dans le cadre de notre tude nous nous sommes intresss la modlisation floue TS du comportement non linaire du bioprocd. Ce type dapproche "bote grise" permet la reprsentation du systme dynamique comme un modle base de rgles qui approxime la dynamique non linaire comme une concatnation des sous modles localement linaires sous la forme dauto-rgression non-linaire (NARX). Afin de tester la validit de la loi de commande, nous considrons dans notre tude en simulation que toutes les variables de sortie sont mesurables. A partir du modle flou obtenu dans la section prcdente, nous allons raliser la synthse dun contrleur flou MIMO dans lespace dtat du procd, en utilisant la philosophie de commande du type compensation parallle distribue (PDC). Nous nous sommes intresss en particulier, la commande sous-optimale linaire quadratique par retour dtat avec annulation des erreurs stationnaires (en utilisant des intgrateurs numriques), base sur des modles TS affines en temps discret (cf. section 4.2.1). Pour cela, nous ajoutons le mme nombre dintgrateurs numriques dans la boucle de commande que de variables de sortie commander (dans notre cas 2). Nous sommes intresss par la rgulation des concentrations du substrat xnobiotique, S x (k ) , et de la biomasse, X (k ) , par rapport des consignes prspcifies donnes respectivement par les expressions (5.4) et (5.5). Le nombre de clusters issus de la procdure de modlisation (dans ce cas c = 4 ) correspond au nombre de rgles de la loi de commande. Comme on la indiqu prcdemment, au niveau de la modlisation on a dcompos le systme MIMO en trois sous systmes MISO, chacun correspondant la modlisation dynamique pour chacune des sorties du bioprocd. Cependant, pour raliser la synthse de la loi de commande, il est ncessaire davoir une base de rgles "commune" entre les trois partitions obtenues dans lespace des rgresseurs. Dans un but de commande et en sachant que le contrleur fonctionnera en boucle ferme, on peut faire une approximation en considrant que les clusters obtenus pour chaque sortie dans lespace des rgresseurs peuvent tre fusionns en quatre clusters. En effet, les projections sur les axes des variables de la partie antcdent (rgresseurs) de ces diffrents clusters sont assez proches (voir par exemple les Figures 5.9, 5.10 et 5.11 ou bien les Figures 5.12, 5.13 et 5.14). La fusion des clusters est assez simple, dans la mesure o les fonctions dappartenance (exponentielles par morceaux) correspondantes sont des fonctions paramtres (cf. expression (3.4)). Le critre que nous avons utilis pour faire la fusion des clusters consiste calculer la moyenne pondre pour chacun des quatre paramtres { wl , wr , cl et c r } qui dfinissent chacune des fonctions dappartenance, en utilisant comme facteurs de poids les critres VAF obtenus respectivement pour les partitions des variables X (k ) et S x (k ) 97 (cf. Tableau 5.4). Afin de simplifier la notation, nous noterons ici dune faon gnrale ces paramtres comme 'par'. On obtient alors lexpression suivante qui dfinit les paramtres des fonctions dappartenance dans la base de rgles commune98 (nots ' parcom ') des propos de la commande :
parcom = VAFX ( k ) parX ( k ) + VAFS x ( k ) parS x ( k ) VAFX ( k ) + VAFS x ( k )

tel-00136382, version 1 - 13 Mar 2007

(5.8)

97 98

Puisque ce sont les variables dintrt au niveau de la rgulation du bioprocd. Partition "commune" dans lespace des antcdents (rgresseurs) pour les trois sorties du bioprocd.

190

Identification et Commande floues TS du bioracteur

Compte tenu de lunification de la base de rgles, les ensembles flous correspondants au niveau de lcriture des rgles seront nots Ail au lieu de Ail , avec 1 i 4 et 1 l 5 (rappelons que le nombre de clusters est c = 4 et le nombre de rgresseurs est 5 : {X (k ), S x (k ), S e (k ), u1 (k ), u 2 (k )} ). Pour faire la commande du bioprocd, nous avons retenu la base de rgles commune issue des partitions obtenues avec lalgorithme RoFER. La procdure est similaire pour lalgorithme GK. Une fois obtenue cette base de rgles commune au niveau des partitions correspondantes aux trois sorties du bioprocd, il est alors ncessaire de porter les expressions des rgles sous la forme dtat, afin dappliquer les formulations de la commande pour des systmes MIMO dveloppes dans le chapitre 4. Prcdemment, on a vu que pour chaque sortie du systme MISO il y a un ensemble de quatre rgles qui dcrivent leur dynamique associe. A partir de telles rgles, il est simple de montrer quon peut passer la reprsentation dtat dsire en regroupant les rgles de la faon approprie. Il suffit de conformer chaque i-me rgle de la reprsentation dtat partir des i-mes rgles de chacune des sorties. Ainsi par exemple, la premire rgle de la reprsentation dtat MIMO est compos des premires rgles de chacune des sorties du sous systmes MISO, que nous reprenons ici titre de rappel, de la faon suivante : R1X ( k ) : Si X (k ) est A11 et S x (k ) est A12 et S e (k ) est A13 et u1 (k ) est A14 et u 2 (k ) est A15
X (k ) X (k ) X (k ) X (k ) X (k ) Alors X (k + 1) = a11 X (k ) + a12 S x (k ) + a13 S e (k ) + a14 u1 (k ) + a15 u 2 (k ) + d1X ( k )

tel-00136382, version 1 - 13 Mar 2007

R1S x ( k ) : Si X (k ) est A11 et S x (k ) est A12 et S e (k ) est A13 et u1 (k ) est A14 et u 2 (k ) est A15
Sx (k ) Sx (k ) Sx (k ) Sx (k ) Sx (k ) Alors X (k + 1) = a11 X (k ) + a12 S x (k ) + a13 S e (k ) + a14 u1 (k ) + a15 u 2 (k ) + d1S x ( k )

R1Se ( k ) : Si X (k ) est A11 et S x (k ) est A12 et S e (k ) est A13 et u1 (k ) est A14 et u 2 (k ) est A15
Se ( k ) Se ( k ) Se ( k ) Se ( k ) Se ( k ) Alors X (k + 1) = a11 X (k ) + a12 S x (k ) + a13 S e (k ) + a14 u1 (k ) + a15 u 2 (k ) + d1Se ( k )

La premire des quatre rgles de la reprsentation dtat MIMO est alors exprime sous la forme matricielle donne par lexpression suivante : R1
MIMO

:
X (k ) X (k ) a12 Sx (k ) a12 Se ( k ) a12 X (k ) X (k ) X (k ) a14 a13 Sx (k ) Sx (k ) a13 S x (k ) + a14 Se ( k ) Se ( k ) S e (k ) a13 a14 X (k ) d1X ( k ) a15 Sx (k ) S x ( k ) u1 ( k ) a15 u (k ) + d1 Se ( k ) Se ( k ) 2 a15 d1

Si X (k ) est A11 et S x (k ) est A12 et S e (k ) est A13 et u1 (k ) est A14 et u 2 (k ) est A15

X (k + 1) a11 = a S x ( k ) Alors ( 1 ) S k + x 11 Se ( k ) S e (k + 1) a11

De manire similaire, on peut obtenir les trois autres rgles de la reprsentation dtat MIMO. Elles sont donnes par les expressions suivantes :

Identification et Commande floues TS du bioracteur R2


MIMO

191

:
X (k ) X (k ) a 22 Sx (k ) a 22 Se ( k ) a 22 X (k ) X (k ) X (k ) a 24 a 23 Sx (k ) Sx (k ) a 23 S x (k ) + a 24 Se ( k ) Se ( k ) a 23 S e (k ) a 24 X (k ) d 2X ( k ) a 25 Sx (k ) S x ( k ) u1 ( k ) a 25 u (k ) + d 2 d Se ( k ) Se ( k ) 2 a 25 2

Si X (k ) est A21 et S x (k ) est A22 et S e (k ) est A23 et u1 (k ) est A24 et u 2 (k ) est A25

X (k + 1) a 21 = a S x ( k ) Alors ( 1 ) S k + x 21 Se ( k ) S e (k + 1) a 21
R3
MIMO

:
X (k ) X (k ) X (k ) a34 a33 Sx (k ) Sx (k ) a33 S x (k ) + a34 Se ( k ) Se ( k ) a33 S e (k ) a34 X (k ) d 3X ( k ) a35 u k ( ) Sx (k ) 1 Sx (k ) a35 u (k ) + d 3 d Se ( k ) Se ( k ) 2 a35 3

Si X (k ) est A31 et S x (k ) est A32 et S e (k ) est A33 et u1 (k ) est A34 et u 2 (k ) est A35

X (k + 1) a 31 Sx (k ) Alors S x (k + 1) = a31 Se ( k ) S e (k + 1) a31


X (k )

X (k ) a32 Sx (k ) a32 Se ( k ) a32

tel-00136382, version 1 - 13 Mar 2007

R4

MIMO

:
X (k ) X (k ) a 42 Sx (k ) a 42 Se ( k ) a 42 X (k ) X (k ) X (k ) a 44 a 43 Sx (k ) Sx (k ) a 43 S x (k ) + a 44 Se ( k ) Se ( k ) a 43 S e (k ) a 44 X (k ) d 4X ( k ) a 45 u k ( ) Sx (k ) 1 Sx (k ) a 45 u (k ) + d 4 d Se ( k ) Se ( k ) 2 a 45 4 MIMO

Si X (k ) est A41 et S x (k ) est A42 et S e (k ) est A43 et u1 (k ) est A44 et u 2 (k ) est A45

X (k + 1) a 41 Sx (k ) Alors S x (k + 1) = a 41 Se ( k ) S e (k + 1) a 41

, avec A partir du modle flou MIMO dans lespace dtat donn par les rgles Ri 1 i c , et en utilisant la technique de la commande PDC, on obtient donc une structure de commande qui consiste utiliser la mme partie antcdent des rgles que celle du systme flou de type affine TS, et, dans la partie conclusion, des commandes locales prenant la forme donne par lexpression (4.67)99, que nous reprenons par la suite : ) ) ) ) ~ ~ ~ * uk = Ki ~ x k + N i d = Li rk ( K i x k + K v i v k + N i d i ) (5.9)

La loi de commande optimale obtenue pour les sous modles linaires affines [GRI06] ) ) consiste en un retour dtat K i x k , une compensation du terme de biais N i d i , un terme ) ) danticipation li la consigne Li rk et une action intgrale K v i v k agissant sur lerreur entre consignes et mesures. Par analogie avec les rgulateurs classiques comportant une action proportionnelle et une action intgrale , le rsultat obtenu peut tre vue comme une loi globale de commande non linaire multidimensionnelle du type P.I. avec compensation du ~ ~ terme de biais d i . Les matrices K i 2 5 et N i 2 5 ont t dcomposes ) ) ) ) ) ) ) ) ~ ~ en K i = K i K v i o K i 2 3 et K v i 2 2 , et en N i = N i Li o N i 3 2 et Li 2 2 .

Dans ce contexte, chaque sous modle du systme flou de type TS est stabilis localement par une loi linaire. La loi globale de commande est non linaire. La forme de chacune des quatre rgles ( c = 4 ) du systme de commande est donne par lexpression suivante :
99

5 Pour le cas du bioracteur, le vecteur dtat augment, reprsent par ~ x k , est compos par le vecteur
T

dtat des variables de sortie du bioprocd x k = [ X ( k ) S x ( k ) S e ( k )] , et par les sorties des 2 intgrateurs.

192
Ri
commande

Identification et Commande floues TS du bioracteur :

Si X (k ) est Ai1 et S x (k ) est Ai 2 et S e (k ) est Ai 3 et u1 (k ) est Ai 4 et u 2 (k ) est Ai 5 Alors


* u1 (k ) l11 l12 r1 (k ) * = l 22 21 l4 r2 (k ) u 2 (k ) 1 2 4 3 ) Li

X (k ) d i1 k k12 k13 k v 11 k v 12 v1 (k ) n11 n12 n13 11 + d i 2 S x (k ) + k k v 22 n 21 n 22 n 23 v 2 (k ) k 21 k 22 k 23 v 21 2 3 1442 4) 43 4 S e (k ) d i3 142 ) 44 ) 443 144 K N K v i i i

La ralisation du rgulateur flou PDC avec action intgrale pour le bioprocd, consiste ~ ~ dterminer pour les rgles i = 1,K,4 du modle, les gains K i et N i dans les parties conclusions selon lexpression (5.9). La sortie finale du rgulateur flou de type PDC, qui en fait est une loi de commande non linaire, est infre comme suit :
tel-00136382, version 1 - 13 Mar 2007
4 ~ ~ ~ u * (k ) = hi ( z (k )) K i ~ x (k ) + N i d i , avec hi ( z (k )) = i =1

wi ( z (k ))

i =1 wi ( z (k ))
4

(5.10)

avec z (k ) = [ X (k ), S x (k ), S e (k ), u1 (k ), u 2 (k )] , vrifiant pour tout k , les proprits de somme convexe et dactivation des fonctions dappartenance (cf. expression (4.48)). A partir du modle flou MIMO affine Takagi-Sugeno discret obtenu, en choisissant les matrices de pondration Q et R selon les expressions (4.73) et (4.74) et en appliquant la procdure de synthse dcrite dans la section 4.2.3 (expressions (4.68) (4.70)), on obtient ~ ~ alors la solution suivante pour les matrices K i et N i de la loi de commande [GRI06] : Rgle 1 : ~ 0,4414 0,1328 0.1173 0.0120 0.0075 K1 = 0.0464 0.0397 0.0134 0.0010 0.0070 ~ 5,9468 0,3248 0,7883 0,3057 0,0168 N1 = 0,6544 0,0420 0,1050 0,0301 0,0329 Rgle 2 : 0,2319 0,0200 0,0241 0,0120 0,0020 ~ K2 = 0,0114 0,0490 0,0040 0,0003 0,0074 1,1890 0,0533 0,0798 0,1268 0,0077 ~ N2 = 0,0558 0,0861 0,0009 0,0046 0,0295 (5.13) (5.11)

(5.12)

(5.14)

Identification et Commande floues TS du bioracteur Rgle 3 : 0,2358 0,0560 0,0126 0,0114 0,0080 ~ K3 = 0,0320 0,0460 0,0033 0,0011 0,0069 1,4694 0,0918 0,0733 0,1361 0,0014 ~ N3 = 0,1949 0,0976 0,0109 0,0154 0,0307 Rgle 4 : 0,1979 0,0188 0,0210 0,0119 0,0004 ~ K4 = 0,0056 0,0484 0,0059 0,0001 0,0073 0,8747 0,0089 0,0791 0,1083 0,0139 ~ N4 = 0,0261 0,0838 0,0072 0,0018 0,0294
tel-00136382, version 1 - 13 Mar 2007

193

(5.15)

(5.16)

(5.17)

(5.18)

Les rsultats obtenus en appliquant la commande PDC sous-optimale linaire quadratique par retour dtat pour le modle affine MIMO TS en temps discret, afin de rguler les concentrations de biomasse et de substrat xnobiotique du bioprocd en suivant les consignes tablies dans le scnario dfini par les expressions (5.4) et (5.5), sont illustrs sur la Figure 5.15 :
Concentration de biomasse X(k) (g/L) Concentration de substrat xnobiotique Sx(k) (g/L)

temps (h)

Figure 5.15. Evolution des concentrations X(k) et Sx(k) suivant le scnario de contrle dsir.

La Figure 5.16 montre lvolution correspondante aux variables de commande : les taux de dilution u1 (k ) (eau dalimentation) et u 2 (k ) (substrats dalimentation).

194

Identification et Commande floues TS du bioracteur

Taux de dilution u2(k) (h )

-1

Taux de dilution u1(k) (h )

-1

temps (h)

tel-00136382, version 1 - 13 Mar 2007

Figure 5.16. Evolution des variables de commande u1(k) et u2(k) du bioprocd.

Un critre de performance est utilis pour valuer la qualit des performances du systme en boucle ferme. Il correspond lerreur de contrle et la variabilit des entres. Soit les erreurs de contrle relatives pour les concentrations en biomasse et en substrat xnobiotique donns par les expressions :
* S x (k ) S x X (k ) X * (k ) (k ) et ( ) = e X (k ) = e k S * * x ( ) ( ) X k S k x

(5.19)

avec X (k ) et S x (k ) les signaux pris en ligne sans le bruit du aux capteurs. Leur variabilit est dfinie par :
VX = 1 N

e X (k ) 2 , VS x =
k =1

1 N

eS x (k ) 2 , Vu 1 =
k =1

1 N

u1 (k ) 2 , Vu 2 =
k =1

1 N

u 2 (k ) 2
k =1

(5.20)

o N est le nombre de donnes recueillies. Les rsultats de performance obtenus avec le contrleur flou PDC sous optimal pour le bioprocd sont regroups dans le Tableau 5.17 : Paramtre
VX

Description Variabilit de la commande de la concentration de biomasse X (k ) Variabilit de la commande de la concentration du substrat xnobiotique S x (k ) Variabilit du signal de commande u1 (k ) : taux de dilution de leau dalimentation Variabilit du signal de commande u 2 (k ) taux de dilution des substrats dalimentation

Valeur 2,10x10-3 2,04x10-2 1,34x10-4 6,81 x10-6

VS x Vu 1 Vu 2

Tableau 5.17. Critres des performances en boucle ferme du systme de commande flou de type PDC bas sur le modle dynamique flou affine de type Takagi-Sugeno.

Identification et Commande floues TS du bioracteur

195

Le contrleur propos prsente de bons rsultats pour la rgulation autour des consignes imposes. Cependant, un rglage fin des matrices de pondration Q et R du critre quadratique pourrait amliorer les performances. Les rsultats obtenus sont similaires ceux reports dans le cadre du projet europen FAMIMO100 [ROU99] pour dautres techniques de commande bases sur le modle flou de type TS, telles que la commande prdictive ou adaptative. Nous croyons que ces rsultats sont intressants et encourageants pour la suite, compte tenu que pour des rsultats similaires, la synthse propose du contrleur flou bas sur des sous modles linaires affines locaux est mthodique et simple, ainsi que lobtention du modle flou Takagi-Sugeno partir des donns entre-sortie du bioprocd de traitement des eaux uses considr. Comparativement dautres approches de modlisations utilises dans le domaine des bioprocds, comme par exemple celle base sur des bilans de matire, la modlisation floue de type Takagi-Sugeno ne faisant pas intervenir une connaissance pralable des quations de la dynamique du systme (seulement des donnes), peut dans certains cas tre un avantage. Lapproche de modlisation floue de type Takagi-Sugeno, oriente vers la reprsentation du comportement entre-sortie du procd, peut constituer alors une alternative de modlisation performante quand on dispose de telles donnes. Nanmoins, du la forme des rgles du modle flou TS qui dcrivent la dynamique du procd sous la forme de sous modles autorgressifs de type ARX, les paramtres de tels sous modles sont des coefficients qui nont pas la mme signification physique que les paramtres des modles de bilan de matires. Nous considrons que des applications focalises sur le comportement entre-sortie des bioprocds, comme dans le cas de la commande par ordinateur, ne constitue pas un inconvnient. Nous pensons que la dcomposition de la dynamique non linaire du systme par des sous modles linaires locaux peut tre une alternative pour aborder des problmes de modlisation et commande des systmes non linaires da faon relativement simple.

tel-00136382, version 1 - 13 Mar 2007

5.4. Conclusions
Ce chapitre a t consacr lapplication (en simulation) des mthodes didentification et de commande floues de type Takagi-Sugeno sur un bioracteur arobie multivariable en mode continu pour le traitement des eaux uses issues dune industrie papetire. Aprs avoir reprcis le modle obtenu partir des bilans de matire, nous avons dvelopp un modle flou dynamique de type Takagi-Sugeno pour le bioracteur bas sur des donnes exprimentales entre-sortie en appliquant les techniques de clustering flou abordes dans le Chapitre 3. En particulier, nous avons utilis les algorithmes GK et RoFER qui nous on sembl les plus reprsentatives et les mieux adapts pour la tche de modlisation. Nous avons obtenu de bons rsultats avec ces deux algorithmes (cf. Tableaux 5.3 et 5.4), avec une lgre supriorit de performance numrique globale de lapproximation (selon le critre VAF de lordre de 95%) en utilisant lalgorithme RoFER, en prsence dun bruit blanc de faible amplitude ajout aux donnes didentification. Dans le cadre de la modlisation des fin de commande, les principaux avantages de lutilisation de ce dernier algorithme pourraient tre, malgr leffort du calcul associ, la dtermination "automatique" du nombre des clusters (rgions linaires), base sur la dfinition du seuil de cardinalit robuste, ainsi que lobtention des clusters parallles aux axes des rgresseurs (meilleure interpretabilit pour lobtention des rgles du modle flou sous la forme dcompose).
100

Waste-water Benchmark, in Fuzzy Algorithms for the Control of Multiple-Input, Multiple Output Processes (FAMIMO) project, funded by the European Comission (Esprit LTR 21911).

196

Identification et Commande floues TS du bioracteur

Le systme dynamique MIMO avec deux entres (les taux de dilution de leau dalimentation u1 (k ) et des substrats dalimentation u 2 (k ) ) et trois sorties (les concentrations de biomasse X (k ) et des substrats xnobiotique S x (k ) et nergtique S e (k ) ) a t ainsi reprsent comme trois sous systmes de type MISO, reprsents chacun par un modle flou affine TS. Ces modles flous de type TS, pour lesquels le nombre de rgles correspond au nombre de clusters (dans notre cas quatre), approximent la dynamique non linaire comme une concatnation des sous modles localement linaires sous la forme dauto-rgression non linaire (NARX). Nous avons test la validit des modles obtenus dans lespace des donnes de lidentification en obtenant des rsultats remarquables, en particulier pour le mode dopration continu du bioracteur. A titre illustratif, nous avons aussi conduit des expriences de modlisation en incluant des donnes en mode batch, qui ont montr la limitation du modle pour reprsenter ce mode de culture. Cela est du la forme conjonctive des rgles dans lesquelles interviennent comme rgresseurs u1 (k ) et u 2 (k ) , qui suggre lutilisation dun modle spcifique pour chacun des modes dopration, ou bien, lutilisation de plusieurs modles dynamiques (modle hybride) pour des applications en biotechnologie qui demandent lopration du bioprocd en diffrents modes.
tel-00136382, version 1 - 13 Mar 2007

Nous avons galement propos une base de rgles commune (partition commune dans lespace des antcdents (rgresseurs) pour les trois sorties du bioprocd), conduisant un modle MIMO autorgressif dans lespace dtat, afin de pouvoir raliser la synthse de la loi de commande propose dans le Chapitre 4. En sachant que le contrleur fonctionnera en boucle ferme, cette approximation dans un but de commande peut tre valide, comme effectivement nous lavons constat lors de nos expriences de simulation. En appliquant la philosophie de commande de type PDC base sur le modle flou dynamique TS, nous avons fait la synthse de la loi de commande la mieux adapte au modle du bioprocd : une commande sous-optimale linaire quadratique par retour dtat avec annulation des erreurs statiques (en utilisant des intgrateurs numriques), afin de rguler les concentrations de biomasse et de substrat xnobiotique du bioprocd. Le contrleur propos, qui peut tre vu comme une sorte de contrleur de type PI multidimensionnel avec retour dtat, prsente de bons rsultats pour la rgulation autour des consignes imposes (cf. Figure 5.15 et Tableau 5.17). Cependant, un rglage fin des matrices de pondration Q et R du critre quadratique pourrait amliorer les performances. Nous pensons que les rsultats obtenus sont intressants, en effet la synthse propose du contrleur flou bas sur des sous modles linaires affines locaux est mthodique et simple, ainsi que lobtention du modle flou Takagi-Sugeno partir des donns entre-sortie du bioprocd de traitement des eaux uses considr.

Conclusions et Prospectives

197

Conclusions et prospectives

Les travaux prsents dans ce mmoire sarticulent autour des thmes principaux de la modlisation et de la commande floue de type Takagi-Sugeno (TS) pour une application une station dpuration des effluents issus dune industrie papetire. Ces travaux sont diviss en deux parties, une premire concernant le traitement des eaux rsiduaires et la seconde, sur la modlisation floue partir des donnes et la commande floue de type PDC (compensation parallle distribue) avec application au bioprocd de traitement des eaux uses. Dans la premire partie nous montrons dabord comment les procds biologiques sont utiliss pour restaurer la qualit de leau en dgradant les matires organiques. Ce sont des procds complexes, car ils font intervenir des organismes vivants. Du point de vue de lAutomatique, de manire gnrale, ces procds sont caractriss par des systmes multivariables, non linaires et non stationnaires. Nous avons t confronts aux deux premiers aspects pour le cas du procd envisag. Ainsi, dans la premire partie de nos travaux, nous avons dvelopp des aspects lis la modlisation dynamique des bioprocds en nous focalisant sur lapproche des bilans de matire des composants principaux pour caractriser la dynamique de tels procds. Nous avons galement positionn la problmatique gnrale de lAutomatique des bioprocds, en remarquant deux dfis majeurs, qui sont le manque dune instrumentation de mesure en ligne permettant de connatre leur fonctionnement interne et la difficult lie la modlisation de la dynamique (dans une perspective de commande). Le procd considr qui est un bioracteur arobie multivariable en mode continu pour le traitement des eaux uses issues dune industrie papetire a t la base dune premire tude de modlisation en utilisant lapproche de bilans de matires. Ce procd est aliment par un mlange bi-polluant (substrats nergtique et xnobiotique), dans lequel les microorganismes exhibent des interactions telles que la comptition et lactivation/inhibition comptitive. Le modle que nous avons retenu, dvelopp sous Matlab, est une version amliore de celui utilis lors du projet europen FAMIMO, pour lequel nous avons ajout un terme de mortalit endogne bactrienne. Ce modle de connaissance nous a servi de base pour comparer en simulation la performance dun modle flou de type Takagi-Sugeno pour reprsenter le comportement dynamique non-linaire entre-sortie du systme. Dans la deuxime partie, nous avons prsent dabord une approche structurale de la modlisation et de lidentification floues en nous focalisant particulirement sur le modle de type TS partir des donnes entre-sortie. En effet, au cours des dix dernires annes la discipline a volu dune faon graduelle, vers une utilisation pratiquement exclusive des systmes flous dans lesquels le consquent des rgles utilise des variables numriques sous la forme de fonctions (modle de type TS) plutt que des variables linguistiques (modle de type Mamdani). Ces modles conservent les caractristiques de transparence et dinterprtabilit linguistique qui distinguent les modles flous dautres approches similaires de type bote noire. Dans le cas de lidentification floue des systmes, le formalisme Takagi-Sugeno est mieux adapt une dmarche plus systmatique pour la construction de modles non linaires

tel-00136382, version 1 - 13 Mar 2007

198

Conclusions et Prospectives

multivariables, grce leur bonne capacit dinterpolation numrique et d"aprentissage" partir de donnes. En utilisant ce formalisme, nous reprsentons le comportement non linaire dun systme par une composition de rgles du type Si-Alors , concatnant un ensemble de sous-modles localement linaires sous la forme dauto-rgression non-linaire (NARX). Les diffrentes zones dopration sont dfinies par les fonctions dappartenance dans les antcdents et les sous-modles linaires sont associs aux consquents des rgles. Pour la construction de tels modles nous abordons dune part, diffrents algorithmes de clustering tels que les algorithmes FCM (clusters hypersphriques), GK (clusters hyperellipsodaux) et FCRM (clusters hyperplanaires), ainsi que les algorithmes baptiss FER101 et RoFER102, caractriss par des prototypes mixtes. Lalgorithme de rgression floue ellipsodal (FER) combine les mesures de distance des algorithmes GK des axes parallles (GKP) et FCRM. Lalgorithme RoFER correspond sa version robuste en prsence de bruit et de points aberrants. Ce dernier est caractris par lutilisation dune mthode d"agglomration comptitive" qui partir dun nombre surestim de clusters linitialisation et la dfinition dun certain seuil de cardinalit robuste, permet de trouver "automatiquement" un nombre convenable de clusters pour la partition. Lalgorithme fournit aussi simultanment les paramtres des consquents des rgles du modle floue affine TS. Nous avons prsent quelques exemples illustratifs dapplication qui ont montr lapplicabilit des algorithmes de clustering comme GK et RoFER, avec une meilleure qualit de lapproximation locale du systme pour ce dernier en prsence de bruits et de points aberrants, malgr un temps de calcul plus important pour la convergence (de lordre de 15 fois plus lev). De plus, dans le cadre de nos recherches nous avons dvelopp FMIDgraph, une bote outils graphique sous MATLAB pour lidentification floue de type TS des systmes non linaires, qui intgre dans un environnement graphique facile utiliser, plusieurs lments et fonctionnalits (e.g. visualisation 2D et 3D) concernant la mthodologie de modlisation aborde. Comparativement dautres approches de modlisation utilises dans le domaine des bioprocds, la modlisation floue de type Takagi-Sugeno ne fait pas intervenir une connaissance pralable des quations de la dynamique du systme (seulement des donnes). Nous pensons que la dcomposition de la dynamique non linaire du systme par des sous modles localement linaires peut tre une alternative pour aborder des problmes de modlisation et de commande des systmes non linaires da faon relativement simple. Apres la modlisation, nous avons abord la synthse de la commande floue TS base sur un modle, en utilisant la philosophie de commande du type compensation parallle distribue (PDC), sous la forme de LMI et de synthse quadratique. Nous nous sommes intresss, en particulier, la commande sous-optimale linaire quadratique par retour dtat base sur un modle affine TS en temps discret. Pour cela, nous proposons trois lois de commande qui tiennent compte du terme indpendant caractristique du modle affine. Les lois de commande sont de type rgulateur, rgulateur avec compensation de gain statique et rgulateur avec action intgrale, ce qui permet lannulation des erreurs statiques. Enfin, nous avons considr lapplication de ces techniques didentification et de commande floues TS sur le modle du bioracteur, en particulier pour le mode dopration continu. Nous avons prsent la dmarche utilise pour construire le modle du procd et la
101 102

tel-00136382, version 1 - 13 Mar 2007

FER : Fuzzy Ellipsoidal Regression. RoFER : Robust Fuzzy Ellipsoidal Regression.

Conclusions et Prospectives

199

loi de commande la mieux adapte au bioprocd : une commande sous-optimale linaire quadratique par retour dtat avec annulation des erreurs statiques (en utilisant des intgrateurs numriques), afin de rguler les concentrations de biomasse et de substrat xnobiotique du bioprocd. Afin de pouvoir raliser la synthse de la loi de commande dveloppe, nous avons galement propos la conformation dune base de rgles commune (partition commune dans lespace des antcdents (rgresseurs) pour les trois sorties du bioprocd), conduisant un modle MIMO autorgressif dans lespace dtat. Le contrleur propos, qui peut tre vu comme une sorte de contrleur de type PI multidimensionnel avec retour dtat, prsente de bons rsultats pour la rgulation autour des consignes imposes. Un rglage fin des matrices de pondration Q et R du critre quadratique est en gnral ncessaire afin damliorer les performances. Nous croyons que les rsultats obtenus sont intressants, compte tenu du fait que la synthse propose du contrleur flou bas sur des sous modles linaires affines locaux est mthodique et simple. De plus, lobtention du modle flou Takagi-Sugeno se fait partir des seules donnes entre-sortie du bioprocd de traitement des eaux uses considr.
tel-00136382, version 1 - 13 Mar 2007

Nous considrons prsent, par la suite quelques-unes des prospectives qui nous semble les plus intressantes tudier : Lextension de lanalyse de la stabilit pour le systme constitu du modle floucommande floue de type affine Takagi-Sugeno en temps discret. Bien que certains travaux ont t raliss dans cette direction [MAR95] [KIM01] [FEN04], les hypothses ou les dveloppements considrs sont assez restrictives, tant en termes de conservativit de la loi de commande que sur lhypothse de considrer un unique point dquilibre lorigine du systme. Ltude approfondi des quivalences, au niveau du comportement dynamique, entre le modle flou de type Takagi-Sugeno et le systme non linaire approxim. A notre connaissance, trs peu des publications ont t consacres ce sujet [JOH00]. Cette tude savrait intressante afin dtablir des conditions dquivalence qui permettrait dassurer le mme type de comportements dynamiques entre la reprsentation Takagi-Sugeno et le systme. Le dveloppement dun observateur flou bas sur le modle affine Takagi-Sugeno, afin destimer les variables non mesurables du systme, comme cest typiquement le cas dans le domaine des bioprocds. Lintgration dans le processus de clustering, probablement au niveau de la fonction objectif, de lunification de la base de rgles pour obtenir une partition commune dans le cas des systmes MIMO des fins de commande.

tel-00136382, version 1 - 13 Mar 2007

200 Conclusions et Prospectives

Rfrences bibliographiques

201

Rfrences bibliographiques
[ABO03] [AND68] ABONYI, J., Fuzzy Modeling Identification for Control. Birkhuser, Boston, 2003. ANDREWS, J. F., A mathematical model for the continuous culture of microorganisms utilizing inhibitory substrate, Biotechnology and Bioengineering, vol.10, pp.707-723, 1968. ASENJO, J. A., SUN, W. H., SPENCER, J. L., Optimal control of batch processes involving simultaneous enzymatic and microbial reactions, Bioprocess and Biosystems Engineering, vol.14, n6, pp.323-329, 1996. ATINE, J.C., Mthodes dapprentissage flou :application la segmentation dimages biologiques. Thse de Doctorat de lInstitut National des Sciences Appliques, Rapport LAAS No. 05600, Toulouse, France, 2005. BABUKA, R., Fuzzy Modeling and Identification Toolbox. Control Engineering Laboratory, Faculty of Information Technology and Systems, Delft University of Technology, Delft, The Netherlands, version 3.3, ed. 2002. (Available at http://www.dcsc.tudelft.nl/~babuska/). BABUKA, R., VERBRUGGEN, H.B., Identification of composite linear models via fuzzy clustering, Proceedings European Control Conference, Rome, Italy, pp.1207-1212, 1995. BABUKA, R. VAN CAN, H., VERBRUGGEN H., Fuzzy modelling of enzymatic Penicilin-G conversion, In Preprints 13th IFAC World Congress, San Francisco, USA, vol.N, pp.479-484, 1996. BABUKA, R. FANTUZZI, C. KAYMAK, U., VERBRUGGEN H. B., Improved inference for Takagi-Sugeno models, In: Proceedings of the IEEE International Conference on Fuzzy Systems, New Orleans, USA, vol.1, pp.701706, 1996. BABUKA, R., Fuzzy Modeling for Control. Kluwer Academic Publishers, Mass., USA, 1998. BABUKA, R., ROUBOS J. A. VERBRUGGEN, H. B., Identification of MIMO systems by input-output TS models, IEEE International Conference on Fuzzy Systems, Anchorage, USA, vol.1, pp.657-662, 1998. BAILEY, J. E., OLLIS, D. F., Biochemical Engineering Fundamentals. McGraw Hill, New York, 1986. BARATO, S., GONZALEZ, D.M., Diseo de un algoritmo de clustering con fines de modelamiento difuso para sistemas no lineales. Memoria de fin de estudios Ingeniera Electrnica, Laboratorio de Automtica, Microelectrnica e Inteligencia Computacional-LAMIC, Universidad Distrital FJDC, Bogot, Colombia, 2003. BASTIN, G. and DOCHAIN, D., On-line Estimation and Adaptive Control of Bioreactors. Elsevier, Amsterdam, 1990. BASTIN, G., VAN IMPE J. F., Nonlinear and adaptive control in biotechnology : A tutorial, European Journal of Control, vol.1, n1, pp.1-37, 1995.

[ASE96]

[ATI05]
tel-00136382, version 1 - 13 Mar 2007

[BAB02]

[BAB95]

[BAB96a]

[BAB96a]

[BAB98a] [BAB98b]

[BAI86] [BAR03]

[BAS90] [BAS95]

202 [BEL57] [BEL99]

Rfrences bibliographiques BELLMAN, R. E. Dynamic Programming. Princeton University Press, Princeton, NJ, 1957. BELANCHE, L. A., VALDES, J. J., COMAS, J., RODA, I. R., POCH, M., Towards a model of input-ouput behaviour of wastewater treatment plants using soft computing techniques, Environmental Modelling & Software, vol.14, pp.409419, 1999. BEN YOUSSEF, C. Filtrage, Estimation et Commande dun Procd de Traitements des Eaux Uses. Thse de Doctorat de lInstitut National Polytechnique de Toulouse, Rapport LAAS No. 96116, Toulouse, France, 1996. BEN YOUSSEF, C., DAHHOU, B., Multivariable adaptive predictive control of an aerated lagoon for a wastewater treatment, Journal of Process Control, vol.6, n5, pp.265-276, 1996. BEN YOUSSEF, C., Benchmark of a waste water treatment process, Rapport LAAS No. 97458, Toulouse, France, 1997. BENSAID, A.M., HALL, L.O., BEZDEK, J., CLARKE, L.P., SILBIGER, M.L., ARRINGTON, J.A., MURTAGH, R.F., Validity-guided (re)clustering with applications to image segmentation, IEEE Transactions on Fuzzy Systems, vol.4, pp.112-123, 1996. BERNARD, O., QUEINNEC, I., Modles dynamiques de procds biochimiques. Proprits des modles. Dans : DOCHAIN, D., (Ed.), Automatique des bioprocds. Herms Science Publications, Paris, 2001. BEZDEK, J., A convergence theorem for the fuzzy isodata clustering algorithms, IEEE Transactions on Pattern Analysis and Machine IntelligencePAMI, vol.2, n1, pp.1-8, 1980. BEZDEK, J., Pattern Recognition with Fuzzy Objective Function. Plenum Press, New York, 1981. BEZDEK, J., HATHAWAY, R.J., SABIN, M.J., TUCKER, W.T., Convergence theory for fuzzy c-means: counterexamples and repairs, IEEE Transactions on Systems, Man and Cybernetics, vol.17, n5, pp.873-877, 1987. BIELA, P., Classification automatique dobservations multidimensionnelles par rseaux de neurones comptitifs. Thse de Doctorat de lUniversit des Sciences et Technologies de Lille, France, 1999. BLANCO, Y., Stabilisation des modles Takagi-Sugeno et leur usage pour la commande des systmes non linaires, Thse de doctorat, Ecole centrale de Lille, UST Lille 2001. BOMBERGER, J.D., SEBORG, D.E., Determination of model order for NARX models directly from input-output data, Journal of Process Control, vol.8, n5, pp.459-468, 1998. BORTOLET, P., PASSAQUAY, D., BOVERIE, S., TITLI, A., Iterative fuzzy modeling and control of nonlinear system using multidimensional fuzzy sets, Proc. IFAC99 World Congress, 9 p., 1999. BORTOLET, P., TITLI, A., Modlisation floue : approche structurale. Dans : FOULLOY, L., GALICHET, S., TITLI, A., (Dir.), Commande floue 2 de lapproximation lapprentissage. Srie Systmes Automatiss - Trait IC2, Herms Science Publications - Lavoisier, Paris, pp.37-91, 2003.

[BEN96]

[BEN96]

[BEN97] [BENS96]
tel-00136382, version 1 - 13 Mar 2007

[BER01]

[BEZ80]

[BEZ81] [BEZ87]

[BIE99]

[BLA01]

[BOM98]

[BOR99]

[BOR03]

Rfrences bibliographiques [BOU03]

203

[BOU93] [BOU95] [BOY94] [BRY69] [CER03]

[CHA97]
tel-00136382, version 1 - 13 Mar 2007

[CHU01]

[COL00]

[CON59]

[CZO89]

[DAH92a]

[DAH92b]

[DAH96]

[DAH06]

[DAV91] [DAV97]

BOUKEZZOULA, R., GALICHET, S., FOULLOY, L., Linarisation entre-sortie floue. Dans : FOULLOY, L., GALICHET, S., TITLI, A., (Dir.), Commande floue 1 de la stabilisation la supervision. Srie Systmes Automatiss - Trait IC2, Herms Science Publications - Lavoisier, Paris, 2003. BOUCHON-MEUNIER, B., La logique floue, Collection Que sais-je, no 2702, Presses Universitaires de France, 1993. BOUCHON-MEUNIER, B., La logique floue et ses applications, AddisonWesley, Paris, 1995. BOYD, S., GHAOUI, L., FERON, E., Linear Matrix Inequalities in Systems and Control Theory. SIAM, Philadelphia, 1994. BRYSON, A. E. Jr., HO, Y-C. Applied optimal control. Blaisdell, Massachusetts, 1969. CERRADA, M., Sur les modles flous adaptatifs dynamiques. Thse de Doctorat de lInstitut National des Sciences Appliques, Rapport LAAS No. 03499, Toulouse, France, 2003. CHAUME, F., BTEAU, J. F., Model based selection of an appropriate control strategy application to an anaerobic digester, Proc. of the 2nd. MATH-MOD, pp.853-858, Vienne, Autriche, 5-7 fvrier 1997. CHUANG, C.C., SU, S.F., CHEN, S.S., Robust TSK fuzzy modeling for function approximation with outliers, IEEE Transactions on Fuzzy Systems, vol.9, n6, pp.810-821, 2001. COLOMER, J., MELENDEZ, J., AYZA, J., Sistemas de supervisin: introduccin a la monitorizacin y supervisin experta de procesos: mtodos y herramientas. Cetisa Boixerau, Barcelona, 2000. CONTOIS, D. E., Relationship between population density and specific growth rate of continuous culture, Journal de Gnie Microbiologique, vol.21, pp.4050, 1959. CZOGALA, E., RAWLIK, T., Modelling of a fuzzy controller with application to the control of biological processes, Fuzzy Sets and Systems, vol.31, pp.13-22, 1989. DAHHOU, B., ROUX, G., CHAMILOTHORIS, G., Modelling and adaptive predictive control of a continuous fermentation process, Applied Mathematical Modelling, vol.16, pp.545-552, 1992. DAHHOU, B., LAKRORI, M., QUEINNEC, I., FERRET, E., CHRUY, A., Control of a continuous fermentation process, Journal of Process Control, vol.2, n2, pp.103-111, 1992. DAHHOU, B., ROUX, G. and VASILACHE, A. Neural networks for biomass growth rate modelling and model changement detection in a yeast fermentation process, 4th IFAC Conference System Structure and Control, Bucharest, Roumanie, pp. 469-474, 1997. DAHHOU, B., ROUX, G. and NAKKABI, Y. Modelling, software sensors, control and supervision of fermentation process. Rapport LAAS No. 06344, Toulouse, France, 2006. DAV, R.N., Characterization and detection of noise in clustering, Pattern Recognition Letters, Vol.12, n11, pp.657-664, 1991. DAV, R.N., KRISHNAPURAM, R., Robust clustering methods: a unified view, IEEE Transactions on Fuzzy Systems, vol.5, pp.270-293, 1997.

204 [DEM86]

Rfrences bibliographiques DEMAIN, A. L., SOLOMON, N. A., Manual of industrial microbiology and biotechnology, American Society for Microbiology, Washington D.C., USA, 1986. DENAC, M., MIGUEL, A., DUNN, I. J., Modeling dynamic experiments on the anaerobic degradation of molasses wastewater, Biotechnology and Bioengineering, vol.31, pp.1-10, 1988. DOCHAIN, D. Automatique des bioprocds. Herms Science Publications, Paris, 2001. DOCHAIN, D., On-line parameter estimation, adaptive state estimation and control of fermentation processes. Thse de Doctorat, Universit catholique de Louvain, Belgique, 1986 DOCHAIN, D., Design of adaptive controllers for non-linear stirred tank reactors : Extension to the MIMO situation, Journal of Process Control, vol.1, n1, p.41-48, 1991. DOCHAIN, D. Contribution to the Analysis and Control of Distributed Paameter Systems with Application to (Bio)chemical Processes and Robotics. Thse dagrgation de lenseignement suprieur, Universit catholique de Louvain, Belgique, 1994. DOHNAL, M., Fuzzy bioengineering models, Biotechnology and Bioengineering, vol.27, pp.1146-1151, 1985. DONDO, R. G., MARQUES, D., Optimal control of a batch bioreactor: a study on the use of an imperfect model, Process Biochemistry, vol.37, n4, pp.379385, 2001. DRIANKOV, D., HELLENDOORN, H., REINFRANK, M., An Introduction to Fuzzy Control, Springer, Berlin, 1993. DUBOIS, D., PRADE, H., Fuzzy Sets and Systems Theory and Applications. Academic Press, New York, 1980. DUBOIS, D., PRADE, H., Thorie des possibilits, Masson, 2ime dition, 1987. DUNN, J., A fuzzy relative to ISODATA process and its use in detecting compact well separated clusters, Journal of Cybernetics, vol.3, n3, pp.32-57, 1974. DUQUE, M., GAUTHIER, A., VILLA, J.L. and RAKOTO, N., Modeling and Control of a Water Treatment Plant, 9th IEEE International Conference on Systems, Man and Cybernetics, Washington, DC, pp. 171-176, 2003. DUVIVIER, E., Optimisation des procds semi-continus de fermentation par programmation dynamique. Thse de Doctorat de lUniversit Paul Sabatier, Toulouse, France, 1988. EDELINE, F., Lpuration Biologique des Eaux : Thorie & Technologie des Racteurs. 4me dition, Editions Cebedoc, Lige, France, 1997. EL GHAOUI, L., Approche LMI pour la commande: une introduction, Ecole dt dAutomatique de Grenoble, identification et commande robustes : approche LMI, 1997. EMMANOUILIDES, C., PETROU, L., Identification and control of anaerobic digesters using adaptive, on-line trained neural networks, Computers & Chemical Engineering, vol.21, n1, pp.113-143, 1996.

[DEN88]

[DOC01] [DOC86]

[DOC91]

[DOC94]
tel-00136382, version 1 - 13 Mar 2007

[DOH85] [DON01]

[DRI93] [DUB80] [DUB87] [DUN74]

[DUQ03]

[DUV88]

[EDE97] [ELG97]

[EMM96]

Rfrences bibliographiques [EST95]

205

[EST97]

[FAN96]

[FEI04]

[FEN97]

[FEN01]
tel-00136382, version 1 - 13 Mar 2007

[FEN04]

[FIL85]

[FIL96]

[FLA80]

[FOU03a]

[FOU03b]

[FOU79] [FOU95]

[FRI96]

[FRI96a]

ESTABEN, M., POLIT, M., LABAT, P., STEYER, J. P., Modlisation floue dun procd de digestion anarobie, Rcents Progrs en Gnie des Procds, vol.9, pp.137-142, 1995. ESTABEN, M., Analyse et Commande par Logique Floue dun Procd Biologique de Dpollution. Thse de Doctorat de lUniversit de Perpignan, France, 1997. FANTUZZI, C., ROVATTI, R., On the approximation capabilities of the homogeneous Takagi-Sugeno model, in Proc. Fifth IEEE International Conference on Fuzzy Systems, New Orleans, USA, pp.1067-1072. FEIL, B., ABONYI, J., SZEIFERT, F., Model order selection of nonlinear inputoutput models a clustering based approach, Journal of Process Control, vol.14, pp.593-602, 2004. FENG, G., CAO, S.G., REES, N.W., CHAK, C.K., Design of fuzzy control systems with guaranteed stability, Fuzzy Sets and Systems, vol. 2, pp. 1-10, 1997. FENG, G., WANG, L., Controller synthesis of fuzzy dynamic systems based on piecewise Lyapunov functions, Fuzzy IEEE2001, Melbourne, Australie, 2001. FENG, G., Stability analysis of discrete-time fuzzy dynamic systems based on piecewise Lyapunov functions, IEEE Transactions on Fuzzy Systems, vol.12, n1, pp. 22-28, 2004. FILEV, P. D., KISHIMOTO, M., SENGUPTA, S., YOSHIDA, T., TAGUCHI, H., Application of the fuzzy set theory to simulation of batch fermentation, Journal of Fermentation Technology, vol.63, pp.545-553, 1985. FILEV, D., Model based fuzzy control, In: Proc. Fourth European Congress on Intelligent Techniques and Soft Computing EUFIT96, Aachen, Germany, 1996. FLANAGAN, M. J., On the application of approximate reasoning to control of the activated sludge process, In : Joint Automatic Control Conference, San Francisco, USA, 1980. FOULLOY, L., GALICHET, S., TITLI, A., (Dir.), Commande floue 1 de la stabilisation la supervision. Srie Systmes Automatiss - Trait IC2, Herms Science Publications - Lavoisier, Paris, 2003. FOULLOY, L., GALICHET, S., TITLI, A., (Dir.), Commande floue 2 de lapproximation lapprentissage. Srie Systmes Automatiss - Trait IC2, Herms Science Publications - Lavoisier, Paris, 2003. FOULARD, C., GENTIL, S., SANDRAZ, J.P., Commande et rgulation numrique par calculateur. Editions Eyrolles, Deuxime dition, Paris, 1979. FOULLOY, L., GALICHET, S., Typology of fuzzy controllers. In: NGUYEN, H.T, SUGENO, M., TONG, R., YAGER, R., (Eds.), Theoretical aspects of fuzzy control, John Wiley & Sons, pp.65-90, 1995. FRIGUI, H., KRISHNAPURAM, R., A robust clustering algorithm based on competitive agglomeration and soft rejection of outliers, Proc. IEEE Computer Society Conference on Computer Vision and Pattern Recognition-CVPR96, pp.550-555, 1996. FRIGUI, H., KRISHNAPURAM, R., A robust algorithm for automatic extraction of an unknown number of clusters from noisy data, Pattern Recognition Letters, Vol.17, pp.1223-1232, 1996.

206 [FRI96b]

Rfrences bibliographiques FRIGUI, H., KRISHNAPURAM, R., A robust clustering algorithm based on competitive agglomeration and soft rejection of outliers, Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, San Francisco, CA, USA, pp.550-555, 1996. FRIGUI, H., KRISHNAPURAM, R., Clustering by competitive agglomeration, Pattern Recognition, Vol.30, n7, pp.1109-1119, 1997. FRIGUI, H., KRISHNAPURAM, R., A robust competitive clustering algorithm with applications in computer vision, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.21, n5, pp.450-465, 1999. FU C. S., POCH, M., Fuzzy model and decision of COD control for an activated sludge process, Fuzzy Sets and Systems, vol.93, n3, pp.281-292, 1998. GAHINET, P., NEMIROVSKI, A., LAUB, A., CHILALI, M., LMI Control Toolbox, The Math Works Inc ., Natick Massachusetts, 1995. GALICHET, S., Contrle flou : de linterpolation numrique au codage de lexpertise. Habilitation Diriger des Recherches, Laboratoire LAMII, Universit de Savoie, Annecy, France, 2001. GATH, I., GEVA, A., Unsupervised optimal fuzzy clustering, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.7, pp.773-781, 1989. GAUTHIER, A., DUQUE, M. and GIRALDO, E., Multivariable identification and control for a high rate anaerobic reactor, XIII International Congress on CAD/Cam & Robotics, Pereira, Colombia, pp.1-8, 1997. GAWEDA, A.E., Optimal data-driven rule extraction using adaptive fuzzyneural models. Ph.D Thesis, Department of Computer Engineering and Computer Science, University of Louisville, Kentucky, USA, 2002. GEORGIEVA, O., PATARINSKA, T., Modeling and control of batch fermentation processes under conditions of uncertainty, Bioprocess and Biosystems Engineering, vol.14, n6, pp.299-306, 1996. GEORGIEVA, O., WAGENKNECHT, M., HAMPEL, R., Takagi-Sugeno fuzzy model development of batch biotechnological processes, International Journal of Approximate Reasoning, vol.26, n3, pp.233-250, 2001. GRIN, F., Modlisation mathmatique pour la valorisation des dchets organiques solides. Publication technique, Conservatoire National des Arts et Mtiers, Mmoire de fin dtudes Ingnieur, Toulouse, France, 2000. GIRALDO, E., OROZCO, A., Tratamientos anaerobios de las aguas residuales, Tesis Magister Ingeniera Civil, Universidad de los Andes, Colombia, 1986. GIRALDO, E., Reglamento de Agua Potable y Saneamiento Bsico. Bogot, Colombia, 1998. GLORENNEC, P.Y., Apprentissage par renforcement application aux systmes dinfrence floue. Dans : FOULLOY, L., GALICHET, S., TITLI, A., (Dir.), Commande floue 1 de la stabilisation la supervision. Srie Systmes Automatiss - Trait IC2, Herms Science Publications - Lavoisier, Paris, pp.149-190, 2003. GODFREY, K., (Ed.), Perturbation Signals for System Identification, Prentice Hall, New York, 1993.

[FRI97] [FRI99]

[FU98]

[GAH95] [GAL01]
tel-00136382, version 1 - 13 Mar 2007

[GAT89]

[GAU97]

[GAW02]

[GEO96]

[GEO01]

[GER00]

[GIR86] [GIR98] [GLO03]

[GOD93]

Rfrences bibliographiques [GOM02]

207

[GOT82]

[GRI04]

[GRI05]

[GRI06]
tel-00136382, version 1 - 13 Mar 2007

[GRI07]

[GUE99]

[GUE01a] [GUE01b]

[GUE01c] [GUE03]

[GUI01]

[GUIA02] [GUS79]

GOMEZ-QUINTERO, C., Modlisation et estimation robuste pour un procd boues actives en alternance de phases, Thse de Doctorat de lUniversit Paul Sabatier, Toulouse, France, 2002. GOTTSCHAL, J.C., FREDE THINGSTAD, T., Mathematical description of competition between two and three bacterial species under dual substrate limitation in the chemostat; a comparison with experimental data, Biotechnology and Bioengineering, vol.24, pp.1403-1419, 1982. GRISALES, V.H., SORIANO, J.J., BARATO, S., GONZALEZ, D.M., Robust agglomerative clustering algorithm for fuzzy modeling purposes, Proceedings of the American Control Conference-ACC04, Boston, MA, USA, pp.17821787, 2004. GRISALES, V. H., GAUTHIER, A., ROUX, G., Fuzzy model identification of a biological process based on input-output data clustering, Proc. of the 2005 IEEE International Conference on Fuzzy Systems - FuzzIEEE, Reno, USA, pp.927-932, 2005. GRISALES, V.H., GAUTHIER, A., ROUX, G., Fuzzy optimal control design for discrete affine Takagi-Sugeno fuzzy models: application to a biotechnological process, Proceedings of the 2006 IEEE World Congress on Computational Intelligence WCCI06, Vancouver, BC, Canada, July 16-21, 2006, pp. 10830-10837. GRISALES, V.H., OROZCO, P.R., UNRIZA, J.C., FMIDg - Fuzzy modeling and identification graphical toolbox for use with Matlab - Users Manual v1.0, Reporte tcnico, Laboratorio de Automtica, Microelectrnica e Inteligencia Computacional - LAMIC, Universidad Distrital FJDC, Bogot, Colombia, 2007. GUERRA, T.M., VERMEIREN, L., DELMOTTE, F., BORNE, P., Lois de commande pour systmes flous continues, Journal Europen des Systmes Automatiss, vol. 33, n 4, pp. 489-527, 1999. GUERRA, T.M., VERMEIREN, L., Control laws for continuous fuzzy systems, Fuzzy Sets and Systems, vol. 120, p. 95-108, 2001. GUERRA, T.M., VERMEIREN, L., Conditions for non quadratic stabilization of discrete fuzzy models, Advanced Fuzzy /Neural Control, IFAC AFNC01, Valence, Espagne pp. 15-20, 2001. GUERRA, T.M., PERRUQUETTI, W., Non quadratic stabilization of discrete fuzzy models, Fuzzy IEEE2001, Melbourne, Australie, 2001. GUERRA, T.M., VERMEIREN, L., Stabilit et stabilisation partir de modles flous. Dans : FOULLOY, L., GALICHET, S., TITLI, A., (Dir.), Commande floue 1 de la stabilisation la supervision. Srie Systmes Automatiss - Trait IC2, Herms Science Publications - Lavoisier, Paris, 2003. GUILLAUME, S., Designing fuzzy inference systems from data: an interpretability-oriented review, IEEE Transactions on Fuzzy Systems, vol.9, n3, pp.426-443, 2001. Ministerio del Medio Ambiente (MA), Gestin para el manejo, tratamiento y disposicin final de las aguas residuales municipales, Colombia, Gua 2002. GUSTAFSON, D.E., KESSEL, W.C., Fuzzy clustering with a fuzzy covariance matrix, Proceedings of the IEEE CDC, San Diego, CA, USA, pp.761-766, 1979.

208 [HAD02]

Rfrences bibliographiques HADJILI, M.L., WERTZ, V., TakagiSugeno fuzzy modeling incorporating input variables selection, IEEE Transactions on Fuzzy Systems, vol.10, n2, pp.728-742, 2002. HADJ-SADOK, Z., K., Modlisation et estimation dans les bioracteurs ; prise en compte des incertitudes : application au traitement de leau. Thse de Doctorat de lUniversit de Nice Sophia Antipolis, Nice, France, 1999. HATHAWAY, R., BEZDEK, J., Grouped coordinate minimization using Newtons method for inexact minimization in one vector coordinate, Journal of Optimization Theory and Applications, vol.71, n3, pp.503-516, 1991. HATHAWAY, R., BEZDEK, J., HATHAWAY, R., BEZDEK, J., Switching regression models and fuzzy clustering, IEEE Transactions on Fuzzy Systems, vol.1, n3, pp.195-204, 1993. HE, X., ASADA, H., A new method for identifying orders of input-output models for nonlinear dynamic systems, Proc. of the American Control Conference, San Francisco, CA, pp.2520-2523, 1993. HELLENDOORN, H., DRIANKOV, D., Fuzzy model identification selected approaches, Springer-Verlag, Berlin, 1997. HENZE, M., LESLIE GRADY Jr, C.P., GUJER, W., MARAIS, G.v.R., MATSUO, T., The activated sludge model no.1, IAWQ Scientific and Technical Report, Londres, UK, 1987. HENZE, M., GUJER, W., MINO, T., MATSUO, WENTZEL, M. T., MARAIS, G.v.R., The activated sludge model no.2 biological phosphorus removal, IAWQ Scientific and Technical Report, Londres, UK, 1994. HENZE, M., HARREMOS, P., LA COUR JANSEN, J. and ARVIN, E., Wastewater Treatment Biological and Chemical Process, 3rd Edition, Environmental Engineering Series, Springer-Verlag, Berlin, 2002. HERNANDEZ DE LEON, H., Supervision et diagnostic des procds de production deau potable. Thse de Doctorat de lInstitut National des Sciences Appliques, Rapport LAAS No. 06584, Toulouse, France, 2006. HONDA, H., KOBAYASHI, T., Fuzzy control of bioprocess, Journal of Bioscience and Bioengineering, vol.89, n5, pp.401-408, 2000. HORIUCHI, J., KISHIMOTO, M., MOMOSE, H., Hybrid simulation of microbial behavior combining a statistical procedure and fuzzy identification of culture phases, Journal of Fermentation Bioengineering, vol.79, pp.297-299, 1995. HORIUCHI, J. I., Fuzzy modeling and control of biological processes, Journal of Bioscience and Bioengineering, vol.94, n6, pp.574-578, 2002. HUBER, P.J., Robust Statistics, John Wiley & Sons, New York, 1981. ISERMAN, R., Supervision, fault detection and fault diagnosis methods an introduction, Control Engineering Practice, vol.5, n5, pp.639-652, 1997. JAIN, A.K., DUBES, R.C., Algorithms for Clustering Data. Prentice Hall, Englewood Cliffs, NJ, 1988. JANG, J.-S.R. ANFIS: Adaptive-network-based fuzzy inference systems, IEEE Transactions on Systems, Man and Cybernetics, vol.23, n3, pp.665-685, 1993. JIN, Y., Fuzzy modeling of high-dimensional systems: complexity reduction and interpretability improvement, IEEE Transactions on Fuzzy Systems, vol.8, pp.212-222, 2000.

[HAD99]

[HAT91]

[HAT93]

[HE93]

[HEL97]
tel-00136382, version 1 - 13 Mar 2007

[HEN87]

[HEN94]

[HEN02]

[HER06]

[HON00] [HOR95]

[HOR02] [HUB81] [ISE97] [JAI88] [JAN93] [JIN00]

Rfrences bibliographiques [JOH00]

209

[JOH99]

[JUL97]

[KAY95]

[KEM04]

[KHO97]
tel-00136382, version 1 - 13 Mar 2007

[KIE97]

[KIM01]

[KIM95] [KIR98]

[KIS91]

[KIT94] [KLI95] [KON89] [KON92] [KOS91] [KOS94] [KRI93]

JOHANSEN, T. A., SHORTEN, R., MURRAY-SMITH, R., On the interpretation and identification of dynamic Takagi-Sugeno fuzzy models, IEEE Transactions on Fuzzy Systems, vol.8, n3, pp. 297-313, 2000. JOHANSSON, M., RANTZER, A., ARZEN, K., Piecewise quadratic stability of fuzzy systems, IEEE Transactions on Fuzzy Systems, vol. 7, pp. 713-722, 1999. JULIEN, S., Modlisation et estimation pour le contrle dun procd boues actives liminant lazote des eaux rsiduaires urbaines. Thse de Doctorat de lUniversit Paul Sabatier, Toulouse, France, 1997. KAYMAK, U., BABUKA, R., Compatible cluster merging for fuzzy modelling, In: Proceedings of the FUZZ-IEEE/IFES95, Yokohama, Japan, pp.897-904, 1995. KEMPOWSKY, T. Surveillance de procds base de mthodes de classification : conception dun outil daide pour la dtection et le diagnostic de dfaillances. Thse de Doctorat de lInstitut National des Sciences Appliques, Rapport LAAS No. 04748, Toulouse, France, 2004. KHODJA, L., Contribution la classification floue non supervise. Thse de Doctorat de lUniversit de Savoie, France, 1997. KIELY, G., TAYFUR, G., DOLAN, C., TANJI, K. K., Physical and mathematical modeling of anaerobic digestion of organic wastes, Water Research, vol.31, n3, pp.534-540, 1997. KIM, E., KIM, D., Stability analysis and synthesis for an affine fuzzy system via LMI and ILMI : discrete case, IEEE Transactions on Systems, Man and Cybernetics-Part B : Cybernetics, vol.31, n1, pp. 132-140, 2001. KIM, W.C., HAN, S.C., KWON, W.H., Stability analysis and stabilization of fuzzy state space models, Fuzzy Sets and Systems, vol. 71, pp. 131-142, 1995. KIRIAKIDIS, K., GRIVAS, A., TZES, A., Quadratic stability analysis of the Takagi-Sugeno fuzzy model, Fuzzy Sets and Systems, vol. 98, n 1, pp. 1-14, 1998. KISHIMOTO, M., KITTA, Y., TAKEUCHI, S., NAKAJIMA, M., YOSHIDA, T., Computer control of glutamic acid production based on fuzzy clusterization of culture phases, Journal of Fermentation Bioengineering, vol.72, pp.110-114, 1991. KITSUTA, Y., KISHIMOTO, M., Fuzzy supervisory control of glutamic acid production, Biotechnology and Bioengineering, vol.44, pp.87-94, 1994. KLIR, G., YUAN, B., Fuzzy sets and fuzzy logic; theory and applications. Prentice Hall, 1995. KONSTANTINOV, K., YOSHIDA, T., Physiological state control of fermentation processes, Biotechnology and Bioengineering, vol.33, pp.1145-1156, 1989. KONSTANTINOV, K., YOSHIDA, T., Knowledge-based control of fermentation processes, Biotechnology and Bioengineering, vol.39, pp.479-486, 1992. KOSKO, B., Neural Networks and Fuzzy Systems, Prentice Hall, Englewood Cliffs, NJ, 1991. KOSKO, B., Fuzzy systems as universal approximators , IEEE Trans.Computers, vol.43, pp.1329-1333, 1994. KRISHNAPURAM, R., KELLER, J., A possibilistic approach to clustering, IEEE Transactions on Fuzzy Systems, vol.1, n2, pp.98-110, 1993.

210 [LAC03]

Rfrences bibliographiques LACROSE, V., TITLI, A., Contrleurs flous complexit rduite : fusion de variables et structuration de la commande. Dans : FOULLOY, L., GALICHET, S., TITLI, A., (Dir.), Commande floue 1 de la stabilisation la supervision. Srie Systmes Automatiss - Trait IC2, Herms Science Publications Lavoisier, Paris, 2003. LEE, C., Fuzzy logic in control systems: fuzzy logic controller part I, IEEE Trans. on Systems, Man and Cybernetics, vol.20, n2, pp.404-418, 1990. LEE, C., Fuzzy logic in control systems: fuzzy logic controller part Ii, IEEE Trans. on Systems, Man and Cybernetics, vol.20, n2, pp.419-435, 1990. LEONARITIS, I., BILLINGS, S., Input-output parametric models for nonlinear systems, International Journal of Control, vol.41, pp.303-344, 1985. LONARD, D., BEN YOUSSEF, C., DESTRUHAUT, C., LINDLEY, N. D., QUEINNEC, I., Phenol degradation by Ralstonia eutropha : colorimetric determination of 2-hydroximuconate semialdehyde accumulation to control feed strategy in fed-batch fermentations, Biotechnology and Bioengineering, vol.65, n4, pp.407-415, 1999. LINTON, J.D., DROZD, J.W., Microbial interactions and communities in biotechnology, In : Microbial interactions and communities, BULL, A.T., SLATER, J.H., (Eds.), Academic Press, London, 1982, pp.357-406. LIN, C., Neural Fuzzy Control Systems with Structure and Parameter Learning. World Scientific, Singapore, 1994. LJUNG, L., System identification, Theory for the user. Prentice Hall, New Jersey, 1987. MA, X.J., SUN, Z.Q., HE, Y.Y., Analysis and design of fuzzy controller and fuzzy observer, IEEE Transactions on Fuzzy Systems, vol. 6, n 1, pp. 41-50, 1998. MAMDANI, E., Application of fuzzy logic to approximate reasoning using linguistic systems, Fuzzy Sets and Systems, vol.26, pp.1182-1191, 1977. MANESIS, S. A., SAPIDIS, D. J., KING, R. E., Intelligent control of wastewater treatment plants, Artificial Intelligence in Engineering, vol.12, pp.275-281, 1998. MARIN, J.P., Conditions ncessaires et suffisantes de stabilit quadratique dune classe de systmes flous, Rencontres LFA95, pp. 240-247, Paris, novembre, 1995. MEGEE, R.D., DRAKE, J.F., FREDRICKSON, A.G., TSUCHIYA, H.M., Studies in intermicrobial symbiosis, Saccharomyces cerevisae and Lactobacillus cosei, Canadian Journal of Microbiology, vol.18, pp.1733-1742, 1972. METCALF & EDDY Inc, TCHOBANOPOULOS, G., BURTON, F. and STENCEL, H., Wastewater Engineering : Treatment and Reuse, 4th Edition, McGraw-Hill, 2003. MJICA, E., GAUTHIER, A., Desarrollo y simulacin de un modelo para un proceso de cultivo celular en bioreactor, II Congreso Colombiano de Bioingeniera e Ingeniera Biomdica, Bogot, Colombia, pp.1-6, 2005. MOLETTA, R., VERRIER, D., ALBAGNAC, G., Dynamic modelling of anaerobic digestion, Water Research, vol.20, n4, pp.427-434, 1986. MONTAGUE, G., MORRIS, J., Neural network contribution in biotechnology, TIBTECH, vol.12, pp.312-323, 1994.

[LEE90a] [LEE90b] [LEO85] [LEO99]

[LIN82]
tel-00136382, version 1 - 13 Mar 2007

[LIN94] [LJU87] [MA98]

[MAM77] [MAN98]

[MAR95]

[MEG72]

[MET03]

[MOJ05]

[MOL86] [MON94]

Rfrences bibliographiques [MOR92]

211

[MUL97]

[MUR95] [MUR97] [NAI03] [NAK85]

[NAK97a]
tel-00136382, version 1 - 13 Mar 2007

[NAK97b]

[NAR90]

[NGU98] [OBE99]

[OHN76] [ORO03] [ORO07]

[PAI97]

[PAL95] [PAR93]

MORENO, R., DE PRADA, C., LAFUENTE, J. M., POCH, M. MONTAGUE, G., Non-linear predictive control of dissolved oxygen in the activated sludge process. In : Proc. of the ICCAFT 5/IFAC-BIO 2 Conference, Keystone, USA, pp.289-293, 1992. MLLER, A., MARSILI-LIBELI, S., AIVASIDIS, A., LLOYD, T., KRONER, S., WANDREY, C., Fuzzy control of disturbances in a wastewater treatment process, Water Research, vol.31, n12, pp.3157-3167, 1997. MURALIKRISHNAN, G., CHIDAMBARAM, M., Control of bioreactors using a neural network model, Bioprocess Engineering, vol.12, pp.35-39, 1995. MURRAY-SMITH, R., JOHANSEN, T.A., (Eds.), Multiple Model Approaches to Modelling and Control, Taylor & Francis, London, 1997. NAIDU, D. S. Optimal Control Systems. CRC Press, USA, 2003. NAKAMURA, T., KURATANI, T., MORITA, Y., Fuzzy control: application to glutamic acid fermentation, Proc. of IFAC Modeling and Control of Biotechnology Process, pp.211-215, 1985. NAKOULA,Y., Apprentissage des modles linguistiques flous, par jeu de rgles pondres. Thse de Doctorat, Universit de Savoie, France, 1997. NAKOULA,Y., GALICHET, S., FOULLOY, L., Identification of linguistic fuzzy models based on learning, In: HELLENDOORN, H., DRIANKOV, D., (Eds.), Fuzzy model identification selected approaches, Springer-Verlag, Berlin, pp.281-319, 1997. NARENDRA, K. S., PARTHASARATHY, K., Identification and control of dynamical systems using neural networks, IEEE Trans. on Neural Networks, vol.1, n1, pp.4-27, 1990. NGUYEN, H., SUGENO, M., (Dir.), Fuzzy Systems: Modeling and Control, The Handbooks of Fuzzy Sets Series. Kluwer Academic Publishers, 1998. OBENAUS, F., ROSENWINKEL, K. H., ALEX, J., TSCHEPETZKI, R., JUMAR, U., Components of a model-based operation system for wastewater treatment plants, Water Science and Technology, vol.39, n4, pp.103-111, 1999. OHNO, H., NAKANISHI, E., TAKAMATSU, T., Optimal control of a semibatch fermentation, Biotechnology & Bioengineering, vol.18, pp. 847-864, 1976. OROZCO, A., Bioingeniera de Aguas Residuales. Bogot, Colombia, 2003. OROZCO, P.R., UNRIZA, J.C., GRISALES, V.H., FMIDGraph, Herramienta computacional para modelamiento e identificacin difusa de sistemas, sometido al VII Congreso de la Asociacin Colombiana de Automtica-ACA, 6p., Cali, Marzo, 2007. PAILLES, D., Modlisation et commande robuste dun procd de traitement des eaux uses de type biofiltre. Mmoire de fin dtudes Ingnieur, Publication technique, Conservatoire National des Arts et Mtiers, Toulouse, France, 1997. PAL, N., BEZDEK, J., On cluster validity for the fuzzy c-means model, IEEE Transactions on Fuzzy Systems, vol.3, n3, pp.370-379, 1995. PARK, Y. S., SHI, Z. P., SHIBA, S., CAYUELA, C., IIJIMA, S., KOBAYASHI, T., Application of fuzzy reasoning on control of glucose and ethanol concentrations in bakers yeast culture, Applications of Microbiology and Biotechnology, vol.38, pp.649-655, 1993.

212 [PAT97]

Rfrences bibliographiques PATNAIK, P., A recurrent neural network for a fed-batch fermentation with recombinant Escherichia coli subject to inflow disturbances, Process Biochemistry, vol.32, n5, pp.391-400, 1997. PAV, A., Modlisation en biologie et en cologie. Alas, Lyon, 1994. PEDRYCZ, W., An identification algorithm in fuzzy relational systems, Fuzzy Sets and Systems, vol.13, pp.153-167, 1984. PEDRYCZ, W., Fuzzy Sets Engineering. CRC Press, Boca Raton, FL, 1995. PETERSEN, I.R., A procedure for simultaneously stabilizing a collection of single input linear systems using non linear state feedback control, Automatica, vol.23, n1, pp.33-40, 1987. POLIT, M., GENOVESI, A., CLAUDET, B., Fuzzy logic observers for a biological wastewater treatment process, Applied Numerical Mathematics, vol.39, pp.173-180, 2001. POLIT, M., ESTABEN, M., LABAT, M., A fuzzy model for an anaerobic digester, comparison with experimental results, Engineering Applications of Artificial Intelligence, vol.15, pp.385-390, 2002. PONTRYAGIN, L. S., BOLTYANSKII, V. G., GAMKRELIDZE, R. V., MISHCHENKO, E. F., The Mathematical Theory of Optimal Processes. WileyInterscience, New York, NY, 1962. (Traduit du Russe). PROSSER, J. I., Mathematical modeling of nitrification processes, Advances in Microbial Ecology, vol.11, pp.263-304, 1990. PSICHOGIOS, D., UNGAR, L., A hybrid neural-network first principles approach to process modeling, AIChE Journal, vol.38, pp.1499-1511, 1992. QUEINNEC, I. Contribution la Commande de Procds Biotechnologiques : Application au Traitement Biologique de la Pollution. Habilitation Diriger des Recherches, Laboratoire dAnalyse et dArchitecture des Systmes, Rapport LAAS No. 00455, Toulouse, France, 2000. QUEINNEC, I, LONARD, D., DENOU, G., State observation of phenol degradation by Ralstonia eutropha based on dissolved oxygen measurement, Proc. of the IFAC Symposium Adchem, Pise, Italie, 14-16 juin, 2000. QUEINNEC, I, DOCHAIN, D., Modelling and simulation of steady-state secondary settlers in wastewater treatment plants, Proc. of the 5th International Symposium on Systems Analysis and Computing in Water Quality Management (WATERMATEX), Gent, Belgique, 18-20 septembre, 2000. QUEINNEC, I., TROFINO-NETO, A., H attenuation of a bioprocess with parameter uncertainty, In : Proc. of the American Control Conference, Albuquerque, USA, pp. 1066-1067, 1997. QUEINNEC, I., HARMAND, J., STEYER, J. P., BERNET, N., Mathematical analysis of a nitrification process, Recent Research Developments in Fermentation and Bioengineering, vol.1, pp.153-163, 1998. RAGOT, J., GRAPIN, G., CHATELLIER, P., COLIN, F., Modelling of a water treatment plant. A multi-model representation, Environmetrics, vol.12, pp.599611, 2001. RAMASWAMY, S., CUTRIGHT, T. J., QAMMAR, H. K., Control of a continuous bioreactor using model predictive control, Process Biochemistry, vol.40, n8, pp.2763-2770, 2005.

[PAV94] [PED84] [PED95] [PET87]

[POL01]

[POL02]

tel-00136382, version 1 - 13 Mar 2007

[PON62]

[PRO90] [PSI92] [QUE00]

[QUE00a]

[QUE00b]

[QUE97]

[QUE98]

[RAG01]

[RAM05]

Rfrences bibliographiques [RAP02]

213

[REN03]

[RHO98] [ROD02]

[ROD99]

[ROL95]
tel-00136382, version 1 - 13 Mar 2007

[ROU92]

[ROU94]

[ROU99] [ROU01]

[ROV96]

[RUS69] [RYD72]

[SAL05] [SET98]

[SHI94]

RAPAPORT, A., HARMAND, J., Robust regulation of a class of partially observed nonlinear continuous bioreactors, Journal of Process Control, vol.12, n2, pp.291-302, 2002. REN, L., IRWIN, G.W., Robust fuzzy Gustafson-Kessel clustering for nonlinear system identification, International Journal of Systems Science, vol.34, n1415, pp.787-803, 2003. RHODES, C., MORARI, M., Determining the model order for nonlinear input/output systems, AIChE Journal, vol.44, n1, pp.151-163, 1998. RODRIGUEZ, M., PAZ, A., HERNANDEZ, C., BELALCAZAR, L. and GIRALDO, E., Retention of granular sludge at high hydraulic loading rates in an anaerobic membrane bioreactor, Water Science and Technology, vol.45, n.10, pp.169174, 2002. RODRIGO, M. A., SECO, A., FERRER, J., PENYA-ROJA, J. M., VALVERDE, J. L., Nonlinear control of an activated sludge aeration process : use of fuzzy techniques for tuning PID controllers, ISA Transactions, vol.38, n3, pp.231241, 1999. ROLS, J.L., GOMA, G., FONADE, C., Biotechnology and paper industry. Aerated lagoon for wastewater treatment, Dans : Environmental Biotechnology : Principles and Practice, Kluwer Academic Publishers, 1995. ROUX, G. Contribution llaboration dalgorithmes de commande adaptative pour la conduite de procds fermentaires. Thse de Doctorat de lUniversit Paul Sabatier, Rapport LAAS No. 92513, Toulouse, France, 1992. ROUX, G., DAHHOU, B., QUEINNEC, I., Adaptive non-linear control of a continuous stirred tank bioreactor, Journal of Process Control, vol.4, n3, pp.121-126, 1994. ROUX, G., TITLI, A. (Eds.), FAMIMO Waste-water Benchmark, FAMIMO deliverable, Rapport LAAS-CNRS, Fvrier, 1999, 58p. ROUX, G. Contribution lestimation, lobservation et la commande de procds. Habilitation Diriger des Recherches, Laboratoire dAnalyse et dArchitecture des Systmes, Rapport LAAS No. 01650, Toulouse, France, 2001. ROVATTI, R., Takagi-Sugeno models as approximators in Sobolev norms: the SISO case, in Proc. Fifth IEEE International Conference on Fuzzy Systems, New Orleans, USA, pp.1060-1066. RUSPINI, E., A new approach to clustering, Information and Control, vol.15, pp.22-32, 1969. RYDER, D.N., SINCLAIR, C.G., Model for the growth of aerobic microorganisms under oxygen limiting conditions, Biotechnology and Bioengineering, vol.14, pp.787-798, 1972. SALA, A., BABUKA, R., GUERRA, T.M., Perspectives of fuzzy systems and control, Fuzzy Sets and Systems, vol.156, pp.432-444, 2005. SETNES, M., BABUKA, R., VERBRUGGEN, H.B., Rule-based modelling: precision and transparency, IEEE Transactions on Systems, Man and Cybernetics - Part C: Applications and Reviews, vol.28, n1, pp.165-169, 1998. SHIBA, S., NISHIDA, Y., PARK, Y. S., IIJIMA, S., KOBAYASHI, T., Improvement of cloned -amylase gene expression in fed-batch culture of recombinant Saccharomyces cerevisiae by regulating both glucose and ethanol

214

Rfrences bibliographiques concentrations using a fuzzy controller, Biotechnology and Bioengineering, vol.44, pp.1055-1063, 1994. SIIMES, T., LINKO, P., VON NUMERS, C., NAKAJIMA, M., ENDO, I., Real-time fuzzy-knowledge-based control of bakers yeast production, Biotechnology and Bioengineering, vol.45, pp.135-143, 1995. INDEL, R., BABUKA, R., Input selection for nonlinear regression models, IEEE Transactions on Fuzzy Systems, vol.12, n5, pp.688-696, 2004. SPRANDIO, M., Dveloppement dune procdure de compartimentation dune eau rsiduaire urbaine et application la modlisation dynamique de procds boues actives. Thse de Doctorat de lInstitut National des Sciences Appliques, Toulouse, France, 1998. STEYER, J. P., GNOVSI, A., HARMAND, J., Outils daide au diagnostic et dtection de pannes. Dans : DOCHAIN, D., (Ed.), Automatique des bioprocds. Herms Science Publications, Paris, 2001. STEYER, J.P. Modlisation, Commande et Diagnostic des Procds Biologiques de Dpollution. Habilitation Diriger des Recherches, Laboratoire de Biotechnologie INRA, Narbonne, France, 1998. SUGENO, M., KANG, G.T., Structure identification of fuzzy model, Fuzzy Sets and systems, vol.28, pp.15-33, 1988. SYKES, R.M., Identification of the limiting nutrient and specific growth rate, Journal of Water Pollution of Control Federation, vol.45, pp.888-890, 1973. TAKAGI, T., SUGENO, M., Fuzzy identification of systems and its application to modeling and control, IEEE Trans. on Systems, Man and Cybernetics, vol.15, n1, pp.116-132, 1985. TAKAGI, T., SUGENO, M., Fuzzy identification of systems and its application to modeling and control, IEEE Trans. on Systems, Man and Cybernetics, vol.15, n1, pp.116-132, 1985. TANAKA, K., SUGENO, M., Stability analysis and design of fuzzy control systems, Fuzzy Sets and Systems, vol.45, n2, pp.135-156, 1992. TANAKA, K., SANO, M., A., Robust stabilization problem of fuzzy control systems and its application to backing up control of a truck-trailer, IEEE Transactions on Fuzzy Systems, vol. 2, n 2, pp. 119-134, 1994. TANAKA, K., SANO, M., Trajectory stabilization of model car via fuzzy control, Fuzzy Sets and Systems, vol. 70, pp. 155-170, 1995. TANAKA, K., IKEDA, T., WANG, H., Robust stabilization of a class of uncertain nonlinear systems via fuzzy control: Quadratic stability, H control theory and linear matrix inequalities, IEEE Transactions on Fuzzy Systems, vol.4, n1, pp.1-13, 1996. TANAKA, K., IKEDA, T., WANG, H.O., Fuzzy regulators and fuzzy observers: relaxed stability conditions and LMI-based designs, IEEE Transactions on Fuzzy Systems, vol. 6, n 2, pp. 1-16, 1998. TAY, J. H., ZHANG, X. A fast predicting neural fuzzy model for high-rate anaerobic wastewater treatment systems, Water Research, vol.34, n11, pp.2849-2860, 2000. TE BRAAKE, H ., BABUKA, R., VAN CAN, E., HELLINGA, C., Predictive Control in Biotechnology using Fuzzy and Neural models. In: VAN IMPE, J.F.M., VANROLLEGHEM, P.A., ISERENTANT, D.M., (Eds.), Advanced

[SII95]

[SIN04] [SPE98]

[STE01]

[STE98]

tel-00136382, version 1 - 13 Mar 2007

[SUG88] [SYK73] [TAK85]

[TAK85]

[TAN92] [TAN94]

[TAN95] [TAN96]

[TAN98]

[TAY00]

[TEB98]

Rfrences bibliographiques

215

[THA97] [TOM99]

[TON80] [TRA97] [TRA03] [TSA96]

tel-00136382, version 1 - 13 Mar 2007

[TSO95]

[TUC87]

[UNR07]

[VAN98]

[VAN98a]

[VANL02]

[VEN99]

[VON94]

[WAN94]

Instrumentation, Data Interpretation, and Control of Biotechnological Processes. Kluwer Academic Publishers, The Netherlands, 1998. THATHACHAR M.A.L., VISWANATH P.; On the stability of fuzzy systems, IEEE Transactions on Fuzzy Systems, vol. 5, n 1, pp. 145-151, 1997. TOMIDA, S., HANAI, T., UEDA, N., HONDA, H., KOBAYASHI, T., Construction of COD simulation model for activated sludge process by fuzzy neural network, Journal of Bioscience and Bioengineering, vol.88, pp.215-220, 1999. TONG, R. M., BECK, M. B., LATTEN, A., Fuzzy control of the activated sludge wastewater treatment process, Automatica, vol.16, pp.659-701, 1980. TRAV-MASSUYS, L., DAGUE, P., GUERRIN, F., Le raisonnement qualitatif. Herms, France, 1997. TRAORE, A., Logique floue et Contrle Supervis des Procds Biologiques de Dpollution. Thse de Doctorat de lUniversit Montpellier II, France, 2003. TSAI, Y. P., OUYANG, C. F., WU, M. Y., CHIANG, W. L., Effluent suspended solids control of activated sludge process by fuzzy control approach, Water Environment Research, vol.68, n6, pp.1045-1053, 1996. TSONEVA, R. G., PATARINSKA, T. D., Optimal control of continuous fermentation processes, Bioprocess and Biosystems Engineering, vol.13, n4, pp.189-196, 1995. TUCKER, W.T., BEZDECK, J., Counterexamples to the convergence theorem for fuzzy ISODATA clustering algorithms, In the Analysis of Fuzzy Information, CRC Press, Boca Raton, FL, vol.3, ch.7, 1987. UNRIZA, J.C., OROZCO, P.R., GRISALES, V.H., Seleccin del orden de modelos dinmicos no lineales MIMO a partir de datos de entrada-salida, sometido al VII Congreso de la Asociacin Colombiana de Automtica-ACA, 6p., Cali, Marzo, 2007. VAN IMPE, J.F.M., VANROLLEGHEM, P.A., ISERENTANT, D.M., (Eds.), Advanced Instrumentation, Data Interpretation, and Control of Biotechnological Processes. Kluwer Academic Publishers, The Netherlands, 1998. VAN IMPE, J.F.M., BASTIN, G., Optimal Adaptive Control of Fed Batch Fermentation Process. In: VAN IMPE, J.F.M., VANROLLEGHEM, P.A., ISERENTANT, D.M., (Eds.), Advanced Instrumentation, Data Interpretation, and Control of Biotechnological Processes. Kluwer Academic Publishers, The Netherlands, 1998. VAN LITH, P. F., BETLEM, B. H. L., ROFFEL, B., A structured modeling approach for dynamic hybrid fuzzy-first principles models, Journal of Process Control, vol.12, pp. 605-615, 2002. VENKATESWARLU, Ch., NAIDU, K. V. S., Dynamic fuzzy model based predictive controller for a biochemical reactor, Bioprocess Engineering, vol.23, pp.113-120, 2000. VON NUMERS, C., NAKAJIMA, M., ASAMA, H., LINKO, P., ENDO, I., A knowledge based system using fuzzy inference for supervisory control of bioprocesses, Journal of Biotechnology, vol.34, pp.109-118, 1994. WANG, L.X., Adaptive Fuzzy Systems and Control, Design and Stability Analysis. Prentice Hall, New Jersey, 1994.

216 [WAN95]

Rfrences bibliographiques WANG, H. O., TANAKA, K. and GRIFFIN, M., Parallel Distributed Compensation of Nonlinear Systems by Takagi-Sugeno Fuzzy Model, Proc. IEEE International Conference on Fuzzy Systems - FUZZ-IEEE95, Yokohama, Japan, pp.531-538, 1995. WANG, K. W., BALTZIS, B. C., LEWANDOWSKI, G. A., Kinetics of phenol biodegradation in the presence of glucose, Biotechnology and Bioengineering, vol.51, pp.87-94, 1996. WEN, C. H., VASSILIADIS, C. A., Applying hybrid artificial intelligence techniques in wastewater treatment, Engineering Applications of Artificial Intelligence, vol.11, n6, pp.685-705, 1998. YAGER, R.R., FILEV, D.P., Essentials of fuzzy modeling and control, John Wiley & Sons, New York, 1994. YEN, J., WANG, L., Simplifying fuzzy rule-base models using orthogonal transformation methods, IEEE Transactions on Systems, Man and Cybernetics - Part B: Cybernetics, vol.29, n1, pp.13-24, 1999. YI, S., CHUNG, M., Identification of fuzzy relational model and its application to control, Fuzzy Sets and Systems, vol.59, pp.25-33, 1993. YOON, H., KLINZING, G., BLANCH, H.W., Competition for mixed substrates by microbial populations, Biotechnology and Bioengineering, vol.19, pp.11931210, 1977. YU, J., CHENG, Q., HUANG, H., Analysis of the weighting exponent in the FCM, IEEE Transactions on Systems, Man and Cybernetics-Part B: Cybernetics, vol.34, n1, pp.634-639, 2004. YU, R. F., LIAW, S. L., CHANG, C. N., CHENG, W. Y., Applying real-time control to enhance the performance of nitrogen removal in the continuous-flow SBR system, Water Science and Technology, vol.38, n3, pp.271-280, 1998. ZADEH, L., Fuzzy sets, Inf. Control, vol.8, pp.338-353, 1965. ZADEH, L., Outline of a new approach to the analysis of complex systems and decision processes, IEEE Trans. on Systems, Man, and Cybernetics, vol.1, pp.28-44, 1973. ZENG, X., SINGH, M., Approximation theory of fuzzy systems MIMO case, IEEE Trans. on Fuzzy Systems, vol.3, n2, pp.219-235, 1995. ZHAO, J., System modelling, identification and control using fuzzy logic, Thse de doctorat, Universit Catholique de Louvain, Belgique, 1995. ZHAO, J., GOREZ, R., WERTZ, V., Fuzzy controllers with guaranteed robustness and performance, EUFIT96, Aachen, Allemagne, pp. 1886-1890, 1996. ZHAO, J., GOREZ, R., WERTZ, V., Synthesis of Fuzzy Control Systems Based on Linear Takagi-Sugeno Fuzzy Models. In : MURRAY-SMITH, R., JOHANSEN, T.A., (Eds.), Multiple Model Approaches to Modelling and Control, Taylor & Francis, London, pp.307-336, 1997. ZHU, G. Y., ZAMAMIRI, A., HENSON, M. A., HJORTS, M. A., Model predictive control of continuous yeast bioreactors using cell population balance models, Chemical Engineering Science, vol.55, n24, pp.6155-6167, 2000. ZIMMERMANN, H.J., Fuzzy Sets, Decision Making and Expert Systems. Kluwer Academic Publishers, Boston, USA, 1987.

[WAN96]

[WEN98]

[YAG94] [YEN99]

[YI93]
tel-00136382, version 1 - 13 Mar 2007

[YOO77]

[YU04]

[YU98]

[ZAD65] [ZAD73]

[ZEN95] [ZHA95] [ZHA96]

[ZHA97]

[ZHU00]

[ZIM87]

Rsum

217

Thse Universit Paul Sabatier-Toulouse III, France - Universit de los Andes, Colombie cole Doctorale Systmes, Spcialit Systmes Automatiques Monsieur Victor-Hugo GRISALES PALACIO, 22 fvrier 2007 MODLISATION ET COMMANDE FLOUES DE TYPE TAKAGI-SUGENO APPLIQUES UN BIOPROCD DE TRAITEMENT DES EAUX USES
Rsum : Ce travail de thse sinscrit au carrefour de lAutomatique, de lIntelligence Artificielle et des Biotechnologies. Il cherche dvelopper une mthodologie de modlisation et de commande qui repose sur une approche par logique floue. La premire partie du travail prsente une introduction aux principes et techniques mises en uvre dans les stations dpuration actuelles, et met en vidence la difficult de modlisation des diffrents phnomnes mis en jeu. A partir de ce constat, dans une deuxime partie, focalise sur la modlisation et la commande floues, nous dveloppons dabord lidentification de modles flous affines de type Takagi-Sugeno (TS) partir de donnes entressorties. Nous considrons diffrentes mthodes de coalescence floue et une mthode dagglomration comptitive, robuste en prsence de bruit. Ce type dapproche bote grise permet une reprsentation base de rgles qui approxime la dynamique non linaire comme une concatnation de sous-modles localement linaires sous la forme dauto-rgression non-linaire (NARX). De plus, nous avons dvelopp une version graphique de la bote outils pour la modlisation floue des systmes (FMIDg). Ensuite, nous proposons une commande floue TS sous-optimale linaire quadratique adapte la structure du modle flou identifi, en utilisant la philosophie de commande du type compensation parallle distribue (PDC). La mthodologie globale est finalement teste et valide en simulation sur un bioprocd arobie de dpollution des eaux uses. Mots-cls: Modle flou Takagi-Sugeno, identification des systmes, coalescence floue, commande floue, compensation parallle distribue, traitement des eaux uses, procds biologiques.

tel-00136382, version 1 - 13 Mar 2007

TAKAGI-SUGENO FUZZY MODELLING AND CONTROL APPLIED TO A WASTEWATER TREATMENT BIOPROCESS


Abstract: This thesis work is placed at the crossroad of Automatic control, Artificial Intelligence and Biotechnology. It aims at developing a modelling and control methodology based on a fuzzy logic approach. The first part of the work presents an introduction to the principles and techniques used in current wastewater treatment plants. It highlights the difficulty in modelling the multiple phenomena involved. From this fact, in the second part, focused on fuzzy modelling and control, we develop initially the identification of affine fuzzy models of Takagi-Sugeno (TS) type from input-output data. We used several fuzzy clustering methods as well as an agglomerative-competitive method which is robust in presence of noise. This type of "grey box" approach allows a rule-based representation which approximates the nonlinear dynamics as a concatenation of locally linear sub-models in the nonlinear autoregressive form (NARX). Moreover, we have developed a graphical version of the FMID toolbox for the fuzzy modelling of systems. Then, we propose a suboptimal linear-quadratic TS fuzzy control relevant to the structure of the identified fuzzy model, by using the parallel distributed compensation (PDC) technique. Finally, the whole methodology is tested and validated in simulation on an aerobic wastewater treatment bioprocess. Keywords: Takagi-Sugeno fuzzy model, system identification, fuzzy clustering, fuzzy control, parallel distributed compensation, wastewater treatment, biological processes.

218

Rsum

MODELADO Y CONTROL DIFUSOS DE TIPO TAKAGI-SUGENO APLICADOS A UN BIOPROCESO DE TRATAMIENTO DE AGUAS RESIDUALES
Resumen: Este trabajo de tesis se enmarca en un punto de encuentro de la Automtica, la Inteligencia Artificial y la Biotecnologa. El propsito es el desarrollo de una metodologa de modelado y control basados en el enfoque de la lgica difusa. La primera parte del trabajo presenta una introduccin a los principios y tcnicas usados en las plantas actuales de tratamiento de aguas residuales y resalta la dificultad del modelado de los mltiples fenmenos presentes. A partir de este hecho, la segunda parte centrada en el modelado y control difusos, desarrolla inicialmente la identificacin a partir de datos de entrada-salida de modelos difusos afines de tipo Takagi-Sugeno (TS). Se consideran distintos mtodos de agrupamiento difuso (clustering) as como un mtodo de aglomeracin competitiva, robusto en presencia de ruido. Este tipo de enfoque caja gris permite una representacin basada en reglas que aproxima la dinmica no lineal como la concatenacin de submodelos localmente lineales bajo la forma de autoregresin no lineal (NARX). Tambin se ha desarrollado una versin grfica de la caja de herramientas FMID para el modelado difuso de sistemas. As mismo, utilizando la filosofa de control de compensacin paralela distribuida (PDC), se ha propuesto un control difuso subptimo lineal cuadrtico adaptado a la estructura del modelo difuso identificado. Finalmente la metodologa general es probada y validada en simulacin en un bioproceso aerobio de tratamiento de aguas residuales. Palabras clave: Modelo difuso Takagi-Sugeno, identificacin de sistemas, agrupamiento difuso, control difuso, compensacin paralela distribuida, tratamiento de aguas residuales, procesos biolgicos.

tel-00136382, version 1 - 13 Mar 2007