Professional Documents
Culture Documents
Son sistemas de razonamiento basados en modelos de redes y, con base en las leyes de la teora de la probabilidad, se emplean para razonar en situaciones de incertidumbre. La principal ventaja del razonamiento probabilstico en comparacin con el razonamiento lgico es que el agente lgico puede tomar decisiones racionales an si disponer de suficiente informacin para probar que una accin dada funcionar.
Si bien la distribucin de probabilidad conjunta puede dar respuesta a cualquier pregunta relacionada con un dominio determinado, conforme aumenta la cantidad de variables, su magnitud se convierte intratablemente extensa. Adems, no resulta muy natural la especificacin de probabilidades de eventos atmicos y puede volverse bastante complicada, a menos de contar con una gran cantidad de datos que permita recopilar estimaciones estadsticas.
Tambin, las relaciones de independencia condicional que existen entre las variables permiten simplificar el clculo de los resultados de una consulta y reducir tambin la cantidad de probabilidades condicionales que es necesario especificar. Para representar la dependencia que existe entre determinadas variables, se usa una estructura de datos conocida como red bayesiana (red de creencia, red probabilstica, red causa, mapa de conocimiento).
Los nodos de la red estn formados por un conjunto de variables aleatorias. Cada par de nodos se conecta entre s mediante un conjunto de enlaces o flechas. El significado implcito de una flecha que vaya del nodo X al nodo Y es el de que X ejerce una influencia directa sobre Y. Por cada nodo hay una tabla de probabilidad condicional que sirve para cuantificar los efectos de los padres sobre el nodo. Los padres de un nodos son aquellos cuyas flechas apuntan hacia ste. La grfica no tiene ciclos dirigidos (es acclica).
Alarma
Juanllama
Maryllama
P(B) .001
B T T F F
E T F T F
P(E) .002
Terremoto
Alarma
Juanllama
Maryllama
Considerar la red como una representacin de la distribucin de probabilidad conjunta. Esto es til para poder saber cmo construir redes. Considerar la red como la codificacin de un conjunto de aseveraciones de independencia condicional. Esto es til para el diseo de procedimientos de inferencia.
La red bayesiana permite obtener una descripcin completa del dominio. Una entrada genrica en la probabilidad conjunta es la probabilidad de que se de la conjuncin de determinadas asignaciones a cada una de las variables:
P(X1=x1 ... Xn=xn)
Se calcula como:
(1)
P( x1 ,..., xn ) P ( xi | Padres ( X i )
i 1 n
Ejemplo: Se puede calcular la probabilidad del evento de que suene la alarma sin que se hayan producido ni el robo ni el terremoto, habiendo llamado tanto Juan como Mary.
P( J M A R T ) P( J | A) P( M | A) P( A | R T ) P(R) P(T ) (0.9)(0.7)(0.001)(0.999)(0.998) 0.00062
La ecuacin (1) define el significado de una determinada red bayesiana. Sin embargo, no explica cmo construir una red bayesiana de manera que la distribucin conjunta resultante sea una buena representacin de un determinado dominio. La ecuacin (1) implica ciertas relaciones de independencia condicional que pueden servir a un ingeniero de conocimiento como guas para construir la topologa de la red.
Repitiendo este procedimiento, reduciendo cada una de las probabilidades conjuntivas a una probabilidad condicional y a una conjuncin ms pequea, se obtiene al final:
P( x1 ,...,xn ) P( xn | xn 1 ,...,x1 ) P( xn1 | xn 2 ,...,x1 )...P( x2 | x1 ) P( x1 ) P( xi | xi 1 ,...,x1 )
i 1 n
(2)
P( X i | X i 1 ,..., X 1 ) P( X i | Padres ( X i ))
Suponiendo que Padres(Xi){xi-1,...,x1}. Esta ltima condicin se puede satisfacer sin mayor problema identificando los nodos de acuerdo con un orden congruente con el orden parcial implcito en la estructura de la grfica.
La ecuacin anterior significa que la red bayesiana ser la representacin correcta del dominio si cada uno de los nodos tiene independencia condicional respecto de sus predecesores en la secuencia de nodos, tomando como referencia a sus padres. Por lo tanto, si se desea construir una red bayesiana cuya estructura sea la adecuada para el dominio, hay que escoger los padres de cada nodo de manera que se satisfaga la propiedad anterior.
Escoger el conjunto de variables Xi que sirvan para describir el dominio. Definir la manera como se van a ordenar las variables. Siempre que haya variables:
Por cada variable Xi que se escoja, aadir a la red un nodo Asignar Padres(Xi) a un conjunto mnimo de nodos que est presente en la red, para de esta manera satisfacer la propiedad de independencia condicional (2). Elaborar la tabla de probabilidad condicional correspondiente a Xi
Este mtodo evita la construccin de redes con ciclos y con l adems es imposible violar los axiomas de probabilidad.
An en el caso de un dominio de estructuracin local, el construir una red bayesiana no es un problema trivial. Tambin es necesario que la topologa de la red refleje en realidad tales influencias directas a travs del conjunto de padres adecuado. La manera correcta de aadir los nodos consiste en poner primero las causas raz y despus las variables sobre las que tienen influencia y as sucesivamente, hasta llegar a la parte de las hojas, las que no ejercen ninguna ingluencia causal sobre las otras variables.
Red Bayesiana resultado de un orden equivocado al agregar nodos: Maryllama Juanllama Terremoto Robo Alarma
Maryllama Juanllama
Terremoto
Robo
Alarma
Dada la cantidad de posibles casos de condicionamiento, para llenar la tabla se necesita bastante tiempo y mucha experiencia. En realidad esto sucede en el peor de los casos, cuando la relacin que existe entre padres e hijos es totalmente arbitraria. Por lo general, la relacin padre-hijo corresponde a una de varias categoras que tienen distribuciones cannicas, es decir, un patrn estandar. El ejemplo ms sencillo son los nodos deterministas, donde su valor est definido exactamente por los nodos de los padres, sin lugar a incertidumbre.
El nodo norteamericano es una disyuncin de sus padres canadiense, estadounidense y mexicano. Si los nodos padres son precios en distintas tiendas y el hijo es el precio final a pagar, el hijo es el mnimo de los padres.
Dada una red, es posible saber si un conjunto de nodos X es independiente de otro conjunto Y, con base en el conjunto de los nodos de evidencia E? La respuesta es s, y el mtodo se deriva del concepto de separacin dependiente de la direccin o separacin d. Si la ruta no dirigida (independiente de la direccin de las flechas) que va de un nodo que est en X a un nodo que est en Y tiene una separacin dependiente de la direccin (d) por E, entonces tanto X como Y son condicionalmente independientes en funcin de E.
El conjunto de nodos E separa con dependencia de la direccin (d) dos conjuntos de nodos X y Y cuando todas las rutas no dirigidas que van de un nodo que est en X a un nodos que est en Y estn bloqueadas, en funcin de E. Una ruta est bloqueada en funcin de un conjunto de nodos E si en la ruta existe un nodo Z en el cual se cumple una de las tres condiciones siguientes:
Z est en E y una de las flechas entra y la otra sale de Z Z est en E y las dos flechas de la ruta salen de Z Ni Z ni sus descendientes estn en E, y las dos flechas de la ruta entran a Z.
Rutas Bloqueadas
X
1 2 3
Y Y
Ejemplo para demostrar que los nodos con separacin dependiente de la direccin (d) son condicionalmente independientes:
Batera
Radio
Ignicin Arranque
Gas
Movimiento
Ejemplo para demostrar que los nodos con separacin dependiente de la direccin (d) son condicionalmente independientes:
1. El que el carro tenga Gasolina y que se oiga el Radio son independientes si se cuenta con evidencia de que las bujas estn flameadas (la Ignicin no funciona). 2. Gasolina y Radio son independientes cuando se sabe que la Batera funciona. 3. La Gasolina y el Radio son independientes cuando no se cuenta con ninguna evidencia. Sern dependientes cuando hay alguna evidencia acerca del Arranque del auto. Por ejemplo, si el carro no arranca, el que se escuche el radio es evidencia mayor de que nos hemos quedado sin gasolina. La Gasolina y el Radio son dependientes cuando se cuenta con evidencia acerca del Movimiento del auto, puesto que esto se produce con el arranque del carro.
El principal objetivo de un sistema de inferencia probabilista es el clculo de la distribucin de probabilidad posterior de un conjunto de variables de consulta, con base en determinadas variables de evidencia. Es decir, el sistema calcula P(Consulta|Evidencia). En general, el agente asigna valores a las variables de evidencia basndose en sus percepciones (o en otro tipo de razonamientos) y solicita el posible valor de otras variables de manera que le permita decidir qu tipo de accin a emprender.
Las redes bayesianas no se limitan a un razonamiento de diagnstico; de hecho efectan cuatro tipos de inferencia:
Con base en que JuanLlama, calcular P(Robo|JuanLlama) Con base en Robo, calcular P(JuanLlama|Robo) y P(MaryLlama|Robo) Con base en Alarma, calcular P(Robo|Alarma). Al aadir Temblor, calcular la nueva P(Robo|Alarma Temblor) Dados JuanLlama y Temblor, calcular P(Alarma|JuanLlama Temblor) y P(Robo| JuanLlama Temblor)
Tipos de inferencias
Q E Q E E
E diagnstica
Q causal intercausal
E mixta