Professional Documents
Culture Documents
desde cero
Ricardo Mayer B.
18 de marzo de 2002
1.
slidos fundamentos recibidos por la Teora de Probabilidades (ehhh ... Clsica o Bayesiana??? , bueno, de momento no importa) , que a su vez recibe formalizacin matemtica por la va de la Teora de Conjuntos y de la Teora de la Medida, todo lo cual es, Uds. lo saben, muy bien considerado en los das que corren. Estadstica es la nica manera de acercarse a la realidad y menos an que exista una sola manera o un solo nivel de profundidad para usar Estadstica. Emplear herramientas estadsticas -como lo hace siempre la Econometra- es una opcin, con ventajas y desventajas. Si ustedes quisieran agotar un tema de investigacin deberan emplear adems otras formas de aproximacin (como estudios de casos, por ejemplo) y vern que no siempre la estadstica es apropiada para cualquier tema. En lo que sigue de esta seccin veremos algunas consideraciones que vale tener en cuenta antes de entrar en materia con un breve repaso de Probabilidades.
Pero, debo ser muy claro en esto desde el comienzo, no es correcto pensar que la
1.1.
Imagnese por un momento como un feliz y competente econometrista. Posesinese de su papel. Listo? Bien, imagine ahora que Ud. acaba de terminar un estudio economtrico sobre la demanda por agua potable (o, bien podra ser, sobre el efecto del salario mnimo sobre el empleo juvenil).
* Profesor
Imagine que tuvo tanta fortuna que todos los datos que ocup estaban bien recolectados, que su modelo no tena defecto economtrico alguno y que su cochino ayudante de investigacin no se dedicaba a chatear mientras haca su pega y por lo tanto el programa utilizado -sosticado y eciente, todo muy hi-tech - est libre de errores. Mejor imposible, no?. Bueno, si en esa envidiable situacin un amigo le pregunta por los resultados de su investigacin, esto es lo que debera ocurrir: - Oye, Pelao ... y cunto es la elasticidad de la demanda al nal? - La pulenta, compadre? - Si poh, la rme... - Bueno: No s. En realidad, la respuesta bsica es efectivamente "no s". Por denicin, si la respuesta se pudiera en realidad hacemos es esforzarnos por entregar la mejor respuesta posible dada la informacin con que se cuenta. Todo el mrito de un modelo economtrico ,an cuando est libre de errores en los datos o errores de especicacin, es entregar la respuesta ms verosmil dada la informacin y teora utilizada. Punto. Por cierto que eso es ms de lo que se podra conseguir por varios otros medios, pero est lejos de la seguridad con que algunos descubrimientos se proclaman a partir de este tipo de estudios. De este modo, el dilogo debera seguir as. - No sabes? - Claro que no. Si pudiera conocerse con exactitud, no estaramos usando estadstica y si los resultados no dependieran de la teora con la cual se interpreta slo haramos estadstica y no econometra. Pero si me encargas darte alguna respuesta, mi resultado es ,creo, la respuesta ms verosmil dada la informacin disponible y dada mis teoras. No es poco , pero eso es todo lo que podemos hacer.
1.2.
All afuera, en el mundo real . . . hay probabilidades? hay variables aleatorias? hay modelos estadsticos? han visto en la calle algn modelo economtrico? Probablemente todos contestemos que no y creo que estaramos en lo correcto. Pero si reformulamos levemente la pregunta ya no sonara tan ridcula: es estocstico nuestro mundo? o hilando un poco ms no: es estocstico el mundo o slo nuestras
descripciones por incompletas deben ser probabilsticas?. Es slo por falta de informacin que el uso de las probabilidades es necesario? es decir, si conociramos
mejor, si supiramos todo acerca de la estructura sistema estudiado . . . podramos llegar a tener una descripcin determinstica del mundo?. Por cierto que el hecho de que la enorme mayora de las veces solo contamos con una parte de la infor-
macin relevante para nuestro estudio nos obliga a tratar los resultados posibles y an las conexiones entre variables en trminos de meras probabilidades, pero contra la tentacin de armar que si supiramos lo suciente acerca de nuestro sistema y de pasada anulramos el libre albero podramos entonces establecer una descripcin puramente determinista del curso del futuro, yo me atrevera a postular que an sin tener que apelar al tema del conocimiento incompleto (y del libre albedro cuando tratemos con personas) nos veremos
proveer una representacin probabilstica de muchos sistemas dinmicos, puesto que en gran variedad de casos, no importa cuanta informacin poseamos de la estructura del sistema, la descripcin determinstica simplemente no est denida. Al respecto, djenme contarles la siguiente historia :
nos alej an ms. Pero tiempo ms tarde, nuestro otro amigo, Poincar, lleg a la conclusin que ni siquiera el demonio laplaciano podra prever con certeza determinstica el futuro de muchos sistemas dinmicos, porque en muchos casos no existen (no estn denidas
la aparicin de un fenmeno denominado resonancia entre las frecuencias que describen las trayectorias de las partculas, que podramos describir en una separata.
1 por
contar qu pasar con una miserable partcula en ciertas condiciones, independiente de que supiramos con plena exactitud las condiciones iniciales del problema. Poincar, sin quererlo expuls de la Utopa al pobre demonito de LaPlace . . . C est la vie , se le oy decir. Desde ese da la Estadstica y la Probabilidad se col en la fsica y en la ciencias naturales por una razn adicional a la simple ignorancia y poca precisin humana. Pero, en vez de tomarlo como una derrota o un escollo, nuestro tro de amigos : Kolmogorov, Arnold y Moser (conocidos como KAM) sistematizaron el problema dividiendo las trayectorias posibles entre las agradables (determinsticas) y aquellas otras trayectorias aleatorias . Y dieron un reformulacin coherente y probabilstica de los sistemas dinmicos que es el estndar hoy para entender y trabajar en dicho campo. El demonio laplaciano se recuper nalmente de su alcoholismo , se reconcili con su seora y le vendi el guin de PI (la pelcula) a un joven director estadounidense. Con el poco dinero que recibi se compro un chalet en Cartagena y hoy dice que le gusta el pescado frito con pur.
2.
gan la distincin entre la idea intuitiva de probabilidad y el concepto matemtico de probabilidad. Todos tenemos alguna idea de lo probable asociado a los juegos de azar o las incertidumbres cotidianas: a esa idea , a esa intuicin, le hemos llamado
zado como probabilidad. Nuestro amigo Kolmogorov axiomatiz en el siglo XX la teora de probabilidades y el artefacto que all se ocupa tiene en parte la intencin de ser comparable a la intuicin, a la idea informal de probable, para que tenga alguna relacin con fenmenos reales (y pueda existir una aplicacin prctica). Pero no son lo mismo. Nunca , pero nunca, esta dems pensar con detenimiento si podemos hacer uso (y no abuso ) de la palabra probabilidad ligndola a uso comn cuando queremos interpretar cosas de nuestro modelo. En estos apuntes vamos a comenzar el tema de la probabilidad con algunas deniciones muy elementales para poder presentar los Axiomas de Probabilidad de nuestro amigazo Kolmogorov.
2.1.
Componentes bsicos: rase una vez un conjunto bueno al que maltrataban todos los elementos . . .
Los distintos resultados que nuestro experimento, o situacin o proceso o lo que sea, puede exhibir se llaman eventos y pueden constituir de un hecho singular o de la ocurrencia de varios hechos individuales. Por ejemplo, si manejar un auto fuese un experimento aleatorio, de la innidad de cosas que nos podras ocurrir, un evento posible al salir a manejar es que nos choque una micro 227, otro evento sera que atropellemos a Rafael Araneda, pero tambin puede ser descrito como un evento que ambas cosas sucedan: el evento consistente en atropellar al
Rafa Araneda y que adems nos choque una micro 227. De este modo diremos que
sentido muy libre: ser cualquier situacin donde los resultados no se conozcan con certeza de antemano.
los posibles resultados de ocurrir el experimento una sola vez. Pero la cantidad de cosas que comprende un evento simple depende de como sea nuestro experimento: si el experimento consiste en lanzar 3 veces una moneda , los eventos singulares sera del tipo cara, sello, sello, es decir seran tripletas, por al hacer
experimento es denido como lanzar slo una vez la moneda , los eventos singulares sern del estilo cara o sello.
formado por todos los posibles eventos singulares de la situacin que estamos estudiando. Si vemos la vida cotidiana como un experimento aleatorio
gigantesco, son todas las cosas que pueden pasar al salir a manejar, o todas las cosas que pueden ocurrir en una carrera en el Club Hpico si ests apostando, todas los posibles sucesos que ocurren en tu primera cita. En la prctica no siempre es obvio cules fenmenos debemos incluir como resultados posibles de nuestro experimento y cuales podemos ignorar (o que podremos calicar como imposibles) y en mltiples ocasiones la subjetividad del investigador debe intervenir para denir qu entra y que no. Es ms, no siempre es fcil hacer una denicin precisa de nuestro experimento aleatorio. La prctica usual es renunciar a imaginar todos los casos posibles y conformarse con una Denicin o una Regla que nos diga que tipo de eventos pueden entrar en consideracin y cules no (ejemplo: "todo ser humano que mida ms de 1.7 metros de altura y que pase enfrente de mi ventana entre las 12 y las 15 horas"). Existen , para este propsito 3 tipos bsicos de conjuntos: aquellos con un nmero aquellos con un
establecer una relacin uno-a-uno con el conjunto de los nmeros naturales , en cuyo caso se llaman conjuntos innitos numerables o con-
tables
innitos de elementos pero donde la relacin uno-a-uno arriba citada no es posible, en cuyo caso se llaman conjunaquellos con un nmero tos innitos no-numerables (por ejemplo el intervalo (0,1) de nmeros reales). Pregunta: si no podemos contar los elementos de uno de estos conjuntos, cmo podemos decir que uno es ms grande que otro?. Podemos, siempre y cuando seamos capaces de inventar algn criterio de tamao , que llamaremos medida, y que ese criterio se pueda aplicar a esos dos conjuntos. En ese caso podramos
medir
ambos
para ser llamados eventos. Por favor note, que en los nmeros reales, un slo nmero es un punto, no intervalo, los puntos no tienen medida positiva. Es por esa razn que decimos que en una situacin continua, la probabilidad de un solo punto es por lo general igual a 0.
Def 4: Eventos.
eventos singulares o simples de nuestro experimento: "hay estallido social en Argentina el 26 de Diciembre", o alguno ms elaborado, como la unin de dos (o tres) eventos singulares :"hay estallido social en Argentina el 26 de Diciembre o
no ocurrir ninguno de los dos: sale el presidente sin estallido social de por medio postulado por nosotros como otro evento del Espacio Muestral). De la misma manera un evento puede ser la interseccin de dos eventos singulares: estallido social y (a pesar de eso) De La Ra se mantiene en Casa Rosada. Una vez que identique los eventos singulares puede jugar con ellos de distintas manera para construir otros eventos.
Evento que ocurrir con certeza. conjunto formado por todos los subconjuntos del
espacio muestral. La diferencia con el Espacio Muestral es que en el Espacio de Eventos no solo son miembros de este espacio los eventos singulares si no
que al leer operaciones de conjuntos, la unin es un .o"lgico (la o no excluyente) y la interseccin es un 2 "lgico
7
2 recuerde
2.2.
El Seor de los Axiomas: Un campo para gobernarlos a todos. Un campo para encontrarlos, un campo para atraerlos a todos y en las probabilidades atarlos.
comentario preliminar : La teora axiomtica, que explicaremos a continuacin, no no nos dice mucho de cmo asignar probabilidades a cada evento
simple. Si usted es capaz de presentar una funcin que mida conjuntos y que cumpla con los tres axiomas, Kolmogorov los bendecir con el ttulo de Probabilistas. Todo el tema de interpretacin y si tiene alguna relacin con aspectos del mundo real correr por cuenta suya. As es como los probabilistas clsicos tienen su propia forma de asignar las probabilidades , los empiricistas la suya y los bayesianos la suya. La teora axiomtica es lo sucientemente exible para acomodar esas tres tradiciones dentro de su campo. tarse su propia regla para asignar una probabilidades a los eventos y mientras no se salga del marco que damos ms adelante, ser efectivamente una probabilidad en regla y todos los teoremas sobre probabilidades le sern aplicables. Pero nada ms que eso, el resto, repetimos, corre por su cuenta. Llamemos
y como estamos hablando de probabilidad, adoptar el conjunto Universo nombre de Espacio Muestral.
Por el momento slo consideren que la Probabilidad es una funcin que toma como input un conjunto (un evento) y lo asocia con un nmero real. Fcil, verdad? Es decir cualquiera de nosotros agarra un conjunto por ah y le asigna un nmero real. Pero vamos a pedirle tres cosas ms, para que esa funcin puede decirle a sus vecinos soy una medida de Probabilidad, soy una medida de Probabilidad !!. Esas tres condiciones son:
Axioma 1
en el conjunto
P (A) 0
Slo estamos pidiendo de momento que la probabilidad sean nmeros nonegativos.
Axioma 2
en el conjunto
P (C ) = 1
Axioma 3
A1 , A2 . . .
en el conjunto
Ya lo saben: practiquen en la calle tomando conjuntos (aquellos que estn dentro de algn
negativo, asignen siempre un 1 a cuanto Espacio Muestral se denan, pero hagan todo aditivamente contable (i.e como en el Axioma 3) y con eso ya pueden ir disfrazados de Probabilidad a cualquier esta, como su profesor. Por efecto del Axioma 3 , la probabilidad de la unin de sucesos excluyentes es no-decreciente: si A y B son eventos excluyentes, el suceso ocurre A o bien
ocurre B es a lo menos tan probable como el evento solo ocurre A o el evento solo ocurre B. Si este ltimo axioma (Axioma 3) quisiramos repetirlo en un lenguaje
un poco ms sosticado , habramos escrito:
Axioma 3
en donde
Llamemos
{ Ai : i I }
enteros y que puede ser o bien nito o innito pero contable (como por ejemplo los llamados nmeros naturales). Entonces,
P
iA
Ai
=
iA
P (Ai )
La propiedad que nos entrega el Axioma 3 se conoce como Aditividad Contable y quiere decir que la probabilidad que se le debe asignar a una
coleccin de
subconjuntos disjuntos de (subconjunto de que no tienen elementos en comn) es igual a la suma de las probabilidades asignadas a cada uno de esos
subconjuntos en forma individual.
veremos por el momento es tambin un conjunto, uno que consta de 3 elementos o ingredientes: 1 Espacio Muestral (no muy maduro), un Espacio de Eventos (a gusto) generado a partir del anterior y una Funcin de Probabilidad cuyos inputs (su dominio) sea ese Espacio Muestral, mostrar que se puede usar
(podramos
= (, E , P )
No es tan fcil construir algo como un espacio probabilstico al hacer investigacin: debemos denir claramente que experimento estamos estudiando,
delimitar los posibles resultados de (hacer una vez) el experimento, que componen construir
funcin de valor real que va asociar cada suceso con un nmero entre 0 y 1 y que
probabilidades. Finalmente, debe construir alguna regla, alguna cumpla con los Axiomas 1, 2 y 3.
A1 , A2 , A3 . . . B1 , B2 , B3 . . .
Si
(es de-
Teorema 1
y adems
A1 A2
, entonces
Teorema 2 Teorema 3
Ai 0 P (Ai ) 1
P () = 0
Teorema 4 Teorema 5
cluyentes:
Sea
Ac i
el complemento de
Ai ,
entonces
P (Ai ) = 1 P (Ac i)
Si
A = A 1 A2 A3 . . . A n
A1 , A2 , A3 . . . An
A=
, entonces
Teorema 6
Ai
P (A1 A2 A3 ) = P (A1 )+P (A2 )+P (A3 )P (A1 A2 )P (A1 A3 )P (A2 A3 )+P (A1 A2 A3 )
10
donde la suma del nal debe aparecer para evitar sustraer dos veces los elementos de los sucesos cuando tenemos ms de una interseccin operando negativamente. Ms an, vean lo fcil que se entiende ahora este til resultado atribuido a Poincar: Para
n
i = 1, 2 . . . n,
n
tenemos que
n
P (Ai ) =
i
P (Ai )
i<j
P (Ai Aj )+
i<j<k
Teorema 7
P (n i Ai )
P (Ai )
en donde, cuando no son sucesos excluyentes la desigualdad es estricta y cuando todos son mutuamente excluyentes (disjuntos) la igualdad se sostiene.
Teorema 8
P (A) = P (A B ) + P (A B c )
que podra leerse como: la probabilidad total de que ocurra A es igual a la probabilidad de que A ocurra junto con B , ms la probabilidades de que A ocurra junto con cada uno de los otros eventos posibles
Teorema 9
excluyentes
A1 , A2 , A3 . . . An
P (A) = P (A A1 ) + P (A A2 ) + P (A A3 ) . . . + P (A An )
Teorema 10
Desigualdad de Bonferroni, porque es particularmente til al trabajar con test de Hiptesis ms adelante. Para cualquier
Ai
n
(An i=1 )
1
i=1
P (Ai )
A diferencia del teorema de Poincar ms arriba que entrega el valor de la probabilidad, el de Bonferroni entrega una cota superior a la probabilidad. Una aplicacin de esa cota es muy comn en el caso de mltiples test de hiptesis. Por ejemplo, suponga que realiza una secuencia de de signicancia es porque:
1 , 2 , . . . 3
i . Esto
P (Fi ) = 1 P (Fi ) 1 1
en donde, como seguramente recuerdan (je), en el
P (Fi ) =
rechazo
i
es verdadero
= P(
H0 |H0
i-simo
Fi s
11
2.3.
B . As, por ejemplo, para pertenecer a A hay que ser rica y para pertenecer a B hay que ser inteligente y todo suceso que cumpla la condicin es rica e inteligente pertenece a P (A B ). Por supuesto que es generalizable a ms de dos conjuntos: P (A B C D ) es
entran tanto en como en la probabilidad conjunta de sucesos del tipo A,B,C y D. Algo as como el conjunto formado por todos los eventos que cumplan (entre otras propiedades que nos sean excluyentes) con ser rica, inteligente, consecuente y divertida
P (A) > 0
y el evento B. Escribiremos
P (B |A)
rido.
espacio muestral que antes? sigo con el mismo grupo de eventos probables que antes? Obviamente no, pues. Si el evento A ha ocurrido, no sobrevive en nuestro pool de posibilidades ningn evento que se contradiga con A. Por ejemplo si
signica ahora es inteligente , todos los sucesos (simples, compuestos) que
incluyen la caracterstica es tonta quedan automticamente fuera del Universo: quedan fuera de nuestro nuevo Espacio Muestral. Tomen nota de los siguiente: si el suceso A ha ocurrido nos hemos quedado que un nuevo Espacio Muestral, conformado exclusivamente por sucesos que comparten la caracterstica es inteligente . El pool de eventos ya no es el mismo: no es igual de fcil toparse con un evento es rica entre la poblacin total de eventos que encontrarse un evento es rica en un pueblo donde no hay ninguna tonta . Al respecto, cul es su intuicin? Suben o bajan las probabilidades de toparse con un evento rica (al menos rica, es decir rica y nada ms o rica y cualquier otra caracterstica adicional) en el universo formado por tontas e inteligentes (P (B )) o en el nuevo universo formado slo por inteligentes (P (B |A))?
ver la inteligencia con lo otro y ambas probabilidades sean por tanto las mismas. Por ejemplo, si en vez de condicionar en el evento es rica , condicionramos en carnet de identidad terminado en 7 , cree usted que la probabilidad del evento
3 les
4 mis
dije que el conjunto poda ser vaco . . . amigos dicen que s bajan, pero para mi no es tan claro
12
es rica se vera alterado por esta condicin? Yo dira que no. Diramos que es rica y carnet de identidad terminado en 7 seran eventos entre s ...pero ya hablaremos de eso. Lo importante es que si condicionamos en la
independientes
ocurrencia de A, todos los sucesos que ahora tengan probabilidad positiva deben 2 ser necesariamente "suceso X y suceso A ", cosas como "slo suceso X y no A a se sabe que tienen probabilidad 0, pues estamos eligiendo slo aquellos donde A s ocurre. Ahora que el concepto ha sido introducido, veamos la formalidad del asunto:
P (B |A) =
P (A B ) P (A)
P (A B ) = P (A)P (B |A)
Es decir la probabilidad de que A y B ocurran en separable en dos partes: que ocurra A y que dado que A ocurri que entonces ocurra B. Dado que la ocurrencia de A nos modica el Espacio Muestral, bsicamente nos hemos quedado con menos elementos, nuestro TOTAL de eventos es ahora ms pequeo, de modo que un evento del mismo tamao antes poda ser una pequea proporcin del total y ser improbable , pero ahora un evento del mismo tamao absoluto es en trminos relativos ms grandote, porque el Total es ms reducido, ahora sera ms probable. Eso indica que las probabilidades antiguas pueden ser reescaladas para aumentarlas dado este nuevo espacio muestral. Cual es la escala correcta ahora?? Fcil: decir, por denicin
P (A).
los elementos que sobreviven tienen algo en comn: todos cumplen con
A.
Es
P (B |A) = 1,
P (A A)
si hay poquitos A en el universo original (y por lo tanto P(A) ser un nmero chiquito, como 0.05), al retirar todos los eventos que no cumplen con A nos quedaremos muy pero muy pocos elementos del conjunto original y por esa razn un conjunto que antes era minsculo en relacin al total (y tena por lo tanto una probabilidad muy baja) ser ahora un conjunto grandotote en relacin al nuevo total, por lo que su probabilidad debe ser aumentada bastante, que es lo que ocurre al dividirlo por un nmero chiquito como 0.05 . Finalmente, pueden ustedes fcilmente vericar que
P (B |A)
Axiomas y es por lo tanto una probabilidad con todas las de la ley. Y eso qu? Bueno, por esa razn todos los teoremas sobre probabilidades que vimos ms arriba tambin se aplican a las probabilidades condicionales y eso nos hace la vida harto ms fcil.
P (A B ) = P (A)P (B |A)
13
la Probabilidad Conjunta es igual a la Probabilidad Condicional multiplicado por algo ms: ese algo ms es la probabilidad marginal. Si tiene ganas de aprendrselo de memoria, anote: la probabilidad marginal es la probabilidad incondicional de aqul evento que est actuando como condicionador. Veremos ms sobre probabilidad marginal cuando veamos distribuciones de probabilidad.
de pares
de Eventos:
P (A B ) = P (A)P (B )
es decir la probabilidad condicional de B dado A, es la misma probabilidad incondicional que tena B antes de condicionar por A. Como dira mi sabia amiga Susana, aqu se aplica el viejo proverbio japons: "A nikita nipone". Recalquemos que independencia de a pares no es suciente para poder armar que tres o ms eventos son conjuntamente independientes.
conjunta
de Eventos:
Los eventos
A1 , A2 , . . . An son
P (n i=1 Ai ) =
i=1
P (Ai ) Ai
2.4.
Hasta ahora hemos jugado en la cancha comn de los Axiomas Kolmogorovianos de la Probabilidad (El Seor de los Axiomas), pero si miramos un poco
14
ms lejos -hacia las Tierras Media, por ejemplo- veremos distintas "escuelas"que trabajan con deniciones (o interpretaciones) distintas de la probabilidad. La gracia de los Tres Axiomas es que puede incluir a estas interpretaciones como casos particulares, cada escuela puede traducir sus ideas a la formalidad kolmogoroviana y facilitar as la comunicacin entre distintas escuelas. Las interpretaciones ms conocidas son la clsica, frecuentista (o emprica) y la bayesiana.
factibles
h n
maneras posibles (seis maneras en total), todos (los sucesos) h , entonces la probabilidad de ese suceso es . La probabilidad es por n
igualmente
es muy grande, un f veces, entonces la probabilidad emprica de ese suceso es . n repeticiones de un experimento, donde
dor. Por supuesto, el juicio que adelantemos puede estar basado en algo parecido
a la probabilidad emprica o la experiencia... pero de qu me sirve saber que de 100 lanzamientos de alguna moneda 52 veces sali cara y 48 sali sello? Me obliga eso a creer que la probabilidad de que salga sello al lanzar la moneda que yo tengo en el bolsillo es 0.48? No tengo idea de si la moneda es igual a del estudio anterior, ni si lanzaron la moneda de la misma manera que yo, etc. Ms an al intentar modelar la incertidumbre frente a decisiones econmicas es casi seguro que las probabilidades con los agentes analizan su mundo son todas subjetivas. El mtodo bayesiano lo que hace es otorgar un poco de estructura a esta probabilidades subjetivas. En particular, nos entrega una regla para realizar en una forma lgicamente consistente lo que conocemos como actualizacin de creencias , amn de proveer trminos y teoremas especializar para tratar con esta visin de las probabilidades.
Pa-
Si los eventos
P (A) =
for
j = k,
Bi , i I , iI Bi = S ,
que si se jan, no es ms que el Teorema 9 que ya vimos, slo que hemos reemplazado cional.
P (A) > 0,
P (Bj |A) =
Bj
La regla de Bayes provee un medio para actualizar las probabilidades de cualquier evento de la particin de cin entre cuando que el evento
A ocurre. 5
Esta distin-
P (Bj )
es la probabilidad de
B,
Comentario:
so) que la probabilidad no es ni frecuentista ni clsica ni bayesiana, pero que dependiendo del problema (no importando si es prctico o terico )que estemos examinando, alguna de estas tradiciones se mostrar ms til o ms iluminadora. Debemos tratar de estar capacitados para trabajar en cualquier terreno.
ejemplo si ustedes estn haciendo predicciones econmicas o escribiendo la simulacin de un modelo, pueden plantear escenarios hipotticos donde el evento H ocurre y calculan cuales seran las probabilidades de todo el resto de los eventos restantes dado que H ocurri.
5 Por
16
3.
En esta esquina del ring, pesando los kilos que ustedes quieran, vistiendo pantaln del color que deseen, de la categora y de la dimensin que se nos pare . . . la invicta ... Variableeee Aaaaleaaatoriaaaaaaa !!!!!!!!!
3.1.
Advertencia nmero uno: una variable aleatoria es una ccin entre cciones, pues lo que en realidad tenemos es una Funcin Aleatoria. Efectivamente, lo que tenemos es una Funcin que toma eventos (inputs) y arroja un nmero, o una n-tupla de nmeros. Hagamos al siguiente prueba: 1. Consiga un Espacio Probabilstico tipo mano los subconjuntos de 2.
(, E , P )
y preocpese de tener a
(eventos simples).
Tome slo elementos (subconjuntos, que son eventos, Ud. sabe) de suyo . . . que
. Hgalo
sea su dominio.
3.
Cada vez que tome uno de esos subconjuntos asgnele un nmero (pero una vez que bautiz un subconjunto con un nmero no se lo vaya a cambiar despus, ok?).
4.
Sea poeta: a cada nmero que ha utilizado para marcar los subconjuntos de
es
7.
Renamientos:
tiene un nmero nito de elementos o un nmero innito de En caso contrario (nmero innito de elementos y no es
Discreta.
Continua.
17
b)
son categoras
Completa, Educacin Media Incompleta, Educacin Media Completa, etc. es usted un Funcin Cualitativa Aleatoria. Ya hablaremos de eso.
c)
Si todos los nmeros que usted us (las imgenes, las que forman su Rango) son nmeros reales, le informo que su merced es una Funcin
Real
R,
que
T,
de Teniente. En
O :
T, T R
d)
de
a, b, c
conjunto a nmeros, entonces las imgenes son tro reales y pertenecen 3 3 a R y su biografa debera escribirse ahora as: O : T, T R y sus amigotes le diran "Funcin Real Aleatoria
Multivariada!"
Bueno, pero ya es hora de unirse a la prctica habitual: aunque pensemos en una Funcin Aleatoria la llamaremos Variable Aleatoria. Formalizando lo esencial de lo dicho ms arriba, escribiremos:
Sea
(, E , P )
experimento cualquiera. La funcin vectorial n-dimensional de valor real X : S T, T Rn , o simplemente X, es llamada una variable aleatoria
n > 1
n = 1.
Al
3.2.
Recuerden que la variable aleatoria es una funcin, cuyo trabajo es asignar nmeros. De modo, que por favor no confundan un grupo de nmeros que esta funcin ha asignado con la funcin propiamente tal . . . no confundan a la funcin con el producto de su trabajo (llamado realizaciones de la variable aleatoria)
es la funcin.
es la abreviacin de
X : S T, T Rn
0, 3, 4, 33 x1 , x2
. . . xT
son
aleatoria son sencillamente nmeros arrojados por la Funcin. En particular cuando pensamos en un Experimento Aleatorio, los resultados de ese experimento son considerados una realizacin de la variable aleatoria que en nuestra cabecitas hemos hecho responsable de los resultados. En ese caso, una realizacin es una huella que la Funcin Aleatoria nos ha dejado y que nos servir para tratar de descubrir en algunos casos de que tipo de funcin se trata o al menos a qu tipo de funcin se parecera. Es como si la variable fuera una fantasma que se nos "manifestara a travs de aquellos nmeros en los experimentos aleatorios.
3.3.
Como la desmemoria por conveniencia es religin ocial hoy por hoy, pues a nadie habra de extraar que en Probabilidades y en Estadstica se haga lo mismo, con la salvedad de que en este caso no nos estamos sentando encima de nadie. Aqu el olvido consiste en reemplazar los conjuntos de eventos por nmeros, siempre por los cmodos nmeros (reales casi siempre), gracias ese traductor conjuntosa-nmeros que se llama Funcin (Variable) Aleatoria: 1.
es el nmero 57 el que le digan "sali inteligente.o "57"es exactamente y quizs los eventos eran nmeros desde el comienzo: por ejemplo, que los
X (inteligente) = 57 que puede leerse: "la traduccin a X realiza cuando se trata del evento `inteligente`
igual de informativo para Usted. Por supuesto, puede ser ms afortunado eventos fuesen los distintos pesos, en kilogramos, de un beb al nacer: 1.7 , 2.3, 3.5, etc. quizs un intervalo completo de la funcin
Etraducido
original. Por
Etraducido
19
3.
la antigua funcin 4.
Reemplazamos el Espacio Probabilstico = (, E , P ) por otro donde slo existen nmeros reales o intervalos de nmeros reales y funciones que trabajan con ellos:
T raducido = (RAN GO(X), Etraducido , Pdelotraducido ).
traduccin es obra de la Funcin Ahora bien, como la
T raducido x =
(RAN GO(X), Ex , Px )
sido hechas por
X.
3.4.
Aprovechando una franquicia SENCE, la Funcin Aleatoria X (alias la variable aleatoria) asiste a un curso de perfeccionamiento para funciones aleatorias y el primer tpico es Maneras convenientes de asignar valores numricos a los
cochinos eventos que lo estaba dictando en esa poca mile Borel, un veterano
de la Resistencia Francesa, ex-prisionero del repulsivo gobierno de Vichy y que era a la sazn uno de los padres de la Teora de Funciones. Si de algo el viejo Borel saba, era sobre la medicin de conjuntos . . . ms an si se trataba de conjuntos con elementos reales que es el caso de RANGO(X), que era una de sus especialidades. numricos a los eventos es
X aprendi all que una forma conveniente para asignar valores seleccionar subconjuntos de R y ponerlos ordenados y formar con ellos el conjunto RANGO(X) que es la traduccin de
En efecto,
a nmeros en
R.
Bz = (, z ],
es decir por
todos los nmeros reales (que sean imgenes de alguien) menores o iguales a lo que en lenguaje formal deberamos de escribir as:
z,
Bz = {r R : r z } R
. . . los vamos a llamar, oh sorpresa, conjuntos de Borel. Cmo interpretar ese intervalo recin escrito??. Recuerden ustedes que todos los eventos traducidos a nmeros reales mediante
omega's
son
X( ) = r,
arriba se puede leer en un pelcula de Hollywood subtitulada en Mxico como "ponga en este maldito conjunto a todos los jodidos eventos cuya traduccin
20
z
y donde
numrica de algn otro evento. Puesto eso mismo en lenguaje formal, diramos
Bz
{x : x = X( ) z }
As las cosas la Funcin Aleatoria (variable aleatoria para los amigos) aprendi que poda poner en orden creciente todas las imgenes de los eventos y formar estos conjuntos borelianos (los intervalos) diciendo "en este pondr al ( o los) evento(s) con la imagen ms pequea de todas, luego al que tenga la imagen ms chica de las que van quedando y as hasta terminar con el (o los) evento(s) que tenga una imagen igual al nmero
z
. Y como
cuenta que si lo que quera era mostrar slo los eventos con imgenes entre
z
y
y y Bz = {r R : r z }
By = {r R : r y }
con cualquier interseccin o unin de conjuntitos borelianos, con ellos podemos recuperar cualquier evento o grupo de eventos que queramos. Miren que fcil es mantener todo lo que sabamos de los eventos originales (quin era subconjunto de quin, quin era disjunto con quin) porque los intervalos de nmeros reales son tambin conjuntos. Al conjunto grandote que contiene como elementos suyos a todos esos intervalos (los conjuntos de Borel) lo llamaremos Espacio de Borel y se escribe Apndice de este apunte. Ahora bien, es este enfoque apto slo para variables aleatorias continuas o tambin sirve para variables discretas?? Por supuesto que tambin sirve para variables discretas. Que la terminologa de intervalos no lo confunda: si el conjunto de las imgenes es discretos, los conjuntos como
Bz
En el examen para graduarse de Funcin Aleatoria en el curso de perfeccionamiento, Borel les revisaba cuidadosamente que no existiera ni un slo evento simple cuya imagen no estuviera incluida en algn intervalo tipo les peda que:
Bz ,
esto es, se
{ : X ( ) Bz }
21
valores numricos de lugar en lugar y de momento a momento y que no parecen ser perfectamente predecibles. Los eventos que dan origen a estas variables aleatorias son inmensamente complicados, envolviendo miradas de transacciones individuales, con decisiones dependientes en informacin que va cambiando. Luego, el giro desde eventos hacia variables aleatorias que permite clculos numricos es un paso esencial para posteriores progresos. De hecho, la econometra est primariamente concentrada en analizar variables aleatorias, de modo que deberemos desarrollar aquellas herramientas apropiadas para describir, categorizar y analizar su comportamiento". Y eso, justamente eso es lo que haremos en el prximo apunte. Nota Bibliogrca: el material de probabilidades cubierto en este apunte est basado principalmente en los apndices probabilsticos de los libros citados ms abajo.
Referencias
David F. Hendry.
Dynamic Econometrics.
Oxford University Press, rst edition, 1995. Adrian Pagan and Aman Ullah. Nonparametrics Economics. Themes in modern econometrics. Cambridge University Press, rst edition, 1999. Douglas J. Miller Ron C. Mittelhammer, George G. Judge. Econometric Foun-
22