You are on page 1of 22

Electivo de Econometra. Notas de Clase Primer Apunte : Probabilidad...

desde cero
Ricardo Mayer B.

18 de marzo de 2002

1.

As es que has decidido ocupar Estadstica, eh?


Hacer Econometra es bien visto. Al parecer la Estadstica le dara soporte,

slidos fundamentos recibidos por la Teora de Probabilidades (ehhh ... Clsica o Bayesiana??? , bueno, de momento no importa) , que a su vez recibe formalizacin matemtica por la va de la Teora de Conjuntos y de la Teora de la Medida, todo lo cual es, Uds. lo saben, muy bien considerado en los das que corren. Estadstica es la nica manera de acercarse a la realidad y menos an que exista una sola manera o un solo nivel de profundidad para usar Estadstica. Emplear herramientas estadsticas -como lo hace siempre la Econometra- es una opcin, con ventajas y desventajas. Si ustedes quisieran agotar un tema de investigacin deberan emplear adems otras formas de aproximacin (como estudios de casos, por ejemplo) y vern que no siempre la estadstica es apropiada para cualquier tema. En lo que sigue de esta seccin veremos algunas consideraciones que vale tener en cuenta antes de entrar en materia con un breve repaso de Probabilidades.

Pero, debo ser muy claro en esto desde el comienzo, no es correcto pensar que la

1.1.

El mundo del "no s": incertidumbre urbe et orbi

Imagnese por un momento como un feliz y competente econometrista. Posesinese de su papel. Listo? Bien, imagine ahora que Ud. acaba de terminar un estudio economtrico sobre la demanda por agua potable (o, bien podra ser, sobre el efecto del salario mnimo sobre el empleo juvenil).

* Profesor

Instructor, Departamento de Economa, Universidad de Chile

Imagine que tuvo tanta fortuna que todos los datos que ocup estaban bien recolectados, que su modelo no tena defecto economtrico alguno y que su cochino ayudante de investigacin no se dedicaba a chatear mientras haca su pega y por lo tanto el programa utilizado -sosticado y eciente, todo muy hi-tech - est libre de errores. Mejor imposible, no?. Bueno, si en esa envidiable situacin un amigo le pregunta por los resultados de su investigacin, esto es lo que debera ocurrir: - Oye, Pelao ... y cunto es la elasticidad de la demanda al nal? - La pulenta, compadre? - Si poh, la rme... - Bueno: No s. En realidad, la respuesta bsica es efectivamente "no s". Por denicin, si la respuesta se pudiera en realidad hacemos es esforzarnos por entregar la mejor respuesta posible dada la informacin con que se cuenta. Todo el mrito de un modelo economtrico ,an cuando est libre de errores en los datos o errores de especicacin, es entregar la respuesta ms verosmil dada la informacin y teora utilizada. Punto. Por cierto que eso es ms de lo que se podra conseguir por varios otros medios, pero est lejos de la seguridad con que algunos descubrimientos se proclaman a partir de este tipo de estudios. De este modo, el dilogo debera seguir as. - No sabes? - Claro que no. Si pudiera conocerse con exactitud, no estaramos usando estadstica y si los resultados no dependieran de la teora con la cual se interpreta slo haramos estadstica y no econometra. Pero si me encargas darte alguna respuesta, mi resultado es ,creo, la respuesta ms verosmil dada la informacin disponible y dada mis teoras. No es poco , pero eso es todo lo que podemos hacer.

saber, no estaramos usando un modelo estadstico. Lo que

1.2.

Realidad estocstica o poesa aleatoria? : edad de la inocencia del demonio de Laplace

All afuera, en el mundo real . . . hay probabilidades? hay variables aleatorias? hay modelos estadsticos? han visto en la calle algn modelo economtrico? Probablemente todos contestemos que no y creo que estaramos en lo correcto. Pero si reformulamos levemente la pregunta ya no sonara tan ridcula: es estocstico nuestro mundo? o hilando un poco ms no: es estocstico el mundo o slo nuestras

descripciones por incompletas deben ser probabilsticas?. Es slo por falta de informacin que el uso de las probabilidades es necesario? es decir, si conociramos
mejor, si supiramos todo acerca de la estructura sistema estudiado . . . podramos llegar a tener una descripcin determinstica del mundo?. Por cierto que el hecho de que la enorme mayora de las veces solo contamos con una parte de la infor-

macin relevante para nuestro estudio nos obliga a tratar los resultados posibles y an las conexiones entre variables en trminos de meras probabilidades, pero contra la tentacin de armar que si supiramos lo suciente acerca de nuestro sistema y de pasada anulramos el libre albero podramos entonces establecer una descripcin puramente determinista del curso del futuro, yo me atrevera a postular que an sin tener que apelar al tema del conocimiento incompleto (y del libre albedro cuando tratemos con personas) nos veremos

obligados a tener que

proveer una representacin probabilstica de muchos sistemas dinmicos, puesto que en gran variedad de casos, no importa cuanta informacin poseamos de la estructura del sistema, la descripcin determinstica simplemente no est denida. Al respecto, djenme contarles la siguiente historia :

1.2.1. rase una vez un pobrecito demonio . . .


Fue nuestro amigo Pierre Simon de LaPlace (1749-1827) quin resumiera el optimismo cientco-matemtico de la Ilustracin al postular a un ser imaginario (conocido como el demonio laplaciano) que al conocer las verdaderas ecuaciones dinmicas que gobiernan la fsica del Universo podra comenzar su clculo en el minuto del nacimiento del cosmos y , ecuaciones verdaderas en la mano y con los datos originales del universo en su cabeza, podra calcular segundo a segundo toda la evolucin del cosmos, hasta nuestros das y mucho ms all. En el lenguaje de ecuaciones diferenciales, nuestro demonio al conocer las condiciones de borde y la ecuaciones exactas, sabra cada una de las trayectorias de cada partcula, del comienzo hasta hasta la eternidad: lo sabra todo. Pero, mundo cruel, a diferencia del demonio laplaciano, los seres humanos slo conoceran datos aproximados porque no observan ni miden con precisin suciente, ni han descubierto an las ecuaciones correctas, de ah que debamos introducir un termino de error para subsanar nuestra falta de sintona na en la construcciones del verdadero modelo, de mediciones perfectas de los datos. Pero la Utopa est planteada: ser los demonios de LaPlace y eliminar lo aleatorio. As las cosas, el demonio est feliz y nosotros estamos sonados. A medida que pas el tiempo y trabajamos largamente sobre los sistemas de ecuaciones llegaron ms malas noticias: incluso si supiramos las verdaderas leyes de movimiento de un sistema, si las trayectorias en vez de converger divergen (si es muy sensible a las condiciones iniciales) , necesitaramos informacin

innitamente precisa sobre las condiciones iniciales y la Utopa se

nos alej an ms. Pero tiempo ms tarde, nuestro otro amigo, Poincar, lleg a la conclusin que ni siquiera el demonio laplaciano podra prever con certeza determinstica el futuro de muchos sistemas dinmicos, porque en muchos casos no existen (no estn denidas

) las ecuaciones determinsticas que nos puedan

la aparicin de un fenmeno denominado resonancia entre las frecuencias que describen las trayectorias de las partculas, que podramos describir en una separata.

1 por

contar qu pasar con una miserable partcula en ciertas condiciones, independiente de que supiramos con plena exactitud las condiciones iniciales del problema. Poincar, sin quererlo expuls de la Utopa al pobre demonito de LaPlace . . . C est la vie , se le oy decir. Desde ese da la Estadstica y la Probabilidad se col en la fsica y en la ciencias naturales por una razn adicional a la simple ignorancia y poca precisin humana. Pero, en vez de tomarlo como una derrota o un escollo, nuestro tro de amigos : Kolmogorov, Arnold y Moser (conocidos como KAM) sistematizaron el problema dividiendo las trayectorias posibles entre las agradables (determinsticas) y aquellas otras trayectorias aleatorias . Y dieron un reformulacin coherente y probabilstica de los sistemas dinmicos que es el estndar hoy para entender y trabajar en dicho campo. El demonio laplaciano se recuper nalmente de su alcoholismo , se reconcili con su seora y le vendi el guin de PI (la pelcula) a un joven director estadounidense. Con el poco dinero que recibi se compro un chalet en Cartagena y hoy dice que le gusta el pescado frito con pur.

1.2.2. Quin estim a Gaete? (poesa aleatoria)


En trminos prcticos, los hombres nos valemos de ciertas artefactos para representar algn pedazo del mundo para poder seguirle la pista: seleccionamos algunos rasgos de nuestro objeto y nos olvidamos de otros. Es como si para estudiar una persona nos concentrramos en algunos datos abstractos como su altura y su peso. Mientras ms tratamos de abarcar del objeto real, seleccionamos ms caractersticas y descartamos menos, por ejemplo incluimos su edad, su raza, su religin. Pero an en los casos ms sosticados lo nico que tenemos son metforas. Una ecuacin con peso, edad, religin, edad, etc. NO ES esa persona, hemos creado un artefacto que guarda cierto paralelo con esa persona. Metforas relacionadas con l. Todo lo que hacemos es poesa, poesa axiomatizada, porque sigue reglas bien denidas. En la medida que nuestras metforas conserven cercanas en los puntos clave con los objetos las deducciones que saquemos de las metforas sern medianamente aplicables al objeto real. En la medida que nuestras metforas sigan las reglas de la lgica axiomtica, tendremos en un modo ordenado de trabajar con ellas. Ms an, podrn ensamblarse con otros poemas matemticos y extender las conclusiones all donde la lgica lo permita. Ni por un segundo piensen que el hecho de trabajar con metforas es trivial: las hay llenas de errores y las hay intiles por doquier. Algunas son a veces complicadas de comprender sin preparacin previa, pero afortunadamente, si se empieza de las metforas ms bsicas (secuencia, lmite, evento, variable aleatoria) todos los poemas estocsticos, hasta los ms oscuros, se vuelven cristalinos. Y eso es precisamente lo que pienso mostraros a continuacin:

2.

Probabilidad: hora cero.


Quiero que ha-

Intuicin y formalidad se parecen, pero no son lo mismo.

gan la distincin entre la idea intuitiva de probabilidad y el concepto matemtico de probabilidad. Todos tenemos alguna idea de lo probable asociado a los juegos de azar o las incertidumbres cotidianas: a esa idea , a esa intuicin, le hemos llamado

probabilidad. Pero no es lo mismo que el artefacto matemtico bauti-

zado como probabilidad. Nuestro amigo Kolmogorov axiomatiz en el siglo XX la teora de probabilidades y el artefacto que all se ocupa tiene en parte la intencin de ser comparable a la intuicin, a la idea informal de probable, para que tenga alguna relacin con fenmenos reales (y pueda existir una aplicacin prctica). Pero no son lo mismo. Nunca , pero nunca, esta dems pensar con detenimiento si podemos hacer uso (y no abuso ) de la palabra probabilidad ligndola a uso comn cuando queremos interpretar cosas de nuestro modelo. En estos apuntes vamos a comenzar el tema de la probabilidad con algunas deniciones muy elementales para poder presentar los Axiomas de Probabilidad de nuestro amigazo Kolmogorov.

2.1.

Componentes bsicos: rase una vez un conjunto bueno al que maltrataban todos los elementos . . .

Los distintos resultados que nuestro experimento, o situacin o proceso o lo que sea, puede exhibir se llaman eventos y pueden constituir de un hecho singular o de la ocurrencia de varios hechos individuales. Por ejemplo, si manejar un auto fuese un experimento aleatorio, de la innidad de cosas que nos podras ocurrir, un evento posible al salir a manejar es que nos choque una micro 227, otro evento sera que atropellemos a Rafael Araneda, pero tambin puede ser descrito como un evento que ambas cosas sucedan: el evento consistente en atropellar al

Rafa Araneda y que adems nos choque una micro 227. De este modo diremos que

Def 1: Experimento Aleatorio

Utilizaremos el trmino experimento en un

sentido muy libre: ser cualquier situacin donde los resultados no se conozcan con certeza de antemano.

Def 2: Puntos muestrales o eventos singulares o simples

Son cada uno de

los posibles resultados de ocurrir el experimento una sola vez. Pero la cantidad de cosas que comprende un evento simple depende de como sea nuestro experimento: si el experimento consiste en lanzar 3 veces una moneda , los eventos singulares sera del tipo cara, sello, sello, es decir seran tripletas, por al hacer

cada vez el experimento tenemos tres lanzamientos. Pero si el


5

experimento es denido como lanzar slo una vez la moneda , los eventos singulares sern del estilo cara o sello.

Def 3: Espacio Muestral

Es el conjunto de referencia de nuestro anlisis. Est

formado por todos los posibles eventos singulares de la situacin que estamos estudiando. Si vemos la vida cotidiana como un experimento aleatorio
gigantesco, son todas las cosas que pueden pasar al salir a manejar, o todas las cosas que pueden ocurrir en una carrera en el Club Hpico si ests apostando, todas los posibles sucesos que ocurren en tu primera cita. En la prctica no siempre es obvio cules fenmenos debemos incluir como resultados posibles de nuestro experimento y cuales podemos ignorar (o que podremos calicar como imposibles) y en mltiples ocasiones la subjetividad del investigador debe intervenir para denir qu entra y que no. Es ms, no siempre es fcil hacer una denicin precisa de nuestro experimento aleatorio. La prctica usual es renunciar a imaginar todos los casos posibles y conformarse con una Denicin o una Regla que nos diga que tipo de eventos pueden entrar en consideracin y cules no (ejemplo: "todo ser humano que mida ms de 1.7 metros de altura y que pase enfrente de mi ventana entre las 12 y las 15 horas"). Existen , para este propsito 3 tipos bsicos de conjuntos: aquellos con un nmero aquellos con un

nito de elementos nmero innito de elementos

pero donde podemos

establecer una relacin uno-a-uno con el conjunto de los nmeros naturales , en cuyo caso se llaman conjuntos innitos numerables o con-

tables

innitos de elementos pero donde la relacin uno-a-uno arriba citada no es posible, en cuyo caso se llaman conjunaquellos con un nmero tos innitos no-numerables (por ejemplo el intervalo (0,1) de nmeros reales). Pregunta: si no podemos contar los elementos de uno de estos conjuntos, cmo podemos decir que uno es ms grande que otro?. Podemos, siempre y cuando seamos capaces de inventar algn criterio de tamao , que llamaremos medida, y que ese criterio se pueda aplicar a esos dos conjuntos. En ese caso podramos

medir

ambos

conjuntos y compararlos. Ms an, cuando nuestro espacio muestral

es continuo, solamente los subconjuntos que sean medibles calican

para ser llamados eventos. Por favor note, que en los nmeros reales, un slo nmero es un punto, no intervalo, los puntos no tienen medida positiva. Es por esa razn que decimos que en una situacin continua, la probabilidad de un solo punto es por lo general igual a 0.

Def 4: Eventos.

Tcnicamente, un evento es cualquier subconjunto (subconjun-

to medible, en el caso que

es continuo) del espacio muestral. Pueden ser

eventos singulares o simples de nuestro experimento: "hay estallido social en Argentina el 26 de Diciembre", o alguno ms elaborado, como la unin de dos (o tres) eventos singulares :"hay estallido social en Argentina el 26 de Diciembre o

De La Ra se mantiene en el poder- (ntese que podra

no ocurrir ninguno de los dos: sale el presidente sin estallido social de por medio postulado por nosotros como otro evento del Espacio Muestral). De la misma manera un evento puede ser la interseccin de dos eventos singulares: estallido social y (a pesar de eso) De La Ra se mantiene en Casa Rosada. Una vez que identique los eventos singulares puede jugar con ellos de distintas manera para construir otros eventos.

Def 5: Evento imposible. Def 6: Evento seguro.

Evento que jams ocurrir.

Evento que ocurrir con certeza. conjunto formado por todos los subconjuntos del

Def 7: Espacio de eventos.

espacio muestral. La diferencia con el Espacio Muestral es que en el Espacio de Eventos no solo son miembros de este espacio los eventos singulares si no

todos los eventos que queramos denir. Al espacio de eventos lo llamaremos


E.

Def 8: Evento seguro.

Evento que ocurrir con certeza.

que al leer operaciones de conjuntos, la unin es un .o"lgico (la o no excluyente) y la interseccin es un 2 "lgico
7

2 recuerde

2.2.

El Seor de los Axiomas: Un campo para gobernarlos a todos. Un campo para encontrarlos, un campo para atraerlos a todos y en las probabilidades atarlos.

comentario preliminar : La teora axiomtica, que explicaremos a continuacin, no no nos dice mucho de cmo asignar probabilidades a cada evento
simple. Si usted es capaz de presentar una funcin que mida conjuntos y que cumpla con los tres axiomas, Kolmogorov los bendecir con el ttulo de Probabilistas. Todo el tema de interpretacin y si tiene alguna relacin con aspectos del mundo real correr por cuenta suya. As es como los probabilistas clsicos tienen su propia forma de asignar las probabilidades , los empiricistas la suya y los bayesianos la suya. La teora axiomtica es lo sucientemente exible para acomodar esas tres tradiciones dentro de su campo. tarse su propia regla para asignar una probabilidades a los eventos y mientras no se salga del marco que damos ms adelante, ser efectivamente una probabilidad en regla y todos los teoremas sobre probabilidades le sern aplicables. Pero nada ms que eso, el resto, repetimos, corre por su cuenta. Llamemos

Usted mismo podra inven-

al conjunto Universo de cada situacin que queramos considerar

y como estamos hablando de probabilidad, adoptar el conjunto Universo nombre de Espacio Muestral.

es nuestro Espacio Muestral

Por el momento slo consideren que la Probabilidad es una funcin que toma como input un conjunto (un evento) y lo asocia con un nmero real. Fcil, verdad? Es decir cualquiera de nosotros agarra un conjunto por ah y le asigna un nmero real. Pero vamos a pedirle tres cosas ms, para que esa funcin puede decirle a sus vecinos soy una medida de Probabilidad, soy una medida de Probabilidad !!. Esas tres condiciones son:

Axioma 1

Para cada suceso

en el conjunto

P (A) 0
Slo estamos pidiendo de momento que la probabilidad sean nmeros nonegativos.

Axioma 2

Para el suceso seguro o cierto

en el conjunto

P (C ) = 1

Axioma 3

Para cualquier nmero de sucesos mutuamente excluyentes

A1 , A2 . . .

en el conjunto

P (A1 A2 . . .) = P (A1 ) + P (A2 ) . . .

Ya lo saben: practiquen en la calle tomando conjuntos (aquellos que estn dentro de algn

, se entiende) asignndoles alegremente nmeros reales no-

negativo, asignen siempre un 1 a cuanto Espacio Muestral se denan, pero hagan todo aditivamente contable (i.e como en el Axioma 3) y con eso ya pueden ir disfrazados de Probabilidad a cualquier esta, como su profesor. Por efecto del Axioma 3 , la probabilidad de la unin de sucesos excluyentes es no-decreciente: si A y B son eventos excluyentes, el suceso ocurre A o bien

ocurre B es a lo menos tan probable como el evento solo ocurre A o el evento solo ocurre B. Si este ltimo axioma (Axioma 3) quisiramos repetirlo en un lenguaje
un poco ms sosticado , habramos escrito:

Axioma 3
en donde

Llamemos

{ Ai : i I }

a una coleccin de eventos disjuntos en

es un conjunto ndice de nmeros positivos, formado por nmeros

enteros y que puede ser o bien nito o innito pero contable (como por ejemplo los llamados nmeros naturales). Entonces,

P
iA

Ai

=
iA

P (Ai )

La propiedad que nos entrega el Axioma 3 se conoce como Aditividad Contable y quiere decir que la probabilidad que se le debe asignar a una

coleccin de

subconjuntos disjuntos de (subconjunto de que no tienen elementos en comn) es igual a la suma de las probabilidades asignadas a cada uno de esos
subconjuntos en forma individual.

Def 9: El cochino Espacio Probabilstico

La construccin ms ambiciosa que

veremos por el momento es tambin un conjunto, uno que consta de 3 elementos o ingredientes: 1 Espacio Muestral (no muy maduro), un Espacio de Eventos (a gusto) generado a partir del anterior y una Funcin de Probabilidad cuyos inputs (su dominio) sea ese Espacio Muestral, mostrar que se puede usar

(podramos

en vez). Formalmente, denotaremos a este

Espacio Probabilstico por el tro

= (, E , P )
No es tan fcil construir algo como un espacio probabilstico al hacer investigacin: debemos denir claramente que experimento estamos estudiando,

delimitar los posibles resultados de (hacer una vez) el experimento, que componen construir

Luego de eso usted debe meditar sobre aquellos sucesos y

, es decir usted debe denir (si no le es prctico enumerar) to-

dos los subconjuntos de

funcin de valor real que va asociar cada suceso con un nmero entre 0 y 1 y que
probabilidades. Finalmente, debe construir alguna regla, alguna cumpla con los Axiomas 1, 2 y 3.

sobre los cuales tiene sentido hacer operar las

2.2.1. Algunos teoremas sobre Probabilidades


Sean

A1 , A2 , A3 . . . B1 , B2 , B3 . . .
Si

subconjuntos del Espacio Muestral

(es de-

cir, son eventos).

Teorema 1
y adems

A1 A2

, entonces

P (A1 ) P (A2 ) P (A2 A1 ) = P (A2 ) P (A1 )

Teorema 2 Teorema 3

Para cada suceso

Ai 0 P (Ai ) 1

P () = 0

Teorema 4 Teorema 5
cluyentes:

Sea

Ac i

el complemento de

Ai ,

entonces

P (Ai ) = 1 P (Ac i)
Si

A = A 1 A2 A3 . . . A n

A1 , A2 , A3 . . . An

son sucesos ex-

P (A) = P (A1 ) + P (A2 ) + P (A3 ) . . . + P (An )


En particular, si

A=

, entonces

P (A1 ) + P (A2 ) + P (A3 ) . . . + P (An ) = 1

Teorema 6

Para cualquier grupo de sucesos

Ai

P (A1 A2 ) = P (A1 ) + P (A2 ) P (A1 A2 )


es interesante generalizarlo al caso de 3 eventos (vean que simple que es):

P (A1 A2 A3 ) = P (A1 )+P (A2 )+P (A3 )P (A1 A2 )P (A1 A3 )P (A2 A3 )+P (A1 A2 A3 )
10

donde la suma del nal debe aparecer para evitar sustraer dos veces los elementos de los sucesos cuando tenemos ms de una interseccin operando negativamente. Ms an, vean lo fcil que se entiende ahora este til resultado atribuido a Poincar: Para
n

i = 1, 2 . . . n,
n

tenemos que
n

P (Ai ) =
i

P (Ai )
i<j

P (Ai Aj )+
i<j<k

P (Ai Aj Ak )+ . . . (1)n1 P (Ai )

Teorema 7

El resultado anterior (basta mirar el caso de 2 eventos para entenn

der) es la base para lo que se conoce como la Desigualdad de Boole:

P (n i Ai )

P (Ai )

en donde, cuando no son sucesos excluyentes la desigualdad es estricta y cuando todos son mutuamente excluyentes (disjuntos) la igualdad se sostiene.

Teorema 8

Para dos sucesos

P (A) = P (A B ) + P (A B c )
que podra leerse como: la probabilidad total de que ocurra A es igual a la probabilidad de que A ocurra junto con B , ms la probabilidades de que A ocurra junto con cada uno de los otros eventos posibles

Teorema 9
excluyentes

Si un suceso A debe resultar en uno de los sucesos mutuamente entonces

A1 , A2 , A3 . . . An

P (A) = P (A A1 ) + P (A A2 ) + P (A A3 ) . . . + P (A An )

Teorema 10

Muy interesante es el caso de este otro teorema, conocido como

Desigualdad de Bonferroni, porque es particularmente til al trabajar con test de Hiptesis ms adelante. Para cualquier

Ai
n

(An i=1 )

1
i=1

P (Ai )

A diferencia del teorema de Poincar ms arriba que entrega el valor de la probabilidad, el de Bonferroni entrega una cota superior a la probabilidad. Una aplicacin de esa cota es muy comn en el caso de mltiples test de hiptesis. Por ejemplo, suponga que realiza una secuencia de de signicancia es porque:

test independientes, con niveles

1 , 2 , . . . 3

. En ese caso la desigualdad de Bonferroni nos est

indicando que la signicancia del conjunto de los test ser a lo ms de

i . Esto

P (Fi ) = 1 P (Fi ) 1 1
en donde, como seguramente recuerdan (je), en el

P (Fi ) =
rechazo

i
es verdadero

= P(

H0 |H0

i-simo

test) y donde los

Fi s

son las regiones donde se acepta la hiptesis.

11

2.3.

La Probabilsima Trinidad: la conjunta, la condicional y la marginal


AyB
es simplemente

2.3.1. El Padre: la Probabilidad Conjunta


Seremos breves: la probabilidad conjunta de dos sucesos

P (A B ). No es nada ms que la probabilidad de un conjunto : de aqul conjunto


(que bien puede ser vaco, tener un elemento, dos elementos, etc.) cuyos elementos

B . As, por ejemplo, para pertenecer a A hay que ser rica y para pertenecer a B hay que ser inteligente y todo suceso que cumpla la condicin es rica e inteligente pertenece a P (A B ). Por supuesto que es generalizable a ms de dos conjuntos: P (A B C D ) es
entran tanto en como en la probabilidad conjunta de sucesos del tipo A,B,C y D. Algo as como el conjunto formado por todos los eventos que cumplan (entre otras propiedades que nos sean excluyentes) con ser rica, inteligente, consecuente y divertida

2.3.2. El Hijo: la Probabilidad Condicional


Tomen dos sucesos: el evento A, con

P (A) > 0

y el evento B. Escribiremos

P (B |A)
rido.

para sealar la probabilidad del evento B dado que el evento A ha ocur-

Pregntense: ahora que

que el evento A ha ocurrido, sigo con el mismo

espacio muestral que antes? sigo con el mismo grupo de eventos probables que antes? Obviamente no, pues. Si el evento A ha ocurrido, no sobrevive en nuestro pool de posibilidades ningn evento que se contradiga con A. Por ejemplo si

signica ahora es inteligente , todos los sucesos (simples, compuestos) que

incluyen la caracterstica es tonta quedan automticamente fuera del Universo: quedan fuera de nuestro nuevo Espacio Muestral. Tomen nota de los siguiente: si el suceso A ha ocurrido nos hemos quedado que un nuevo Espacio Muestral, conformado exclusivamente por sucesos que comparten la caracterstica es inteligente . El pool de eventos ya no es el mismo: no es igual de fcil toparse con un evento es rica entre la poblacin total de eventos que encontrarse un evento es rica en un pueblo donde no hay ninguna tonta . Al respecto, cul es su intuicin? Suben o bajan las probabilidades de toparse con un evento rica (al menos rica, es decir rica y nada ms o rica y cualquier otra caracterstica adicional) en el universo formado por tontas e inteligentes (P (B )) o en el nuevo universo formado slo por inteligentes (P (B |A))?

O quizs no tenga nada que

ver la inteligencia con lo otro y ambas probabilidades sean por tanto las mismas. Por ejemplo, si en vez de condicionar en el evento es rica , condicionramos en carnet de identidad terminado en 7 , cree usted que la probabilidad del evento

3 les

4 mis

dije que el conjunto poda ser vaco . . . amigos dicen que s bajan, pero para mi no es tan claro
12

es rica se vera alterado por esta condicin? Yo dira que no. Diramos que es rica y carnet de identidad terminado en 7 seran eventos entre s ...pero ya hablaremos de eso. Lo importante es que si condicionamos en la

independientes

ocurrencia de A, todos los sucesos que ahora tengan probabilidad positiva deben 2 ser necesariamente "suceso X y suceso A ", cosas como "slo suceso X y no A a se sabe que tienen probabilidad 0, pues estamos eligiendo slo aquellos donde A s ocurre. Ahora que el concepto ha sido introducido, veamos la formalidad del asunto:

P (B |A) =

P (A B ) P (A)

P (A B ) = P (A)P (B |A)
Es decir la probabilidad de que A y B ocurran en separable en dos partes: que ocurra A y que dado que A ocurri que entonces ocurra B. Dado que la ocurrencia de A nos modica el Espacio Muestral, bsicamente nos hemos quedado con menos elementos, nuestro TOTAL de eventos es ahora ms pequeo, de modo que un evento del mismo tamao antes poda ser una pequea proporcin del total y ser improbable , pero ahora un evento del mismo tamao absoluto es en trminos relativos ms grandote, porque el Total es ms reducido, ahora sera ms probable. Eso indica que las probabilidades antiguas pueden ser reescaladas para aumentarlas dado este nuevo espacio muestral. Cual es la escala correcta ahora?? Fcil: decir, por denicin

P (A).

Si lo piensan, vern que ahora todos

los elementos que sobreviven tienen algo en comn: todos cumplen con

A.

Es

P (B |A) = 1,

lo que fuerza a que el denominador sea igual a

P (A A)

para que al lado derecho tambin obtengamos un uno. Intuitivamente,

si hay poquitos A en el universo original (y por lo tanto P(A) ser un nmero chiquito, como 0.05), al retirar todos los eventos que no cumplen con A nos quedaremos muy pero muy pocos elementos del conjunto original y por esa razn un conjunto que antes era minsculo en relacin al total (y tena por lo tanto una probabilidad muy baja) ser ahora un conjunto grandotote en relacin al nuevo total, por lo que su probabilidad debe ser aumentada bastante, que es lo que ocurre al dividirlo por un nmero chiquito como 0.05 . Finalmente, pueden ustedes fcilmente vericar que

P (B |A)

cumple los Tres

Axiomas y es por lo tanto una probabilidad con todas las de la ley. Y eso qu? Bueno, por esa razn todos los teoremas sobre probabilidades que vimos ms arriba tambin se aplican a las probabilidades condicionales y eso nos hace la vida harto ms fcil.

2.3.3. El Espritu Santo: la Probabilidad Marginal


En la ecuacin

P (A B ) = P (A)P (B |A)
13

la Probabilidad Conjunta es igual a la Probabilidad Condicional multiplicado por algo ms: ese algo ms es la probabilidad marginal. Si tiene ganas de aprendrselo de memoria, anote: la probabilidad marginal es la probabilidad incondicional de aqul evento que est actuando como condicionador. Veremos ms sobre probabilidad marginal cuando veamos distribuciones de probabilidad.

2.3.4. Y algunas fueron Creadas independientes por el Seor (Amn).


Coloquialmente, decimos que dos eventos son independientes cuando la ocurrencia de uno de ellos no afectas las chances de ocurrir el otro evento. En formalidad hacemos la distincin entre independencia de a pares e indepencia conjunta tambien llamada independencia , as sin apellidos (esto es, cuando estemos en presencia de varios eventos, el trmino independencia, as sin ms, estar signicando independencia conjunta.

Def 10: Independencia

de pares

de Eventos:

A y B son eventos independi-

entes de a par si y slo si:

P (A B ) = P (A)P (B )
es decir la probabilidad condicional de B dado A, es la misma probabilidad incondicional que tena B antes de condicionar por A. Como dira mi sabia amiga Susana, aqu se aplica el viejo proverbio japons: "A nikita nipone". Recalquemos que independencia de a pares no es suciente para poder armar que tres o ms eventos son conjuntamente independientes.

Def 11: Independencia


1.

conjunta

de Eventos:

Los eventos

A1 , A2 , . . . An son

conjuntamente independientes si y slo si: Son independientes de a pares entre si:

P (Aj Ak ) = P (Aj )P (Ak )j = k, j, k = 1, 2 . . . n


2. y adems (que no es los mismo):

P (n i=1 Ai ) =
i=1

P (Ai ) Ai

2.4.

. . . y haba tambin un mapa bayesiano, una frecuencia clsica y un lindo hiperplano

Hasta ahora hemos jugado en la cancha comn de los Axiomas Kolmogorovianos de la Probabilidad (El Seor de los Axiomas), pero si miramos un poco

14

ms lejos -hacia las Tierras Media, por ejemplo- veremos distintas "escuelas"que trabajan con deniciones (o interpretaciones) distintas de la probabilidad. La gracia de los Tres Axiomas es que puede incluir a estas interpretaciones como casos particulares, cada escuela puede traducir sus ideas a la formalidad kolmogoroviana y facilitar as la comunicacin entre distintas escuelas. Las interpretaciones ms conocidas son la clsica, frecuentista (o emprica) y la bayesiana.

2.4.1. Enfoque Clsico


Imaginen que un suceso (que salga par al lanzar un dado) que puede ocurrir de de

factibles

h n

maneras distintas (3 maneras: sale 2 o sale 4 o sale 6) de un nmero total

maneras posibles (seis maneras en total), todos (los sucesos) h , entonces la probabilidad de ese suceso es . La probabilidad es por n

igualmente

tanto una proporcin entre cosas que podran potencialmente ocurrir.


Note por favor que usted confa conoce todos los resultados posibles (o puede calcular cuantos son) , confa en que son todos igual de factibles, y conoce de cuantas maneras puede ocurrir el evento que le interesa.

2.4.2. Enfoque Frecuentista o Emprico


Si despus de suceso ocurre

es muy grande, un f veces, entonces la probabilidad emprica de ese suceso es . n repeticiones de un experimento, donde

2.4.3. Enfoque Bayesiano


Las probabilidades bayesianas son subjetivas: son un juicio del experimenta-

dor. Por supuesto, el juicio que adelantemos puede estar basado en algo parecido
a la probabilidad emprica o la experiencia... pero de qu me sirve saber que de 100 lanzamientos de alguna moneda 52 veces sali cara y 48 sali sello? Me obliga eso a creer que la probabilidad de que salga sello al lanzar la moneda que yo tengo en el bolsillo es 0.48? No tengo idea de si la moneda es igual a del estudio anterior, ni si lanzaron la moneda de la misma manera que yo, etc. Ms an al intentar modelar la incertidumbre frente a decisiones econmicas es casi seguro que las probabilidades con los agentes analizan su mundo son todas subjetivas. El mtodo bayesiano lo que hace es otorgar un poco de estructura a esta probabilidades subjetivas. En particular, nos entrega una regla para realizar en una forma lgicamente consistente lo que conocemos como actualizacin de creencias , amn de proveer trminos y teoremas especializar para tratar con esta visin de las probabilidades.

Y que diablos es la actualizacin de creencias? (la cita a ciegas)


ciencia, nios, ms adelante en el curso habr timepo para ver esto. 15

Pa-

Teorema 11 (Teorema de la Probabilidad Total)


son tales que then

Si los eventos

P (A) =

P (A|Bi ) est denida i, Bj Bk = iI P (A|Bi )P (Bi ).

for

j = k,

Bi , i I , iI Bi = S ,

que si se jan, no es ms que el Teorema 9 que ya vimos, slo que hemos reemplazado cional.

P (A Bi ) por su equivalente en la denicin de probabilidad condi-

Teorema 12 (Regla de Bayes)


rema anterior y dada una

Si se cumplen todas las condiciones del Teoentonces:

P (A) > 0,

P (Bj |A) =

P (A|Bj )P (Bj ) iI P (A|Bi )P (Bi ) , dado

Bj

La regla de Bayes provee un medio para actualizar las probabilidades de cualquier evento de la particin de cin entre cuando que el evento

A ocurre. 5

Esta distin-

no ha ocurrido y dado que ya ocurri , ha llevado a usar

las expresiones probabilidad a priori y probabilidad a posteriori.

P (Bj )

es la probabilidad de

B,

la probabilidad a priori (porque

P (Bj |A) es tambin la probabilidad de B la probabilidad a posteriori es posterior a la ocurrencia efectiva de A)

Comentario:

Mayer cree (a nadie le importa lo que Mayer crea, en todo ca-

so) que la probabilidad no es ni frecuentista ni clsica ni bayesiana, pero que dependiendo del problema (no importando si es prctico o terico )que estemos examinando, alguna de estas tradiciones se mostrar ms til o ms iluminadora. Debemos tratar de estar capacitados para trabajar en cualquier terreno.

ejemplo si ustedes estn haciendo predicciones econmicas o escribiendo la simulacin de un modelo, pueden plantear escenarios hipotticos donde el evento H ocurre y calculan cuales seran las probabilidades de todo el resto de los eventos restantes dado que H ocurri.

5 Por

16

3.

En esta esquina del ring, pesando los kilos que ustedes quieran, vistiendo pantaln del color que deseen, de la categora y de la dimensin que se nos pare . . . la invicta ... Variableeee Aaaaleaaatoriaaaaaaa !!!!!!!!!

3.1.

El Espacio Probabilstico es Pangea

Advertencia nmero uno: una variable aleatoria es una ccin entre cciones, pues lo que en realidad tenemos es una Funcin Aleatoria. Efectivamente, lo que tenemos es una Funcin que toma eventos (inputs) y arroja un nmero, o una n-tupla de nmeros. Hagamos al siguiente prueba: 1. Consiga un Espacio Probabilstico tipo mano los subconjuntos de 2.

(, E , P )

y preocpese de tener a

(eventos simples).

Tome slo elementos (subconjuntos, que son eventos, Ud. sabe) de suyo . . . que

. Hgalo

sea su dominio.

3.

Cada vez que tome uno de esos subconjuntos asgnele un nmero (pero una vez que bautiz un subconjunto con un nmero no se lo vaya a cambiar despus, ok?).

4.

Sea poeta: a cada nmero que ha utilizado para marcar los subconjuntos de

, llmelos imgenes (cada unos de esos numeritos es la imagen de alguien,


de algn subconjunto). 5. Pngase fome: Junte despus todos los nmeros que son imagen de alguien y todos juntos forman su Rango (s, Ud. tiene Rango). 6. Si lleg hasta aqu (bsicamente si lleg hasta el punto 3) felicitaciones:

Usted un Funcin Aleatoria.


a)
Si

es

7.

Renamientos:

tiene un nmero nito de elementos o un nmero innito de En caso contrario (nmero innito de elementos y no es

elemento pero contables, entonces usted ser una Funcin Aleatoria

Discreta.

contable) es usted una Funcin Aleatoria

Continua.

17

b)

Si los eventos que componen

son categoras

, como Educacin Bsica

Completa, Educacin Media Incompleta, Educacin Media Completa, etc. es usted un Funcin Cualitativa Aleatoria. Ya hablaremos de eso.

c)

Si todos los nmeros que usted us (las imgenes, las que forman su Rango) son nmeros reales, le informo que su merced es una Funcin

Real

Aleatoria (discreta o continua). Por si no se haba percatado

usted est yendo de

R,

mas exactamente a esa parte de

que

es el Rango que us , digamos que su Rango es

T,

de Teniente. En

simbolitos, si por ejemplo Usted se llamara Ozzy, podra rmar

O :

T, T R
d)
de

y sera como escribir su biografa entera.

Ahora, si un solo nmero no le bastaba para describir algn elemento

y usaba un tro de nmeros reales

a, b, c

para traducir cada sub-

conjunto a nmeros, entonces las imgenes son tro reales y pertenecen 3 3 a R y su biografa debera escribirse ahora as: O : T, T R y sus amigotes le diran "Funcin Real Aleatoria

Multivariada!"

Bueno, pero ya es hora de unirse a la prctica habitual: aunque pensemos en una Funcin Aleatoria la llamaremos Variable Aleatoria. Formalizando lo esencial de lo dicho ms arriba, escribiremos:

Def 11: Variable Aleatoria


multivariada si

Sea

(, E , P )

un Espacio Probabilstico para un

experimento cualquiera. La funcin vectorial n-dimensional de valor real X : S T, T Rn , o simplemente X, es llamada una variable aleatoria

n > 1

variable aleatoria univariada si

n = 1.

Al

valor (i.e. la imagen!) de la funcin

evaluada en un evento particular de

, x = X( ) para , se le llama una realizacin de la variable aleatoria

3.2.

Por sus realizaciones la conoceris . . .

Recuerden que la variable aleatoria es una funcin, cuyo trabajo es asignar nmeros. De modo, que por favor no confundan un grupo de nmeros que esta funcin ha asignado con la funcin propiamente tal . . . no confundan a la funcin con el producto de su trabajo (llamado realizaciones de la variable aleatoria)

es la funcin.

es la abreviacin de

X : S T, T Rn

mientras que las series (o los intervalos) de nmeros reales:

0, 3, 4, 33 x1 , x2
. . . xT

[5, 5,25] , (, 45]


18

son

realizaciones de la variable aleatoria X. Una realizacin de la variable

aleatoria son sencillamente nmeros arrojados por la Funcin. En particular cuando pensamos en un Experimento Aleatorio, los resultados de ese experimento son considerados una realizacin de la variable aleatoria que en nuestra cabecitas hemos hecho responsable de los resultados. En ese caso, una realizacin es una huella que la Funcin Aleatoria nos ha dejado y que nos servir para tratar de descubrir en algunos casos de que tipo de funcin se trata o al menos a qu tipo de funcin se parecera. Es como si la variable fuera una fantasma que se nos "manifestara a travs de aquellos nmeros en los experimentos aleatorios.

3.3.

La seductora desmemoria. Olvidando de dnde hemos venido

Como la desmemoria por conveniencia es religin ocial hoy por hoy, pues a nadie habra de extraar que en Probabilidades y en Estadstica se haga lo mismo, con la salvedad de que en este caso no nos estamos sentando encima de nadie. Aqu el olvido consiste en reemplazar los conjuntos de eventos por nmeros, siempre por los cmodos nmeros (reales casi siempre), gracias ese traductor conjuntosa-nmeros que se llama Funcin (Variable) Aleatoria: 1.

Reemplazamos por RANGO(X): dejamos atrs los elementos de


y nos quedamos slo con sus imgenes asignadas, que son nmeros. La idea 2 es que en vez de que digan "sali inteligente", usted slo escuche "57 como usted sabe que nmeros que la funcin

es el nmero 57 el que le digan "sali inteligente.o "57"es exactamente y quizs los eventos eran nmeros desde el comienzo: por ejemplo, que los

X (inteligente) = 57 que puede leerse: "la traduccin a X realiza cuando se trata del evento `inteligente`

igual de informativo para Usted. Por supuesto, puede ser ms afortunado eventos fuesen los distintos pesos, en kilogramos, de un beb al nacer: 1.7 , 2.3, 3.5, etc. quizs un intervalo completo de la funcin

R como [1,65, 5,25], en ese caso

puede simplemente repetir el contenido de cada subconjunto

que toma y listo. 2.

Reemplazamos E por Etraducido .


que usted cre,

Note que, por efecto de la traduccin

Etraducido

puede tener menos elementos que el

original. Por

ejemplo si tiene cuatro eventos distintos en nmero real a 2 de ellos, para

y usted le asign el mismo

Etraducido

tendr slo tres nmeros reales distintos

en el lugar donde antes estaban 4 eventos. Obviamente , lo mismo se aplica

en donde RANGO(X) tambin puede contener menos elementos

distintos entre s que en nmeros.

por las misma razones de codicacin de los eventos

19

3.

Reemplazamos P por Pdelotraducido .


recoger eventos (de de

Es un ajuste de tornillo que se

realiza sobre la Funcin de Probabilidad, RANGO(X) , para que en vez de

y asignarles nmeros positivos entre 0 y 1, ahora

recoja nmeros o intervalos de nmeros (del conjunto RANGO(X) en vez

y le asigne nmeros entre 0 y 1 que coincidan con los que asignaba

la antigua funcin 4.

Reemplazamos el Espacio Probabilstico = (, E , P ) por otro donde slo existen nmeros reales o intervalos de nmeros reales y funciones que trabajan con ellos:
T raducido = (RAN GO(X), Etraducido , Pdelotraducido ).
traduccin es obra de la Funcin Ahora bien, como la

X , dejaremos su rma en cada una de

sus obras, de modo que de hoy en adelante escribiremos

T raducido x =

(RAN GO(X), Ex , Px )
sido hechas por

donde que queda explcito que las traducciones han

X.

3.4.

La Funcin traductora (X) va a un curso de perfeccionamiento y conoce al seor Borel

Aprovechando una franquicia SENCE, la Funcin Aleatoria X (alias la variable aleatoria) asiste a un curso de perfeccionamiento para funciones aleatorias y el primer tpico es Maneras convenientes de asignar valores numricos a los

cochinos eventos que lo estaba dictando en esa poca mile Borel, un veterano
de la Resistencia Francesa, ex-prisionero del repulsivo gobierno de Vichy y que era a la sazn uno de los padres de la Teora de Funciones. Si de algo el viejo Borel saba, era sobre la medicin de conjuntos . . . ms an si se trataba de conjuntos con elementos reales que es el caso de RANGO(X), que era una de sus especialidades. numricos a los eventos es

X aprendi all que una forma conveniente para asignar valores seleccionar subconjuntos de R y ponerlos ordenados y formar con ellos el conjunto RANGO(X) que es la traduccin de
En efecto,

a nmeros en

R.

Esos intervalos son de la forma

Bz = (, z ],

es decir por

todos los nmeros reales (que sean imgenes de alguien) menores o iguales a lo que en lenguaje formal deberamos de escribir as:

z,

Bz = {r R : r z } R
. . . los vamos a llamar, oh sorpresa, conjuntos de Borel. Cmo interpretar ese intervalo recin escrito??. Recuerden ustedes que todos los eventos traducidos a nmeros reales mediante

omega's

son

X( ) = r,

de modo que el intervalo de

arriba se puede leer en un pelcula de Hollywood subtitulada en Mxico como "ponga en este maldito conjunto a todos los jodidos eventos cuya traduccin

20

numrica (imagen) sea menor que que al denir

z

y donde

es muy comnmente la traduccin

numrica de algn otro evento. Puesto eso mismo en lenguaje formal, diramos

Bz

tenamos en mente el siguiente conjunto:

{x : x = X( ) z }
As las cosas la Funcin Aleatoria (variable aleatoria para los amigos) aprendi que poda poner en orden creciente todas las imgenes de los eventos y formar estos conjuntos borelianos (los intervalos) diciendo "en este pondr al ( o los) evento(s) con la imagen ms pequea de todas, luego al que tenga la imagen ms chica de las que van quedando y as hasta terminar con el (o los) evento(s) que tenga una imagen igual al nmero

z

. Y como

X no era nada de lesa se dio

cuenta que si lo que quera era mostrar slo los eventos con imgenes entre

z
y

le bastaba con tomas dos conjuntos borelianos como

y y Bz = {r R : r z }

By = {r R : r y }

y tomar la interseccin entre ambos. Listo. Y as

con cualquier interseccin o unin de conjuntitos borelianos, con ellos podemos recuperar cualquier evento o grupo de eventos que queramos. Miren que fcil es mantener todo lo que sabamos de los eventos originales (quin era subconjunto de quin, quin era disjunto con quin) porque los intervalos de nmeros reales son tambin conjuntos. Al conjunto grandote que contiene como elementos suyos a todos esos intervalos (los conjuntos de Borel) lo llamaremos Espacio de Borel y se escribe Apndice de este apunte. Ahora bien, es este enfoque apto slo para variables aleatorias continuas o tambin sirve para variables discretas?? Por supuesto que tambin sirve para variables discretas. Que la terminologa de intervalos no lo confunda: si el conjunto de las imgenes es discretos, los conjuntos como

. Ms sobre este asunto podr leerlo en el

Bz

siempre lo sern tambin.

En el examen para graduarse de Funcin Aleatoria en el curso de perfeccionamiento, Borel les revisaba cuidadosamente que no existiera ni un slo evento simple cuya imagen no estuviera incluida en algn intervalo tipo les peda que:

Bz ,

esto es, se

{ : X ( ) Bz }

3.4.1. Una palabrita acerca de la conveniencia de las Variables Aleatorias


Uno de los autores que hemos consultado plagiando descaradamente a ratos para este apunte es David Hendry (Dynamic Econometrics, 1995). En una parte del apndice sobre probabilidad, Hendry escribe (traduccin imperfecta): "En Economa est lleno de cosas que representa como variables aleatorias entre las se incluyen precios, ingresos, gastos y productos, todos los cuales toman diferentes

21

valores numricos de lugar en lugar y de momento a momento y que no parecen ser perfectamente predecibles. Los eventos que dan origen a estas variables aleatorias son inmensamente complicados, envolviendo miradas de transacciones individuales, con decisiones dependientes en informacin que va cambiando. Luego, el giro desde eventos hacia variables aleatorias que permite clculos numricos es un paso esencial para posteriores progresos. De hecho, la econometra est primariamente concentrada en analizar variables aleatorias, de modo que deberemos desarrollar aquellas herramientas apropiadas para describir, categorizar y analizar su comportamiento". Y eso, justamente eso es lo que haremos en el prximo apunte. Nota Bibliogrca: el material de probabilidades cubierto en este apunte est basado principalmente en los apndices probabilsticos de los libros citados ms abajo.

Referencias
David F. Hendry.

Dynamic Econometrics.

Advanced Texts in Econometrics.

Oxford University Press, rst edition, 1995. Adrian Pagan and Aman Ullah. Nonparametrics Economics. Themes in modern econometrics. Cambridge University Press, rst edition, 1999. Douglas J. Miller Ron C. Mittelhammer, George G. Judge. Econometric Foun-

dations. Cambridge University Press, rst edition, 2000.

22

You might also like