Professional Documents
Culture Documents
La estadística descriptiva es una parte de la estadística que se dedica a analizar y representar los
datos. Este análisis es muy básico, pero estudio. Aunque hay tendencia a generalizar a toda la
población las primeras conclusiones obtenidas tras un análisis descriptivo, su poder inferencial es
mínimo y debería evitarse tal proceder. Otras ramas de la estadística se centran en el contraste de
hipótesis y su generalización a la población.
Algunas de las técnicas empleadas en este primer análisis de los datos se enumeran más abajo en
el listado de conceptos básicos. Básicamente, se lleva a cabo un estudio calculando una serie de
medidas de tendencia central, para ver en qué medida los datos se agrupan o dispersan en torno a
un valor central.
La población conceptual: También se conoce con población hipotética es cuando existen otras
situaciones donde los integrantes de la población no pueden ser listado, por ejemplo, si se trata de
comparar dos políticas de venta de un producto, es claro,que lo que se pretende es que las
políticas de venta se puedan aplicar a futuros productos("todos los productos producidos en el
presente y en el futuro͟) y en consecuencia sería imposible en el momento del estudio hacer una
lista de ellos, en tales casos se dirá quenuestra población es una población hipotética. Cuando el
objetivo es estudiar las características y/o comportamientos de poblaciones finitas, ellas deben
estar claramente definidas a través de los criterios deinclusión y exclusión. Pero cuando el estudio
intenta sacar conclusiones hacia una poblaciónhipotética lo que se debe describir son las
características del grupo sobre los cuales se quiere trabajar.
Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio adecuado
(que consienta no solo hacer estimaciones de la población sino estimar también los márgenes de
error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca podremos
estar enteramente seguros de que el resultado sea una muestra representativa, pero sí podemos
actuar de manera que esta condición se alcance con una probabilidad alta.En el muestreo, si el
tamaño de la muestra es más pequeño que el tamaño de la población, se puede extraer dos o más
muestras de la misma población. Al conjunto de muestras que se pueden obtener de la población
se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de
extracción, sigue la llamada distribución muestral.
* Conveniencia ponderada.
Muestra aleatoria ponderada. Cuando la población incluye un grupo muy pequeño pero esencial,
hay el riesgo de que ningún miembro de ese grupo quede dentro de una muestra aleatoria. Tales
grupos claves de usuarios de productos son, entre otros, gente corto de vista, duro de oído o con
la capacidad reducida del movimiento, véase una lista de tal gente. Otras minorías a menudo
significativas originan de religiones, de nacionalidades y de lenguas.
Para asegurar por lo menos algunos de una minoría clave (marcada con x en el diagrama a la
derecha) en la muestra, podemos incrementar deliberadamente la razón de la muestra sobre este
grupo de especial importancia. Por supuesto que esto generará un desequilibrio en las mediciones
que se obtengan a partir de la muestra ponderada, pero será fácil restaurar el equilibro original.
Esto se hace así cuando se combinan los resultados; por ejemplo, al calcular la media de todas las
mediciones daremos a las mediciones de cada grupo su peso apropiado correspondiente a los
porcentajes genuinos en la población.
Una población de observaciones es un grupo que consiste en los valores numéricos de una
característica cuantificable determinada en cada elemento de una población de unidades.
Este concepto es de importancia para el análisis estadístico porque por lo general uno dispone de
una muestra de una población para el estudio que intenta realizar. Por ejemplo, si necesitáramos
hacer un promedio de todas las alturas de los habitantes de un país de 200.000.000 de habitantes
(esta sería la población estadística), es lógico suponer lo engorroso que sería medir la altura de
todos. Esto se realiza midiendo las alturas de una muestra de esta población, por ejemplo 10.000
habitantes. Este procedimiento es inductivo ya que el investigador saca conclusiones acerca de la
población basándose en el análisis de una muestra de esa población; esto es hacer una inferencia
acerca de una población partiendo de una muestra.
Se llama inferencia estadística una conclusión que se refiere a una población de observaciones,
obtenida sobre la base de una muestra de observaciones.
* Tipos de poblaciones.
TIPOS DE POBLACIÓN:
POBLACIÓN FINITA: Es aquella que indica que es posible alcanzarse o sobrepasarse al contar.
PARÁMETRO: Son las características medibles en una población completa. Se le asigna un símbolo
representado por una letra griega.
CLASES DE DATOS:
VARIABLE CUANTITATIVA O ESCALAR: Será una variable cuando pueda asumir sus resultados en
medidas numéricas.
VARIABLE CUANTITATIVA DISCRETA : Es aquella que puede asumir sólo ciertos valores, números
enteros.
Ejemplo: El número de estudiantes (1,2,3,4)
VARIABLE CUANTITATIVA CONTINUA: Es aquella que teóricamente puede tomar cualquier valor en
una escala de medidas, ya sea entero o fraccionario.
Ejemplo: ¿Cuál será la preferencia del consumidor ante dos marcas de refresco con similares
características en un ambiente armónico y sin publicidad?
Gráficos de tallo y hoja: es una forma rápida de obtener una representación visual ilustrativa del
conjunto de datos, para construir un diagrama de tallo y hoja primero se debe seleccionar uno ó
más dígitos iniciales para los valores de tallo, el dígito o dígitos finales se convierten en hojas,
luego se hace una lista de valores de tallo en una columna vertical. Prosiguiendo a registrar la hoja
por cada observación junto al valor correspondiente de tallo, finalmente se indica las unidades de
tallos y hojas en algún lugar del diagrama, este se usa para listas grandes y es un método resumido
de mostrar los datos, posee la desventaja que no proporciona sino los datos, y no aparece por
ningún lado información sobre frecuencias y demás datos importantes.
* Distribución de frecuencias.
1) RANGO.
Es una medida de dispersión que se obtiene como la diferencia entre el número mayor y el
número menor de los datos.
R = N_max - N_min
Ejemplo.
R= 15- 5
2) AMPLITUD TOTAL.
AT = (R+1)
3) LAS CLASES.
Están formadas por dos extremos. el menor se llama límite inferior el mayor se llama límite
superior. hay distintos tipos de clases.
Nc= 1 + 3.33log ( N )
Donde:
Vi = AT / Nc
Donde:
Anchura o tamaño del intervalo: es la diferencia entre los límites reales de una clase
Marca de Clase: Es el punto medio del intervalo de clase, se recomienda observar que los puntos
medios coincidan con los datos observados para minimizar el error.
Frecuencia Acumulada: Indica cuantos casos hay por debajo o arriba de un determinado valor o
límite de clase.
Frecuencia Relativa: Indica la proporción que representa la frecuencia de cada intervalo de clase
en relación al total, es útil para comparar varias distribuciones con parámetros de referencia
uniformes.
Frecuencia Acumulada Relativa: Indica la proporción de datos que se encuentra por arriba o
debajo de cierto valor o límite de clase.
Histograma:
Esta formado por rectángulos cuya base es la amplitud del intervalo y tiene la característica que la
superficie que corresponde a las barras es representativa de la cantidad de casos o frecuencia de
cada tramo de valores, puede construirse con clases que tienen el mismo tamaño o diferente (
intervalo variable). La utilización de los intervalos de amplitud variable se recomienda cuando en
alguno de los intervalos , de amplitud constante, se presente la frecuencia cero o la frecuencia de
alguno o algunos de los intervalos sea mucho mayor que la de los demás, logrando así que las
observaciones se hallen mejor repartidas dentro del intervalo.
Polígono de Frecuencias
Se puede obtener uniendo cada punto medio (marca de clase) de los rectángulos del histograma
con líneas rectas, teniendo cuidado de agregar al inicio y al final marcas de clase adicionales, con el
objeto de asegurar la igualdad del áreas.
Curvas de frecuencia
No es más que la curva suavizada que se traza sobre el polígono y representa la asimetría y la
curtosis que tiene la distribución, permite visualizar un esquema más claro del patrón de datos.
Existen varios tipos de curva de frecuencia: Curvas J, Simétricas o Asimétricas (sesgada a la
derecha o a la izquierda), Unimodales, Bimodales y Multimodales.
Ojivas: Cuando se trata de relacionar observaciones en un mismo aspecto para dos colectivos
diferentes no es posible ejecutar comparaciones sobre la base de la frecuencia, es necesario tener
una base estándar, la frecuencia relativa. La ojiva representa gráficamente la forma en que se
acumulan los datos y permiten ver cuantas observaciones se hallan por arriba o debajo de ciertos
valores. Es útil para obtener una medida de los cuartiles, deciles , percentiles.
Los promedios son una medida de posición que dan una descripción compacta de como están
centrados los datos y una visualización más clara del nivel que alcanza la variable, pueden servir de
base para medir o evaluar valores extremos o raros y brinda mayor facilidad para efectuar
comparaciones.
Es importante poner en relieve que la notación de promedio lleva implícita la idea de variación y
que este número promedio debe cumplir con la condición de ser representativo de conjunto de
datos.
El promedio como punto típico de los datos es el valor al rededor del cual se agrupan los demás
valores de la variable.
MEDIA ARITMÉTICA
Características de la Media:
1. En su cálculo están todos los valores del conjunto de datos por lo que cada uno afecta la media.
2. La suma algebraica de las desviaciones de los valores individuales respecto a la media es cero.
3. La suma del cuadrado de las desviaciones de una serie de datos a cualquier número A es mínimo
si A = X
4. Aunque es confiable porque refleja todos los valores del conjunto de datos puede ser afectada
por los valores extremos, y de esa forma llegar a ser una medida menos representativa, por lo que
si la distribución es asimétrica, la media aritmética no constituye un valor típico.
La media aritmética es el valor obtenido sumando todas las observaciones y dividiendo el total por
el número de observaciones que hay en el grupo.
La media resume en un valor las características de una variable teniendo en cuenta todos los
casos. Solamente puede utilizarse con variables cuantitativas.
Alumno Nota
4 7,0 27,6/5=5,52
5 6,1 ·La media aritmética en este ejemplo es 5,52
La media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos.[2] Se
le llama también promedio o, simplemente, media.
LA MODA
La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta.[5] En
cierto sentido la definición matemática corresponde con la locución "estar de moda", esto es, ser
lo que más se lleva.
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir,
dos datos que tengan la misma frecuencia absoluta máxima. Cuando en una distribución de datos
se encuentran tres o más modas, entonces es multimodal. Por último, si todas las variables tienen
la misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el
intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.
La moda, cuando los datos están agrupados, es un punto que divide el intervalo modal en dos
partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:
Siendo ni la frecuencia absoluta del intervalo modal y ni о 1 y ni + 1 las frecuencias absolutas de los
intervalos anterior y posterior, respectivamente, al
Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase viene dada por la
siguiente tabla (debajo):
Calificaciones | 1 |2 |3 |4 |5 |6 |7 |8 |9 |
Número de alumnos |2 |2 |4 |5 |8 |9 |3 |4 |2 |
LA MEDIANA
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez
que éstos están ordenados de menor a mayor.[7] Por ejemplo, la mediana del número de hijos de
un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2,
puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición
central es 2:
Existen métodos de cálculo más rápidos para datos más númerosos (véase el artículo principal
dedicado a este parámetro). Del mismo modo, para valores agrupados en intervalos, se halla el
"intervalo mediano" y, dentro de éste, se obtiene un valor concreto por interpolación.
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen derecho).
Así, aplicando la formula asociada a la mediana para n impar, obtenemos X(39+1)/2 = X20 y
basándonos en la fórmula que hace referencia a las frecuencias absolutas:
Por tanto la mediana será el valor de la variable que ocupe el vigésimo lugar. En nuestro ejemplo,
21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es aconsejable no
olvidar las unidades; en este caso como estamos hablando de calificaciones, serán puntos)
Ejemplo (N par)
Las calificaciones en la asignatura de Matemáticas de 38 alumnos de una clase viene dada por la
siguiente tabla (debajo):
Calificaciones | 1 |2 |3 |4 |5 |6 |7 |8 |9 |
Número de alumnos |2 |2 |4 |5 |6 |9 |4 |4 |2 |
xi | fi | Fi |
1 |2 |2 |
2 |2 |4 |
3 |4 |8 |
4 |5 | 13 |
5 |6 | 19 = 19 |
6 |9 | 28 |
7 |4 | 32 |
8 |4 | 36 |
9 |2 | 38 |
Calculemos la Mediana:
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho).
Si volvemos a utilizar la fórmula asociada a la mediana para n par, obtenemos X(38/2) = X19 y
basándonos en la fórmula que hace referencia a las frecuencias absolutas --> Ni-1< n/2 < Ni = N18
< 19 < N19
Con lo cual la mediana será la media aritmética de los valores de la variable que ocupen el
decimonoveno y el vigésimo lugar.
* Coeficiente de variación.
Exigimos que:
Se calcula:
Propiedades y aplicaciones
Depende de la desviación típica y en mayor medida de la media aritmética, dado que cuando esta
es 0 o muy próxima a este valor C.V. pierde significado, ya que puede dar valores muy grandes,
que no necesariamente implican dispersión de datos.
Amplitud
Para presentar lo que es la modulación en amplitud, comencemos con una etapa amplificadora,
donde la señal de entrada "Eo" se amplifica con una ganancia constante "A". En ese caso la salida
del amplificador, "Em", es el producto de A y Eo.
Supongamos ahora que la ganancia de la etapa amplificadora "A" es variable en función del
tiempo, entre 0 (cero) y un valor máximo, regresando a 0 (cero). Lo anterior significa, que la etapa
amplificadora multiplica el valor de entrada "Eo" por un valor diferente de "A" en cada instante. La
descripción efectuada en el proceso anterior, es lo que denominamos Modulación en Amplitud.
Por lo tanto, la modulación en amplitud es un proceso de multiplicación y se muestra en la
próxima figura. Al multiplicador lo podemos considerar también, como un dispositivo de ganancia
controlada por una tensión. En este caso, la entrada de control de ganancia corresponde con la
entrada "x". La forma de onda mostrada en la figura pertenece a un modulador balanceado; mas
adelante explicaremos esa denominación. En ella podemos observar que la envolvente de "Em",
tiene la misma forma que la señal de entrada "Es".
2.1.1. PROBABILIDAD
Mientras mas pequeña sea la desviación típica es más probable. Obtener un valorcercano a la
media, mientras mayor sea la desviación típica, es mas probable encontrar u obtener un valor a
cercano a la media, mientras mayor sea la desviación, es mas probable encontrar u obtener un
valor alejado de la media. Todo esto se resume de la sig. Forma:
Ejemplo
* Permutaciones
Permutaciones En n Objetos
Ejemplo
Los cinco individuos que componen la dirección de una pequeña empresa manufacturera serán
sentados juntos en un banquete. Determinar el número de diferentes posiciones posibles de los
asientos para los cinco individuos.
Solución
n Pn = n! = 5! = (5)(4)(3)(2)(1) = 120
nPr = n!
(n-r)!
* Combinaciones
Por lo tanto en las combinaciones se busca el número se subgrupos diferentes que pueden
tomarse a partir de n objetos.
nCr = n!
r! (n-r)!
Ejemplo
Supongamos que se elegirá a tres miembros de una pequeña organización social con un total de
diez miembros para que integren un comité. ¿Cuál es el número de grupos diferentes de tres
personas que pueden ser elegidos, sin importar el diferente orden en el que cada grupo podría
elegirse?
Solución
* Probabilidad.
Cuando las variables aleatorias tienen una varianza finita, el teorema central del límite extiende
nuestro entendimiento de la convergencia de su promedio describiendo la distribución de
diferencias estandarizadas entre la suma de variables aleatorias y el valor esperado de esta suma.
Sin importar la distribución subyacente de las variables aleatorias, esta diferencia estandarizada
converge a una variable aleatoria normal estándar.
En estadística se llama espacio muestral al conjunto de todos los posibles resultados individuales
de un experimento aleatorio. Se suele representar por ɏ.
Sus elementos se representan por letras minúsculas (w1,w2,...) y se denominan eventos o sucesos
elementales. Los subconjuntos de ɏ se designan por medio de letras mayúsculas (A,B,C,D,...) y se
denominan eventos o sucesos. Los sucesos representan los posibles resultados del experimento
aleatorio.
Particiones
Es posible definir particiones sobre el espacio muestral. Formalmente hablando, una partición
sobre ɏ se define como un conjunto numerable:
tal que
1.
2.
3.
Ejemplos
Por ejemplo, en el caso del experimento aleatorio "lanzar un dado", el espacio muestral del
experimento sería: ɏ={1,2,3,4,5,6}. Por otro lado, si cambiamos ligeramente la experiencia
pensando en el número resultante de la suma de 2 dados, entonces tenemos 2 espacios
muestrales:
ɏ={(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),...(6,6)} = {1,2,3,4,5,6}x{1,2,3,4,5,6}
ɏ'={2,3,4,...,12}
Unión
Para cada par de conjuntos A y B existe un conjunto Unión de los dos, que se denota como el cual
contiene todos los elementos de A y de B. De manera más general, para cada conjunto S existe
otro conjunto denotado como de manera que sus elementos son todos los tales que . De esta
manera es el caso especial donde .
Es claro que el hecho de que un elemento x pertenezca a es condición necesaria y suficiente para
afirmar que x es un elemento de A o al menos de B. Es decir
Entonces
Intersección n
Si dos conjuntos y son tales que , entonces y se dice que son conjuntos disjuntos.
Es claro que el hecho de que es condición necesaria y suficiente para afirmar que y . Es decir
* Postulados de la probabilidad.
Desde el punto de vista de la escuela lógica, todos los sistemas tienen en común la relación lógica
entre dos proposiciones q/p como relación indefinida (esto es, que sólo está definida por los
axiomas o postulados), que se lee ͞probabilidad de q dado p͟. Todo cuanto satisface a estos
axiomas será una interpretación de la probabilidad, y cabe esperar el que haya diversas
interpretaciones, por ejemplo, las de las axiomáticas de Keynes y Jeffreys, pero todas tienen el
mismo punto de arranque, y es la definición anteriormente expresada. Los axiomas o postulados
requeridos fueron recogidos por C.D. Broad (1920), y son los siguientes:
II. Los posibles valores de q/p son todos los números reales en el intervalo (0,1).
* Probabilidades y posibilidades.
Se habla muy comúnmente en sitios de apuestas, como en las autódromos o hipódromos, de que
"las apuestas a tal o cual participante es de x a y", es decir, que las posibilidades de que gane es de
x a y. Esta manera de expresarse se refiere al uso de razones.
Esto quiere decir que si la probabilidad de que un evento ocurra es p, entonces las posibilidades
de que ocurra son x a y, es decir
Por ejemplo: Si se tira un dado no trucado, sabemos que la probabilidad de obtener un cuatro es
1/6, es decir que la posibilidad de obtener un cuatro es de 1 a 6; pero se acostumbra decir que las
posibilidades en contra, esto es, de no obtener un cuatro es de 6 a 1. |
* Reglas de adicción
Regla especial de la adición. Establece que si dos eventos A y B son mutuamente excluyentes la
probabilidad de que uno u otro evento ocurra es igual a la suma de sus probabilidades. De lo
anterior se puede deducir que la probabilidad de que ocurra A más la probabilidad de que no
ocurra A debe sumar 1. A esto se le llama la regla del complemento. Esta regla establece que para
determinar la probabilidad de que ocurra un evento se puede restar de 1 la probabilidad de que
no ocurra.
ejemplo: Si A y B son dos eventos que no son mutuamente excluyentes, entonces P(A o B) se
calcula con la siguiente fórmula: P(A o B) = P(A) + P(B) - P(A y B) El Diagrama de Venn ilustra esta
regla
175 dijeron tener una TV y 100 dijeron tener ambos Si un estudiante es seleccionado
aleatoriamente, ¿cuál es la probabilidad de que tenga sólo un estéreo, sólo una TV y uno de cada
uno? P(S) = 320 /500 = .64. P(T) = 175 /500 = .35. P(S y T) = 100 /500 = .20.
* Probabilidad de condicional.
* Eventos independientes.
Ejemplo:
lanzar al aire dos veces una moneda son eventos independientes por que el resultado del primer
evento no afecta sobre las probabilidades efectivas de que ocurra cara o sello, en el segundo
lanzamiento.
* Reglas de la multiplicación.
* Teorema de bayes.
Teorema
Sea {A1,A2,...,Ai,...,An} un conjunto de sucesos mutuamente excluyentes y exhaustivos, y tales que
la probabilidad de cada uno de ellos es distinta de cero. Sea B un suceso cualquiera del que se
conocen las probabilidades condicionales P(B | Ai). Entonces, la probabilidad P(Ai | B) viene dada
por la expresión:
donde:
Esto se cumple
Por ejemplo, el valor esperado cuando tiramos un dado equilibrado de 6 caras es 3,5. Podemos
hacer el cálculo
y cabe destacar que 3,5 no es un valor posible al rodar el dado. En este caso, en el que todos los
sucesos son de igual probabilidad, la esperanza es igual a la media aritmética.
Una aplicación común de la esperanza matemática es en las apuestas o los juegos de azar. Por
ejemplo, la ruleta americana tiene 38 casillas equiprobables. La ganancia para acertar una apuesta
a un solo número paga de 35 a 1 (es decir, cobramos 35 veces lo que hemos apostado y
recuperamos la apuesta, así que recibimos 36 veces lo que hemos apostado). Por tanto,
considerando los 38 posibles resultados, la esperanza matemática del beneficio para apostar a un
solo número es:
que es -0,0526 aproximadamente. Por lo tanto uno esperaría, en media, perder unos 5 céntimos
por cada euro que apuesta, y el valor esperado para apostar 1 euro son 0.9474 euros. En el mundo
de las apuestas, un juego donde el beneficio esperado es cero (no ganamos ni perdemos) se llama
un "juego justo".
Nota: El primer paréntesis es la "esperanza" de perder tu apuesta de $1, por eso es negativo el
valor. El segundo paréntesis es la esperanza matemática de ganar los $35. La esperanza
matemática del beneficio es el valor esperado a ganar menos el valor esperado a perder.
LA TEORÍA DE LA DECISIÓN
Es un estudio formal sobre la toma de decisiones. Los estudios de casos reales, que se sirven de la
inspección y los experimentos, se denominan teoría descriptiva de decisión; los estudios de la
toma de decisiones racionales, que utilizan la lógica y la estadística, se llaman teoría preceptiva de
decisión. Estos estudios se hacen mas complicados cuando hay mas de un individuo, cuando los
resultados de diversas opciones no se conocen con exactitud y cuando las probabilidades de los
distintos resultados son desconocidas.
La toma de decisión es también un proceso durante el cual la persona debe escoger entre dos o
más alternativas. Todos y cada uno de nosotros pasamos los días y las horas de nuestra vida
teniendo que tomar decisiones. Algunas decisiones tienen una importancia relativa en el
desarrollo de nuestra vida, mientras otras son gravitantes en ella.
En los administradores, el proceso de toma de decisión es sin duda una de las mayores
responsabilidades. La toma de decisiones en una organización se circunscribe a una serie de
personas que están apoyando el mismo proyecto. Debemos empezar por hacer una selección de
decisiones, y esta selección es una de las tareas de gran trascendencia.
Con frecuencia se dice que las decisiones son algo así como el motor de los negocios y en efecto,
de la adecuada selección de alternativas depende en gran parte el éxito de cualquier organización.
Una decisión puede variar en trascendencia y connotación.
Para comprender de una manera mas amplia y rigurosa los tipos de variables, es necesario
conocer la definición de conjunto discreto. Un conjunto es discreto si está formado por un número
finito de elementos, o si sus elementos se pueden enumerar en secuencia de modo que haya un
primer elemento, un segundo elemento, un tercer elemento, y así sucesivamente.[3]
Variable aleatoria discreta: una v.a. es discreta si su recorrido es un conjunto discreto. La variable
del ejemplo anterior es discreta. Sus probabilidades se recogen en la función de cuantía (véanse
las distribuciones de variable discreta).
Se denomina distribución de variable discreta a aquella cuya función de probabilidad sólo toma
valores positivos en un conjunto de valores de X finito o infinito numerable. A dicha función se le
llama función de masa de probabilidad. En este caso la distribución de probabilidad es el
sumatorio de la función de masa, por lo que tenemos entonces que:
* Distribución binominal.
Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, sólo son posibles dos
resultados. A uno de estos se denomina éxito y tiene una probabilidad de ocurrencia p y al otro,
fracaso, con una probabilidad q = 1 - p. En la distribución binomial el anterior experimento se
repite n veces, de forma independiente, y se trata de calcular la probabilidad de un determinado
número de éxitos. Para n = 1, la binomial se convierte, de hecho, en una distribución de Bernoulli.
Para representar que una variable aleatoria X sigue una distribución binomial de parámetros n y p,
se escribe:
* La distribución hipergeometrica.
* La distribución de poisson.
Fue descubierta por Siméon-Denis Poisson, que la dio a conocer en 1838 en su trabajo Recherches
sur la probabilité des jugements en matières criminelles et matière civile (Investigación sobre la
probabilidad de los juicios en materias criminales y civiles).
Toda distribución de probabilidad es generada por una variable aleatoria x, la que puede ser de
dos tipos:
1. Variable aleatoria discreta (x). Se le denomina variable porque puede tomar diferentes
valores, aleatoria, porque el valor tomado es totalmente al azar y discreta porque solo puede
tomar valores enteros y un número finito de ellos.
Ejemplos:
x Variable que nos define el número de burbujas por envase de vidrio que son generadas en un
proceso dado.
Con los ejemplos anteriores nos damos cuenta claramente que los valores de la variable x siempre
serán enteros, nunca fraccionarios.
2. Variable aleatoria continua (x). Se le denomina variable porque puede tomar diferentes
valores, aleatoria, porque los valores que toma son totalmente al azar y continua porque puede
tomar tanto valores enteros como fraccionarios y un número infinito de ellos.
Es aquella que puede asumir cualquier valor en un intervalo específico; significa entonces que
entre cualquiera de dos valores que puede tomar la V. A. continua, existe un número infinito de
valores.
Naturaleza de la distribución de una variable continua
Consecuencias:
El polígono de frecuencias se aproxima a una curva suave que sirve para representar gráficamente
las distribuciones de probabilidad de una V. A. continua.
La frecuencia relativa (probabilidad para n ! ") de ocurrencia para los valores entre dos puntos
específicos del eje de las x, es igual área total delimitada por la curva, el eje de las abcisas y las
rectas perpendiculares levantadas sobre ambos puntos.
La probabilidad de cualquier valor específico de la variable es cero, por lo que sólo podremos
hablar de probabilidad dentro de intervalos.
El cálculo de probabilidad se basa en el cálculo integral del área bajo la curva entre dos puntos
cualesquiera del eje de abcisas, generándose la función de densidad de probabilidad.
* La distribución normal.
La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre (1667-
1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y
formuló la ecuación de la curva; de ahí que también se la conozca, más comúnmente, como la
"campana de Gauss". La distribución de una variable normal está completamente determinada
por dos parámetros, su media y su desviación estándar, denotadas generalmente por y . Con esta
notación, la densidad de la normal viene dada por la ecuación:
Ecuación 1: | |
que determina la curva en forma de campana que tan bien conocemos (Figura 2). Así, se dice que
una característica sigue una distribución normal de media y varianza , y se denota como , si su
función de densidad viene dada por la Ecuación 1.
Al igual que ocurría con un histograma, en el que el área de cada rectángulo es proporcional al
número de datos en el rango de valores correspondiente si, tal y como se muestra en la Figura 2,
en el eje horizontal se levantan perpendiculares en dos puntos a y b, el área bajo la curva
delimitada por esas líneas indica la probabilidad de que la variable de interés, X, tome un valor
cualquiera en ese intervalo. Puesto que la curva alcanza su mayor altura en torno a la media,
mientras que sus "ramas" se extienden asintóticamente hacia los ejes, cuando una variable siga
una distribución normal, será mucho más probable observar un dato cercano al valor medio que
uno que se encuentre muy alejado de éste.
El estudio detenido que acabamos de realizar, desde el punto de vista del análisis matemático, de
las distribuciones normales tipificadas y sin tipificar, nos permitirá aprovechar los conocimientos
que la ciencia estadística proporciona acerca de dicha distribución teórica de frecuencias para
obtener ciertas conclusiones de tipo cuantitativo, de gran aplicación en el análisis de la
uniformidad de las variables psicológicas que tendremos ocasión de llevar a cabo, por ejemplo, en
el Anexo 2.
Del mismo modo, en la página siguiente pueden verse expresadas, de manera conjunta las
diversas áreas existentes bajo una curva de distribución normal tipificada o no en función de las
unidades de desviación típica o ͞standard͟ que se adicionen a la media aritmética por el eje de
abscisas. Esto es:
En la siguiente tabla se presentan las áreas: (multiplicadas por 1.000) bajo la curva de distribución
normal. A saber:
a) Área total bajo la curva normal y probabilidad de que la variable psicológica tome un valor
cualquiera de su recorrido o campo de variación (de - ).a +
La simple observación de la tabla anterior nos dice que el área bajo la curva normal, desde 0 a 3'9,
toma el valor:
Por la simetría de la curva de Gauss, ésta es la mitad del área total, que vale la unidad. Por otra
parte, la probabilidad de que la variable psicológica en estudio x tome cualquier valor es la certeza
absoluta; por ello, su valor es la unidad, en virtud del axioma o postulado que reza que ͞la
probabilidad de un suceso cierto vale 1͟ (probabilidad total).
b) Área bajo la curva determinada por las ordenadas en los extremos de los intervalos (1, 2) y (-1, -
2). ¿Cuál es el valor de la probabilidad de que la variable psicológica x tome un valor comprendido
entre 1 y 2? ¿Y entre -2 y -1?
Según puede verse en la tabla anterior, las áreas bajo la curva comprendidas entre el eje de
ordenadas (x=0) y las ordenadas x=2 y x=1, son, respectivamente:
477 / 1.000 = 0'477 y 341 / 1.000 = 0'341 ;
que es también la probabilidad de que la variable psicológica x tome un valor comprendido entre 1
y 2, por la propiedad aditiva del intervalo de integración en las integrales definidas.
c) Intervalo (-a, a) cuyas ordenadas extremas delimiten el 50 por 100 del área total existente bajo
la curva normal y su expresión probabilística.
Hemos de encontrar ahora un valor x = a, tal que delimite hasta el eje de ordenadas el 25 por 100
del área total (por simetría, el intervalo [-a, 0] delimitará el otro 25 por 100).
Según la tabla, este valor comprendido entre x = 0'6 y x = 0'7, y las áreas respectivas, a saber,
0'226 y 0'258, incluyen la de valor 0'250 pedido.
De la proporción:
d) Valor de a tal que las colas (áreas a la izquierda de -a y a la derecha de +a) que existen bajo la
curva normal sumen el 5 por 100 del área total.
El área de cada cola debe medir el 2'5 por 100 del área total; entonces el valor de a ha de
satisfacer la condición:
Según la tabla, este valor de a está comprendido entre 1'9 y 2'0 y se puede estimar según la
proporción:
En la práctica, se suelen tomar los valores de -2 y 2 para definir la cola del 5 por 100, o lo que es
igual:
Habida cuenta de su interés para la realización de este tipo de cálculos dada la dificultad de
resolver integrales definidas de funciones de densidad normales como las que venimos estudiando
en el presente capítulo de nuestro libro, a continuación se presenta una tabla que ofrece las áreas
existentes bajo la curva normal tipificada, limitadas por la ordenada z = 0 y cualquier valor positivo
de z. A partir de esta misma tabla, se pueden encontrar las áreas comprendidas entre dos
ordenadas cualesquiera, utilizando la simetría de la curva de Gauss en relación al eje de ordenadas
z = 0. La tabla siguiente se refiere a las áreas hasta z. Por último, seexistentes bajo la curva normal
tipificada, desde - incluye también una tabla con los valores de las ordenadas (y) de la curva
normal tipificada para los diferentes valores de z.
Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma
de campana.
En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un mismo valor de p y
valores de n cada vez mayores, se ve que sus polígonos de frecuencias se aproximan a una curva
en "forma de campana".
Caracteres fisiológicos, por ejemplo; efecto de una misma dosis de un fármaco, o de una misma
cantidad de abono.
Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de
individuos, puntuaciones de examen.