Probabilidad y Estadística

PROBABILIDAD Y ESTADISTICA
Temario
Unidad 1. “Estadística Descriptiva”
Unidad 2. “Elementos de probabilidad”
Unidad 3. “Variables aleatorias discretas y continuas”
Unidad 4. “Estimación de parámetros estadísticos”
Bibliografía
TÍTULO: Probabilidad y Estadística para ingeniería y ciencias

AUTOR: Walpole, Ronald., Myers, Raymond H., Myers, Sharon L
AÑO: 2007
EDITORIAL O REFERENCIA: Pearson Educación
LUGAR Y AÑO DE LA EDICIÓN México, 2007
TÍTULO: Probabilidad y estadística para ingeniería y ciencias,

AUTOR: Devore, Jay L AÑO: 2008
EDITORIAL O REFERENCIA: Cengage Learning editores
TÍTULO: Estadística para ingenieros y científicos,

AUTOR: NAVIDI, William,
AÑO: 2006
EDITORIAL O REFERENCIA: Mc. Graw Hill
Introducción
El uso de modelos de probabilidad y métodos estadísticos

para analizar datos se ha convertido en una práctica común
en virtualmente todas las disciplinas científicas.
La estadística está ligada con los métodos científicos en la

toma, organización, recopilación, presentación y análisis de
datos, tanto para la deducción de conclusiones como para
tomar decisiones razonables de acuerdo con tales análisis.
Conceptos
La Estadística se define como el arte y la ciencia de reunir datos, analizarlos,

presentarlos e interpretarlos.
Datos son hechos/informaciones y cifras que recogen, analizan y resumen para su

presentación e interpretación.
A todos los datos reunidos para un determinado estudio se les llama conjunto de
datos para el estudio.
Elementos son las entidades de las que se obtienen los datos.
Una variable es una característica de los elementos que es de interés. Los valores
encontrados para cada variable en cada uno de los elementos constituyen los
datos. Al conjunto de mediciones obtenidas para un determinado elemento se le
llama observación.
El S&P consta de
500 empresas
elegidas por
Standard & Poor’s.
Estas empresas
representan 76% de
la capitalización de
mercado de todas
las acciones de
Estados Unidos. Las
acciones de S&P
500 son
estrechamente
observadas por los
inversionistas y por
los analistas de
Wall Street.
Datos cualitativos y cuantitativos
Los datos cualitativos comprenden etiquetas o nombres que se usan para identificar un
atributo de cada elemento.
Los datos cuantitativos requieren valores numéricos que indiquen cuánto o cuántos.
Variables Cualitativas. No se pueden medir numéricamente (por ejemplo: nacionalidad,

sexo, color de piel).
Variables Cuantitativas. Tienen valor numérico (edad, precio de un producto, ingreso
anual).
Por su parte las variables cuantitativas se pueden clasificar en “Discretas y Continuas”.
Variables Discretas. Sólo pueden tomar valores enteros.

Variables Continuas. Pueden tomar cualquier valor real dentro de un intervalo.
Clasificación de una variable estadística
Ejercicio
Unidad 1. ESTADISTICA DESCRIPTIVA
La mayor parte de la información estadística en periódicos, revistas, informes de empresas y

otras publicaciones, consta de datos que se resumen y presentan en una forma fácil de leer y
de entender. A estos resúmenes de datos, que pueden ser tabulares, gráficos o numéricos se
les conoce como estadística descriptiva.
La estadística descriptiva es la rama de las matemáticas que recolecta, presenta y

caracteriza un conjunto de datos con el fin de describir apropiadamente las diversas
características de ese conjunto.
Una de las principales contribuciones de la estadística es emplear datos de una muestra para
hacer estimaciones y probar hipótesis acerca de las características de una población
mediante un proceso al que se le conoce como inferencia estadística.
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes
conceptos:
Individuo: Cualquier elemento que aporte información sobre el fenómeno que se estudia.
Población: Conjunto de todos los individuos que aporten información sobre el elemento
que se estudia.
Muestra: Cualquier subconjunto de los elementos que forman la población.
Estadística descriptiva:
presentaciones tabulares y gráficas
Resumen de datos cualitativos
Distribución de frecuencia. Es un resumen tabular de datos que muestra el número de

elementos en cada una de las diferentes clases que no se sobreponen.
Al ordenar datos muy numerosos, es usual agruparlos en clases o categorías. Al determinar

cuantos pertenecen a cada clase, establecemos la frecuencia. Construimos así una tabla de
datos llamada tabla de frecuencias.
¿Para qué se construyen las tablas de frecuencias?
1. Ordenar
2. Agrupar
3. Resumir información
Tabla de frecuencias
El formato general de una tabla estadística, también llamada tabla de frecuencias es la
siguiente:
Nombre de la variable Frecuencia

Categorías o Frecuencias
Recorrido de la variable Observadas
TOTAL n
Distribuciones de frecuencia relativa y porcentual
Tipos de Frecuencias:
Frecuencia Absoluta: Es el número de veces que se presenta un valor o categoría de una

variable. Se representa por fi.
Frecuencia Relativa: Se puede expresar en términos de porcentaje o de proporción y se

representa por fr.
Distribuciones de frecuencia relativa y porcentual
En una distribución de frecuencia se aprecia el número (frecuencia) de los elementos de
cada una de las diversas clases que no se repiten.
Sin embargo, con frecuencia lo que interesa es la proporción o porcentaje de elementos en

cada clase. La frecuencia relativa de una clase es igual a la parte o proporción de los
elementos que pertenecen a cada clase. En un conjunto de datos, en el que hay n
observaciones, la frecuencia relativa de cada clase se determina como sigue:
La frecuencia porcentual de una clase es la frecuencia relativa multiplicada por 100.
Una distribución de frecuencia relativa da un resumen tabular de datos en el que se muestra

la frecuencia relativa de cada clase. Una distribución de frecuencia porcentual da la
frecuencia porcentual de los datos de cada clase.
En esta tabla se observa que la frecuencia relativa de la Coca Cola es 0.38. En la
distribución de frecuencia porcentual, se muestra que 38% de las ventas fue de Coca Cola
clásica
Ejercicio
Presentación de datos
La representación gráfica de los datos puede realizarse a través de las siguientes gráficas:
• Tabla de frecuencias
• Gráfico de barras
• Gráfico circular
• Histograma
•Gráfico de líneas
•Polígono de frecuencias
Gráficas de barra y gráficas de pastel
Una gráfica de barras o un diagrama de barras, es una gráfica para representar datos
cualitativos de una distribución de frecuencia, de frecuencia relativa o de frecuencia
porcentual.
La gráfica de pastel proporciona otra gráfica para presentar distribuciones de frecuencia

relativa y de frecuencia porcentual de datos cualitativos.
Ejemplo 1
Resumen de datos cuantitativos
Distribución de frecuencia. Es un resumen tabular de datos que muestra el número de

elementos en cada una de las diferentes clases que no se sobreponen. Esta definición es
válida tanto para datos cualitativos como cuantitativos. Sin embargo, cuando se trata de
datos cuantitativos se debe tener más cuidado al definir las clases que se van a usar en la
distribución de frecuencia.
Número de clases. Las clases se forman especificando los intervalos que se usarán para
agrupar los datos. Se recomienda emplear entre 5 y 20 clases. Cuando los datos son pocos,
cinco o seis clases bastan para resumirlos. Si son muchos, se suele requerir mas clases. La
idea es tener las clases suficientes para que se muestre la variación en los datos, pero no
deben ser demasiadas si algunas de ellas contienen sólo unos cuantos datos.
Número de clases = (3,32 * Log (n)) + 1

Ancho de clase. El segundo paso al construir una distribución de frecuencia para datos
cuantitativos es elegir el ancho de clases. Como regla general es recomendable que el ancho
sea el mismo para todas las clases. Así, el ancho y el número de clases no son decisiones
independientes. Entre mayor sea el numero de clases menor es el ancho de las clases y
viceversa. Para determinar el ancho de clase apropiada se empieza por identificar el mayor y
el menor de los valores de los datos. Después usando el número de clases deseado, se
emplea la expresión siguiente para determina el ancho aproximado de clase:
El ancho aproximado de clase que se obtiene se redondea a un valor más adecuado con las
preferencias de la persona que elabora la distribución de frecuencia.
En la práctica el número de clases y su ancho adecuado se determinan por prueba y error.
Una vez que se elige un determinado número de clases, se emplea la ecuación anterior para
determinar el ancho aproximado de clase.
Límites de clase. Los límites de clase deben elegirse de manera que cada dato pertenezca a
una y sólo una de las clases. El límite de clase inferior indica el menor valor de los datos a
que pertenece esa clase. El límite de clase superior indica el mayor valor de los datos a que
pertenece esa clase.
Tabla de frecuencias de datos agrupados. En ocasiones, al agrupar los datos en
intervalos, nos puede ayudar para realizar un mejor análisis de ellos.
Marca de clase: Representante de un intervalo, y corresponde al promedio entre los

extremos de éste.
Frecuencia Absoluta acumulada: Corresponde a la frecuencia absoluta del intervalo más

la suma de las frecuencias absolutas de todos los valores anteriores.
Frecuencia Relativa acumulada: Corresponde al porcentaje de la frecuencia relativa del

intervalo más la suma de las frecuencias relativas de todos los valores anteriores.
Ejemplo: Número de clases = 5
Límite de clases = 4
Ejemplo:
En la siguiente tabla se presenta el motivo de la consulta médica, durante una semana en un
consultorio particular. Ampliar la tabla con frecuencias relativa, porcentual, absoluta
acumulada y porcentual acumulada.
Motivo Consulta Número de pacientes

Bronquitis 19
Gripa común 13
Heridas 7
Fracturas 18
Vacunas 20
Total 77
Ejemplo:
Los siguientes datos corresponden a las notas obtenidas por un curso de 24 alumnos en un
trabajo de matemáticas.
3.2 4.2 5.6 6.0 2.8 3.9 4.2 4.2 5.0 5.0 3.9 3.9 3.2 3.2
4.2 5.6 6.0 6.0 3.2 6.0 4.2 5.0 5.6 5.0
Ordenemos estos datos en una tabla con lo siguiente:

•Nombre de la variable: (Notas)
•Frecuencia Absoluta
•Frecuencia Relativa
•Frecuencia porcentual
•Frecuencia absoluta acumulada
•Frecuencia porcentual acumulada
Ejemplo:
Notas fi fr f% fiA fr%A

2.8 1 0.04 4 1 4
3.2 4 0.17 17 5 21
3.9 3 0.12 12 8 33
4.2 5 0.21 21 13 54
5.0 4 0.17 17 17 71
5.6 3 0.12 12 20 83
6.0 4 0.17 17 24 100
24
Ejemplo de datos agrupados con intervalo
Sueldo ($) Marca de frecuencia Frecuencia Frecuencia Frecuencia
Clase Absoluta Relativa % Absoluta Relativa
Acumulada Acumulada %
200,000 – 300,000
300,000 – 400,000
400,000 – 500,000
500,000 – 600,000
600,000 – 700,000
700,000 – 800,000
Ejemplo de datos agrupados con intervalo
Sueldo ($) Marca de frecuencia Frecuencia Frecuencia Frecuencia
Clase Absoluta Relativa % Absoluta Relativa
Acumulada Acumulada %
200,000 – 300,000 250,000 5 25 5 25
300,000 – 400,000 350,000 4 20 9 45
400,000 – 500,000 450,000 4 20 13 65
500,000 – 600,000 550,000 3 15 16 80
600,000 – 700,000 650,000 2 10 18 90
700,000 – 800,000 750,000 2 10 20 100

Construir la tabla de frecuencias para los siguientes datos:
Los pesos de 65 empleados de una fábrica son los siguientes:
Ejercicio
Peso fi fr% fiA frA
(50-60) 8 12 8 12
(60-70) 10 15 18 27
(70-80) 16 25 34 52
(80-90) 14 22 48 74
(90-100) 10 15 58 89
(100-110) 5 8 63 97
(110-120) 2 3 65 100
Histograma
Una presentación gráfica usual para datos cuantitativos es el histograma. Esta gráfica se
hace con datos previamente resumidos mediante una distribución de frecuencia. A
diferencia de las gráficas de barras, en un histograma no hay separación natural entre los
rectángulos de clases adyacentes.
Polígono de frecuencias
Es el gráfico creado a partir de un histograma de frecuencia. El polígono de frecuencias es

realizado uniendo los puntos de mayor altura de estas columnas. Es decir, se forma a partir
de la unión de los puntos medios de las cimas de las columnas que configuran el histograma
de frecuencia. Se caracteriza porque utiliza columnas verticales y no hay espacio entre las
columnas.
Ejemplos
Medidas de resumen
Sirven para describir en forma resumida un conjunto de datos que constituyen una muestra
tomada de alguna población.
Podemos distinguir cuatro grupos de medidas de resumen:
• Medidas de Tendencia Central

• Medidas de Posición
• Medidas de Dispersión
• Medidas de Forma
Medidas de Tendencia Central
Son categorías o puntos del recorrido de la variable que nos ayudan a localizar valores
centrales en un conjunto de datos.
Existen diversos indicadores de este tipo, las principales son:
Media.-Valor promedio de una variable, es la suma de un conjunto de cantidades dividida

entre el número de ellas. Proporciona una medida de localización central de los datos.
Mediana.- Es el punto dentro del recorrido de una variable que supera a no más de la mitad
de los datos y es superado por no más de la otra mitad.
Moda.- Es el dato de variable que aparece más veces en una distribución.

Media.-
Es el promedio de un conjunto de números, es llamada también media aritmética o valor
medio, se representa de la siguiente manera:
Media poblacional Media muestral
Media para datos

agrupados
Ejemplo 1: La media aritmética de los números 8, 3, 5, 12, 10 es…
Respuesta: 7.6
Ejemplo 2: Si 5, 8, 6 y 2 se presentan con frecuencias 3, 2, 4 y 1 respectivamente, la media

aritmética es…
Respuesta: 5.7
Media de los sueldos:

$3,540 Media de los días de
auditoría: 19
Mediana.-
La mediana de una colección de datos ordenados en orden de magnitud es el valor medio o
la media aritmética de los dos valores medios.
1. Ordenar los datos de menor a mayor (en forma ascendente)

2. Si el número de observaciones es impar, la mediana es el valor de en medio. Es decir, la
mediana es el valor que ocupa la posición (n+1)/2
3. Si el número de observaciones es par, la mediana es el promedio de las dos
observaciones de en medio. Es decir, los dos datos que están en el centro de la muestra
ocupan las posiciones n/2 y (n/2)+1. La suma de estos dos puntos se divide entre dos.
Si los datos se encuentran ordenados en tabla de frecuencia, se utiliza el mismo

procedimiento anterior y posteriormente la siguiente fórmula en caso que n sea par:
Para esto, se deberá contar

con la tabla de frecuencia
absoluta acumulada, ya que
es la posición que ocupa la
mediana.
Calculo de la Mediana para datos agrupados en intervalos.-
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad

de la suma de las frecuencias absolutas, es decir, se busca en el intervalo en el que se
encuentre N/2 y se calcula con la siguiente fórmula:
Donde:
Li = límite inferior de la clase donde se encuentra la mediana
N/2 = es la semisuma de las frecuencias absolutas
Fi-1= es la frecuencia acumulada anterior a la clase mediana
fi = es la frecuencia absoluta del intervalo mediano
ti = es la amplitud de los intervalos. Se calcula restando el extremo superior menos el
inferior del intervalo
Ejemplos
Sean los números 3,4,4,5,6,8,8,8,10 su mediana es 6.
Sean los números 5,5,7,9,11,12,15,18 su mediana es el promedio de los dos datos centrales,
por lo tanto es 10.
Sueldo ($) Marca de frecuencia Frecuencia N/2 = 20/2 = 10

Clase Absoluta Absoluta
Acumulada
200,000 – 300,000 250,000 5 5
300,000 – 400,000 350,000 4 9
400,000 – 500,000 450,000 4 13
500,000 – 600,000 550,000 3 16
600,000 – 700,000 650,000 2 18
700,000 – 800,000 750,000 2 20

Moda.-
La Moda de una serie de números es aquel valor que se presenta con la mayor frecuencia, es
decir, es el valor más común. La moda puede no existir, incluso si existe puede no ser única.
Ejemplo:
El sistema 2,2,5,7,9,9,9,10,10,11,12,18 tiene moda 9
El sistema 3,5,8,10,12,15,16 no tiene moda
El sistema 2,3,4,4,4,5,5,7,7,7,9 tiene dos modas, 4 y 7 y se llama bimodal
Una distribución que tiene una sola moda se llama unimodal.

Moda para datos agrupados en intervalos.-
En tablas de frecuencias con datos agrupados hablaremos de intervalo modal. La moda se

representa por Mo.
Donde:
Li = extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia absoluta)
fi = frecuencia absoluta del intervalo modal
fi-1 = frecuencia absoluta del intervalo anterior al modal
fi+1 = frecuencia absoluta del intervalo posterior al modal
ti = amplitud de los intervalos
Ejemplos:
Calcular la media, moda y mediana de los siguientes datos:
xi 61 64 67 70 73
fi 5 18 42 27 8
Ejemplos:
Calcular la media, moda y mediana de los siguientes datos:
Media: xi 61 64 67 70 73
= (61)(5) + (64)(18) + (67)(42) + (70)(27) + (73)(8)

fi 5 18 42 27 8
100
= 6745 / 100 = 67.45
Moda: 67
Mediana: 67
Ejercicio:
Con los siguientes datos realiza una tabla de frecuencias con datos agrupados y calcula la
media, la mediana y la moda:
5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4.
Media: 4.8
Moda: 5
Mediana: 5
Xi Fi Fr (%) FiA FrA
2 2 10 2 10
3 2 10 4 20
4 5 25 9 45
5 6 30 15 75
6 2 10 17 85
8 3 15 20 100
Total 20 100
8,900,000
Sueldo ($) Marca de fi fiA fr% frA xifi 20
Clase
Xi
N/2 = 20/2 = 10
200,000 – 300,000 250,000 5 5 25 25 1,250,000
300,000 – 400,000 350,000 4 9 20 45 1,400,000
400,000 – 500,000 450,000 4 13 20 65 1,800,000
500,000 – 600,000 550,000 3 16 15 80 1,650,000
600,000 – 700,000 650,000 2 18 10 90 1,300,000
700,000 – 800,000 750,000 2 20 10 100 1,500,000
8,900,000
Medidas de Posición
Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de
individuos. Para calcular las medidas de posición es necesario que los datos estén ordenados
de menor a mayor.
Las medidas de posición son:

• Cuartiles
• Deciles
• Percentiles
Cuartiles.-
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.
Q2 coincide con la mediana.
Deciles.-
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los
deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D 5
coincide con la mediana.
Percentiles.-
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los
percentiles dan los valores correspondientes al 1%, al 2%... Y al 99% de los datos. P 50
coincide con la mediana.
Medidas de Dispersión
Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los
valores de la distribución respecto al valor central.
Las medidas de dispersión que estudiaremos son:
• Rango
• Varianza
• Desviación
Rango.-
El rango de un conjunto de números es la diferencia entre el mayor y el menor de ellos.
Ejemplo:
El rango de los números 2, 3, 3, 5, 5, 5, 8, 10, 12
es 12-2 = 10
Varianza.-
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de
una distribución estadística.
La varianza es una medida de variabilidad que utiliza todos los datos.

La varianza sirve para comparar la variabilidad de dos o más variables.
La varianza poblacional se representa por σ2.

La varianza muestral se representa por S2.
Se calcula de la siguiente manera:
Varianza muestral para datos agrupados: Varianza poblacional para datos agrupados:
Ejemplo:
Xi
σ2= 11.75
19
27
20
22
S2= 13.43
18
21
27
18
Media = 21.5
s2= 27,440.91
Ejemplo Datos Agrupados:
X = 43.33
Desviación estándar.-
Se define como la raíz cuadrada de la varianza. La desviación estándar es una medida
cuadrática que informa de la media de distancias que tiene los datos respecto a su media
aritmética. La desviación estándar se mide en las mismas unidades que los datos originales.
Se calcula de la siguiente manera:
Desviación estándar muestral para datos agrupados

Ejemplo:
Xi σ2= 11.75
19
σ = 3.427
27
20
22 S2= 13.43
18
S = 3.664
21
27
18
Media = 21.5
s2= 27,440.91
s= 165.65
Ejemplo Datos Agrupados:
S2=223.98
S=14.96
Medidas de Forma
Los medidas de forma permiten comprobar si una distribución de frecuencia tiene
características especiales como simetría, asimetría, nivel de concentración de datos y nivel
de apuntamiento que la clasifiquen en un tipo particular de distribución. Se divide en dos
opciones:
• Sesgo
• Curtosis
Medidas de Forma
Sesgo.-
Es el grado de simetría o asimetría de una distribución.
Fórmula para calcular el sesgo de datos muestrales es:

Ejemplo sesgo:
Medidas de Forma
Curtosis.-
Es la agudeza de la curva normal, esta agudeza puede ser alta, baja o intermedia dando lugar
a diferentes tipos de curvas como las que a continuación se describen:
Medidas de Forma
Puntos z.-
Las medidas de localización relativa ayudan a determinar qué tan lejos de la media se
encuentra un determinado valor. A partir de la media y la desviación estándar, se puede
determinar la localización relativa de cualquier observación. Para cada valor xi existe otro
valor llamado punto z.
La siguiente ecuación permite calcular el punto z correspondiente a cada xi:

Medidas de Forma
Ejemplo punto z:
Teorema de Chebyshev
El teorema de Chebyshev permite decir que proporción de los valores que se tienen en los
datos debe estar dentro de un determinado número de desviaciones estándar de la media.
Teorema de Chebyshev
Ejemplo:
Suponga que en las calificaciones obtenidas por 100 estudiantes en un examen de estadística para
la administración, la media es 70 y la desviación estándar es 5. ¿Cuántos estudiantes obtuvieron
puntuaciones entre 60 y 80?, ¿y cuántos tuvieron puntuaciones entre 58 y 82?
En el caso de las puntuaciones entre 60 y 80 observe que 60 está dos desviaciones estándar
debajo de la media y que 80 está dos desviaciones estándar sobre la media. Mediante el teorema
de Chebyshev encuentre que por lo menos 0.75, o por lo menos 75%, de las observaciones deben
tener valores dentro de dos desviaciones estándar de la media. Así que por lo menos 75% de los
estudiantes deben haber tenido puntuaciones entre 60 y 80.
En el caso de las puntuaciones entre 58 y 82, se encuentra que (58-70)/5= -2.4, por lo que 58 se
encuentra 2.4 desviaciones estándar debajo de la media, y que (82/70)/5=+2.4, entonces 82 se
encuentra 2.4 desviaciones sobre la media. Al aplicar el teorema de Chebyshev con z=2.4, se
tiene:
Por lo menos 82.6% de los estudiantes deben tener puntuaciones entre 58 y 82.
Regla empírica
Una de las ventajas del teorema de Chebyshev es que se aplica a cualquier conjunto de
datos, sin importar la forma de la distribución de los datos. Sin embargo, para aplicar la
regla empírica, los datos deben tener una distribución aproximadamente normal para
determinar el porcentaje de los valores de los datos que deben encontrarse dentro de un
determinado número de desviaciones estándar de la media.
Ejemplo:
Los envases con detergente líquido se llenan
en forma automática en una línea de
producción. Los pesos de llenado suelen
tener una distribución en forma de campana.
Si el peso medio de llenado es de 16 onzas y
la desviación estándar de 0.25 onzas, la
regla empírica es aplicada para sacar las
conclusiones siguientes:

Probabilidad y Estadística

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Probabilidad y Estadística

Uploaded by

Copyright:

Available Formats

PROBABILIDAD Y ESTADISTICA

TÍTULO: Probabilidad y Estadística para ingeniería y ciencias

TÍTULO: Probabilidad y estadística para ingeniería y ciencias,

TÍTULO: Estadística para ingenieros y científicos,

El uso de modelos de probabilidad y métodos estadísticos

La estadística está ligada con los métodos científicos en la

La Estadística se define como el arte y la ciencia de reunir datos, analizarlos,

Datos son hechos/informaciones y cifras que recogen, analizan y resumen para su

Elementos son las entidades de las que se obtienen los datos.

Variables Cualitativas. No se pueden medir numéricamente (por ejemplo: nacionalidad,

Por su parte las variables cuantitativas se pueden clasificar en “Discretas y Continuas”.

Variables Discretas. Sólo pueden tomar valores enteros.

La mayor parte de la información estadística en periódicos, revistas, informes de empresas y

La estadística descriptiva es la rama de las matemáticas que recolecta, presenta y

Distribución de frecuencia. Es un resumen tabular de datos que muestra el número de

Al ordenar datos muy numerosos, es usual agruparlos en clases o categorías. Al determinar

¿Para qué se construyen las tablas de frecuencias?

Nombre de la variable Frecuencia

Frecuencia Absoluta: Es el número de veces que se presenta un valor o categoría de una

Frecuencia Relativa: Se puede expresar en términos de porcentaje o de proporción y se

Sin embargo, con frecuencia lo que interesa es la proporción o porcentaje de elementos en

La frecuencia porcentual de una clase es la frecuencia relativa multiplicada por 100.

Una distribución de frecuencia relativa da un resumen tabular de datos en el que se muestra

La gráfica de pastel proporciona otra gráfica para presentar distribuciones de frecuencia

Distribución de frecuencia. Es un resumen tabular de datos que muestra el número de

Número de clases = (3,32 * Log (n)) + 1

Marca de clase: Representante de un intervalo, y corresponde al promedio entre los

Frecuencia Absoluta acumulada: Corresponde a la frecuencia absoluta del intervalo más

Frecuencia Relativa acumulada: Corresponde al porcentaje de la frecuencia relativa del

Motivo Consulta Número de pacientes

Ordenemos estos datos en una tabla con lo siguiente:

Notas fi fr f% fiA fr%A

200,000 – 300,000 250,000 5 25 5 25

300,000 – 400,000 350,000 4 20 9 45

400,000 – 500,000 450,000 4 20 13 65

500,000 – 600,000 550,000 3 15 16 80

600,000 – 700,000 650,000 2 10 18 90

700,000 – 800,000 750,000 2 10 20 100

Los pesos de 65 empleados de una fábrica son los siguientes:

Es el gráfico creado a partir de un histograma de frecuencia. El polígono de frecuencias es

Podemos distinguir cuatro grupos de medidas de resumen:

• Medidas de Tendencia Central

Existen diversos indicadores de este tipo, las principales son:

Media.-Valor promedio de una variable, es la suma de un conjunto de cantidades dividida

Moda.- Es el dato de variable que aparece más veces en una distribución.

Media poblacional Media muestral

Media para datos

Ejemplo 2: Si 5, 8, 6 y 2 se presentan con frecuencias 3, 2, 4 y 1 respectivamente, la media

Media de los sueldos:

1. Ordenar los datos de menor a mayor (en forma ascendente)

Si los datos se encuentran ordenados en tabla de frecuencia, se utiliza el mismo

Para esto, se deberá contar

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad

Sueldo ($) Marca de frecuencia Frecuencia N/2 = 20/2 = 10

200,000 – 300,000 250,000 5 5

300,000 – 400,000 350,000 4 9

400,000 – 500,000 450,000 4 13

500,000 – 600,000 550,000 3 16

600,000 – 700,000 650,000 2 18

700,000 – 800,000 750,000 2 20

Una distribución que tiene una sola moda se llama unimodal.

En tablas de frecuencias con datos agrupados hablaremos de intervalo modal. La moda se

= (61)(5) + (64)(18) + (67)(42) + (70)(27) + (73)(8)

= 6745 / 100 = 67.45