Apuntes de clases-ESTADIST-1

CURSO: ESTADISTICA I
DR. GINO PERONCINI

gperonci@unap.cl
UNIDAD I: ESTADÍSTICA DESCRIPTIVA
Estadística es la ciencia que utilizando las matemáticas y de modo particular el

cálculo estudia las leyes de comportamiento de aquellos fenómenos que no estando
sometidos a leyes rígidas dependen del azar y basándose en ella, se predicen resultados.
La estadística tiene dos grandes ramas: Descriptiva e Inferencial.
- Estadística Descriptiva analiza las características de una población o muestra

definiéndose unas propiedades acerca de su estructura y composición.
- Estadística Inferencial basándose en los resultados obtenidos de una muestra

induce o estima las leyes reales de comportamiento de la población de la que
proviene dicha muestra.
- Población son todos y cada uno de los elementos que se quieren analizar.
Puede ser finita o infinita (en realidad las poblaciones infinitas no existen, pero
cuando se trata de un número grande se trata como si lo fuera).
- Muestra es un subconjunto de la población o parte de la población que se

observa.
- Característica de una población es la propiedad que se estudia.
- Variables es cualquier característica cuantitativa (tome valor numérico) de una

población.
Ejemplo: Población Estudiantes de Económicas de Antofagasta, Característica Edad de

ellos, la característica se designa con letras mayúsculas X, Y, Z,...., los valores de esas
edades son numéricos entonces es una variable cuantitativa y los valores que toman se
denotarían X={x1, x2, x3,........xn }.
- Dominio de la variable son los valores que toma
- Recorrido de la variable es la diferencia entre el valor mayor y el menor de los

que toma la variable.
Profesor: Gino Peroncini. Magister en Estadísticas

- Variable Discreta cuando toma un número finito de valores o bien cuando toma
infinitos y son numerables es decir entre dos no hay otro intermedio. Ejemplo:
numero de hijos, n. trabajadores, numero de cargas, camioneta
- Variable continúa cuando entre dos valores cualesquiera siempre puede haber
otro. Ejemplo: peso, edad,
- Variable unidimensional Estudia solo una característica de la población.

Ejemplo: Estudiar el peso (X)
- Variable bidimensional Estudia dos características de una población. Ejemplo

Estatura(X) y peso (Y)
- Variable multidimensional estudiaría infinitas características
- Atributos son características de la población no susceptibles de cuantificación

numérica. Ejemplo.: Color del pelo, los atributos se designan con letras A, B,
C, .......y sus valores A={a1, a2, .............., an}.
En Economía son muchos más importantes las variables (toman valor numérico))
que los atributos.
ETAPAS DEL ANÁLISIS ESTADÍSTICO

1) Recogida de Datos
2) Ordenación de los mismos en tablas
3) Resumen de la información recogida a través de las medidas(Descriptiva)
4) Analizar los datos provenientes de una muestra para sacar conclusiones sobre la
población de la que proviene la muestra (Inferencial).
ESCALAS DE MEDIDA
- Escala nominal la característica estudiada se clasifica en una serie de

características numéricas y mutuamente excluyentes y no se puede establecer
ningún orden entre ellos.
- Escala ordinal el carácter medido no es numérico pero puede establecerse

algún tipo de orden. Ejemplo estudios de una persona.
- Escala de intervalos la característica puede cuantificarse numéricamente,

estableciéndose intervalos entre dos operaciones. Ejemplo: Renta mensual que
percibe una persona.

ANÁLISIS ESTADÍSTICO DE DISTRIBUCIONES UNIDIMENSIONALES
- Distribución unidimensional está formada por los valores que toma la variable
que se estudia acompañados de sus respectivas frecuencias.
- Frecuencia absoluta ( fi ) es el número de veces que se repite un determinado

valor.
- Frecuencia relativa ( hi) es el cociente entre la frecuencia absoluta y el número

total de observaciones, por tanto la frecuencia relativa está siempre entre cero
y uno.
- Frecuencia absoluta acumulada es decir se suman las frecuencias
anteriores a un valor dado, por tanto la acumulada al final coincide con la

población N.
- Distribución por datos no agrupados es cuando se especifican todos y cada uno

de los valores de la variable.
- Distribución por datos agrupados los valores de la variable se miden en

intervalos, la amplitud del intervalo es la diferencia entre el extremo superior e
inferior del intervalo y la suma de las amplitudes de todos los intervalos es igual
al recorrido (diferencia entre el valor mayor y el menor de la distribución).
- Marca de clase de un intervalo es la semisuma de los extremos del intervalo y
es el valor que sustituye a todo el intervalo siendo el intervalo
[li-1 , li ].
Tablas de frecuencias
Qué es una tabla de frecuencias

La tabla de frecuencias es una tabla donde los datos estadísticos aparecen bien
organizados, distribuidos según su frecuencia, es decir, según las veces que se repite en la
muestra.
En esta tabla se representan los diferentes tipos de frecuencias, ordenados en columnas.

La tabla de frecuencias es una herramienta que permite la realización de los gráficos o
diagramas estadísticos de una forma más fácil.

Tipos de frecuencias
Antes de aprender a construir una tabla de frecuencias, debemos conocer los tipos de
frecuencias que existen y cómo se calcula cada una de ellas. Existen frecuencias absolutas
y relativas, así como frecuencias absolutas y relativas acumuladas.
Vamos a ver cada una de ellas más despacio:
Frecuencia absoluta
La frecuencia absoluta es el número de veces que un dato se repite dentro de un conjunto de

datos. Se representa como fi, donde la «i» corresponde al número de dato.
La forma de obtener la frecuencia absoluta no es otra que contando las veces que aparece el
dato en el conjunto de datos.
La suma de las frecuencias absolutas corresponde al número total de datos, representado
por la letra N:
Frecuencia relativa
La frecuencia relativa de un dato es el número que se repite ese dato en relación al número
total de datos, o en otras palabras, es la proporción de veces que aparece ese dato con
respecto al total.
Se representa como «ni», siendo «i» el número de dato. y se calcula dividiendo la
frecuencia absoluta de cada dato entre el número total de datos:
El valor de la frecuencia relativa siempre va a estar entre 0 y 1. El valor obtenido está en

tanto por uno, pero lo podemos expresar en tanto por ciento si lo multiplicamos por 100.
La suma de todas las frecuencias relativas de todos los datos de la muestra es igual a 1
(cuando se expresa en tanto por 1, que es lo más común):
Frecuencia absoluta acumulada
La frecuencia absoluta acumulada es la suma de las frecuencias absolutas que se va

acumulando hasta ese dato, es decir, la frecuencia absoluta acumulada de un dato en
concreto se obtiene sumando su frecuencia absoluta a las frecuencias absolutas de los datos
que son menores que él.

Se representa como «Fi», donde «i» es el número de dato.
Se calcula sumando la frecuencia absoluta de un dato más la frecuencia absoluta del dato
anterior. Por tanto, la frecuencia absoluta acumulada del primer dato coincide con su
frecuencia absoluta y la frecuencia absoluta acumulada del último dato coincide con
el número total de datos.
Frecuencia relativa acumulada
La frecuencia relativa acumulada es el mismo concepto que para la frecuencia absoluta
acumulada.
Se representa como «Ni», donde la «i» es el número de dato y se puede obtener como el
cociente entre la frecuencia absoluta acumulada para cada dato entre el número de datos
totales:
O también, como la suma de la frecuencia relativa de un dato más la frecuencia relativa del
dato anterior. Así que, la frecuencia relativa acumulada del primer dato coincide con su
frecuencia relativa y la frecuencia relativa acumulada es igual a 1.
UNIDAD II: MEDIDAS DE RESUMEN
MEDIDAS DE POSICIÓN
Se trata de resumir la información en un único número.

Las medidas de posición pueden ser:
 De tendencia central o promedios
1. Media
2. Mediana
3. Moda

 De tendencia no central (dispersión)
1. Cuantiles.
Las medidas de posición tienen que cumplir que intervengan todos los valores de la
variable, que se puedan calcular y que su valor sea único para cada distribución de
frecuencias.
1.- MEDIA
La media puede ser:

 Aritmética simple o ponderada
 Media Cuadrática
 Media Geométrica
 Media Armónica
Media aritmética simple
Se suman de todos los valores de la variable y dividida todo ello por el número total de
observaciones
= media (promedio) es un estadistico
Datos sueltos
Ejemplo : 2,4,5,6
=( ) = (x1 +x2+x3+x4)/4 = (2+4+5+6)/4 = 17/4= 4.25 es la media (promedio)
Números de hijos 0 x1 1 x2 2 x3
Frecuencia 6 f1 4 f2 2 f3
000000
1111
22
Media para tabla de frecuencias
=( ) = (f1*x1+f2*x2+f3*x3)/12 = (0*6+1*4+2*2/12 = 8/12 = 0.66
La media aritmética es siempre el centro de gravedad de la distribución y es

siempre un valor que entra dentro del campo de variación de la variable.
Si los datos están agrupados en intervalos se toma la marca de clase de cada intervalo
para su cálculo.

Propiedades
1.- Cuando a los valores de la variable se les suma una constante, la nueva media
es la antigua más la constante.
Demostración
Puesto que la suma de las

fi es N.
2.- Si a los valores de la variable se les multiplica por una constante, la nueva
media es la antigua multiplicada por la constante.
Demostración
3.- Como consecuencia de las dos anteriores si a los valores de una variable se les
multiplica por constante y se les suma un número, la media aritmética queda
multiplicada por la constante y sumado el número.
Es decir si:
4.- La media aritmética se puede hacer siempre con variables cuantitativas y es

perfecta, pero tiene un inconveniente que es que si los valores son muy extremos
(desviados del resto), puede desvirtuarse la situación y hacerla poco
representativa, debido a este problema, a veces se hace la media truncada que es
quitar los extremos y hacer la media de los que quedan.
Media Aritmética ponderada
Es igual que la media aritmética simple, pero se pondera cada valor de la variable
por un coeficiente distinto de la frecuencia absoluta.

Media para datos agrupados en intervalos
= marca de clase con la mayor frecuencia
= frecuencia de la clase
= desviación de la clase
= cantidad total de datos =
= amplitud de la clase =
2.- MEDIANA
Es el valor de la variable que ocupa el lugar central de la distribución, es decir el valor de la

variable que deja el 50% de observaciones hacia la izquierda y el 50% a la derecha.
Para poder hallar la mediana, lo primero que hay que hacer es ordenar los valores de la
variable de forma creciente, y escribir los valores de las frecuencias acumuladas F i.
Distinguiremos dos casos, datos no agrupados y datos agrupados.
Para datos no agrupados
Datos sueltos
Ejemplo:
3, 5, 7, 9, 10, 12 , 3, 5,7
la mediana = 10
3,4,5,7,9,10,5,8 =7y9 8 la mediana

Se calcula primero el 50% de la población N/2, se lleva ese valor a la columna de
frecuencias absolutas acumuladas.
 Si el valor no está en la columna de acumuladas, se toma como valor de la mediana

el de la variable correspondiente al siguiente.
 Si el valor si está en la columna de acumuladas, se toma como mediana la media

aritmética del valor de la variable y el siguiente.
Para datos agrupados
= Límite inferior donde se encuentra la mediana
= número de datos
= frecuencia acumulada mediana

= frecuencia anterior a la frecuencia mediana
3.- MODA

Es el valor de la variable que más veces se repite. En algunos casos existen varias modas,
pero normalmente es una, si son dos se llama bimodal.
Para datos no agrupados
Ejemplo:
24278944
=2
= 2 y 4 bimodal
La moda es el valor de la variable correspondiente a la mayor frecuencia absoluta.
Para datos agrupados en intervalos
Se halla la densidad de frecuencia de cada uno de los intervalos (di) y el de mayor

densidad de frecuencia se selecciona como intervalo modal, para determinar el valor de la
Moda, se aplica la siguiente fórmula, basada en la proporcionalidad:
Li= limite donde se encuentra la frecuencia modal

fi = frecuencia modal
fi-1 = la frecuencia anterior a la frecuencia modal
fi+1 = la frecuencia posterior a la frecuencia modal
a = amplitud del intervalo de clases
Si los intervalos tienen todas las mismas amplitudes el intervalo modal es el de mayor
frecuencia absoluta.
CUANTILES
Son medidas de posición que no tiene porqué ser central. Hay varios tipos de cuantiles:

1.- Cuartiles Son valores de la variable que dividen a la distribución en cuatro partes
iguales, por lo tanto los cuartiles son tres C1 que deja por detrás de él al 25% de la
población, C2 que divide a la población en dos partes iguales y C3 que deja dtrás de él al
75% de la población.
2.- Deciles Son valores e la variable que dividen a la distribución en diez partes iguales, por
lo tanto los deciles son nueve, D1 deja al 10% antes, D2 al 20% y así sucesivamente hasta D9
que deja al 90% antes y al 10% después de él.
3.- Percentiles.- Son valores de la variable que dividen a la distribución en cien partes
iguales, por lo tanto los percentiles son 99.
Percentiles P deciles D cuartiles Q
P1
P2
P3
P10…………………………….D1
P25…………………………………………………………….Q1
P30……………………………..D3
P50……………………………..D5……………………………Q2
P60…………………………….D6
P75……………………………………………………………..Q3
P100………………………….D10…………………………….Q4

En realidad tanto cuartiles como deciles se calculan con el correspondiente percentil.
D1= P10 D9 = P90 Q1 = P25 Q2 = D5 = P50 = ME .
Para calcular cualquiera de ellos se utiliza por lo tanto el mismo procedimiento que
el descrito en el cálculo de la Mediana.
PERCENTILES (P) DECILES (D) CUARTILES (Q)
PERCENTILES PARA DATOS AGRUPADOS POR INTERVALOS
= + )*
= Percentil de orden k
= número de percentil
= número de datos
= frecuencia percentil
= frecuencia anterior a la frecuencia percentil
= amplitud de la clase

MEDIDAS DE DISPERSIÓN
Las medidas de dispersión nos indican el mayor o menor alejamiento de los valores
de una variable respecto a un promedio. Casi siempre acompañando a un promedio
debe ir una medida de dispersión que nos indica la mayor o menor representatividad
del promedio.
Las medidas de dispersión absoluta más utilizadas son:
 Recorrido
 Recorrido Intercuartílico
 Desviación Media
 Varianza s^2
 Desviación Típica
RECORRIDO
Es la diferencia entre el mayor y el menor valor de la variable
R = Pmayor – Pmenor
RECORRIDO INTERCUARTÍLICO
Es la diferencia entre el tercer cuartil y el primer cuartil
RI = Q3 – Q1 = P75-P25
DESVIACIÓN MEDIA
Es la suma de los valores en valor absoluto de la diferencia entre cada valor de la variable
y la media aritmética por su frecuencia y dividido por el número de datos.

VARIANZA
Siempre es positiva (por estar al cuadrado). Como la varianza es siempre positiva, a

mayor varianza mayor será la dispersión.
Propiedades:
1.-La varianza siempre es mayor o igual que cero. Tan solo hay un caso en que es cero y es
cuando todos los valores de la variable son iguales.
2.- Si a los valores de la variable le sumo una constante, la varianza de la nueva variable es
la misma que la que tenía antes.
Es decir si xi´= xi+K entonces S2x´= S2x

Demostración:
3.- Si a los valores de la variable se les multiplica por una constante, la varianza de la
nueva variable es la que tenía por el cuadrado de la constante.
Es decir si xi´= k xi entonces S2x´= k2 S2x

Demostración
4.- Es consecuencia de las dos anteriores, la varianza de la variable Y=aX+b es la varianza

de X multiplicada por el cuadrado de a.
5.- Cálculo abreviado de la varianza que es la fórmula más utilizada.

Demostración
DESVIACIÓN TÍPICA (S)
Para datos sueltos
Ejemplo
2, 6, 8 4
= 2+6+8+4= 20/4 = 5
=5
S = raiz [(2-5)^2+(6-5)`2+(8-5)^2+(4-5)^2]/4 = raiz( 9+1+9+1)/4 = raíz( 5)= 2.23
Es la raíz cuadrada positiva de la varianza y es la medida de dispersión más utilizada.
DESVIACION TIPICA PARA DATOS AGRUPADOS

*a
Clases de medidas de dispersión relativas
Se caracterizan por ser adimensionales, la más importante es el coeficiente de

variación de Pearson, nos indica la mayor o menor homogeneidad de los datos respecto
de la media y por lo tanto nos da la representatividad de la media en la distribución.
UNIDAD III. DISTRIBUCION ESTADISTICAS DE DOS CARACTERES
El diagrama de dispersión es una técnica estadística utilizada para estudiar la relación

entre dos variables. Por ejemplo, entre una característica de calidad y un factor que le
afecta.
X Y dos variables y
X: INGRESOS Y : ESTUDIO estas variables están relacionadas

PESO ESTATURA están relacionados

PESO EDAD
Estatura edad
La ventaja de utilizar este tipo de diagramas es que al hacerlo se tiene una comprensión
más profunda del problema planteado.
La relación entre dos variables se representa mediante una gráfica de dos dimensiones en
la que cada relación está dada por un par de puntos (uno para cada variable).
La variable del eje horizontal x normalmente es la variable causa, y la variable del eje
vertical y es la variable efecto.
La relación entre dos variables puede ser: positiva o negativa. Si es positiva, significa que
un aumento en la variable causa x provocará una aumento en la variable efecto y y si es
negativa significa que una disminución en la variable x provocará una disminución en la
variable y.
Por otro lado se puede observar que los puntos en un diagrama de dispersión pueden
estar muy cerca de la línea recta que los atraviesa, o muy dispersos o alejados con
respecto a la misma. El índice que se utiliza para medir ese grado de cercanía de los
puntos con respecto a la línea recta es la correlación. En total existen cinco grados de
correlación: positiva evidente, positiva, negativa evidente, negativa y nula.

Accidentes laborales
• • •
•
•
•
• Correlación
• •
• •
•
• • positiva,
•
•
•
•
•
•
posible
• • •
• • •
•
• •
Numero de órdenes urgentes
Diagrama de dispersión
Diferentes tipos de correlación
Tipos de correlación
Correlación Positiva Correlación Negativa

25
Evidente 25
Evidente
20 20
15 15
10
Y
Y 10
5
5
0
0 5 10 15 20 25 Sin Correlación 0
0 5 10 15 20 25
X 25 X
20
15
Correlación 10
Y
5
Correlación
25
Positiva 0 Negativa
0 5 10 15 20 25 25
20
X 20
15
15
Y
10
Y
10
5
5
0
0 5 10 15 20 25 0
0 5 10 15 20 25
X
X

X: pelo y : ojos hay una correlación
Tabaco peso ( masa) no hay correlación
Ingresos lugar
Si todos los puntos estuvieran completamente sobre la recta la ecuación lineal sería y = a +
bx. Como la correlación no siempre es perfecta, se calculan a y b de tal forma que se
minimice la distancia total entre puntos y la recta. Los cálculos son:
Método de Mínimos Cuadrados
Ecuación de regresión (o de la línea) MODELO LINEAL
a = parámetro del modelo ( intercepto)

B = parámetro del modelo ( pendiente)
METODO DE MINIMOS CUADRADOS
COEFICIENTE DE CORRELACION (r)

El coeficiente de correlación se acera a 1 hay correlación
El coefciente de correlación se acerca a -1 no hay correlación
-1> r > 1

El índice de correlación (r) se puede calcular estadísticamente mediante las ecuaciones
que a continuación se presentan DEBE ESTAR ENTRE LOS VALORES -1 AL 1
CUANDO SE ACERCA A 1 HAY UNA CORRELACION CASI PERFECTA
CUANDO SE ACERCA A – A NO HAY CORRELACION
SCxy
r
SCx  SCy
SCxy   xy 
x y
n
SCx   x 
 x 
2
2
SCy   y 
 y 
2
2
n
Donde:
r = Coeficiente de correlación lineal
SCxy = Suma de cuadrados de xy
SCx = Suma de cuadrados de x
SCy = Suma de cuadrados de y
x 2
 Sumatoria de los valores de la variable x al cuadrado
y 2
 Sumatoria de los valores de la variable y al cuadrado
 xy  Sumatoria del producto de xy

 x   Cuadrado de la sumatoria de la variable x
2
 y  2
 Cuadrado de la sumatoria de la variable y
n = número de pares ordenados (pares de datos x, y)
El factor de correlación es un número entre –1 (correlación negativa evidente) y +1

(correlación positiva evidente), y r = 0 indicaría correlación nula.

La correlación se utiliza para cuantificar el grado en que una variable provoca el
comportamiento de otra. Por ejemplo si se encuentra que la variable temperatura tiene
una correlación positiva con el porcentaje de artículos defectuosos, se deben buscar
soluciones al problema de los artículos defectuosos mediante acciones asociadas con la
variable temperatura; de lo contrario, sería necesario buscar la solución por otro lado.
COEFICIENTE DE CORRELACION PARA DATOS AGRUPADOS
UNIDAD III: NUMEROS INDICES
Es un índice que sirve para describir la variación que experimenta una variable o grupo de
variables, a través del tiempo o de algún otro aspecto., por ejemplo el IPC, índice de
rendimiento escolar, índice de desempleo, etc
En general in índice nos servirá para comparar la evolución, que experimenta una variable
en un periodo con respecto a otro
Índice Simple
Es cuando describe la evolución, en dos periodos de tiempos de una variable que se

refiere exclusivamente a un solo “Ítem “. Por ejemplo: índice de precio de la gasolina en
mayo respecto de abril, en este caso, la variable es el precio, el ítem es gasolina y los
periodos considerados son los meses de mayo a abril.
Consideremos una cierta variable X que se refiere a un Ítem o Rubro A. Queremos

describir el comportamiento de X, en un periodo k respecto de un periodo base b, para
esto se define el Índice Simple:
Índice Agregado

Es cuando la variable considerada se refiere a un grupo de ítems o a un ítem compuesto
por dos o más subíndices, por ejemplo: Índice de precios de los combustibles, en 1986
respecto de 1985; donde este Ítem está compuesto por los subitems gasolina, parafina,
diésel y gas licuado.
Enlace Relativo o Encadenamiento

Es un Índice que describe la evolución de una variable, que se refiere a un cierto ítem, en
un periodo de tiempo, respecto del anterior
Encadenamiento
Sea X una variable que se refiere a un cierto ítem y supongamos que disponemos del
siguiente conjunto de enlace relativo entre todos los periodos 1, 2, 3…..es decir
, ,
Índice de Agregación Simple
Este Índice, describe la evaluación en dos periodos de tiempos, de una variable que está
relacionada con un grupo de Ítems o con un Ítem compuesto de dos o más variables
Supongamos que:
R: es el conjunto de ítems considerados, entonces el índice estará dado por:
INDICE DE AGREGACION PONDERADA
Estos sirven para describir la evolución de una variable, que tiene que ver con un grupo de
ítems, en un cierto periodo respecto de otro.. Sin embargo acá se considera la importancia
relativa o el “peso” que tiene cada ítem dentro del grupo, esto implica que a cada ítem es
asignada una ponderación.

Índice de Precios de Laspeyres
Es un índice de agregación ponderada de un grupo de bienes o servicios en dos periodos,

usando como ponderaciones ya sea el precio o la cantidad controlada q en el periodo base
b
Sea
Para el cálculo del índice se usa:
……..precio del bien o servicio en el periodo k
….……precio del bien o servicio en el periodo base b
……….es la ponderación o el peso asignado al ítems y como se ve. Es la

cantidad empleada o consumida en el periodo base b
Índice de Cantidad de Laspeyres
Índice de Precios de Paasche
Índice de cantidad de Paasche


Apuntes de clases-ESTADIST-1

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Apuntes de clases-ESTADIST-1

Uploaded by

Copyright:

Available Formats

CURSO: ESTADISTICA I

DR. GINO PERONCINI

UNIDAD I: ESTADÍSTICA DESCRIPTIVA

Estadística es la ciencia que utilizando las matemáticas y de modo particular el

La estadística tiene dos grandes ramas: Descriptiva e Inferencial.

- Estadística Descriptiva analiza las características de una población o muestra

- Estadística Inferencial basándose en los resultados obtenidos de una muestra

- Muestra es un subconjunto de la población o parte de la población que se

- Característica de una población es la propiedad que se estudia.

- Variables es cualquier característica cuantitativa (tome valor numérico) de una

Ejemplo: Población Estudiantes de Económicas de Antofagasta, Característica Edad de

- Dominio de la variable son los valores que toma

- Recorrido de la variable es la diferencia entre el valor mayor y el menor de los

Profesor: Gino Peroncini. Magister en Estadísticas

- Variable unidimensional Estudia solo una característica de la población.

- Variable bidimensional Estudia dos características de una población. Ejemplo

- Variable multidimensional estudiaría infinitas características

- Atributos son características de la población no susceptibles de cuantificación

ETAPAS DEL ANÁLISIS ESTADÍSTICO

- Escala nominal la característica estudiada se clasifica en una serie de

- Escala ordinal el carácter medido no es numérico pero puede establecerse

- Escala de intervalos la característica puede cuantificarse numéricamente,

Profesor: Gino Peroncini. Magister en Estadísticas

- Frecuencia absoluta ( fi ) es el número de veces que se repite un determinado

- Frecuencia relativa ( hi) es el cociente entre la frecuencia absoluta y el número

- Frecuencia absoluta acumulada es decir se suman las frecuencias

anteriores a un valor dado, por tanto la acumulada al final coincide con la

- Distribución por datos no agrupados es cuando se especifican todos y cada uno

- Distribución por datos agrupados los valores de la variable se miden en

- Marca de clase de un intervalo es la semisuma de los extremos del intervalo y

es el valor que sustituye a todo el intervalo siendo el intervalo

Qué es una tabla de frecuencias

En esta tabla se representan los diferentes tipos de frecuencias, ordenados en columnas.

Profesor: Gino Peroncini. Magister en Estadísticas

La frecuencia absoluta es el número de veces que un dato se repite dentro de un conjunto de

El valor de la frecuencia relativa siempre va a estar entre 0 y 1. El valor obtenido está en

Frecuencia absoluta acumulada

La frecuencia absoluta acumulada es la suma de las frecuencias absolutas que se va

Profesor: Gino Peroncini. Magister en Estadísticas

UNIDAD II: MEDIDAS DE RESUMEN

Se trata de resumir la información en un único número.

 De tendencia central o promedios

 De tendencia no central (dispersión)

La media puede ser:

Profesor: Gino Peroncini. Magister en Estadísticas

Media aritmética simple

= media (promedio) es un estadistico

=( ) = (x1 +x2+x3+x4)/4 = (2+4+5+6)/4 = 17/4= 4.25 es la media (promedio)

=( ) = (f1*x1+f2*x2+f3*x3)/12 = (0*6+1*4+2*2/12 = 8/12 = 0.66

La media aritmética es siempre el centro de gravedad de la distribución y es

Profesor: Gino Peroncini. Magister en Estadísticas

Puesto que la suma de las

4.- La media aritmética se puede hacer siempre con variables cuantitativas y es

Media Aritmética ponderada

Profesor: Gino Peroncini. Magister en Estadísticas

= marca de clase con la mayor frecuencia

Es el valor de la variable que ocupa el lugar central de la distribución, es decir el valor de la

Distinguiremos dos casos, datos no agrupados y datos agrupados.

Para datos no agrupados

3,4,5,7,9,10,5,8 =7y9 8 la mediana

Profesor: Gino Peroncini. Magister en Estadísticas

 Si el valor no está en la columna de acumuladas, se toma como valor de la mediana

 Si el valor si está en la columna de acumuladas, se toma como mediana la media

=( ) = (f1x1+f2x2+f3x3)/12 = (06+14+22/12 = 8/12 = 0.66