You are on page 1of 9

ESTADÍSTICA DESCRIPTIVA Y BIDIMENSIONAL

www.apuntesfacultad.com
ÍNDICE
1. Definición de Estadística
. C!nce"t!s #ene$a%es
&. T$ata'ient! de %a inf!$'ación
(. Re"$esentación de %!s dat!s
). Medidas de cent$a%i*ación
+. Medidas de dis"e$sión
,. Estadística -idi'ensi!na%
.. C!$$e%ación
/. Re#$esión
Definición de Estadística 0 la palabra estadística procede del vocablo "estado" pues era
función principal de los gobiernos de los estados establecer registros de población ,
nacimientos , defunciones , etc . Hoy en día la mayoría de las personas entienden por
estadística al conjunto de datos , tablas , gráficos , que se suelen publicar en los
periodicos .
En la actualidad se entiende por estadística como un mtodo para tomar decisiones , de
a!í que se emplee en multitud de estudios científicos .
"a estadística se puede dividir en dos partes #
- Estadística desc$i"ti1a ! ded2cti1a 3 que trata del recuento , ordenación y
clasificación de los datos obtenidos por las observaciones . $e construyen tablas y
se representan gráficos , se calculan parámetros estadísticos que caracteri%an la
distribución , etc.
- Estadística infe$encia% ! ind2cti1a 3 que establece previsiones y conclusiones
sobre una población a partir de los resultados obtenidos de una muestra . $e apoya
fuertemente en el cálculo de probabilidades .
P!-%ación 0 es el conjunto de todos los elementos que cumplen una determinada
característica . Ejemplo # alumnos matriculados en &'( en toda Espa)a .
M2est$a 0 cualquier subconjunto de la población . Ejemplo # alumnos de &'( del
$otomayor .
Ca$4cte$ estadístic! 0 es la propiedad que permite clasificar a los individuos , puede
!aber de dos tipos #
- &uantitativos # son aquellos que se pueden medir . Ejemplo # n* de frijos , altura ,
temperatura .
- &ualitativos # son aquellos que no se pueden medir . Ejemplo # profesión , color de
ojos , estado civil .
Va$ia-%e estadística 0 es el conjunto de valores que puede tomar el carácter estadístico
cuantitativo + pues el cualitativo tiene "modalidades,, - . .uede ser de dos tipos #
- Disc$eta 0 si puede tomar un n/mero finito de valores . Ejemplo # n* de frijos
- C!ntin2a 0 si puede tomar todos los valores posibles dentro de un intervalo .
Ejmplo # temperatura , altura .
5$ec2encia a-s!%2ta f
i
0 + de un determinado valor 0
i
- al n/mero de veces que se repite
dic!o valor .
5$ec2encia a-s!%2ta ac2'2%ada 5
i
0 + de un determinado valor 0
i
- a su frecuencia
absoluta más la suma de las frecuencias absolutas de todos los valores anteriores .
5$ec2encia $e%ati1a f$i 0 es el cociente f
i
12 , donde 2 es el n/mero total de datos .
5$ec2encia $e%ati1a ac2'2%ada 5$i 0 es el cociente 3
i
12
$i las frecuencias relativas las multiplicamos por 455 obtenemos los 6 .
T$ata'ient! de %a inf!$'ación 0 se deben de seguir los siguientes pasos #
- recogida de datos
- ordenación de los datos
- recuento de frecuencias
- agrupación de los datos , en caso de que sea una variable aleatoria continua o bien
discreta pero con un n/mero de datos muy grande se agrupan en clases .
2* de clases 7 2
"os puntos medios de cada clase se llaman marcas de clase .
8demás se debe adoptar el criterio de que los intervalos sean cerrados por la
i%quierda y abiertos por la derec!a .
- construcción de la tabla estadística que incluirá , clases , marca de clase , f
i
, 3
i
, fri

,
3ri .
Ejemplo # "as notas de 9atemáticas de una clase !an sido las siguientes #
: ; < 4 = > ? > @ A A @ ? > @ @ 4 5 4 : ? ? > 5 > > > ? : @
&onstruir una tabla #
6
i
f
i
5
i
f$i 5$i
5 = = =1;5 =1;5
4 ; : ;1;5 :1;5
= 4 A 41;5 A1;5
; 4 @ 41;5 @1;5
< 4 > 41;5 >1;5
: ; 44 ;1;5 441;5
A = 4; =1;5 4;1;5
@ : 4> :1;5 4>1;5
> @ =: @1;5 =:1;5
? : ;5 :1;5 ;51;5
;5 4
Re"$esentaci!nes #$4ficas 0 para !acer más clara y evidente la información que nos
dan las tablas se utili%an los gráficos , que pueden ser #
• Biagramas de barras + datos cualitativos y cuantitativos de tipo discreto - . En el eje
y se pueden representar frecuencias absolutas o relativas .
• 3ristogramas + datos cuantitativos de tipo continuo o discreto con un gran n/mero de
datos - . El fristograma consiste en levantar sobre cada intervalo un rectángulo cuyo
área sea igual a su frecuencia absoluta
área 7 base C altura f
i
7
i i
n C 0 ∆
luego la altura de cada rectángulo vendrá dada por n
i
que se llama f2nción de
densidad . $i por ejemplo un intervalo es doble de anc!o que los demás su altura n
i

debe ser la mitad de la frecuencia absoluta y así no se puede inducir a errores .
2ormalmente la amplitud de los intervalos es cte por lo que n
i
será
proporcional a f
i
y por tanto podemos tomar f
i
como la altura n
i
ya que la forma del
gráfico será la misma , aunque a!ora el área del rectángulo ya no sea e0actamente
la frecuencia absoluta + a no ser que la amplitud del intervalo sea igual a 4 - .
• .olígono de frecuencias
0
1
2
3
4
5
6
7
8
0 1 2 3 4 5 6 7 8 9
Notas
F
r
e
c
u
e
n
c
i
a
s

a
b
s
o
l
u
t
a
s

f
i
• Biagrama de sectores
• &artogramas
• .irámides de población
• Biagramas lineales
• .ictogramas
&D"&("' BE .8ED9EFE'$ #
Medidas de cent$a%i*ación 0
• Media a$it'7tica 0

2
..... 0 0
0
= 4
+ +
=
2
0
i ∑
= si son pocos datos


...... f f
..... f 0 f 0
0
= 4
= = 4 4
+ +
+ +
=
2
f 0
i i ∑
= si son muc!os valores pero se repiten muc!o
En el caso de que los datos estn agrupados en clases , se tomará la marca de clase
como 0
i
.
0
1
2
3
4
5
6
7
8
0 1 2 3 4 5 6 7 8 9
notas
f
r
e
c
u
e
n
c
i
a
s

a
b
s
o
l
u
t
a
s

f
i
2
3 1
1
1
3
2
5
7
5
0
1
2
3
4
5
6
7
8
9
2o siempre se puede calcular la media aritmtica como por ejemplo cuando los
datos son cualitativos o los datos están agrupados en clases abiertas .
Ejemplo # !acer los cálculos para el ejercicio de las notas
• M!da 0 es el valor de la variable que presenta mayor frecuencia absoluta . .uede
!aber más de una . &uando los datos están agrupados en clases se puede tomar la
marca de clase o utili%ar la fórmula #
9
5
7 "
inf
G
= 4
4
d d
d
+
⋅ ∆
donde # "
inf
7 límite inferior de la clase modal , ∆7amplitud
del intervalo , d
4
7 diferencia entre la f
i
de la clase modal y la f
i
de la clase anterior y
d
=
7 diferencia entre la f
i
de la clase modal y la f
i
de la clase posterior .
Fambin se puede !acer gráficamente #
"a moda si sirve para datos cualitativos , pero no tiene por qu situarse en la %ona
central del gráfico .
Ejemplo # en el ejercicio de las notas la moda sería 07>
• Mediana 0 es el valor de la variable tal que el n/mero de observaciones menores
que l es igual al n/mero de observaciones mayores que l . $i el n/mero de datos es
par , se puede tomar la media aritmtica de los dos valores centrales .
&uando los datos están agrupados la mediana viene dada por el primer valor de la
variable cuya 3
i
e0cede a la mitad del n/mero de datos . $i la mitad del n/mero de
datos coincide con 3
i
se tomará la semisuma ente este valor y el siguiente .
&uando los datos estn agrupados en clases se puede utili%ar reglas de tres o la
fórmula #
9 7 "
inf
G
i
4 i
f
3
=
2


⋅ ∆
Hráficamente se !ace a partir del polígono de frecuencias acumuladas .
Ejemplo # En el caso de las notas podrías ordenar de menor a mayor los datos y
obtendríamos # 5 5 4 4 4 = ; < : : : A A @ @ @ @ @ > > > > > > > ? ? ? ? ?
dato n/mero 4:I4A +por ser par-
luego la mediana sería @
Fambin se podría observar las 3
i
y ver que en el @ se e0cede a la mitad del n* de datos ,
es decir , sobrepasa el 4: .
• C2anti%es 0 son parámetros que dividen la distribución en partes iguales , así por
ejemplo la mediana los divide en dos partes iguales , los c2a$ti%es son tres valores
que dividen a la serie de datos en cuatro partes iguales , los 82inti%es son cuatro
valores que lo dividen en : partes , los deci%es en 45 y los "e$centi%es en 455 . $e
calculan de la misma manera que la mediana .
Fambin se puede utili%ar la fórmula # &
n
7 "
inf
G
i
4 i
f
3
455
2
n

− ⋅
⋅ ∆
donde n es el
valor que deja el n6 de valores por debajo de l .
Medidas de dis"e$sión 0
• Ran#! ! $ec!$$id! 0 es la diferencia entre el mayor valor y el menor . Bepende
muc!o de los valores e0tremos por que se suele utili%ar el rango intercuartílico 7
J
;
I J
4
o el rango entre percentiles 7 .
?5
I .
45
Ejemplo # .ara el caso de las notas sería ? I 5 7 ?
• Va$ian*a s

0 es la media aritmtica de los cuadrados de las desviaciones respecto a
la media + desviación respecto a la media d 7 0
i
I 0 - .
s
=
7
( ) ( )
2
....... 0 0 0 0
=
=
=
4
+ − + −
7
( )
2
0 0
=
i ∑



s
=
7
( ) ( )
.... f f
....... 0 0 f 0 0 f
= 4
=
= =
=
4 4
+ +
+ − + −
7
( )
2
0 0 f
=
i i ∑

8l igual que la media en el caso de que los datos estn agrupados en clases , se
tomará la marca de clase como 0
i
.
'tra forma de calcular s
=
es #
s
=
7
( )
2
0 0 f
=
i i ∑

7
( )
=
− +

2
0 0 = 0 0 f
i
= =
i i = =
=
i i
0 = 0
2
0 f
− +

7
=
=
i i
0
2
0 f


$e llama des1iación tí"ica s a la raí% cuadrada de la varian%a . Es más /til que la
varian%a ya que tiene las mismas dimensiones que la media
Ejemplo # Hacer los cálculos para el ejercicio de las notas
- C!eficiente de 1a$iación 0 es el cociente entre la desviación típica y la media
aritmtica . Kalores muy bajos indican muestras muy concentradas .
&.K. 7
0
σ
BL$FELM(&L'2E$ MLBL9E2$L'28"E$ #
Va$ia-%es estadísticas -idi'ensi!na%es 0 es cuando al estudiar un fenómeno
obtenemos dos medidas 0 e y , en ve% de una como !emos !ec!o !asta a!ora .
Ejemplo # pulso y tN de los enfermos de un !ospital , ingresos y gastos de las familias de
los trabajadores de una empresa , edad y n* de días que faltan al trabajo los productores
de una fábrica .
Ti"!s de dist$i-2ci!nes -idi'ensi!na%es 0
- cualitativa I cualitativa
- cualitativa I cuantitativa + discreta o continua -
- cuantitativa + discreta o continua - I cuantitativa + discreta o continua -
Ti"!s de ta-%as 0
- Fabla de dos columnas 0
i ,
y
i
+ pocos datos -
- Fabla de tres columnas 0
i
, y
i
, f
i
+ muc!os datos y pocos valores posibles -
- Fablas de doble entrada + muc!os datos y muc!os valores posibles -
0
4
0
=
...... 0
n
f
Oj
y
4
f
44
f
=4
...... f
n4
f
O4
y
=
f
4=
f
==
...... f
n=
f
O=
..... ..... ...... ...... ...... ......
y
m
f
4m
f
=m
...... f
nm
f
Om
f
iO
f
4O
f
=O
...... f
nO
f
OO
72
Dia#$a'as de dis"e$sión 0
$i !ay pocos datos + tabla de dos columnas -, se representan las variables en los ejes 0 e
y .
$i !ay muc!os datos pero muy agrupados + tabla de tres columnas y tablas de doble
entrada -, se !ace igual pero con los puntos más gordos seg/n la f
i
,o se pintan muc!os
puntos juntos , o se pinta en tres dimensiones 0 , y , f
i
, con lo que obtendríamos un
diagrama de barras en tres dimensiones .
$i !ay muc!os datos y muc!os valores posibles , se pueden agrupar en clases , y se
utili%an los este$e!#$a'as + ; dimensiones - en los que el volumen de cada prisma es
proporcional a la frecuencia . Fambin se puede tomar la marca de clase de los
intervalos y tratar la variable continua como si fuese discreta .
C4%c2%! de "a$4'et$!s 0
- &uando !ay pocos datos o están muy agrupados + tablas de = o ; columnas -

2
f 0
0
i i ∑
=
2
f y
y
i i ∑
=
( )
2
0 0 f
s
=
i i =
0


=

( )
2
y y f
s
=
i i
=
y


=
8parece un parámetro nuevo que es la c!1a$ian*a que es la media aritmtica de las
desviaciones de cada una de las variables respecto a sus medias respectivas .

( )( )
2
y y 0 0 f
s
i i i
0y

− −
= 7 y 0
2
y 0 f
i i i
⋅ −

- &uando !ay muc!os datos + tablas de doble entrada -
∑∑

= =
2
f 0
2
f 0
0
ij i O i i

∑∑

= =
2
f y
2
f y
y
ij j j O j

( ) ( )
∑ ∑ ∑ ∑

− =

=

=
= =
i ij
=
i ij
=
i O i
=
0
0 0 f
2
0 0 f
2
0 0 f
s

( )
( )
∑∑ ∑∑

− =

=

=
= =
j ij
=
j
ij
=
j j O =
y
y y f
2
y y f
2
y y f
s


( ) ( )
2
y y 0 0 f
s
j i ij
0y
∑∑
− −
= 7 y 0
2
y 0 f
j i ij
⋅ −
∑∑
C!$$e%ación ! de"endencia 0 es la teoría que trata de estudiar la relación o dependencia
entre las dos variables que intervienen en una distribución bidimensional , seg/n sean
los diagramas de dispersión podemos establecer los siguientes casos #
- Inde"endencia f2nci!na% ! c!$$e%ación n2%a # cuando no e0iste ninguna relación
entre las variables .+ r 7 5 -
- De"endencia f2nci!na% ! c!$$e%ación f2nci!na% # cuando e0iste una función tal
que todos los valores de la variable la satisfacen + a cada valor de 0 le corresponde
uno solo de y o a la inversa - +r 7 ±4-
- De"endencia a%eat!$ia ! c!$$e%ación c2$1i%inea 9ó %inea% :# cuando los puntos del
diagrama se ajustan a una linea recta o a una curva , puede ser positiva o directa , o
negativa o inversa + I4PrP5 ó 5PrP4-
Ejemplo # a 4= alumnos de &'( se les toma las notas de los /ltimos e0ámenes de
9atemáticas , 3ísica y 3ilosofía #
9atemáticas 3ísica 3ilosofía
= 4 =
; ; :
< = @
< < >
: < :
A < ;
A A <
@ < A
@ A @
> @ :
45 ? :
45 45 ?
$i representamos las variables matemáticasI física en un diagrama y matemáticasI
filosofía en otro vemos que la correlación es muc!o más fuerte en el primero que en el
segundo ya que los valores están más alineados .

C!eficiente de c!$$e%ación %inea% 0 es una forma de cuantificar de forma más precisa el
ttipo de correlación que !ay entre las dos variables .
$ ;
y 0
0y
s s
s
Re#$esión 0 consiste en ajustar lo más posible la nube de puntos de un diagrama de
dispersión a una curva . &uando esta es una recta obtenemos la recta de regresión lineal
, cuando es una parábola , regresión parabólica , cuando es una e0ponencial , regresión
e0ponencial , etc . + logicamente r debe ser distinto de 5 en todos los casos - .
"a $ecta de $e#$esión de < s!-$e 6 es #
- 0 0 +
s
s
y y
=
0
0y
− = −
en la cual se !ace mínima
la distancia entre los valores y
j
obtenidos e0perimentalmente y los valores teóricos de y.
8 valor
=
0
0y
s
s
se le llama c!eficiente de $e#$esión de < s!-$e 6 + nos da la pendiente de
la recta de regresión -.
"a $ecta de $e#$esión de 6 s!-$e < es #
- y y +
s
s
0 0
=
y
0y
− = −
en la cual se !ace mínima
la distancia entre los valores 0
i
obtenidos e0perimentalmente y los valores teoricos de 0.
8 valor
=
y
0y
s
s
se le llama c!eficiente de $e#$esión de 6 s!-$e < + su inversa nos da la
otra pendiente - .