You are on page 1of 74

ELEMENTOS DE

ESTADSTICA
DESCRIPTIVA
Profr. Eliud Quintero Rodrguez

Introduccin

La Estadstica es una ciencia que


facilita la solucin de problemas
en los cuales necesitamos
conocer caractersticas sobre el
comportamiento de algn
suceso o evento.

Nos permite inferir el


comportamiento de sucesos
iguales o similares sin
necesidad de que estos

Esto nos da la posibilidad de


tomar decisiones acertadas
y a tiempo, as como
realizar proyecciones del
comportamiento del suceso.
Slo se realizan los clculos
y el anlisis con los datos
obtenidos de una muestra
de la poblacin y no con
toda la poblacin.

Conceptos bsicos

Estadstica:
Es la ciencia que se encarga de recolectar,
organizar, resumir y analizar datos para
despus obtener conclusiones. Se divide en
Estadstica Descriptiva y Estadstica
Inferencial.

Estadstica
descriptiva:
Se encarga de la
recoleccin,
organizacin,
presentacin y anlisis

Estadstica

Introduccin
Esquema de las etapas de un estudio estadstico

AREA DE INTERES

DATOS

ORGANIZAR Y RESUMIR
Tema de Investigacin
-Antecedentes Previos
-Objetivos
-Preguntas de Investigacin
-Posibles Hiptesis
-Unidad de Anlisis
-Poblacin
-Variables

ESTADSTICA DESCRIPTIVA

(Tablas,
Grficos, Medidas
Descriptivas, etc.)

INTERPRETACIN
Poblacin o Muestra?
Poblacin

Muestra

INFERENCIA ESTADSTICA

CONCLUSIONES
INFORMACIN
5

Probabilidad

Estadstica

Resumen de algunos conceptos planteados en la Introduccin

VARIABLE: es lo que se va a medir y representa una caracterstica de la UNIDAD DE ANLISIS.


QUINES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Anlisis de una
Poblacin o una Muestra
POBLACIN : Es el total de unidades de anlisis que son tema de estudio.
MUESTRA: Es un conjunto de unidades de anlisis provenientes de una poblacin.

Poblacin:
Las personas que trabajan
en empresas de
comunicacin

Muestra

Muestra: 60 trabajadores de empresas de comunicacin


Unidad de anlisis: Trabajador de empresa de comunicacin
Variables: sexo, edad, salario, N de horas de trabajo, etc.

Estadstica
Variable: corresponde a la caracterstica de la Unidad de Anlisis
TIPOS DE VARIABLES
Variables Cualitativas

Variables Cuantitativas
CONTINUA

DISCRETA

NOMINAL

ORDINAL

Intervalo

Toma valores enteros


Ejemplos: Nmero de Hijos, Nmero de
empleados de una empresa, Nmero de
asignaturas aprobadas en un semestre, etc.
Toma cualquier valor dentro de un intervalo
Ejemplos: Peso; Estatura; Temperatura, etc.

Caracterstica o cualidad
cuyas categoras no tienen
un orden preestablecido.
Ejemplos: Sexo, Deporte
Favorito, etc.
Caracterstica o cualidad cuyas
categoras tienen un orden
preestablecido.
Ejemplos: Calificacin (S, N, A);
Grado de Inters por un tema, etc.

Unidad de Medida:
Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura

Poblacin:
Conjunto definido de TODOS los INDIVIDUOS,
de donde se observa cierta caracterstica.

Al nmero de integrantes de la poblacin


se llama tamao de la poblacin y se
representa con la letra N.
Las poblaciones pueden ser finitas o
infinitas.

Poblacin Estadstica:
Conjunto de TODOS los DATOS que se
obtienen al realizar la medicin de una
variable en los elementos de una poblacin.

Muestra:
Subconjunto de una poblacin, que
intenta reflejar las caractersticas de la
poblacin lo mejor posible.
El nmero de individuos que integran la
muestra, llamado tamao de la
muestra se representa con la letra n.

Individuo:
Es el elemento de la poblacin o de la muestra
que aporta informacin sobre lo que se estudia.

Variable:
Caracterstica o propiedad de los
individuos que se desea estudiar y se
puede medir o calificar; cambia o vara
con el tiempo en un individuo dado, o
cambia o vara de elemento a elemento.
Ej. Edad, peso, sexo, estado civil, nmero

Dato:
Valor que se obtiene al realizar la medicin de la
caracterstica de la variable en estudio.
Pueden ser univariados, bivariados o
multivariados.

La naturaleza de los datos pueden ser


datos cuantitativos o datos
cualitativos.

Datos Cuantitativos
(nmeros):
Valores obtenidos al medir
peso, estatura, temperatura,
nmero de hijos.

Datos Cualitativos
(categoras):
Se obtienen al calificar la
caracterstica en cuestin
como el sexo, estado
civil, grado mximo de

Variable Dicotmica:
Slo puede tomar dos valores (s no, 0 1,
hombre mujer, bueno malo, encendido
apagado).

En la variable CUANTITATIVA se pueden


distinguir dos tipos: continua y
discreta.

Variable Continua:
Si la variable puede tomar cualquier
nmero real entre dos valores dados
(decimal o entero).
Ej. El peso de un individuo.

Variable Discreta:
Si la variable slo puede
tomar nmeros enteros.
Ej. El nmero de hijos de un
individuo.

Escalas de Medicin

Escala Nominal

Escala
Ordinal

Escala de
Intervalo

Escala de
Razn

Escala Nominal:
Est asociada a variables cualitativitas y es
denominada de este modo si no se pueden
hacer operaciones aritmticas entre sus valores,
pues stos son nicamente ETIQUETAS.
Ejemplo: sexo, cdigo postal, estado civil,
nmero telefnico, nmero al correr en un
maratn, deporte favorito, carrera a estudiar,
etc.

Escala Ordinal:
Los valores de la variable que tienen un
ORDEN con un nivel especfico, pero no se
pueden hacer operaciones aritmticas entre
ellas.
Ejemplo:
Psimo Malo Regular Bueno Excelente
Primaria Secundaria Preparatoria Licenciatura

Escala de Intervalo:
En ella existe un orden entre los valores de la
variable y adems una NOCIN DE DISTANCIA
aunque no se puedan realizar operaciones.
El cero o punto de inicio no es nico, es ms
bien un punto de referencia.
Ejemplo: Escalas de temperatura, la edad de
la Tierra, la lnea del tiempo de la humanidad.

Escala de Razn:
La magnitud tiene SENTIDO FSICO,
existe el cero absoluto, existe orden, se
puede determinar cuntas veces es
mayor uno que otro.
Ejemplo: peso, estatura, edad, distancia,
dinero, etc.

Fuentes de informacin

Encuesta:
Recopilar los datos mediante el
uso de cuestionarios o entrevistas.

Experimento:
Procedimiento utilizado en la
investigacin cientfica para
obtener informacin que
permita conocer el
comportamiento de algn

Fuentes de Informacin

Investigacin
Documental:
Procedimiento para
obtener
datos mediante la consulta
de informacin ya escrita y
concentrada en
documentos
que se localicen en libros o
revistas en bibliotecas,

Redondeo de datos,
notacin cientfica y cifras
significativas.

Redondeo:
El redondeo de datos es un
procedimiento que consiste en
escribir un nmero que
representa a una cantidad con
menos cifras de las que tiene
realmente para tener una idea
rpida de la cantidad.

Notacin Cientfica

Es una manera de escribir en forma breve


cifras muy grandes o pequeas. La forma
n es
general
a x 10 , en donde a es un nmero entre 1
y 9, n es un nmero entero.

Ejemplo:
4
El nmero 25 000 se escribe 2.5 x 10- 4, o el
nmero 0.00025 se escribe como 2.5 x 10 .

Cifras Significativas

A los dgitos exactos que se utilizan para escribir


una cifra, a parte de los ceros para localizar el
punto decimal, se les llama cifras significativas.

Ejemplos:

3.22 tiene 3 cifras significativas.

0.0032 = 3.2 x 10 tiene 2 cifras significativas.

3 tiene 3 cifras significativas.


0.00320 = 3.20 x 10
3

La cifra 3.22 se encuentra realmente


entre 3.215 y 3.225.

La cifra 0.0032 es un valor que se


encuentra entre 0.00315 y 0.00325.

La cifra 0.00320 se encuentra entre las


cifras 0.003195 y 0.003205

Orden de datos

La ordenacin es el proceso mediante el


cual los datos estn acomodados de tal
manera que se establece un orden
(ascendente o descendente) entre ellos.

Hay dos mtodos comunes:

Listado en orden
ascendente
Mtodo de tallo y hojas

Ejemplo

Considera que la variable de estudio es


el peso de 25 estudiantes. Los pesos se
encuentran en la siguiente tabla:
Peso de 25 estudiantes
(en kg)
40
43
48
51
49
56
44
42
55
52
52
62
44
50
59
63
50
56
55
45
57
66
63
51
58

Listado en orden
ascendente

El proceso consiste en ordenarlos de


menor a mayor

Peso de 25 estudiantes
(en kg)
42
40
48
51
49
56
44
43
55
52
52
62
44
50
59
63
50
56
55
45
57
66
63
51
58

Peso de 25 estudiantes
(en kg)
40
45
51
55
59

42
48
51
56
62

43
49
52
56
63

44
50
52
57
63

44
50
55
58
66

Mtodo de tallo y hojas

Si los nmeros de los datos estn


formados por dos dgitos, se hace una
columna con el primer dgito (decenas) y a
la derecha de cada uno de ellos se escribe,
en fila, slo el segundo dgito (unidades)
de cada uno de los datos que tengan el
mismo primer dgito.

Datos sin ordenar:

Datos ordenados:

4
5
6

Peso de 25 estudiantes
(en kg)
2,0,8,9,4,3,4,5
42
40
48
51
49
1,6,5,2,2,0,9,0,6,5,7,1 56 44 43 55 52
52
62
44
50
59
,8
2,3,6,3
63
50
56
55
45
57
66
63
51
58

4
5
6

0,2,3,4,4,5,8,9
0,0,1,1,2,2,5,5,6,6,7,8
2,3,3,6
,9

Doble tallo

Una variante de este mtodo es en lugar de


dividir en un grupo las decenas, se divide en
dos grupos. El primero abarcando los dgitos
del 0 al 4 y el segundo del 5 al 9.

El ejemplo anterior 4
4
queda:
5
5
6
6

0,2,3,4,4
5,8,9
0,0,1,1,2,2,
5,5,6,6,7,8,9
2,3,3
6

Caso de variables
cualitatitivas

El procedimiento es:

Se identifican todos los valores


diferentes y se acomodan en columna.

Se agrega una segunda columna en


donde se van registrando, mediante una
lnea vertical, la veces que aparece el
valor dado.

Ejemplo

Considera que la variable de estudio es


el color de playera de 25 estudiantes.
Los colores se encuentran en la
siguiente tabla:
rosa

azul

blanco azul

gris

blanco caf

negro

rosa

azul

caf

blanco blanco

gris

azul

blanco rosa

gris

blanco caf

negro

rosa
blanco
gris
verde

Color

rosa

azul

gris

blanc caf
o

negro blanc
o

azul

blanc blanc
o
o

rosa
gris
gris

azul

blanc azul
o

caf

blanc rosa
o

blanc caf
o

rosa

gris

negro verde

Azul
Blanco
Caf
Gris
Negro
Rosa
Verde

Frecuen
cia

IIII
IIII I
II I I
IIII
II
IIII
I

Tabla de Frecuencia de
Datos

Una vez que se tenga ordenados los


datos, se acomodan en la Tabla de
distribucin de frecuencias o tabla de
frecuencias.

La tabla es bsicamente una tabla de


valores x-y, dnde x representa el dato
y y representa la frecuencia.

La frecuencia es el nmero de veces que


aparece cada dato.

Hay dos clases de tablas de frecuencias:

Para datos NO agrupados.


Para datos agrupados.

Tabla de frecuencias para


datos NO agrupados

Est formada por dos columnas: una


para la variable xi y la otra para su
frecuencia f, a esta frecuencia se le
llama frecuencia absoluta o frecuencia
observada.

Ejemplo

Tabla de frecuencias de los pesos en kg


de 25 alumnos.

Peso de 25 estudiantes
(en kg)
40
45
51
55
59

42
48
51
56
62

43
49
52
56
63

44
50
52
57
63

44
50
55
58
66

xi

xi

40

52

42

55

43

56

44

1
2

57

45

58

1
1

48

59

49

62

50

63

51

66

2
1

Tota
l

25

Frecuencia relativa y
acumulada

Por lo regular, se agregan dos columnas:


la de la frecuencia relativa fr y la de la
frecuencia acumulada fa.
La frecuencia relativa se obtiene
mediante el cociente de la frecuencia y el
nmero total de datos, esto es fr = f/n.
La frecuencia acumulada se obtiene
sumando las frecuencias anteriores a las
frecuencias de un dato dado.

Ejemplo
1/25
xi

fr

40

42

0.0
4
0.0

43

44

45

48

49

50

51

fa
1

xi

fr

fa

52

14

55

56

57

0.0
8
0.0
8.0
0
8
0.0

2/25

4
0.0
4
0.0
8
0.0

3
6

58

4
0.0
4
0.0

7
8

59

62

4
0.0
8
0.0
8

10

63

12

66

Tot
al

25

4
0.0
4
0.0
4
0.0
4
0.0
8
0.0
4
1

16
18
19
20
21
22
24
25

Siempre es 1

Siempre
es el
nmero
total

Intervalo de clase

En ocasiones es conveniente acomodar los datos en


pequeos grupos de igual tamao, llamados intervalos de
clase.

El punto medio o marca de clase xi, se obtiene con:

El tamao del intervalo se obtiene mediante la


diferencia de los lmites superior e inferior.

Marca de
clase =

Lmite inferior + lmite


2
superior

Ejemplo
Lmite inferior

Lmite superior

Intervalo de clase
38 42
43 47
48 52
53 57
58 62
63 67

Lm inf + Lim sup


2

Punto medio xi
40
45
50
55
60
65

Lmite verdadero del


intervalo
Frontera de clase o lmite verdadero del
intervalo: de clase Punto medio xi
Intervalo
37.5 42.5
40
45
40 + 2.5
40 2.5 42.5 47.5
47.5 52.5
50
52.5 57.5
55
57.5 62.5
60
62.5 67.5
65

Tabla de intervalos con


lmites verdaderos
Usando smbolos
Est incluido
No est incluido
de desigualdad

Intervalo
de clase

Punto
medio
xi

37.5 x <
42.5

40

42.5 x <
47.5

45

47.5 x <
52.5

50

52.5 x <

55

Usando
Est incluido
No est incluido

parntesis y
corchetesPunto
Intervalo
de clase

medio
xi

[37.5 , 42.5)

40

[42.5 , 47.5)

45

[47.5 , 52.5)

50

[52.5 , 57.5)

55

[57.5 , 62.5)

60

[62.5 , 67.5)

65

El tamao del intervalo es

Si por alguna razn no es fcil decidir el


ancho del intervalo y el nmero de ellos,
se pueden utilizar las siguientes frmulas:

K = 1 + 3.3 log (n)


Donde K = nmero aproximado de
clases
= los
nmero
de datos.
Amplitudn de
intervalos
= Rango / K
Donde Rango = diferencia entre el
dato mayor
y
el dato menor.

Ejemplo

Para el ejemplo de los datos de los pesos


de 25 alumnos, el valor de K:
K = 1 + 3.3 log (n) = 1 + 3.3 log (25) =
5.6.
Por lo tanto se requieren
aproximadamente
intervalos.sera:
Y la amplitud de los6 intervalos
Amplitud = Rango / K = (66 40) / 5.6 =
4.64.
Aproximadamente 5 unidades es la
amplitud de los intervalos.

Se elabora con los intervalos de clase, sus


puntos medios y las frecuencias
correspondientes para cada uno de los
intervalos.

xi

52

40

55

Datos
agrupados
Intervalo
Punto

42

56

de clase

43

57

44

58

38 42

40

2
4

45

59

43 47

45

48

62

48 52

50

49

63

53 57

55

50

66

58 62

60

51

Tota

25

63 - 67

65

Datos sin
agrupar

Tabla de distribucin de
frecuencias para datos
agrupados

medio
xi

3
3
2

Se agregan las columnas de frecuencia


relativa fr y frecuencia acumulada
Interva
Punto
f
fr
Fa
fa:
2/25
lo de
clase

medio
xi

38 42

40

43 47

45

48 52

50

53 57

55

58 62

60

63- 68

65

Total

25

0.08
0.16
0.32
0.20
0.12
0.12
1

2
6
14
19
22
25

4/25
8/25

Por ltimo se agregan las columnas:


Frecuencia porcentual, f% %f, se
obtiene multiplicando la frecuencia
relativa fr x 100.
Frecuencia relativa acumulada fra,
se obtiene sumando las frecuencias
relativas anteriores a un dato dado.
Frecuencia porcentual acumulada, f
%a, se obtiene sumando las frecuencias
porcentuales acumuladas a un dato dado.

Tablas de frecuencias
absoluta, relativa y
acumulada0.08 x
Interva
lo de
clase

Punto
medio
xi

38 42

40

43 47

45

fr

0.0
8
0.1
6

48 52

50

0.3
2

53 57

55

0.2
0

58 62

60

0.1

f%

100

8
16
32
20
12
12
100

fa

2
6
14
19
22

0.08 x
100
2/25

fra f%a
0.0
8
0.2
4
0.5
6
0.7

8
24
56
76

6
0.8
88
8
1 100

Grfica de Datos

Existen dos tipos de grficas mas


usuales:
Polgono de Frecuencias
Histograma

Otros grficos:
Grfica de barras
Pictograma
Grfico Circular o de pastel.

Polgono de Frecuencias

Es la representacin mediante un
grfico de lnea. En l se muestra la
distribucin de frecuencias y est
formado por segmentos de lnea que
unen los puntos correspondientes a la
frecuencia de cada una de las clases.

El eje x representa el dato xi


y el eje y las frecuencias.

Ejemplo

Intervalo
de clase

Punto medio
xi

38 42

40

43 47

45

48 52

50

53 57

55

58 62

60

63 - 68

65

3
Total

25

El eje y puede ser sustituido por las


frecuencias relativas o porcentuales.
Polgono de Frecuencia Relativa

fr

xi

Polgono de Frecuencia Porcentual

%f

xi

Histograma
Es la representacin grfica de
los datos mediante una sucesin
de rectngulos.
Est formado por rectngulos cuya anchura
representa a cada uno de los intervalos y la
altura corresponde a la frecuencia.
En el eje x estarn los lmites verdaderos,
los puntos medios y en el eje y las
frecuencias.

Ejemplo

Intervalo
de clase

Punto medio
xi

38 42

40

43 47

45

48 52

50

53 57

55

58 62

60

63 - 68

65

3
Total

25

Tambin podemos usar la frecuencia


relativa y la frecuencia porcentual.

fr

xi

%f

xi

Pirmide Poblacional

Una variante en el histograma es colocar


en el eje x de tal manera que las
columnas quedarn en forma horizontal,
es muy comn en datos poblacionales.

Ojiva

Es la representacin grfica de las


frecuencias acumuladas mediante un
grfico de lnea. Se muestra la
distribucin de frecuencias
acumuladas de los datos.

En el eje x estarn los puntos


medios y en el eje y las frecuencias
acumuladas.

Ejemplo
Interva
lo de
clase

Punto
medio
xi

fr

fa

38 42

40

0.08

43 47

45

0.16

48 52

50

0.32

14

53 57

55

0.20

19

58 62

60

0.12

22

63- 68

65

0.12

25

25

Total

Usando la frecuencia acumulada y la


frecuencia porcentual.

Interval
Punto
o de
medio xi
clase

fr

f%

fa

fra

f%a

38 42

40

0.0
8

0.0
8

43 47

45

0.1
6

16

0.2
4

24

48 52

50

0.3
2

32

14

0.5
6

56

53 57

55

0.2

20

19

0.7

76

Grfico Circular

Tambin es llamado grfico de pastel.

Slo se representan datos de frecuencias


relativas o frecuencias porcentuales.

Se debe dividir el rea del crculo de


manera proporcional a las frecuencias.

Agregaremos una columna a nuestra


tabla de frecuencias Frecuencia
relativa al crculo, multiplicando (fr)
(360), para mostrar la parte
proporcional de crculo medida en
grados que corresponde a cada
intervalo.

Ejemplo 1
Interval
o de
clase

Punto
medio
xi

38 42

40

0.08

43 47

45

0.16

48 52

50

0.32

53 57

55

0.20

58 62

60

0.12

63- 68

65

0.12

25

Total

fr

0.08 x
360

(fr )
(360)

28.8
57.6
115.2
72
43.2
43.2
360

0.16 x
360

Ejemplo 2
Color

Azul
Blanco
Caf
Gris
Negro
Rosa
Verde

Frecuen
cia

IIII
IIII I
II I I
IIII
II
IIII
I

Conteo

4
7
3
4
2
4
1

Otros Grficos
La grfica de barras se traza similar
al Histograma, slo que las barras se
dibujan separadas unas de otras.
La escala en el eje x es para
mostrar categoras o intervalos de
nmeros NO consecutivos.

Carrera
Medicina
Mecnica
Civil
Agronoma
Fsico Matemticas
Leyes
Contadura

Alumn
os
8
11
8
3
3
6
11

Pictograma

Similar al de barras, slo que se


sustituyen por figuras, generalmente
relacionadas con la variable estudiada.