You are on page 1of 34

PROCESANDO LA INFORMACIN

M.S.I. Leticia Rodrguez Rivas

ORGANIZACIN DE DATOS
Cuando decidimos realizar una investigacin
siempre es una caracterstica la que se estudia, ya
que cada individuo, empresa o articulo cuenta con
muchas de ellas. Entonces cuando recabamos
todas esas observaciones que nos interesan es de
mucha utilidad obtener indicadores que nos
permitan apreciar que tendencia marcan en
conjunto, es decir, los datos aislados a simple vista
no nos dicen nada, debemos entonces organizarlos
y obtener medidas especficas.
Leticia Rodrguez Rivas

CONCEPTOS COMUNMENTE UTILIZADOS


EN LA ORGANIZACIN DE DATOS
Concepto de Estadstica: Ciencia que utiliza diversos mtodos para recopilar,
Organizar, Presentar, Analizar e Interpretar datos o hechos que se pueden
valorar numricamente para obtener conclusiones adecuadas.
Toma de datos: Obtencin de una serie de datos que no han sido
Ordenados numricamente.
Ordenacin: Acomodo u ordenamiento de los datos numricos en
forma creciente o decreciente.
Recorrido o rango: Diferencia entre el mayor y el menor de los datos.

Leticia Rodrguez Rivas

MEDIDAS DE TENDENCIA CENTRAL


Media: Es un promedio de todas las observaciones.
Mediana: Es la observacin que se encuentra justo a la
mitad, despus de organizarlas.
Moda: Es la observacin que ms se presenta.

Leticia Rodrguez Rivas

Leticia Rodrguez Rivas

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS


NO AGRUPADOS
Cuando los datos que recabamos son pocos no es necesario
organizarlos en grupos, simplemente ordenarlos y aplicar las
frmulas para obtener las medidas mencionadas. Por
ejemplo, se desean analizar las ganancias obtenidas durante
esta semana:
480, 325, 232, 607, 805, 557, 607
El primer paso es ordenarlos:
232, 325, 480, 557, 607, 607, 805
Leticia Rodrguez Rivas

Despus de ello podemos obtener la media, con la siguiente


formula, que no es mas que sumar todas las observaciones y
dividirla entre el total de datos recabados, es decir, el tamao
de la muestra, que se representa por n.

= 232+325+480+557+607+607+805 =

= 516.14

Se puede decir entonces que en promedio las ganancias fueron


de $516.14

Leticia Rodrguez Rivas

La mediana debe elegirse obligatoriamente cuando ya fueron


ordenados. La posicin del dato que se encuentra justo a la
mitad de las observaciones se utiliza la frmula:
=
Recuerda que solo es la posicin, NO la mediana.
=

= =4

Debemos entonces elegir el dato que se encuentra en la cuarta


posicin.
232, 325, 480, 557, 607, 607, 805
Para estos entonces la mediana es 557

Leticia Rodrguez Rivas

La moda, por ser el dato que mas se repite no cuenta con


ninguna frmula para obtenerla, simplemente debemos revisar
las observaciones, y la que ms se repita es la que elegimos
como moda. Si no hay dato que se repita entonces se dice que
es amodal, o si tiene dos datos que tienen el mismo nmero de
repeticiones se dice que es bimodal. Para el ejemplo que nos
ocupa la moda ser 607.
232, 325, 480, 557, 607, 607, 805

Leticia Rodrguez Rivas

MEDIDAS DE DISPERSIN PARA DATOS


NO AGRUPADOS
Las medidas de dispersin indican que tanto se alejan los datos
de su media o promedio. Es muy importante destacar que se
representan con diferente smbolo si nos referimos a la varianza
y desviacin estndar de la poblacin o de la muestra, y stas
son:

Poblacin

Muestra

Varianza

S2

Desviacin
Estndar

Leticia Rodrguez Rivas

La frmula que se utiliza para obtener la varianza es:



=
Y para obtener la desviacin estndar simplemente debemos sacar la raz cuadrada de la varianza:
s=
Para este caso en particular se aplican entonces las frmulas:232, 325, 480, 557, 607, 607, 805
=

232 516.14

+ 325 516.14

+ 480 516.14

+ 557 516.14
7

+ 607 516.14

220196.85
= 31456.69
7

Por lo tanto la desviacin estndar es:


= 31456.69 = 177.36

Leticia Rodrguez Rivas

+ 607 516.14

+ 805 516.14

DATOS AGRUPADOS
Pero no siempre son pocos los datos que se utilizan al estudiar cualquier fenmeno, por lo
general las muestras son grandes y en estos casos, para poder manejarlos y analizarlos
ms fcilmente se agrupan. Para ello es necesario familiarizarnos con los siguientes
conceptos:

Distribucin de frecuencias: Ordenacin tabular de datos, distribuidos en clases o


categoras.

Intervalos de clase: Es el tamao de las clases o categoras.

Frecuencia de clase: Nmero de datos (o elementos) pertenecientes a una clase


especfica.

Lmites de clase: Son los datos (numricos) extremos de cada clase o Categora.

Marca de clase: Es el punto medio del intervalo de clase. Se obtiene sumando el lmite
inferior y el lmite superior de la clase y dividiendo el resultado entre dos.

Leticia Rodrguez Rivas

Comenzamos sobre un ejemplo en particular para saber como ir


formando la distribucin de frecuencias. Se han registrado los vehculos que
pasaron por la caseta Sacramento durante las 56 horas alrededor del 16 de
septiembre:
62
39
145
71
96
59
98

31
58
142
70
84
40
139

110
102
128
77
103
136
73

62
58
118
85
34
93
115

129
107
54
140
84
144
117

56
65
77
121
73
137
131

69
37
105
92
123
119
98

77
122
83
53
77
77
84

Lo primero que debe hacerse es ordenar la informacin:


31
34
37
39
40
53
54
56

58
58
59
62
62
65
69
70

71
73
73
77
77
77
77
77

83
84
84
84
85
92
93
96

Leticia Rodrguez Rivas

98
98
102
103
105
107
110
115

117
118
119
121
122
123
128
129

131
136
137
139
140
142
144
145

El nmero de clases, que son los grupos o renglones que van a


tener la distribucin de frecuencias tiene muchas maneras de
obtenerse, una de ellas es mediante la siguiente formula:
!"# $ =
Donde n es el total de observaciones, o datos recabados:
!"# $ = 56 = 7.5
Como esto representa el nmero de grupos, no podemos
manejar datos decimales, entonces lo redondeamos, en este
caso a 8.
Leticia Rodrguez Rivas

A continuacin, determinamos de que tamao sern estas


clases, es decir el intervalo de clase, o tamao de intervalo. El
cual por lo general se representa mediante sus iniciales (i.c.) o
(t.i.) segn los autores. La frmula para su obtencin es:
'#%( )#*(+ '#%( )$ (+
%. &. =
,)$+( '$ -"# $
Para nuestro ejemplo tenemos:
145 31
%. & =
= 14.25
8
En este caso tambin debemos redondear, por lo que el tamao
de intervalo ser de 14.
Leticia Rodrguez Rivas

Ya que sabemos cuantos grupos, clases o renglones tendr


nuestra tabla y de que tamao sern estos grupos, comenzamos
a formarla, tomando el dato mas pequeo como punto de
partida y CONTANDO a partir de el los 14 que marca el tamao
de intervalo. Debemos tener claro que SUMAR no es lo mismo
que contar, ya que en contar estamos considerando a la base ya
como parte de esos 14, por lo tanto CONTAR es lo mismo que
SUMAR uno menos. Veamos el ejemplo.

Leticia Rodrguez Rivas

Clases
31-44

En este caso como el 31 ya cuenta como parte de esos


14, solamente hay que sumar los 13 que restaran para
completar la clase.

45-58

Cada nueva clase se contina con el dato siguiente al


que termina la clase anterior.

59-72
73-86
87-100
101-114
115-128
129-142
143-156
En ocasiones el nmero de clases es exacto, ya que para
abarcar todas las observaciones puede ser necesario agregar
otra clase.
Leticia Rodrguez Rivas

Ahora se deben determinar las marcas de clase que son el


promedio de los limites en cada una. En esta presentacin vern
la operacin para obtener cada una, pero no es necesario
ponerlas posteriormente:
Clases

Marca de Clase

31-44

(31+44)/2= 37.5

45-58

(45+58)/2= 51.5

59-72

(59+72)/2= 65.5

73-86

(73+86)/2=79.5

87-100

(87+100)/2 = 93.5

101-114

(101+114)/2= 107.5

115-128

(115+128)/2= 121.5

129-142

(129+142)/2=135.5

143-156

(143+156)/2=149.5

Leticia Rodrguez Rivas

La siguiente columna registra la cantidad de datos que se


presentan dentro de los limites de cada clase, a sta se le llama
frecuencia absoluta y se representa con una (f):
31
34
37
39
40
53
54
56

58
58
59
62
62
65
69
70

71
73
73
77
77
77
77
77

83
84
84
84
85
92
93
96

98
98
102
103
105
107
110
115

117
118
119
121
122
123
128
129

131
136
137
139
140
142
144
145

Clases

M.C.

Frecuencia
absoluta (f)

31-44

37.5

45-58

51.5

59-72

65.5

73-86

79.5

12

87-100

93.5

101-114

107.5

115-128

121.5

129-142

135.5

143-156

149.5

Leticia Rodrguez Rivas

Una manera de comprobar que se han realizado las operaciones


correctamente es sumar todas las frecuencias y esto debe dar como total el
valor de n. La siguiente columna registra la frecuencia pero expresada a
manera de porcentaje, haciendo una operacin derivada de una regla de tres.
Clases

M.C.

31-44

37.5

=5*100/56=8.93%

45-58

51.5

=5*100/56=8.93%

59-72

65.5

=7*100/56=12.5%

73-86

79.5

12

=12*100/56=21.43%

87-100

93.5

=5*100/56=8.93%

101-114

107.5

=5*100/56=8.93%

115-128

121.5

=8*100/56=14.28%

129-142

135.5

=7*100/56=12.5%

143-156

149.5

=2*100/56=3.57%

TOTAL

Frecuencia
absoluta (f)

56

Frecuencia relativa (% f)

100 %

Leticia Rodrguez Rivas

La siguiente es la frecuencia acumulada y se representa por (F). Como su


nombre lo dice, va juntando las frecuencias clase por clase, sumando lo
que se va acumulando:
Clases
M.C.
( f ) ( %f )
Frecuencia acumulada
(F)
31-44

37.5

8.93%

45-58

51.5

8.93%

=5+5 = 10

59-72

65.5

12.5%

= 7+10 = 17

73-86

79.5

12

21.43%

=12+17= 29

87-100

93.5

8.93%

=5+29 = 34

101-114

107.5

8.93%

=5+34= 39

115-128

121.5

14.28%

=8+39= 47

129-142

135.5

12.5%

=7+47= 54

143-156

149.5

3.57%

=2+54=56

TOTAL

56

100 %
Leticia Rodrguez Rivas

La frecuencia acumulada debe expresarse tambin a manera de


porcentaje:
Clases

M.C.

(f)

( %f )

(F)

(%F)

31-44

37.5

8.93%

=5*100/56=8.93 %

45-58

51.5

8.93%

10

=10*100/56=17.86 %

59-72

65.5

12.5%

17

=17*100/56=30.36 %

73-86

79.5

12

21.43%

29

=29*100/56=51.79 %

87-100

93.5

8.93%

34

=34*100/56=60.71 %

101-114

107.5

8.93%

39

=39*100/56=69.64 %

115-128

121.5

14.28%

47

=47*100/56=83.93 %

129-142

135.5

12.5%

54

=54*100/56=96.43 %

143-156

149.5

3.57%

56

=56*100/56=100 %

TOTAL

56

100 %
Leticia Rodrguez Rivas

Las prximas dos columnas son auxiliares para obtener la media y la


varianza respectivamente:
Clases5 M.C.

( f ) ( %f )

(F) (%F)

f * M.C.

31-44

37.5

8.93%

8.93 %

=5*37.5=187.5

45-58

51.5

8.93%

10

17.86 %

=5*51.5=257.5

59-72

65.5

12.5%

17

30.36 %

=7*65.5=458.5

73-86

79.5

12

21.43%

29

51.79 %

=12*79.5=954

87-100

93.5

8.93%

34

60.71 %

=5*93.5=467.5

101-114

107.5

8.93%

39

69.64 %

=5*107.5=537.5

115-128

121.5

14.28%

47

83.93 %

=8*121.5=972

129-142

135.5

12.5%

54

96.43 %

=7*135.5=948.5

143-156

149.5

3.57%

56

100 %

=2*149.5=299

TOTAL

56

100 %

5082
Leticia Rodrguez Rivas

f * (M.C.2 )

Ahora la segunda:

(F) (%F)

f * M.C

f * (M.C.2 )

8.93%

8.93 %

187.5

=5*(37.52)=7031.25

8.93%

10

17.86 %

257.5

=5*(51.52)=13261.25

65.5

12.5%

17

30.36 %

458.5

=7*(65.52)=30031.75

73-86

79.5

12

21.43%

29

51.79 %

954

=12*(79.52)=75843

87-100

93.5

8.93%

34

60.71 %

467.5

=5*(93.52)=43711.25

101-114

107.5

8.93%

39

69.64 %

537.5

=5*(107.52)=57781.25

115-128

121.5

14.28%

47

83.93 %

972

=8*(121.52)=118098

129-142

135.5

12.5%

54

96.43 %

948.5

=7*(135.52)=128521.75

143-156

149.5

3.57%

56

100 %

299

=2*(149.52)=44700.5

5082

518,980

Clases5

M.C.

31-44

37.5

45-58

51.5

59-72

TOTAL

( f ) ( %f )

56

100 %
Leticia Rodrguez Rivas

Ya que est terminada se comienza la obtencin de las medidas


de tendencia central, comenzando por la media.
( %f )

(F)

(%F)

f * M.C

f * (M.C.2 )

8.93%

8.93 %

187.5

7031.25

51.5

8.93%

10

17.86 %

257.5

13261.25

59-72

65.5

12.5%

17

30.36 %

458.5

30031.75

73-86

79.5

12

21.43%

29

51.79 %

954

75843

87-100

93.5

8.93%

34

60.71 %

467.5

43711.25

101-114

107.5

8.93%

39

69.64 %

537.5

57781.25

115-128

121.5

14.28%

47

83.93 %

972

118098

129-142

135.5

12.5%

54

96.43 %

948.5

128521.75

143-156

149.5

3.57%

56

100 %

299

44700.5

5082

518,980

Clases

M.C.

31-44

37.5

45-58

TOTAL

(f)

56

100 %
Leticia Rodrguez Rivas

La frmula de media es:


=

(/ 1. !. )

La operacin que se debe realizar en el numerador es una sumatoria de


frecuencias por marcas de clase, que a final de cuentas es el resultado de la
penltima columna de la distribucin de frecuencias:
5082
=
= 90.75
56
Esto es que en promedio circularon 90.75 vehculos por hora, o bien se
deseamos expresarlo en cantidades enteras podemos decir que circularon en
promedio 91 vehculos.

Leticia Rodrguez Rivas

La frmula para la mediana es:


5
2
3 = 4)$' +
/

%. &

Donde:
Lmed=Es el lmite inferior de la clase mediana.
F= es la frecuencia acumulada de la clase ANTERIOR a la mediana.
f=es la frecuencia absoluta de la clase mediana
t.i.=es el tamao de intervalo.
Para comenzar a sustituir en la frmula debemos ubicar primero la clase
mediana, y esta es donde por primera vez de iguala o sobrepasa (n/2) en la
columna de la frecuencia acumulada (F).

Leticia Rodrguez Rivas

En base a esto la clase mediana es donde por primera vez


iguale o sobrepase 56/2= 28
(f)

( %f )

(F)

(%F)

f * M.C

f * (M.C.2 )

37.5

8.93%

8.93 %

187.5

7031.25

45-58

51.5

8.93%

10

17.86 %

257.5

13261.25

59-72

65.5

12.5%

17

30.36 %

458.5

30031.75

73-86

79.5

12

21.43%

29

51.79 %

954

75843

87-100

93.5

8.93%

34

60.71 %

467.5

43711.25

101-114

107.5

8.93%

39

69.64 %

537.5

57781.25

115-128

121.5

14.28%

47

83.93 %

972

118098

129-142

135.5

12.5%

54

96.43 %

948.5

128521.75

143-156

149.5

3.57%

56

100 %

299

44700.5

5082

518,980

Clases

M.C.

31-44

TOTAL

56

100 %

Por lo tanto esta es la clase mediana


Leticia Rodrguez Rivas

Aplicando entonces la formula tenemos:


3 = 4)$' + 2

5
/

%. &

Donde:
Lmed=73
F= 17
f=12
t.i.=14
3 = 73 +

14 =85.83

Leticia Rodrguez Rivas

Ahora obtengamos la moda:


7 = 4)(' +

8#
%. &
8# + 89

Donde:
Lmod=Es el lmite inferior de la clase modal.
Da= Frecuencia absoluta de la clase modal menos la anterior.
Db= Frecuencia absoluta de la clase modal menos la posterior.
t.i.=es el tamao de intervalo.
Para comenzar a sustituir en la frmula debemos ubicar primero la clase
modal, y esta es donde la frecuencia absoluta es la mayor.

Leticia Rodrguez Rivas

En base a esto la clase modal es la siguiente:


(f)

( %f )

(F)

(%F)

f * M.C

f * (M.C.2 )

37.5

8.93%

8.93 %

187.5

7031.25

45-58

51.5

8.93%

10

17.86 %

257.5

13261.25

59-72

65.5

12.5%

17

30.36 %

458.5

30031.75

73-86

79.5

12

21.43%

29

51.79 %

954

75843

87-100

93.5

8.93%

34

60.71 %

467.5

43711.25

101-114

107.5

8.93%

39

69.64 %

537.5

57781.25

115-128

121.5

14.28%

47

83.93 %

972

118098

129-142

135.5

12.5%

54

96.43 %

948.5

128521.75

143-156

149.5

3.57%

56

100 %

299

44700.5

5082

518,980

Clases

M.C.

31-44

TOTAL

Da

Db

56

100 %

Por lo tanto esta es la clase modal


Leticia Rodrguez Rivas

Sustituyendo en la formula tenemos:


7 = 4)(' +

8#
%. &
8# + 89

Donde:
Lmod=73
Da= 12-7=5
Db= 12-5=7
t.i.=14
7 = 73 +

5
14 = 78.83
5+7

Leticia Rodrguez Rivas

La varianza, como primera medida de dispersin, se obtiene con la


siguiente frmula:
: =

/ 1. !
1

Donde la primera parte del numerador (la sumatoria) ya la tenemos en


el resultado de la ltima columna de la distribucin de frecuencias, n es
el tamao de la muestra y la es la media que sacamos previamente.
Entonces queda:
: =

518980 56 90.75
= 1050.7
55

Y en base a ella se obtiene la desviacin estndar, sacando la raz a la


varianza:
:=

: = 1050.7 = 32.41

Leticia Rodrguez Rivas

Ahora ya hemos terminado la obtencin de las medidas de tendencia central y


de dispersin tanto en datos agrupados como en datos no agrupados.

Leticia Rodrguez Rivas

You might also like