You are on page 1of 12

FACULTAD DE CIENCIAS INGENIERA CIVIL Y ARQUITECTURA

ESCUELA PROFESIONAL DE CIENCIAS FSICO MATEMTICAS

MTODOS ESTADSTICOS
ETAPA DE ORGANIZACIN DE DATOS
En la etapa de recoleccin se obtiene gran cantidad de datos, los mismos que se
encuentran en formularios, cuestionarios, etc. y totalmente desordenados. En esta etapa
se trata de organizar dichos datos y para ello es necesario cumplir dos actividades:
revisin o crtica y clasificacin de los datos:

1. REVISIN O CRITICA DE DATOS


La revisin tiene por objeto:
Determinar si se han recibido todos los formularios o, cuando menos, en una
proporcin que sea suficiente para no invalidar las conclusiones que se podran
hacer.
Verificar que estn registradas todas las respuestas requeridas.
Localizar posibles incongruencias en la informacin proporcionada. La revisin
de datos constituye lo que se llama control de calidad de la informacin.

Entre las posibles causas del envi incompleto de formularios tenemos:


Formularios o cuestionarios muy extensos.
Ausencia de instrucciones claras.
Bajo nivel educativo del informante.
Dotacin insuficiente o inoportuna de los formularios o cuestionarios.

Si no se han registrado todas las respuestas requeridas, puede deberse a:


Formularios o cuestionarios mal diseados.
Negligencia del entrevistador ya que no recibi adiestramiento.
Informante se niega a contestar la pregunta.

2. CLASIFICACIN U ORGANIZACIN DE DATOS


La clasificacin tiene por objeto organizar los datos en categoras, pero teniendo en
cuenta las escalas de medicin de las variables.

2.1. PARA VARIABLES CUALITATIVAS (NOMINALES U ORDINALES)


Para elaborar datos que pertenecen a variables nominales y orinales, es
necesario conocer cmo se clasifica la variable y luego se procede a la
tabulacin.

a. Se ubica la variable con sus categoras.


Variable
Categora 1
Categora 2
Categora 3

Categora k

..::.. Pg. 1 ..::..


Estadstica General Ing. Ronald Mamani Mayta

b. Se realiza el conteo por categora.

Variable Conteo
Categora 1 //// /
Categora 2 ////
Categora 3 ////

Categora k //// ////

c. Se obtiene la Frecuencia Absoluta (fi): Es el nmero de veces que aparece


repetido un valor en el conjunto de las observaciones realizadas y su valor
es un nmero natural.

Variable Conteo
Categora 1 //// // 1
Categora 2 //// 2
Categora 3 //// 3

Categora k //// ////
k
Total f
i 1
i n

PROPIEDAD: En una distribucin de frecuencias que posee k datos distintos


(categoras), siendo el tamao de muestra n, se cumple:

1 + 2 + 3 + + = =
=1

d. Se obtiene la Frecuencia Relativa (hi): Es el cociente entre su frecuencia


absoluta y el nmero de observaciones realizadas o tamao de muestra (n)

y se denota por: =

Variable Conteo
1
Categora 1 //// // 1 1 =

2
Categora 2 //// 2 2 =

3
Categora 3 //// 3 3 =



Categora k //// //// =

k k
Total f
i 1
i n h
i 1
i 1

PROPIEDAD: En una distribucin de frecuencias que posee k datos distintos


(categoras), la suma de las frecuencias relativas de cada uno de los datos es
igual a 1.

..:: Pg. 2 ::..


Estadstica General Ing. Ronald Mamani Mayta

1 + 2 + 3 + + = = 1
=1

e. Se calcula la Frecuencia Relativa Porcentual (hi%): Es la multiplicacin de


cada una de las frecuencias relativas por 100%.

Variable Conteo %
Categora 1 //// // 1 1 1 100
Categora 2 //// 2 2 2 100
Categora 3 //// 3 3 3 100

Categora k //// //// 100
k k k
Total fi n
i 1
hi 1
i 1
h % 100%
i 1
i

PROPIEDAD: La suma de las frecuencias relativas de todos los datos,


expresados porcentualmente es 100%.

1 % + 2 % + 3 % + + % = % = 100%
=1

Ejemplo: Los siguientes datos representan la preferencia por un color de un


grupo de 20 personas: Azul, Rojo, Azul, Azul, Verde, Verde, Rojo, Azul, Azul,
Verde, Negro, Blanco, Negro, Rojo, Azul, Verde, Azul, Azul, Verde, Azul
Elaborar el cuadro de distribucin de frecuencias.

Solucin:
a. Se ubica la variable con sus categoras.

Color
Azul
Rojo
Verde
Negro
Blanco

b. Se realiza el conteo por categora.

Color Conteo
Azul //// ////
Rojo ///
Verde ////
Negro //
Blanco /

..:: Pg. 3 ::..


Estadstica General Ing. Ronald Mamani Mayta

c. Se obtiene la frecuencia absoluta.

Color Conteo
Azul //// //// 9
Rojo /// 3
Verde //// 5
Negro // 2
Blanco / 1
5
Total f
i 1
i 10

d. Se obtiene la frecuencia relativa.

Color Conteo
9
Azul //// //// 9 = 0.45
20
3
Rojo /// 3 = 0.15
20
5
Verde //// 5 = 0.25
20
2
Negro // 2 = 0.10
20
1
Blanco / 1 = 0.05
20
5 5
Total f i 20
i 1
h
i 1
i 1

e. Se calcula la frecuencia porcentual.

Color Conteo %
Azul //// //// 9 0.45 0.45 100 = 45%
Rojo /// 3 0.15 0.15 100 = 15%
Verde //// 5 0.25 0.25 100 = 25%
Negro // 2 0.10 0.10 100 = 10%
Blanco / 1 0.05 0.05 100 = 5%
5 5 3
Total f i 20
i 1
hi 1
i 1
h % 100%
i 1
i

2.2. PARA VARIABLES CUANTITATIVAS DISCRETAS (Datos no agrupados)


a. Se ubica la variable con sus categoras.
Variable (Xi)
X1
X2
X3

Xk

..:: Pg. 4 ::..


Estadstica General Ing. Ronald Mamani Mayta

b. Se realiza el conteo por categora.

Variable
Conteo
(Xi)
X1 //// //
X2 ////
X3 ////

Xk //// ////

c. Se obtiene la Frecuencia Absoluta (fi).

Variable
Conteo
(Xi)
X1 //// // 1
X2 //// 2
X3 //// 3

Xk //// ////
k
Total f
i 1
i n

d. Se calcula la Frecuencias Absoluta Acumulada (Fi): Es la suma de la


frecuencia absoluta del dato y la de todas las anteriores a l.
El primer valor de la frecuencia absoluta acumulada es el mismo al
primer valor de la frecuencia absoluta simple.
Cada frecuencia absoluta acumulada puede indicarse como el resultado
de sumar la frecuencia absoluta acumulada anterior ms la frecuencia
absoluta del dato correspondiente.
El valor de la ltima frecuencia absoluta acumulada es igual al tamao de
la muestra.

Variable
Conteo
(Xi)
X1 //// // 1 1 = 1
X2 //// 2 2 = 1 + 2
X3 //// 3 3 = 2 + 3

Xk //// //// = 1 + =
k
Total f
i 1
i n

e. Se obtiene la Frecuencia Relativa (hi).

..:: Pg. 5 ::..


Estadstica General Ing. Ronald Mamani Mayta

Variable
Conteo
(Xi)
1
X1 //// // 1 1 = 1 1 =

2
X2 //// 2 2 = 1 + 2 2 =

3
X3 //// 3 3 = 2 + 3 3 =



Xk //// //// = 1 + = =

k k
Total fi n
i 1
h
i 1
i 1

f. Se calcula la Frecuencias Relativa Acumulada (Hi): Es la suma de las


frecuencias relativas del dato y la de todas las anteriores a dicho dato.
Variable
Conteo
(Xi)
1
X1 //// // 1 1 = 1 1 = 1 = 1

2
X2 //// 2 2 = 1 + 2 2 = 2 = 1 + 2

3
X3 //// 3 3 = 2 + 3 3 = 3 = 2 + 3



Xk //// //// = 1 + = = = 1 + = 1

k k
Total fi n
i 1
h
i 1
i 1

g. Se obtiene la Frecuencia Relativa Porcentual (hi%).


Variable
Conteo %
(Xi)
1
X1 //// // 1 1 = 1 1 = 1 = 1 1 100

2
X2 //// 2 2 = 1 + 2 2 = 2 = 1 + 2 2 100

3
X3 //// 3 3 = 2 + 3 3 = 3 = 2 + 3 3 100


//// = 1 + = 1 +
Xk = 100
//// = =1
k k k

Total f
i 1
i n h i 1
i 1 h % 100%
i 1
i

h. Se calcula la Frecuencia Relativa Porcentual Acumulada (Hi%): Es la


suma de las frecuencias relativas porcentuales del dato y las anteriores a l,

..:: Pg. 6 ::..


Estadstica General Ing. Ronald Mamani Mayta

se puede obtener multiplicando las frecuencias relativas acumuladas por


100%.
Variable
Conteo % %
(Xi)
1
X1 //// // 1 1 = 1 1 = 1 = 1 1 100 1 100

2
X2 //// 2 2 = 1 + 2 2 = 2 = 1 + 2 2 100 2 100

3
X3 //// 3 3 = 2 + 3 3 = 3 = 2 + 3 3 100 3 100



Xk //// //// = 1 + = = 1 + 100 100

k k k
Total fi n
i 1
hi 1
i 1
h % 100%
i 1
i

Ejemplo: Los siguientes datos representan el nmero de hermanos de un grupo


de 20 personas: 2, 4, 5, 3, 4, 5, 2, 1, 2, 3, 4, 2, 3, 3, 2, 1, 2, 3, 4, 4.
Elaborar el cuadro de distribucin de frecuencias:
Solucin:
a. Se ubica la variable con sus categoras.
N hermanos
(Xi)
1
2
3
4
5

b. Se realiza el conteo por categora.


N hermanos
Conteo
(Xi)
1 //
2 //// /
3 ////
4 ////
5 //

c. Se obtiene la frecuencia absoluta.


N hermanos
Conteo
(Xi)
1 // 2
2 //// / 6
3 //// 5
4 //// 5
5 // 2
5
Total f
i 1
i 20

..:: Pg. 7 ::..


Estadstica General Ing. Ronald Mamani Mayta

d. Se obtiene la frecuencia relativa.


N hermanos
Conteo
(Xi)
1 // 2 0.10
2 //// / 6 0.30
3 //// 5 0.25
4 //// 5 0.25
5 // 2 0.10
5 5
Total
i 1
f i 20 h
i 1
i 1

e. Se calcula la frecuencia porcentual.


N hermanos
Conteo %
(Xi)
1 // 2 0.10 10%
2 //// / 6 0.30 30%
3 //// 5 0.25 25%
4 //// 5 0.25 25%
5 // 2 0.10 10%
5 5 5
Total
i 1
f i 20 hi 1
i 1
h % 100%
i 1
i

f. Tambin se pueden calcular las frecuencias acumuladas.


N hermanos
Conteo % %
(Xi)
1 // 2 2 0.10 0.10 10% 10%
2 //// / 6 8 0.30 0.40 30% 40%
3 //// 5 13 0.25 0.65 25% 65%
4 //// 5 18 0.25 0.90 25% 90%
5 // 2 20 0.10 1.00 10% 100%
Total 20 1.00 100%

Ejercicio 1: Los siguientes datos representan las temperaturas mximas


registradas durante el mes de noviembre de 2014, en la ciudad de Puno:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30,
30, 31, 30, 31, 34, 33, 33, 29.
Elaborar el cuadro de distribucin de frecuencias.

Ejercicio 2: Un grupo de 30 nios se encuentran en el patio de un colegio. A cada


uno se le pregunta por su edad, obteniendo las siguientes respuestas:
5, 7, 6, 7, 9, 8, 5, 7, 8, 10, 7, 6, 6, 5, 6, 7, 9, 7, 10, 8, 6, 9, 7, 6, 6, 5, 11, 10, 7, 8.
Elaborar el cuadro de distribucin de frecuencias.

..:: Pg. 8 ::..


Estadstica General Ing. Ronald Mamani Mayta

2.3. PARA VARIABLES CUANTITATIVAS CONTINUAS (Datos Agrupados)


La organizacin de datos cuyas variables pertenecen a la escala de intervalo o
de razn, tienen otro tipo de tratamiento, ya que para su organizacin y
posterior anlisis, es necesario agruparlos en clases o intervalos, esto es:

a. Se calcula el rango (R): Diferencia entre el dato mayor y el dato menor.

=
b. Se determina el nmero de clases o intervalos (K): Utilizando la Ley de
Sturges.

= + . ()
Dnde:
log : Logaritmo natural
n : Tamao de muestra

c. Se determina la amplitud de intervalo (A): Rango entre nmero de


intervalos.


=

d. Se forman los intervalos de clase, desde el dato menor aumentndole la
amplitud de intervalo (para el primero), para los dems desde el lmite
superior del intervalo anterior aumentndole la amplitud de intervalo.

[ ( + ) >
e. Se calcula la marca de clase (Xi): Se define como la semisuma de los lmites
inferior y superior de cada intervalo de clase.

+
=

f. Se calculan las frecuencias absolutas (fi), frecuencias absolutas acumuladas
(Fi), frecuencias relativas (hi), frecuencias relativas acumuladas (Hi),
frecuencias relativas porcentuales (hi%) y frecuencias relativas
porcentuales acumuladas (Hi%) para cada intervalo de clase.

..:: Pg. 9 ::..


Estadstica General Ing. Ronald Mamani Mayta

Marca
Intervalo
de clase % %


1
[LI1 LS1> 1 1 1 = 1 1 = 1 = 1 1 100 1 100

2
[LI2 LS2> 2 2 2 = 1 + 2 2 = 2 = 1 + 2 2 100 2 100

3
[LI3 LS3> 3 3 3 = 2 + 3 3 = 3 = 2 + 3 3 100 3 100



[LIk LSk> = 1 + = = 1 + 100 100

k k k

Total fi n
i 1
hi 1
i 1
h % 100%
i 1
i

Ejemplo: La siguiente informacin representa el consumo de protenas (medido en


gramos) en una muestra de 20 estudiantes de la EP de Ciencias Fsico Matemticas de
la UNA Puno, los datos son los siguientes:
21, 25, 35, 22, 18, 24, 21, 23, 16, 23, 27, 17, 26, 19, 29, 20, 19, 20, 23, 22
Elaborar el cuadro de distribucin de frecuencias:

Solucin:
1. Se calcula el rango (R): Diferencia entre el dato mayor y el dato menor.
R = 35 16 = 19

2. Se determina el nmero de clases o intervalos (K): Utilizando la Ley de Sturges.


K = 1 + 3,3 log (20)
K = 5,32 K 5

3. Se determina la amplitud de intervalo (A): Rango entre nmero de intervalos.


A=R/K
A = 19 / 5,32
A = 3.57 A = 4

4. Se forman los intervalos de clase, desde el dato menor aumentndole la amplitud


de intervalo (para el primero), para los dems desde el lmite superior del
intervalo anterior aumentndole la amplitud de intervalo.
Intervalos
[16 20>
[20 24>
[24 28>
[28 32>
[32 36>

5. Se calcula la marca de clase (Xi): Se define como la semisuma de los lmites inferior
y superior de cada intervalo de clase.

..:: Pg. 10 ::..


Estadstica General Ing. Ronald Mamani Mayta

Intervalo Marca de
clase
[16 20> 18
[20 24> 22
[24 28> 26
[28 32> 30
[32 36> 34

6. Se calculan las frecuencias absolutas (fi), frecuencias absolutas acumuladas (Fi),


frecuencias relativas (hi), frecuencias relativas acumuladas (Hi), frecuencias
relativas porcentuales (hi%) y frecuencias relativas porcentuales acumuladas
(Hi%) para cada intervalo de clase.
Intervalo Marca de
% %
clase
[16 20> 18 5 5 0.25 0.25 25% 25%
[20 24> 22 9 14 0.45 0.70 45% 70%
[24 28> 26 4 18 0.20 0.90 20% 90%
[28 32> 30 1 19 0.05 0.95 5% 95%
[32 36> 34 1 20 0.05 1.00 5% 100%
5 5 5

Total f
i 1
i 20 h i 1 h % 100%
i
i 1 i 1

Ejercicio 3: Los siguientes datos corresponden a los resultados de los exmenes


tomados a 30 estudiantes en un curso de la universidad, los puntajes son los
siguientes:
34, 28, 35, 46, 32, 24, 30, 23, 38, 33, 41, 34, 30, 27, 38, 43, 48, 27, 31, 26, 37, 26, 41,
32, 26, 29, 20, 36, 36, 41
Elaborar el cuadro de distribucin de frecuencias:

Ejercicio 4: Dado el cuadro incompleto de la distribucin de frecuencias de las notas


de 50 estudiantes. Completar el cuadro, con un ancho de clase constante e igual a 2.
Intervalo
%

[ > 9
[ > 22%
[ > 11 12
[ >
[ > 7
[ > 6%
TOTAL
Seale:
a) Cuntos estudiantes sacaron un puntaje menor de 10?
b) Qu porcentaje de estudiantes obtuvieron 12 o ms de 12 pero menos de 16?

..:: Pg. 11 ::..


Estadstica General Ing. Ronald Mamani Mayta

Ejercicio 5: Se conoce la siguiente distribucin en base a los pesos de 80 nios.


Pesos
[17 20 > 7
[20 23 > 18
[23 26 > 5a
[26 29 > 12
[29 32 > 2a
[32 35 > 8
Seale:
a) Completar el cuadro de distribucin de frecuencias
b) Qu porcentaje de estudiantes tienen un peso superior a 25 Kg.?
c) Cuntos nios tienen pesos comprendidos entre 21 y 28 Kg.?

..:: Pg. 12 ::..

You might also like