You are on page 1of 14

INVESTIGACION PRCTICA DEL USO DEL

MATLAB EN EL CAMPO ESTADSTICO.


FABRICA DE PERNOS MOCELU S.A.
La produccin de pernos de alta resistencia estn especificados en las normas ASTM
A325 y A490. El perno A325 es fabricado bajo tratamiento trmico y con un acero
temperado de medio carbono, el perno A490 es de un acero de baja aleacin y templado,
tiene propiedades ms altas que el A325. Estas son algunas de las especificaciones que
en general debe cumplir una empresa que fabrica este tipo de piezas. Hoy en da toda
industria bien sea en el campo que se desarrolle debe mantener un alto status de
productividad y calidad para permanecer en el mercado global, esto conlleva
indudablemente a la mejora del nivel de vida de la empresa. Con el fin de mejorar la
organizacin se ha hecho un estudio de calidad en la siguiente empresa productora de
pernos, verificando si es posible satisfacer las necesidades y especificaciones de nuestro
cliente. Para dicho estudio se tom en cuenta una muestra de 300 pernos para su
inspeccin.

DETERMINANDO LA TABLA DE DISTRIBUCIN DE FRECUENCIAS CON MATLAB.


Con ayuda del software matemtico estadstico Matlab, analizaremos los datos, ubicando
en primer lugar la tabla de distribucin de frecuencias.
Para ello estableceremos algunas variables que nos sern muy tiles a la hora de
organizar nuestros datos.
Tambin guiaremos paso a paso a travs de imgenes capturadas del software Matlab en
accin.
Este software no solo nos permitir procesar datos para este ejercicio, sino que tiene una
amplia gama de soluciones para diferentes ramas como ingeniera, matemtica, fsica
qumica biomdicas, estadstica, y en ramas afines.
Una tabla de distribucin de frecuencias nos permitir agrupar de manera practica y
manejable una gran cantidad de datos, ahorrndonos de esta forma muchos clculos y
tiempo, mejorando as la eficiencia de anlisis de datos y su uso, todos estos procesos
realizados a travs del software informtico, estadstico y matemtico, Matlab.

MATRIZ: M
Donde M el dimetro de 300 pernos, cabe resaltar que M esta expresado en forma
matricial para que podamos utilizar los datos y procesarlos estadsticamente.
M=[1.475 1.514 1.507 1.538 1.481 1.512 1.481 1.469
1.539 1.498 1.459 1.420 1.523 1.542 1.515 1.538 1.559
1.509 1.519 1.479 1.455 1.487 1.504 1.524 1.480 1.444
1.422 1.529 1.487 1.518 1.470 1.516 1.511 1.432 1.506
1.520 1.474 1.471 1.487 1.442 1.497 1.510 1.502 1.561
1.532 1.440 1.428 1.523 1.459 1.505 1.544 1.448 1.538
1.491 1.509 1.486 1.487 1.473 1.528 1.511 1.521 1.462
1.427 1.453 1.357 1.494 1.623 1.528 1.516 1.430 1.492
1.509 1.472 1.441 1.496 1.547 1.476 1.508 1.515 1.553
1.492 1.485 1.487 1.510 1.498 1.557 1.460 1.469 1.457
1.561 1.450 1.501 1.480 1.531 1.503 1.444 1.487 1.515
1.420 1.421 1.525 1.503 1.443 1.483 1.445 1.477 1.500
1.483 1.519 1.531 1.510 1.495 1.471 1.496 1.491 1.448
1.339 1.511 1.495 1.536 1.435 1.440 1.468 1.498 1.525
1.519 1.506 1.529 1.466 1.518 1.412 1.515 1.516 1.534
1.577 1.520 1.500 1.486 1.471 1.457 1.412 1.566 1.520
1.501 1.475 1.524 1.511 1.502 1.482 1.474 1.429 1.511
1.461 1.479 1.494 1.496 1.483 1.548 1.508 1.544 1.522
1.527 1.503 1.439 1.528 1.507 1.517 1.482 1.440 1.439
1.481 1.508 1.508 1.518 1.501 1.494 1.529 1.534 1.459
1.526 1.558 1.450 1.516 1.512 1.536 1.529 1.514 1.460
1.535 1.539 1.543 1.581 1.509 1.455 1.479 1.400 1.563
1.528 1.502 1.442 1.508 1.375 1.475 1.455 1.496 1.542
1.523 1.472 1.435 1.510 1.504 1.507 1.442 1.449 1.436
1.390 1.543 1.485 1.555 1.489 1.444 1.573 1.483 1.505
1.525 1.461 1.446 1.497 1.486 1.443 1.455 1.545 1.518
1.535 1.451 1.537 1.528 1.487 1.549 1.436 1.482 1.567
1.470 1.405 1.505 1.496]

1.539
1.475
1.500
1.554
1.526
1.473
1.535
1.489
1.476
1.469
1.479
1.521
1.485
1.445
1.506
1.519
1.485
1.516
1.487
1.487
1.520
1.506
1.477
1.505
1.497
1.485
1.519

1.467
1.495
1.507
1.420
1.536
1.566
1.401
1.394
1.524
1.519
1.446
1.544
1.523
1.534
1.563
1.542
1.513
1.468
1.602
1.498
1.496
1.510
1.562
1.453
1.509
1.509
1.511

Importante:
M=M

RANGO: R
Siendo el rango la diferencia del mximo y el mnimo valor de los datos. Este se
representar con la letra R
R=max(M)-min(M)
Donde:

R= 0.2840

TAMAO DE LA MUESTRA: ni o n
ni=size(M)
Donde:

ni= [300

1]

Nota: el tamao de la muestra indica tambin un 1, como segundo componente de la


matriz, este se origina porque la matriz inicial M es de la forma [a b]
NMERO DE INTERVALOS: K
if ni<25;
ki=1+3.321929*log10(ni),
k=round(ki);%halla k si numero de datos de la matriz M
son menores a 25
else
ki=sqrt(ni);
k=round(ki);%halla k si nmero de datos de la matriz M
son mayores a 25
end

Lo anterior fue una condicin debido a que el valor de k y el mtodo de hallarlo depende
de ni, seguidamente introducimos los siguientes comandos.
ki =

17.3205

k =

17

El nmero de intervalos solo puede ser un nmero entero, por ello el comando round
permite redondear ki a k un entero.
AMPLITUD DE INTERVALOS: ci
ci=R/k(1)

ci= 0.0164
Para determinar la amplitud de intervalos usamos el comando anterior, el cual ser una
diferencia, la misma ser constante en todos los intervalos de la tabla de distribucin de
frecuencias.

MARCA DE CLASE: cl
Para hallar las marcas de clase de cada intervalo primero cabe fijar ciertos comandos
como los que veremos a continuacin.

cl=min(M):ci:max(M)
cl=[1.3390 1.3557 1.3724 1.3891 1.4058 1.4225 1.4392
1. 1.4726 1.4894 1.5061 1.5228 1.5395 1.5562 1.5729
1.5896 1.6063 1.6230]
cma=cl' cmi=cl' cmin=cmi(1:k)

cmax=cma(2:k+1)

Nota: Para hacer el trabajo viable, creamos un vector para espaciar las marcas de clase,
lo cual estar definido en el comando antes visto.

FRECUENCIA ABSOLUTA ACUMULADA:(Nj)

Es aquella que resulta de acumular sucesivamente las frecuencias absolutas ni, por
propiedad, la sumatoria de todas las frecuencias absolutas simples es 1.
for i=1:k
V(i)=[length(find(M<=cmax(i)))]
hi(i)=ci/length(M)
end

V=V
Frecuencia

hi=hi
Frecuencia

absoluta acumulada
1
2
3
8
15
26
54
78
125
170
228
269
284
295
298
299
300

relativa simple
0.0033
0.0033
0.0033
0.0167
0.0233
0.0367
0.0933
0.0800
0.1567
0.1500
0.1933
0.1367
0.0500
0.0367
0.0100
0.0033
0.0033

Nota: Recordemos tambin que el apostrofe() indica que la matriz, al estar en forma
horizontal, la convertir en forma vertical, es decir la representa como la inversa de la
matriz original.
V=V'
for z=2:k
C(z)=V(z)-V(z-1)
end
Luego aplicamos el siguiente comando, para relacionar las variables que en lneas
anteriores ya han sido vistas.
C(1)=V(1)
A=C'

FRECUENCIA RELATIVA SIMPLE: hi


for j=1:k
hi(j)=C(j)/length(M)
end

Como sabemos la frecuencia relativa simple se obtiene del cociente de la frecuencia


absoluta y el nmero total de observaciones realizadas n.
hif=hi'

Frecuencia relativa
simple
0.0033
0.0033
0.0033
0.0167
0.0233
0.0367
0.0933
0.0800
0.1567
0.1500
0.1933
0.1367
0.0500
0.0367
0.0100
0.0033
0.0033

TABLA DE DISTRIBUCIN DE FRECUENCIAS


Son aquellas tablas de trabajo que presentan la distribucin de un conjunto de datos de
acuerdo a las caractersticas de una variable, en ellas observamos la frecuencia o
repeticin de cada una de las variables.

DIAGRAMAS DE BARRAS:
Frecuencia absoluta en funcin de marca de clase.
Comando:
bar((cmax+cmin)/2,A)
ESTE INDICA QUE EL DIAGRAMA SOLICITADO ES EL DE BARRAS, QUE TIENE LOS
COMPONENTES (X,Y), SEGUIDAMENTE MOSTRAREMOS OTRAS DE LAS FUNCION
DE GRAFICOS QUE NOS OFRECE EL MATLAB, TODAS TINEN LA FORMA (X,Y), Y EL
TIPO DE DIAGRAMA SERA DETERMINADO POR EL COMANDO QUE USEMOS, SEA:
BAR, PIE, STAIRS,ENTRE OTRAS.

GRAFICA DE ESCALERA, COMPARANDO FRECUENCIA ABSOLUTA Y FRECUENCIA


ACUMULADA POR MARCA DE CLASE.
bar((cmax+cmin)/2,A)
hold on
stairs((cmax+cmin)/2,V)
El comando hold on permite que la anterior grfica no se borre cuando introducimos la
segunda, esto nos sirve para comparar magnitudes de estadigrafos, como a continuacion
veremos.

DIAGRAMA DE SECTORES CIRCULARES.


pie((cmax+cmin)/2,A)
ESTE ES EL CONOCIDO DIAGRAMA EN FORMA DE TORTA O PIE, NOS SIRVE PARA
PODER COMPARAR NUESTOS DATOS CON OTROS DE SU MISMA ESPECIE, EN
ESTE CASO VEREMOS EL SIGUIENTE EJEMPLO:

ESTADIGRAFOS
En esta seccin veremos algunos de los ms importantes y tiles estadgrafos
estadsticos, que posteriormente nos sern de utilidad.
Media aritmtica:
Usaremos el estadgrafo de posicin ms usado, el cual localiza el centro de la
distribucin de nuestros datos (donde convergen la mayora de nuestras
observaciones).
El comando es:

mean(M)
ans =

1.4947

Mediana:
La media ser usada para obtener el valor medio de la distribucin ms exacto
dividiendo al total de los datos y/o observaciones, ordenadas en forma creciente o
decreciente en dos partes de igual nmero de observaciones.
El comando es:

median(M)
ans =

1.5000

Moda:
La moda ser usada para localizar el valor de la variable a la que le corresponde la
mayor frecuencia absoluta simple.
El comando es:

mode(M)
ans=

1.4870

Media poblacional():
Es la media aritmtica de una poblacin finita de tamao ya definido (M).
El comando es:

= sum(M)/size(M)
ans=

1.4947

Desviacin estndar:
La desviacin estndar no es ms que la raz cuadrada de la varianza.
El comando es:

std(M)

ans =

0.0408

Coeficiente de variacin:
Usaremos este estadgrafo de dispersin relativa (libre de unidades de medida).
El comando es:

CV= (std(M)/mean(M))*100
ans=

2.7327

Coeficiente de asimetra:
Entre los coeficientes de asimetra o de deformacin utilizaremos el primero y el
segundo propuestos por Karl Pearson.
Los comandos sern:
a) Por Karl Pearson:
AS1= ((mean(M)-mode(M))/std(M)
ans=

0.1884

AS2= (3*(mean(M)-median(M))/std(M))
ans=

0.5653

DISTRIBUCIONES ESTADISTICAS, TRABAJADAS EN MATLAB.

DISTRIBUCIN NORMAL (GAUSIANA)


Se aplica para describir atributos humanos o de objetos:
peso, altura, etc. Dentro de un grupo (variaciones en
las notas de exmenes), medidas de errores angulares o
lineales, generacin de ruido y pequeas perturbaciones,
datos meteorolgicos como temperatura y precipitacin
pluvial, errores de instrumentacin, etc.