You are on page 1of 12

Capítulo II

2. Estadística descriptiva
2.1. Análisis descriptivo de una variable cualitativa en escala nominal
Ejemplo 1: Se desea analizar ciertas áreas estudiadas y cartografiadas de acuerdo a la
alteración mineralógica de rocas intrusivas relacionadas con sistemas mineralizantes,
tomando como base la clasificación y modelos de Einaudi (1982 y !uc"anan (1981#
$ealizar este análisis, tomando como base la variable %alteración& del arc"ivo
%descri'(1#sav&#
Nota: )l asignar códigos num*ricos a los cinco ti'os de alteración, no e+iste ninguna
razón a'arente 'ara asignar un menor o mayor valor a cual,uiera de ellos, en estas
situaciones, cuando los valores de una variable son no num*ricos con ausencia de orden
entre ellos, se dice ,ue la variable corres'ondiente es de ti'o cualitativo y ,ue la escala
de medida de sus 'osibles valores es nominal#
)-)./SE  0ES1$23425E S4)42S421S 6$E78E-12ES
5)$2)!.E(S: ).4E$)129-, 1:)$4S: !)$ 1:)$4S,
1:)$4 5).8ES: 6$E78E-12ES
9;
Alteration Mineralogy of Intrusion Related Mineralisisng Systems
16 17.0 17.0 17.0
14 14.9 14.9 31.9
27 28.7 28.7 60.6
18 19.1 19.1 79.8
19 20.2 20.2 100.0
94 100.0 100.0
Argílica avanzada
Argílica
Sericítica
Propilítica
Potásica
Total
alid
!re"#enc$ Percent
alid
Percent
%#&#lative
Percent
Interpretación 1:
################################################################################################################################################
################################################################################################################################################
###############################################################################################################################################
'o(inson illan#eva rvillan#eva)rn&a.co&.pe
2<
)lteraciones mineralógicas de intrusivos
relacionados con sistemas mineralizantes
4i'os de alteración, Einaudi (1982 y !uc"anan (1981
Potásica
Propilítica
Sericítica
Argílica
Argílica avanzada
!
r
e
c
#
e
n
c
i
a
s
30
20
10
0
Ejemplo 2: ) fin de com'arar y analizar la concentración de 1u, 3b y =n, de un
'ros'ecto minero, se "an tomado >9 muestras#
2a) Si la variable %muestreo& del arc"ivo %descri'(2(test#sav& identifica si la muestra se
tomó en roca (valor 1 o en suelo (valor <# 1alcule, la frecuencia de cada uno de sus dos
valores (roca y suelo#
)-)./SE  0ES1$23425E S4)42S421S  6$E78E-12ES
5)$2)!.E(S : ?8ES4$E9
02S3.)/ 6$E78E-1/ 4)!.ES
9;
Statistics muestreo
- 5alid >9
?issing <
muestreo
6re,uency 3ercent 5alid
3ercent
1umulative
3ercent
5alid suelo @A A9#@ A9#@ A9#@
roca @B B<#C B<#C 1<<#<
4otal >9 1<<#< 1<<#<
Figura 2a. 0istribución de frecuencias de los valores de la variable %muestreo&
'o(inson illan#eva rvillan#eva)rn&a.co&.pe
21
Interpretación
2a) : ########################################################################################################################################
#####################################################################################################################
2b) 1alcule 'ara las variables 3b y =n del arc"ivo descri'(2(test#sav, la desviación
tD'ica, el mDnimo y el má+imo valor:
)-)./SE  0ES1$23425E S4)42S421S  0ES1$23425ES
5)$2)!.E(S : 3! y =-
93429-S: ?E)-, 02S3E$S29-, S4# 0E52)429-, ?2-2?8?, ?)E2?8?
02S3.)/ 9$0E$
).3:)!E421
19-42-8E,
9;
0escri'tive Statistics
3! =- 5alid - (listFise
- >9 >9 >9
?inimum @@ 82
?a+imum >1BC A<<<<
?ean 1A2C#8A @<8@#@2
Std# 0eviation 1><>#91 B>89#9A
Figura 2b. )nálisis descri'tivo básico de los valores de las variables 3b y =n
Interpretación
2b): ########################################################################################################################################
################################################################################################################################################
###########################################
2c) 1alcule la media del 1u del arc"ivo descri'(2(test#sav, tanto en rocas como en suelos
)-)./SE  19?3)$E ?E)-S  ?E)-S
0E3E-0E-4 .2S4 : 1u
2-0E3E-0E-4 .2S4: ?8ES4$E9
9;

'o(inson illan#eva rvillan#eva)rn&a.co&.pe
22
$e'ort 18
muestreo ?ean - Std# 0eviation
suelo 12<A#1B @A CC>#C<
roca 1@19#CC @B 11C<#A@
4otal 12>2#8< >9 99<#B<
Figura 2c: ?edias de los valores del 1u, en los dos gru'os definidos 'or los valores de
muestreo (rocas y suelos#
Interpretación
2c) : ########################################################################################################################################
################################################################################################################################################
##############################################################
2.2. Análisis descriptivo de una variable cualitativa en escala ordinal
Ejemplo 3: El estudio geológico de un yacimiento aurDfero "a determinado ,ue e+iste
control estructural en la concentración de este elemento, es decir, las zonas más ricas
están localizadas en los sectores e+traordinariamente fracturados y las más 'obres en oro,
se localizan, en los sectores 'oco fracturados# Es decir, la variable %fract& toma valores no
num*ricos ,ue describen cualidades o atributos y además estos atributos 'resentan un
orden natural (de menor a mayor concentración de oro, 'or tanto al asignarles nGmeros a
las cuatro modalidades: 36 H 'oco fracturado, ?6 H moderadamente fracturado, 26 H
intensamente fracturado y E6 H e+traordinariamente fracturadoI los códigos num*ricos
asignados de menor a mayor valor, son de 1 a A#
En este ti'o de situaciones cuando los valores de una variable son no num*ricos con
'resencia de orden entre ellos, se dice ,ue la variable corres'ondiente es de ti'o
cualitativo y ,ue la escala de medida de sus 'osibles valores es ordinal#
!aJo estas condiciones, tiene sentido estudiar la suma de los 'orcentaJes corres'ondientes
a todos los valores inferiores o iguales a una de las variables#
0e acuerdo a las consideraciones esti'uladas anteriormente, realizar el análisis
descri'tivo de la variable %fract& (arc"ivo descri'(@#sav#
)-)./SE  0ES1$23425E S4)42S421S 6$E78E-12ES
5)$2)!.E(S: 6$)14
S4)42S421S
3E$1E-42. 5).8ES: 78)$42.ES
1E-4$). 4E-0E-1/: ?E02)- , ?90E
19-42-8E
'o(inson illan#eva rvillan#eva)rn&a.co&.pe
2@
1:)$4S: !)$ 1:)$4S
1:)$4 5).8ES: 6$E78E-12ES
# 9;
Statistics
!'A%*
69
0
3.00
3
2.00
3.00
4.00
alid
+issing
,
+edian
+ode
2-
-0
7-
Percentiles
FRACT
11 1-.9 1-.9 1-.9
18 26.1 26.1 42.0
21 30.4 30.4 72.-
19 27.- 27.- 100.0
69 100.0 100.0
.!
/!
+!
P!
Total
alid
!re"#enc$ Percent
alid
Percent
%#&#lative
Percent
Análisis estadístico de la varia(le 0!ract0
en escala nominal
0ensidad de fracturas y fallas
P! +! /! .!
!
r
e
c
#
e
n
c
i
a
30
20
10
0
'o(inson illan#eva rvillan#eva)rn&a.co&.pe
2A
Interpretación :
################################################################################################################################################
################################################################################################################################################
################################################################################################################################################
################################################################################################################################################
################################
2.. Análisis descriptivo de una variable cuantitativa en escala de
intervalo o de ra!ón: Estudio descriptivo de normalidad
1uando los valores de una variable son num*ricos, 'udiendo tomar cual,uier valor en un
intervalo, se dice ,ue la variable corres'ondiente es cuantitativa continua (eJem'los: ley
en mineral, 'otencia de una veta, trasgresión marina, etc, si la variable 'uede tomar sólo
valores enteros (granos de oro en una lámina delgada, nGmero de 'e'itas de oro, etc
entonces la variable es cuantitativa discreta# )demás si tiene sentido "ablar de la razón
entre sus valores, se dirDa ,ue la variable esta medida en escala de razón# Si Gnicamente
tiene sentido de "ablar de la diferencia entre sus valores, careciendo de sentido num*rico
la razón entre ellos, se dirDa ,ue la variable está medida en escala de intervalo# El cuadro
de diálogo siguiente 'ro'orciona el estudio descri'tivo de la distribución de los valores
de la variable )l (arc"ivo: descrip"#"test.sav
)-)./SE  0ES1$23425E S4)42S421S 6$E78E-12ES
5)$2)!.E(S: .E/
S4)42S421S
3E$1E-42. 5).8ES: 1ut 'oints for 1$ e,ual grou's
1E-4$). 4E-0E-1/: ?ean, ?edian, ?ode
02S3E$S29-: St# desviation, variance, range, minimum, ma+imum
02S4$2!8429-: SKeFness, Kurtosis
19-42-8E
1:)$4S: :istograms (Fit" normal curve
9;
%esmarcar: %ispla& 're(uenc& tables
'o(inson illan#eva rvillan#eva)rn&a.co&.pe
2B
2..1 )I*+,-.A/A
Es una re'resentación gráfica de la distribución de valores cuantitativos en la ,ue los
datos son agru'ados en intervalos de la misma longitud, y cada uno de los 'osibles
intervalos se re'resenta mediante un rectángulo de área 'ro'orcional a la frecuencia de
datos en el intervalo corres'ondiente#
A1
A1
!
r
e
"
#
e
n
c
$
10
8
6
4
2
0
Std. 2ev 3 2.18
+ean 3 4.-8
, 3 69.00
2..2. /A.CA %E C0A*E1 I2+E.3A0, %E 3A.IACI42 5 .A2-,:
/A.CA %E C0A*E, es el 'unto medio de cada intervalo, 'ermite identificar el gru'o
de valores en el intervalo corres'ondiente# .as marcas de clase del segundo y cuarto
intervalo son 2,< y @,<# .a longitud de cada intervalo es <,B# .os lDmites inferior y
su'erior se calculan restando y sumando a cada marca de clase <,2B res'ectivamente# 3or
tanto el lDmite inferior del 'rimer intervalo será 1,2B y el lDmite su'erior del Gltimo es
11,2B, lo ,ue no significa ,ue dic"os valores sean alcanzados 'or los valores observados
en la muestra# 9bs*rvese ,ue el mDnimo y má+imo de los valores observados son: 1,<
(%?inimum& y 1<,< (%?a+imum& res'ectivamente, 'or lo ,ue el INTERVALO DE
3A.IACI42 de la ley de aluminio es
[ ] < , 1< I < , 1
,
y su RANGO H 1<,< L 1,< H 9,< (%$ange&#
) 'esar de ,ue el rango de variación es considerable, en el "istograma 'uede notarse ,ue
las observaciones tienden a concentrarse en torno al valor A,B tomando valores
com'rendidos entre los de marca de clase 1,B y >,B#
'o(inson illan#eva rvillan#eva)rn&a.co&.pe
2>
) trav*s de los deciles 'odemos com'robar ,ue en el intervalo
[ ] C@ , A 12 , 2 −
se
concentra, a'ro+imadamente (de'endiendo de la frecuencia con ,ue se 'resenta cada uno
de los dos valores e+tremos del intervalo, el B<M de los casos# Esto se debe a ,ue dic"os
valores corres'onden a los 3ercentiles 1< y ><, ,ue deJan 'or debaJo de ellos al 1<M y
><M, res'ectivamente de los casos#
2... /E%I%A* %E +E2%E2CIA CE2+.A0: /E%IA A.I+/6+ICA1
/E%IA2A 5 /,%A
.a medida de tendencia central más comGnmente utilizada alternativa a la mediana, es la
media aritm7tica de los valores observados#
9bs*rvese ,ue en este caso los valores de la media y la mediana son relativamente
'arecidos (%?ean& H A,B8 y %?edian& H A,29 y 'arecidos, además, a la marca de clase
del intervalo de clase con mayor frecuencia (A,B, lo ,ue induce a 'ensar ,ue la moda
'uede ser tambi*n una buena medida de la tendencia central# Sin embargo note ,ue el
valor de la moda (?ode H 2 es inferior a los valores anteriores, comGnmente coincide
con el mDnimo valor observado#
El inconveniente de la moda cuando se analizan variables continuas es ,ue no es
adecuado construir tablas de distribución de frecuencias 'ara este ti'o de variables# 1omo
consecuencia de esta situación, 'uede suceder, ,ue los valores de mayor frecuencia sean
varios, a 'esar ,ue la frecuencia sea 'e,ueNa y ,ue, 'or tanto, "aya mGlti'les modas#
9bserve el mensaJe: %a ?Glti'le modes e+ist# 4"e smallest value is s"oFn&, es decir, si la
distribución es multimodal, el S3SS, Gnicamente muestra el menor de ellos#
2..#. /E%I%A* %E %I*8E.*I42: .A2-,1 3A.IA29A 5 %E*3IACI42
E*+:2%A.
.a media aritm*tica 'odrDa ser una medida adecuada 'ara resumir la distribución de los
valores de )l, siem're y cuando los valores estuvieran concentrados en torno a ella# Sin
embargo, observando el "istograma com'robamos, ,ue a 'artir de la marca de clase C,<
los datos están dis'ersos#
El rango como medida de dis'ersión 'resenta el inconveniente de ,ue de'ende sólo de
los valores e+tremos# Su'oniendo ,ue, con los mismos valores e+tremos, el resto de los
datos estuvieran más concentrados en torno a la media, el valor del rango serDa el mismo,
a 'esar de la concentración#
8na alternativa 'ara medir la dis'ersión es la varian!a# Si los valores están muy
concentrados las desviaciones res'ecto a la media serán 'e,ueNas, y en consecuencia
tambi*n sus cuadrados# )l elevar las distancia al cuadrado se evita ,ue las desviaciones
'o(inson illan#eva rvillan#eva)rn&a.co&.pe
2C
negativas se com'ensen con las 'ositivas# 0esde este 'unto de vista, la varianza tiende a
e+agerar la verdadera dis'ersión de los valores res'ecto a la media
!aJo estas condiciones la alternativa 'ara medir la dis'ersión y ,ue amortigua dic"o
efecto es la desviación estándar (raDz cuadrada de la varianza# )l inter'retar el valor de
la varianza (variance H A,CB y, 'or tanto de la desviación tD'ica (Std# 0esviation# H 2,18,
debe tenerse en cuenta ,ue de'enden de la magnitud de los datos observados: un mismo
valor de la desviación tD'ica 'uede ser grande o 'e,ueNo de'endiendo de los valores
num*ricos de la variable analizada#
2..;. C,EFICIE2+E %E 3A.IACI42
8na forma de evaluar si la desviación estándar es grande o 'e,ueNa es com'ararla con la
media mediante el coe'iciente de variación <C3 =
µ
σ
).
2..>. .A2-, I2+E.C?A.+@0IC,
)nteriormente, se observó ,ue en el intervalo
[ ] C@ , A 12 , 2 −
se concentraba el B<M de los
casos# 0ado ,ue el 'rimer (71 y tercer cuartil (7@ deJan 'or debaJo de ellos al 2BM, y
CBM de los casos, el intervalo
[ ]
@ 1
, Q Q
tambi*n contendrá el B<M de los casos, sin
embargo, a diferencia del intervalo anterior, este contiene el B<M de los casos más
centrados#
El .ango Intercuartílico <.I) = A B A1 de la misma forma ,ue, como alternativa a la
media, la mediana es una medida de tendencia central basada en 3ercentiles, el $2 'uede
considerarse como una alternativa a la desviación tD'ica 'ara calcular la dis'ersión de los
datos#
'o(inson illan#eva rvillan#eva)rn&a.co&.pe
28
Statistics
A1
69
0
2
a
2.12
2.60
2.90
3.81
4.29
4.73
-.14
6.04
8.87
alid
+issing
,
+ode
10
20
30
40
-0
60
70
80
90
Percentiles
+#ltiple &odes e4ist. *5e s&allest val#e is s5o6n a.
escri!ti"es
4.-8 .26
4.06
-.11
4.47
4.29
4.747
2.18
1
10
9
3.0-
.840 .289
.088 .-70
+ean
1o6er 7o#nd
8pper 7o#nd
9-9 %on:idence
/nterval :or +ean
-9 *ri&&ed +ean
+edian
ariance
Std. 2eviation
+ini&#&
+a4i&#&
'ange
/nter"#artile 'ange
S;e6ness
<#rtosis
A1
Statistic Std. .rror
2..C. -.:FIC, %E CADA* 5 EI-,+E* <FE,G 80,+H)
El grá'ico de caIa & bigotes <FEoJ plotH) 'ro'orciona una re'resentación de la
distribución de la variable aluminio ()l# .os lDmites inferior y su'erior de la caJa
corres'onden a los 1uartiles 'rimero y tercero (o 3ercentiles 2B y CB res'ectivamente,
en consecuencia, la altura de la caJa coincide con el $2 # .a lDnea "orizontal dentro de la
caJa corres'onde al segundo cuartil 72 (o mediana, y los bigotes inferior y su'erior al
mDnimo y al má+imo valor tales ,ue sus distancias a los lDmites inferior y su'erior,
res'ectivamente, de la caJa es inferior a una vez el $2# En el caso de ,ue un valor diste de
los lDmites inferior o su'erior de la caJa más de 1,B veces el $2, a dic"o valor, se le
denomina %fuera del rango& y se re'resenta mediante el sDmbolo %o& y 'or %+& si los
valores son su'eriores a @ veces la longitud de la caJa o rango intercuartDlico,
denominándolos %valores aislados o e+tremos&# Este efecto se 'uede a'reciar meJor en la
segunda gráfica de caJas corres'ondiente a la .abor O2: 5eta 1anaria#
'o(inson illan#eva rvillan#eva)rn&a.co&.pe
29
Es decir, entre el mDnimo valor y el lDmite inferior de la caJa está contenido el 2BM de los
valores más 'e,ueNos, entre el lDmite inferior de la caJa y la lDnea "orizontal dentro de la
caJa, el 2BM, entre la mediana y el lDmite su'erior de la caJa, el 2BM siguiente y, 'or
encima del lDmite su'erior de la caJa, el 2BM restante#
69 , 3
A1
12
10
8
6
4
2
0
64 , 3
1.=
800
600
400
200
0
>200
16
64
63
-8
En esta labor el $2 H >>,9A2B# El dato 1> tiene una ley de 19A,BC 9z )u mayor a 1,B
veces el $2# .os valores de los datos B8, >@ y >A son C<8,18I @@2,B1 y @<2,A> 9z )u,
todas ellas su'eriores a @ veces $ango 2ntercuartDlico#
'o(inson illan#eva rvillan#eva)rn&a.co&.pe
@<
2..K. -.:FIC, %E +A00, 5 ),DA* <F*+E/ L 0EAFH)
El cuadro de diálogo siguiente 'ro'orciona el gráfico de tallo y "oJas (%Stem P .eaf&#
En este gráfico cada lDnea de dDgitos corres'onde a la descom'osición de los valores de la
variable en dos 'artes, el tallo y la "oJa# 3or eJem'lo en la 'rimera lDnea están
re'resentados los valores de tallo < y "oJas < y 1, mientras ,ue en la s*tima fila están los
valores de tallo 1 y "oJas 2 y @#
3ara inter'retar cuales son los valores re'resentados en cada caso, observemos, la
segunda lDnea, en el margen iz,uierdo se indica ,ue la frecuencia es 1A, coincidiendo con
el nGmero de "oJas en la lDnea (B veces 2 y 9 veces @, en la 'arte inferior se indica ,ue
cada "oJa corres'onde a un caso (Eac" leaf : 1 case(a y ,ue la am'litud del tallo es 1<<
(Stem Fidt": 1<<#<< , teniendo en cuenta ,ue cada valor se obtiene como )+4#:, donde
) es la am'litud del tallo, 4 es el tallo y : la "oJa, los 1A valores corres'ondientes son:
<#2 , <#@, con frecuencias de B y 9 res'ectivamente# 6DJese ,ue en la Gltima lDnea del
gráfico se 'ro'orciona la cantidad de los valores e+tremos con el lDmite inferior
corres'ondiente (QH 19B#
)-)./SE  0ES1$23425E S4)42S421S EE3.9$E
0E3E-0E-4 .2S4: .E/
S4)42S421S
0ES1$23425E: 1onfidence 2nterval for mean: 9B
3.94
!9E3.94S: 6actor levels toget"er
0ES1$23425E: StemRandRleaf
19-42-8E
9;
.E/ StemRandR.eaf 3lot
6re,uency Stem P .eaf
22#<< < # <<<<<<<<<<<11111111111
1A#<< < # 22222@@@@@@@@@
>#<< < # AABBBB
>#<< < # >>>CCC
B#<< < # 88899
1#<< 1 # <
@#<< 1 # 2@@
2#<< 1 # BB
1#<< 1 # C
A#<< E+tremes (QH19B
Stem Fidt": 1<<#<<
Eac" leaf: 1 case(s
'o(inson illan#eva rvillan#eva)rn&a.co&.pe
@1