You are on page 1of 58

UNIVERSIDAD PRIVADA DEL NORTE

FACULTAD WORKINGADULT– ING. MINAS

CURSO: GEOESTADISTICA
CLASE I

Docente: ING. WILDER CHUQUIRUNA CHAVEZ

CAJAMARCA, JULIO 2016

CONCEPTOS BASICOS (BD, QAQC, Modelos)

ESTADISTICA
(Media, CV, Análisis, correlación)

VARIOGRAFIA (Conceptos, Análisis)
Geology – Modeling / 1 july 2009

Medidas Estadísticas

Medidas de
posición

Promedio o MEDIA
Moda
Mediana
Percentiles

Medidas de
variabilidad

Rango
Varianza
DESVIACION ESTANDAR
COEF. DE VARIACION

Estadística

Medidas de Posición
n

Promedio o Media de la muestra

Xi
X
i 1 n

Mediana: Valor que deja el 50% de los datos
Con los datos Ordenados:
Número Impar de datos -- el dato central
Número Par de datos -- promedio de los dos
datos centrales.
Moda: Valor más común

Geology – Modeling / 1 july 2009

• Parámetros de tamaño

Mo

– Mínimo (P0)
– Máximo (P100)
– Moda (Mo)
– Mediana (M = P50)
P0

P50

P100

Geology – Modeling / 1 july 2009

MEDIA  Lejos. es la Medida de Tendencia Central más utilizada 0 1 2 3 4 5 6 7 8 9 10 Media = 5  Afectada por Valores Extremos (Outliers) 0 1 2 3 4 5 6 7 8 9 10 12 14 Media = 6 .

 Mediana = X[(n+1)/2].   Si n es par. sino por el tamaño de la muestra. la Mediana es el valor “del medio”  Si n es impar. Mediana =½(X[n/2]+X[n/2+1])  No es afectada por los valores extremos (robusta).MEDIANA  En Arreglo Ordenado. 0 1 2 3 4 5 6 7 8 9 10 Mediana = 5 0 1 2 3 4 5 6 7 8 9 10 12 14 Mediana = 5 .

MODA      Valor que ocurre más Frecuentemente No es Afectado por Valores Extremos Puede que no exista Moda Pueden existir varias Modas Se emplea en datos Categóricos o Numéricos 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Moda = 9 0 1 2 3 4 5 6 No-Moda .

Si la respuesta es afirmativa. usar la Mediana como medida de la tendencia central. En caso contrario la Media si es moderadamente sesgada En todos los casos el histograma debe ser unimodal . si la variable es categórica. Moda o Mediana? ¿Datos son categóricos? Si MODA No ¿El total es de Interés? Si MEDIA No La primera consideración es el tipo de datos. entonces la medida adecuada de la tendencia central es la Media ¿Distribución Sesgada? No MEDIA Si MEDIANA Si el total de las observaciones no es de interés. si el histograma es sesgado. la Moda es la única medida que mejor describe los datos La segunda consideración es preguntarse si el total de las observaciones es de algún interés. Entonces.¿Cuándo usar Media.

V .Medidas de variabilidad Rango: Diferencia entre los valores máximo y mínimo n Varianza muestral S2  Desviación estándar Coeficiente Variacion 2 ( X  X )  i i 1 n 1 S S 2 s C.  x Geology – Modeling / 1 july 2009 .

Variancia Muestral  Importante Medida de la Dispersión  Mide la Desviación Cuadrática Promedio alrededor de la Media. esto es. toma en cuenta cómo se distribuyen los datos alredor de la Media  (X n  Variancia Muestral : s2  i 1 X ) 2 i n 1 .

DEVIACIÓN ESTÁNDAR MUESTRAL  La más Importante Medida de Dispersión  Muestra la Raíz de la Desviación cuadrática promedio alrededor de la Media  Tiene las misma Unidad que los Datos Originales  (X n s  i 1 X ) 2 i n 1  s = 23.35 .

5 ^ s = 3.5 ^ s = 4.9258 Datos C 11 12 13 14 15 16 17 18 19 20 21 Media = 15.COMPARANDO DESVIACIONES ESTÁNDAR Datos A 11 12 13 14 15 16 17 18 19 20 21 Media = 15.57 .5 ^ s = .338 Datos B 11 12 13 14 15 16 17 18 19 20 21 Media = 15.

CV = 1.5 .7 Yacimiento de cobre de mediana var.ESTADÍSTICAS BÁSICAS Yacimiento tipo pórfido cuprífero CV = 0.5 Yacimiento de oro de alta variabilidad CV = 4.

Varianza y soporte .

28 1.57 0.1 0.5 0.3 .7 MOS2 1 0.9 1.Histograma • La escala de intensidades se divide en N clases.42 Sondage n°647 Nb Obs.29 0.43 0.15 0.14 1.3 0.71 0.8 0.00 1.6 0. • Una frecuencia está asociada a cada centro de clase y representada por un rectángulo proporcional • Las frecuencias pueden ser absolutas (Nb) o relativas (%) Histogramme de MoS2.2 0.2 1.86 1. MoS2 (%) <0. 8 37 31 14 4 1 3 0 1 1 24 20 16 Nb d'obs • 12 8 4 0 0 0.1 1.4 0.

• Histograma • La selección del número de clases influye en la legibilidad • 15 a 20 clases es comunmente óptimo 7.8 16 9.2 41 36.8 125 31.8 9 .3 88 14. 21 o 100 clases para un total de 800 observaciones Zn(%) Nb 3.2 219 25.8 220 20.

• Histograma en frecuencias acumuladas • Frecuencias acumuladas de 0% a 100% • Lectura rápida de « percentiles » .

…  (x )2 f (x )  e 2 . fluctuationes mensuales de un nivel piezométrico. 2. geoquímica de un elemento mayor y móvil (Fe.…). 2  .… • Ex.TIPOS DE DISTRIBUCIÓN • Distribución Normal • Eventos debido a múltiples causas independientes. Densidad por alteración.  con : µ = media σ = desviación típica . Mn. granulometría de un sedimento.

1)  • Y tiene distribucion Normal Gaussiana .05 0.00 0 2.5% 2 4 6 8 10 12 14 16 z • Cualquier Distribucion puede pasar a Normal Gaussiana (estandarizar).20 0. X  • Si X ~ N ( .5% 2.35 0.25 95 % 0.  y2 ) definimos: Y  .30 0.10 0.15 0. entonces: Y ~ N (0.DISTRIBUCIÓN NORMAL (GAUSSIANA) • La distribución gaussiana es simétrica: g(z) • La media y mediana son iguales 0.40 0.

3 0.7 0.TIPOS DE DISTRIBUCIÓN La ley Lognormal • Ex.9 1 1.5 0.6 S 0.1 1.2 .4 0.8 0.2 0.NORWAY Sulfur in Norite No of obs • 270 252 234 216 198 180 162 144 126 108 90 72 54 36 18 0 0 xG  M  en 0. • Caracteristicas de la distribución • Los logaritmos de los valores siguen una ley normal • Media ≠ Moda ≠ Mediana (asimetría) • Mediana = Media geométrica Telnes .1 0. distribución geoquímica de elementos en trazas localmente concentra (pepitas).

coeficiente de correlación de posición Transformar los datos para reducir su influencia Bajarlos a un máximo “razonable” Outliers: Observaciones que parecen no pertenecer a la misma población constituida por el resto de los datos Generan considerables problemas al aplicar regresión. debido a que tienen un efecto desproporcionado sobre los coeficientes de regresión estimados Los datos considerados extremos (outliers) puede eliminarse sólo si se ha comprobado que están errados. .ANÁLISIS UNIVARIABLES VALORES EXTREMOS • Valores extremos: afectan considerablemente las estadísticas • básicas ¿Qué hacer con ellos?: • • • • • • • • Declarar los valores extremos como erróneos y eliminarlos Clasificarlos en poblaciones estadísticas separadas Usar estadísticas robustas. En caso de ser datos verdaderos. que son menos sensibles a los valores extremos: mediana. proveen información que puede ser crítica para la respuesta del modelo.

ANÁLISIS UNIVARIABLE • La distribuciones son útiles para chequear la presencia de dos poblaciones CDF PDF .

ANÁLISIS ESTADÍSTICO • Son útiles para chequear la presencia de dos poblaciones • Debe confirmarse con información geológica .

3 9. 18 Histogram 90 14 80 12 70 10 60 No of obs Observed Value 16 8 6 50 40 30 4 20 10 2 0 -1.3 4.0 10.9 15.6 0 7..0 5.6 12..6 Var1 -2 -4 -3 -2 -1 0 1 Theoretical Quantile 2 3 4 .0 0.3 13.7 2.¿Agrupaciones de puntos?  Investigar ..

• No se utiliza para comparar la relación par a par que hay entre las variables. k = 1. K • Graficar q1(pk) versus q2(pk). …. k = 1. 2.ANALISIS ESTADÍSTICO • Gráfico Q-Q: para comparar dos distribuciones F1 y F2 cuantil a cuantil. 2. …. • Escoger una serie de valores de probabilidad pk. K Q-Q PLOT .

52 1.500 -0.000 1.500 0.2 0. p -2.0 0.674 -1.50  Para cada pi hacer Qx(pi) = x(i) 0.8 1.500  Sea F(x) distribución teórica a comprobar.574 -2.24 0.Q-Q plot teórico: Construcción 3.20 1.0 pi  Graficar Qx(pi) vs.63 2. pi 2.20 0.070 -0.00 Qx(pi)  x1 .20 0.00 -0..20 . )i Qt(p) 2. xn valores observados en una muestra X ó Q(p  Calcular pi = (i – 0.40 0.80 1.00 0.99 2. x2 ..6 0. (0 < p < 1) encontrar Qt(p) = F-1(p) -0.105 -1.60 p 0.97 i  x(1)  x(n) es la muestra ordenada de menor a mayor 4.44 2.4 0.00 1. 2 0.145 i  Para p.942 0.243  Graficar Q(p) vs.89 0.304 0..5)/ n  i 1...

0 3. graficar Qx(pi) contra Qt(pi) para i = 1.0 1.0 0.0 1.5 Qt(pi): teótico 1.5 0.Q-Q plot teórico  Para cada valor pi.5 3.5 -1.0 -1.0 2.0 -2.5 1..5 -2.0 -0..0 0.5 2. .5 0. 2.5 2. Qx(pi): empírico 4.0 . n..

ANÁLISIS ESTADÍSTICO ANÁLISIS DE CONTACTO .

Análisis Estadístico Análisis de Contacto Geology – Modeling / 1 july 2009 .

Analisis Bivariable: Covarianza y Correlación • Cuantificación de una nube de puntos – Noción de dispersión alrrededor del centro de gravedad – Momentos de Inercia => Varianzas y Covarianza 2 1 i N 2 σ (x)  σ xx   (xi  µ(x)) N i 1 2 1 i N 2 σ (y)  σ yy   (y i  µ(y)) N i 1 1 i N σ xy   (xi  µ(x))(. y i  µ(y)) N i 1 Geology – Modeling / 1 july 2009 .

Geology – Modeling / 1 july 2009 .

81 .90 .00 Geology – Modeling / 1 july 2009 .90 1.+∞] Correlación : parámetro adimensional [-1.52 V .00 .00 .44 1.73 Cu .38 .38 .Correlación Covarianza : parámetro adimensional [-∞.00 . yy Fe Ni Cu V Fe 1.44 .73 .1]  xy   xy  xx .52 1.81 Ni .

68 X X Caso 3 Caso 4 Y Y =0 =0 X X Caso 6 Caso 5 Y Y  = -0.87  = -1 X X .CORRELACIÓN Caso 1 Caso 2 Y • Diferentes ejemplos de coeficiente de correlación Y = 1  = 0.

Diagrama Dispersión entre 2 Variables Y Y E[Y] E[Y] Cov 0 Cov + X Y E[X] E[X] Y Y E[Y] E[Y] Cov 0 Cov - X X E[X] E[X] .

70 – 0.01 .99 .-0.69 -0.39 -0.90 – 0.00 -0.19 .20 .40 – 0.-0.89 .69 .00 ‘Ninguna’ 0.90 ‘Muy Fuerte’ 0.19 -0.70 ‘Fuerte’ 0.99 -1.-0.Regla Práctica de Interpretación Pendiente Negativa Correlación Pendiente entre X e Y es… Positiva 0.00 r .0.-0.39 .20 ‘Débil’ 0.40 ‘Modesta’ 0.0.01 ‘Muy Débil’ 0.00 ‘Perfecta’ 1.89 -0.-0.

CONCEPTOS BASICOS (BD. CV. Modelos) ESTADISTICA (Media. Análisis) Geology – Modeling / 1 july 2009 . correlación) VARIOGRAFIA (Conceptos. Análisis. QAQC.

Variograma -Definición Es una herramienta que permite analizar el comportamiento espacial de una propiedad o variable sobre una zona dada Ejemplo: Detectar direcciones de anisotropía Zonas de espacial) influencia y su Variabilidad con la distancia extensión (correlación .

Variograma Teórico-Definición Continuidad espacial B A 1 5 7 3 8 9 4 2 1 6 2 4 6 3 8 5 7 9 MEDIA = 5 VARIANZA=50/9 HISTOGRAMAS IGUALES 12 10 10 8 8 Variograma Variograma 12 6 4 6 4 2 2 0 0 0 1 2 Distancia 3 4 0 1 2 Distancia 3 4 .

h)  E Z (x )  Z (x  h)2 2 • El estimador del variograma es: 1 N (h ) 2    (h)  z ( x )  z ( x  h )    2 N (h)  1 *  .ESTIMADOR DEL VARIOGRAMA 1  (x1 . x 2 )  var ianza (Z (x1 )  Z (x 2 ) ) 2 • Variograma: pero en el caso estacionario: (E ( Z (x)  Z (x  h) )2  0  1  (x.

Variograma Experimental-obtención Datos Igualmente espaciados: N (h) 1 2  *( h )  ( z ( x )  z ( x  h ))  i i 2 N (h) i 1 h x1  * (h)  x2 x3 x4 x5 x6  1 (z(x1 )  z(x2 ))2  (z(x2 )  z(x3 ))2  (z(x3 )  z(x4 ))2  (z(x4 )  z(x5 ))2  (z(x5 )  z(x6 ))2 2 *5   * (2h)  1 (z(x1 )  z(x3 ))2  (z(x2 )  z(x4 ))2  (z(x3 )  z(x5 ))2  (z(x4 )  z(x6 ))2 2*4  * (3h)  1 (z(x1 )  z(x4 ))2  (z(x2 )  z(x5 ))2  (z(x3 )  z(x6 ))2 2*3     .

...nh • Se grafica  * versus los valores h...Variograma Experimental-obtención 1  ( h)  2 N (h) *  ( z ( xi )  z ( x j )) 2 xi  x j  h • Se escoge una dirección  • Se escoge una distancia o lag h • Se calcula * para valores de h.. 3h.nh . 3h.2h.2h...

Mapa de Variograma .

crece más lento que una parábola • Toda suma de variogramas es un variograma • El producto de variogramas no es necesariamente un variograma .PROPIEDADES DEL VARIOGRAMA • Simétrico  (h )   ( h ) • Se anula en el origen  (0)  0  (h )  0 • Positivo o nulo • En el infinito.

Cuando los datos son escasos el efecto pepita aparece más alto de lo esperado .RETACIÓN DE VARIOGRAMAS EXPERIMENTALES Variograma Vertical Meseta  Efecto pepita Rango Distancia • • • Meseta = la varianza (1.0 si los datos están estandarizados) Alcance = la distancia a la cual el variograma alcanza la meseta (95%) Efecto pepita = suma de variabilidad debida a microestructuras geológicas y error de medición • • Cualquier error en la medición del valor o la posición asignada a la medida se traduce en un efecto pepita mas alto.

.Variograma teórico (7) • Comportamiento direccional El estudio de los variogramas direccionales permite identificar las anisotropías de la variable regionalizada.

Modelos elementales (2) 3   3 |h| 1  |h|    C     si | h |  a Modelo esférico:  (h)   2 a 2  a   C en caso contrario alcance  a. meseta  C .

.Modelos elementales (3)   3 | h |   ( h )  C 1  exp Modelo exponencial:    a    El parámetro a es el alcance práctico: corresponde a la distancia para la cual el variograma llega al 95% de su meseta C.

meseta  C .Modelos elementales (4)   3 | h |2   Modelo gaussiano:  (h)  C 1  exp   2   a   alcance práctico  a.

Modelos elementales (Estructuras) Geology – Modeling / 1 july 2009 .

PROBLEM VARIOGRAMS AZIMUTH = 0 DIP = 0 (h) = 0.5 250.5 125.0 223 8 0 0 * Sample variogram points with less than 350 pairs have not been plotted.5 4 (h) 6 720 0 764 1 715 9 734 8 8 09 4 793 4 84 1 4 881 8 803 709 0 605 2 499 4 378  0.271 Sph 270.7(h) + 0.0 . 62.329 Sph 30.400 + 0.0 Lag distance (h) 187.5 7 188                      5 240 1 257 9 284 2 299 0 311 1 333 6 354 7 3 66 3 399 9 420 4 45 0 3 447 5 473 5 513 4 551 8 545 0 575 3 610 5 629 2 65 2 1.1(h) 1.

CÁLCULO DE VARIOGRAMAS EXPERIMENTALES • 2-D o 3-D. regular o irregularmente espaciado • Especificación de Dirección (regular): • Especificación de dirección (irregular): Y axis (North) Bandwidth Azimuth Azimuth tolerance X axis (East) .

.CÁLCULO DE VARIOGRAMAS EXPERIMENTALES Ejemplo: Comienzo con una separación (#4) 2 ( h)  1 [ z( u)  z( u  h)]2  N ( h) N ( h ) Comenzar en un nodo y comparar su valor con todos los nodos que caigan dentro del la tolerancia de separación y tolerancia angular.. ..

CÁLCULO DE VARIOGRAMAS EXPERIMENTALES 2 ( h)  1 [ z( u)  z( u  h)]2  N ( h) N ( h ) Ir al siguiente nodo. .. ..

Variograma Experimental-distancia & dirección   clase de distancia h clase de distancia 2h clase de distancia 3h .

Variograma Experimental-obtención    .

Variograma Experimental-tolerancia angular Tolerancia angular .

CONCLUSION PRIMERA PARTE • • Ley espacial Esperanza matemática (Probabilidades) o momento de primer orden E (Z ( x 0 ) )  m ( x 0 ) • Momentos de segundo orden:  2 (x)  E • Varianza • Covarianza • Variograma Z (x)  m(x)  2 C (x1 . x 2 )  2 (x1 )   2 (x 2 ) . x 2 )  j C (x1 . x 2 )  E Z (x1 )  m(x1 )Z (x 2 )  m(x 2 )   E Z (x1 ) Z (x 2 )  m(x1 ) m(x 2 ) 1  *( h )  ( z ( xi )  z ( x j )) 2  2 N (h ) x  x  h i • Correlograma  (x1 .