You are on page 1of 56

Conceptos tiles

Configuracin geomtrica de los datos


Fuente: Apuntes de G. Fuster, U. Catlica.

Configuracin geomtrica de los datos


De acuerdo con la configuracin
geomtrica de los datos, el muestreo se
clasifica en:
1. Regular
2. Aleatorio
2.1 Estratificado
2.2 Uniforme
2.3 Preferencial

3. Irregular

1. Regular
Los datos estn espaciados a una distancia
constante. Se habla as de mallas de 200x200,
100x100 50x50 metros, por ejemplo.

2.1. Aleatorio estratificado


Consiste en dividir la zona de estudio segn una
grilla regular y escoger al azar la ubicacin del
dato dentro de cada celda.

2.2. Aleatorio uniforme


La ubicacin de los datos se escoge al azar
dentro de un dominio. Se puede ver este
muestreo como la realizacin de un proceso
aleatorio uniforme sobre una superficie.

2.3. Aleatorio preferencial


La densidad de datos no es uniforme en el
espacio. La ubicacin de ellos se escoge al azar
dentro de un subconjunto del dominio. En la
prctica, este muestreo es el ms comn.

3. Irregular
Si la ubicacin de los datos no es modelable
por ninguno de los mtodos anteriores,
entonces el muestreo es irregular.
En este caso, al igual que el muestreo aleatorio
preferencial, la solucin para encontrar un
estimador consiste en desagrupar los datos
dentro del dominio en estudio, o bien, intentar
separar el dominio en subconjuntos cuya
densidad de muestreo pueda considerarse
constante.

Cmo impacta?
Casi siempre se calcula la ley promedio
con pesos iguales para todas las
muestras.
Muestras poco separadas son
redundantes (esencialmente entregan la
misma informacin).

Ejemplo
o

0.373

0.015

0.172

0.654

0.792

0.308

0.574

1.194

0.724

Ley media de los datos: 0.534%

Ejemplo (2)
o

0.373

0.015

0.172

0.654

0.792

0.308

o
o
0.574

0.912

o
0.882

o
o
1.194

1.002

o
0.724

1.119

Ley media de los datos: 0.671%


Con 4 datos adicionales, la ley se incrementa un 25%.

Mtodos de desagrupamiento
Polgonos de influencia.
Mtodo de la grilla.
Celda desagrupante.

Polgonos de influencia

Polgonos de influencia

13

Desventajas del mtodo


El peso asociado a cada muestra es el
rea del polgono dividida por el rea
total. Proceso lento.
Las orillas del depsito requieren un
tratamiento especial.
Y para 3 dimensiones?

Mtodo de la grilla
Similar a la idea de los polgonos de
influencia, pero fcil de utilizar en 3D.
Se cubre el dominio con una grilla de
puntos.
Se le asigna a los puntos una ley en base
al vecino ms cercano.
Se calculan las estadsticas sin pesos con
todos los puntos de la grilla.

Mtodo de la grilla
o

0.373

0.015

0.172

0.654

0.792

0.308

o
o
0.574

0.912

o
0.882

o
o
1.194

1.002

o
1.119

o
0.724

Desventajas del mtodo


El espaciamiento de la grilla debe ser
ms pequea que la separacin de los
datos agrupados.
La grilla tendr muchos puntos si el
espaciamiento de ella es pequeo.
Los problemas de borde se mantienen.

Celda desagrupante
Se toma una grilla regular sobre el
dominio.
Se cuenta el nmero de muestras en
cada celda.
Se define un peso que es inversamente
proporcional al nmero de muestras.

Definicin de peso:
wi =

nci
n 1

nc
i
i =1

nci: nmero de datos en la celda que


contiene el dato i.
wi: peso aplicado al dato i para calcular
la media ponderada.

Celda desagrupante
o

0.373

0.015

0.172

0.654

0.792

0.308

o
0.912

o
0.574

o
0.882

o
o
1.194

1.002

Ley
0.373
0.015
0.172
0.654
0.792
0.308
0.574
0.912
1.002
1.194
0.882
1.119
0.724

1/nc
1/1
1/1
1/1
1/1
1/1
1/1
1/1
1/5
1/5
1/5
1/5
1/5
1/1

0.724

1.119

Ley desagrupada: 0.515%.

peso
1/9
1/9
1/9
1/9
1/9
1/9
1/9
1/45
1/45
1/45
1/45
1/45
1/9

Desventajas del mtodo


Es un mtodo de prueba y error:
Generalmente se prueban varios tamaos
de celda.
Generalmente se selecciona el tamao de
celda que minimice la ley media *.

La celda no tiene porque ser cuadrada.

Anlisis del tamao de la celda en base a la media

Ejemplo Isatis

23

Aplicacin de los mtodos


Data Locations
1000

800

600

400

200
Drillhole Collar
Drillhole on Grid
Grade Above 1%

0
0

200

400

600

800

1000

Celda desagrupante
Average Grade By Cell Size
0.75
0.70
0.65
0.60
0.55
0.50
Average Grade (%)

0.45
0.40
50

100

150

200

250

300

350

400

450

Cell Size (m)

Se toma el tamao de celda que minimiza la ley


en 0.52%.

Polgonos de influencia:

Resultados:

Media de los datos: 0.70%.


Celda desagrupante: 0.52%.
Polgonos de influencia: 0.54%.
Mtodo de la grilla: 0.51%.
Datos regulares cada 200 m : 0.52%.

Concepto de valores extremos


(outliers)
Corresponden a valores que se escapan a la
poblacin comn de los datos.
Ningn mtodo estadstico sirve para
encontrarlos.
Estos valores se deben estudiar
detalladamente y medir su impacto.
Chequear en laboratorio la confianza del valor.
Buscar una base geolgica a su existencia.
Ajustar vecindad de bsqueda.

Repaso estadstica

D. ABURTO M.
2014

29

Segn la enciclopedia
universal
La palabra estadstica hace referencia
tanto al conjunto de datos de
observaciones como a la actividad que
consiste en su recopilacin, su tratamiento
y su interpretacin.
(traducido del libro: Probabilits, Analyse des donnes et statistique, SAPORTA, 1990)
Ejemplo: El registro diario de la temperatura mxima en Santiago durante los ltimos 20 aos
constituye una estadstica, mientras que hacer estadstica sobre estos datos consistira por
ejemplo en, trazar grficos, calcular la media, valor mximo, etc
30

Generalidades
Realizar estadstica supone estudiar un conjunto de
objetos equivalentes sobre los cuales observamos
caractersticas llamadas variables. Ejemplo: ley de CuT
(variable) de un yacimiento de tipo prfido cuprfero.
Poblacin (dominio): nocin fundamental en
estadstica, grupo o conjunto de objetos equivalentes.
Los objetos son llamados individuos o unidades
estadsticas.

31

Generalidades
La estadstica se interesa en las propiedades de la
poblacin y no en los individuos en particular (ejemplo:
nos interesamos en la proporcin de outliers y no en un
outliers en particular).

32

Definiciones generales
Generalmente, la poblacin (dominio) es bastante
grande para ser observada exhaustivamente (ms
evidente para el caso de una poblacin infinita).
Censo: El estudio de todos los elementos de una
poblacin finita.
Sondaje: observacin de una parte de la
poblacin, la parte estudiada se llama muestra.
33

Definiciones generales
Variables: conjunto de caractersticas que describen a
cada individuo de una poblacin.
Cuantitativas o numricas: talla, peso, volumen,
densidad, ley de un elemento qumico. Nmeros
reales sobre los cuales operaciones matemticas
tienen sentido.
Continuas: leyes de mineral, densidad, recuperacin
metalrgica.
Discretas: nmero de fallas, nmero de camiones.

Cualitativas o categricas: se expresan de acuerdo


a la pertenencia a una categora de un conjunto
finito. Ej. Tipo de roca, mineralizacin, alteracin.
34

Generalidades
El concepto clave en estadstica es la variabilidad,
que significa que los individuos en apariencia
semejantes pueden tomar valores diferentes.
El anlisis estadstico es por esencia el estudio de
la variabilidad, lo que permitir por ejemplo
prever de manera probabilstica el
comportamiento de individuos que an no han
sido observados. (interpretacin de la informacin
o creacin de modelos).
35

Generalidades
Luego de la recoleccin de datos, la tarea de la estadstica
consiste en realizar el tratamiento y la interpretacin de la
informacin.
Estadstica exploratoria o descriptiva: su objetivo es
sintetizar, resumir y estructurar la informacin contenida en
los datos (tablas, grficos, indicadores numricos). Se
generan hiptesis, se construyen grupos homogneos, se
reducen variables.
Estadstica inductiva o inferencial: su objetivo es de extender
las propiedades constatadas en la muestra a toda la
poblacin, y de validar e inferir hiptesis a priori o
formuladas luego de la fase exploratoria.
36

Estadstica y probabilidades
La teora de probabilidades es una rama de las
matemticas que se ocupa de las propiedades
de ciertas estructuras usadas para modelar
fenmenos donde interviene el azar.
Permite modelar eficazmente ciertos
fenmenos aleatorios.
37

Estadstica y probabilidades
(nexo)
La estadstica se basa en la observacin de
fenmenos concretos (realidad). Los nexos con el
modelo probabilstico:
Datos observados imprecisos (error). El modelo
probabilstico permite representar el error como
una variable aleatoria.
Constatacin que la reparticin estadstica de una
variable (representativa de una poblacin) es
cercana a modelos matemticos propuestos por el
clculo de probabilidades (leyes de
probabilidades).
38

Estadstica y probabilidades
Las muestras de los individuos observados son
la mayora de las veces extradas al azar en la
poblacin (para asegurar su representatividad).
Si el muestreo es equiprobable. Las caractersticas
observadas en las muestras se transforman en
variables aleatorias y el clculo de probabilidades
permite estudiar su reparticin.

39

.
Experiencia aleatoria: una experiencia es
calificada de aleatoria cuando no podemos
predecir sus resultados, y si repetida en
condiciones idnticas, ella puede entregar
resultados diferentes.

40

variables aleatorias
Definicin: Una VA es una funcin que entrega un
valor numrico a cada resultado de una experiencia
aleatoria. Ejemplo clsico el lanzamiento de un
dado.
Se representa siempre por una letra mayscula,
en general X, Y o Z.
Una VA tiene siempre una ley de probabilidad, que
describe la probabilidad de cada valor posible de la
VA.
41

Tipos de VA
VA Discreta

VA Continua

Los valores posibles


forman un conjunto
discreto.
Se puede tener la
probabilidad de cada
valor posible.

Los valores posibles


estn contenidos en
un intervalo.
Hablamos de
probabilidad dentro de
un intervalo.

funcin de densidad de probabilidad.


42

Funcin de densidad de VA
VA Discreta

VA Continua

Si conociramos todos los


valores posibles de la VA
sera el histograma de
la VA.
0

43

Funcin de distribucin
acumulativa de VA
VA Discreta

VA Continua


44

Momentos de una VA
VA Discreta

VA Continua

Es el promedio aritmtico
de los diferentes valores
posibles ponderados por
sus probabilidades.

45

Propiedades de la esperanza
Las propiedades elementales de la esperanza son
aquellas de las integrales y se deducen de la
linealidad.

!"

"

46

Momentos de una VA
VA Discreta
# $

VA Continua
%

)*+ '

%'

&
&

# $
)*+ '

%'

&

%'

&

Varianza: Momento centrado de orden 2.


Medida de la dispersin de una VA alrededor
de su esperanza.

47

Covarianza
de una dupla de VA
,*-

,"

,*-

,*-

,"

" %

# $

"%
"

"

48

Marcha aleatoria

49

Ejercicio
Fuente: Centre de geostatistique, cole des mines de Paris.

Lanzar una moneda 20 veces y registrar el resultado (cara o


sello). Evento equiprobable. n = 20
Tenemos
!1 si el resultado es sello
resultado es cara, para ( 1, , +.
Trazar en funcin de (.
Calcular el promedio y la varianza de
2
234
Tenemos: "
&
Trazar " en funcin de (.
Calcular el promedio de " "

Calcular el promedio de

5 , para 6
8239 82 :
, para
&

%1 si el

0, 1, , 4.

0, 1, , 4.

50

;
# $

0,3
=1
51

52

53

1,5

"

0,5

0
1

9 10 11 12 13 14 15 16 17 18 19 20

Srie1
Srie2
Srie3
Srie4

-0,5

-1
0,7

-1,5

0,6

""

0,5

0,4
Srie1
Srie2
Srie3
Srie4

0,3
0,2
0,1
0
-0,1

0,5

1,5

2,5

3,5

4,5

-0,2
0,9

" %"

0,8

&

0,7
0,6
Srie1
Srie2
Srie3
Srie4

0,5
0,4
0,3
0,2
0,1
0
0

0,5

1,5

2,5

3,5

4,5

54

Ejercicio
Fuente: Centre de geostatistique, cole des mines de Paris.

Versin probabilstica:
Calcular la esperanza y la varianza de .
Calcular la esperanza y la varianza de " .
Depende ella de (?

Calcular la covarianza de Cov " , "


Depende ella de (?

Calcular el variograma de A8 6
Depende el de (?

&

" %"

&

55

Resultados

"

0 # $

0 # $ "

,*- " , "

&

&

B C( 6

" %"

C( 6

&

0 C( 6

0
1

0 C( 6
B C( 6
D
&

&

C( 6

0
1

2
56