Informe Analisis Geoestadistico

TOSHIBA
[Type the document

title]
[Type the document subtitle]
Franco
[Pick the date]
[Type the abstract of the document here. The abstract is typically a short
summary of the contents of the document. Type the abstract of the
document here. The abstract is typically a short summary of the contents
of the document.]
Resumen
Mediante el presente informe se buscara construir modelos predictivos de la
ley de plata y ley de oro en funcin de variables geometalrgicas y
coordenadas respectivamente, obtenidas de un yacimiento aurferoargentfero ubicado a una altura promedio de 1800 m.s.n.m.
En primera instancia se analiz el archivo Datos.xls que contaba con un
poco ms de 700 datos con informacin de muestras de produccin
tomadas en galeras de explotacin de una veta. Pero antes de modelar lo
anteriormente descrito se debe lidiar primero con los datos de leyes
negativas que no son lgicos, los duplicados que aportan la misma
informacin y los outliers, que corresponden a datos muy alejados del
promedio. Para resolver estos problemas, primero se sac los datos
duplicados junto a las leyes negativas. Luego se procedi a la realizacin de
histogramas para ver si los datos tenan una distribucin normal antes de
aplicar el test de Grubbs para outliers. Tras el anlisis de grficos se
concluy que para los datos de Espesor y leyes se aplicara una distribucin
Lognormal y las coordenadas sin modificar. Con estas modificaciones se
realiz el test de Grubbs en los datos restantes bajo el criterio de sacar
datos muy alejados del promedio.
Para crear un modelo predictivo de la ley de plata se realiz un test de
regresin polinomial, en el cual se estudi la correlacin con las variables de
Potencia y Ley de cobre por separado para ver la influencia de cada una y
su importancia con respecto a la ley de plata, donde se concluy que ambas
entregan informacin al modelo final.
Para el segundo modelo correspondiente a la ley de oro en funcin de las
coordenadas Norte y Cota se realizaron los mismos pasos que en el caso
anterior creando 2 modelos diferentes, uno solo con la coordenada Norte y
el otro incluyendo a la cota. Ambos modelos dieron una baja correlacin
entre las variables por lo que se concluy que ambas coordenadas no
poseen relacin con la ley de oro y no son variables eficientes para la
construccin de un modelo predictivo de la ley de un mineral.
Como conclusin general se ha logrado la comprensin de la aplicacin de
las regresiones, el uso de tests y sus distintos criterios, adems y los
modelos respondieron de forma efectiva con unas leves excepciones.
Abstract
Through this report a predictive model for the silver and gold law will be
built, in terms of geometallurgical variables and coordinates respectably,
obtained of from a auriferous-silvery deposit located to an average height of
1800 m.s.n.m.
On first instance Datos.xls was imported which contained approximately
700 values with information of samples taken from galleries of an exploited
vein. But before modeling what was explained, dealing with negative laws,
duplicates and outliers (data that is too apart from the average) is needed.
To solve this problems, in first place the duplicates and the negative laws
were removed. Then histograms were made to analyze if the data had a
normal distribution in order to apply the Grubbs test. In conclusion, the
Potency and the laws of gold and silver had a lognormal distribution, and the
coordinates North and Coat (?) werent modified. Whit this changes the test
of Grubbs was made to the remaining data to remove the outliers.
To create a predictive model for the silver law a polinomial regression test
was made, studying the correlation of the potency and the gold law
separately too observe the influence and significance with respect to the
silver law. It was concluded that both of the variables gave information to
the final model.
For the second model corresponding to the gold law according to the
coordinates North and Cota , the same steps above were performed,
creating two different models ,one only with North and the other including
Cota. Both models gave a low correlation between the variables, for this
reason, it was concluded that both coordinates does not have relationship
with gold law and aren't variables efficient to create a predictive model of
the law of a mineral
As a general conclusion, the understanding of the application of the
regressions models, and the use of the Tests and their criteria was achieved.
Also the model responded effectively with some minor exceptions.
Introduccin
La vida de un proyecto minero est compuesta por varias etapas:
prospeccin, exploracin, evaluacin de proyecto, construccin, explotacin
y cierre de faena. En algunas de estas es necesario estimar diferentes
variables que permitan, por ejemplo, visualizar la factibilidad de la
extraccin del mineral existente.
Para realizar una buena estimacin de los recursos o de alguna variable
minera importante es necesario contar con datos correctos y precisos que
permitan realizar modelos predictivos con el fin de obtener mayor
informacin sobre las variables que estn en estudio.
En el presente informe se analiza una base de datos pertenecientes a un
yacimiento aurfero -argentfero que contiene muestras de produccin con
informacin sobre las coordenadas geogrficas (Norte y cota en metros) de
su centro de gravedad, potencia de la veta (metros) y las leyes de oro y
plata (gramo/tonelada).
El anlisis realizado consta de un estudio exploratorio de datos en donde se
detectan anomalas y errores que puedan entorpecer la posterior formacin
de dos modelos predictivos en los que se relacionan de distinta manera las
variables contenidas en la base de datos.
Con los dos modelos predictivos generados se busc encontrar que
combinacin de variables son las que tienen mayor influencia en la
estimacin de la Ley de plata, el primer modelo toma en cuenta la ley de
oro y la potencia, y el segundo solo las coordenadas geogrficas (norte, este
y cota). Y para finalizar se analiz la real significancia de los modelos
desarrollados basado en parmetros estadsticos y la influencia lgica y real
de las variables usadas en la prediccin de la ley de plata.
.
Objetivos
Objetivos generales
Construir un modelo predictivo de la ley de plata en funcin de

la ley de oro y la potencia.
Construir un modelo predictivo de la ley de oro en funcin de

las coordenadas (Norte y Cota).
Objetivos especfi cos
Realizar un estudio exploratorio de los datos; detectar

eventuales anomalas o errores
Analizar la significancia de los modelos predictivos generados.
Familiarizarse con conocimientos sobre minera y el proceso de

evaluacin de yacimientos.
Antecedentes
Datos de entrada
Los datos utilizados en el informe se obtienen de la planilla de Excel:
Datos.xls, la cual contiene informacin de un yacimiento aurferoargentfero ubicado a 1800 m.s.n.m en el que la mineralizacin se
ubica en una veta aproximadamente vertical de poca potencia
(espesor) en la direccin este-oeste. Los datos fueron obtenidos de
muestras de produccin generadas a medida que la explotacin de la
veta iba avanzando.
En el archivo hay almacenados 714 datos de cada variable, entre las
que se encuentran las coordenadas geogrficas (Norte y Cota [m]),
las leyes de oro y plata [g/T] y la potencia (espesor de la veta [m]).
Las leyes de las especies se midieron con un error cuya desviacin
estndar es de un 10% del valor medido, mientras que la potencia se
midi con un error que presentaba una desviacin estndar de 10 cm
Marco Terico
Para el desarrollo de este informe se har uso de Microsoft Excel 2010 para
respaldar cada clculo requerido adems de contar con la herramienta de
Anlisis de Datos y con esta desarrollar Histogramas y Regresiones, donde
5
estas ltimas a travs de un modelo matemtico que modela una relacin

entre una variable dependiente Y, las variables independientes Xi y un
trmino aleatorio , o una regresin de mayor grado (cuadrtica, cbica,
etc.), con el fin de realizar modelos predictivos y ver que aproximacin es
mejor bajo el criterio de que R^2 sea similar a 1 cuando la aproximacin es
buena.
En cuanto a la deteccin de outliers se ocupar el test de Grubbs tambin
conocido como el mximo normado residual de ensayo, es una prueba
estadstica para reconocer valores atpicos en un conjunto de datos en la
que se supone que vienen de una distribucin normal de la poblacin. Para
realizar este test se debe realizar una hiptesis nula y una alternativa.
Luego se aplica el estadstico G de la siguiente frmula:
Frmula 1
Y para comparar si se aprueba no la hiptesis a un determinado nivel de

confianza, se utiliza la siguiente frmula:
Frmula 2
Con N nmero de datos y la incertidumbre asociada al grado de confianza
Distribucin Normal o Gaussiana

Es una distribucin la cual tiene una densidad de probabilidad igual a la
campana de Gauss.
Frmula 3
Grfico 1
La distribucin normal estndar corresponde a aquella de media 0 y

varianza 1; se denota usualmente como N(0,1).
Distribucin Lognormal
X tiene distribucin log-normal cuando su logaritmo sigue una distribucin
normal. La densidad de probabilidad es:
Frmula 3
Grfico 2
Test de Fisher
Se busca dos varianzas experimentales S 12 y S22 y de dos muestras
gaussianas independientes de tamao n 1 y n2. Definindose:
Frmula 4
Bajo la hiptesis nula (H 0) de que las muestras provienen de distribuciones

normales con la misma varianza, F tiene una distribucin de Fisher con n 1 - 1
y
n2 -1 grados de libertad. Luego se compara el valor de F con el valor
critico para el nivel de significancia deseado para as poder concluir si
rechazar o no H0.
Ajuste polinomial:
Supongamos que se ha ajustado un modelo polinomial con un determinado
grado . Se quiere saber si un modelo de grado inferior hubiese sido
suficiente. Se suele proceder de forma iterativa:
1. Se testea la hiptesis de que el trmino de mayor grado no es
necesario: = 0.
2. Si se rechaza esta hiptesis, entonces el modelo de grado es
necesario. Si no, se contina el testeo, buscando si un modelo an
ms simple sera suficiente. El paso siguiente es testear la hiptesis =
= 0.
3. Si es preciso, continuar hasta testear = = = = 0. Si se acepta esta
ltima hiptesis, esto significa que la variable no sirve para modelar
la variable.
Los resultados de estos tests pueden presentarse en una tabla de anlisis
de varianza.
Tabla 1 , S: suma de cuadrados ; MS: la media
Regresin Polinomial
Determina la combinacin lineal de varias variables X 1 XM que mejor
explica una variable Y. La calidad de la regresin se puede cuantificar con el
coeficiente de determinacin mltiple (R 2): este coeficiente, comprendido
entre 0 y 1, mide cunto se explica la variable al utilizar el modelo de
regresin con las variables regresin con las variables.
Propagacin de Errores
Es importante saber cmo los errores se propagan a travs de los clculos
que uno realiza. En trminos de varianzas de las mediciones, se tiene:
Frmula 5
De forma general, la propagacin de un error a travs de una funcin puede

ser determinada usando las derivadas parciales de esta funcin (Valida para
errores pequeos):
Frmula 6
En trminos de varianzas:
Frmula 7
Conceptos Bsicos
Datos atpicos: Datos con valores extremos que
afectan
considerablemente las estadsticas bsicas y generan problemas al
aplicar regresin o construir modelos
Predictivos. Estos pueden ser datos errneos o aberrantes (outliers)
Datos errneos: no son considerados como lgicos. Por ejemplo las
leyes negativas., el porcentaje de cobre soluble que sea mayor al
porcentaje de cobre total,etc.
Outliers o datos aberrantes: Un elemento que es significativamente

diferente a los otros datos de la muestra. Las estadsticas calculadas
de una muestra que contenga outliers sern frecuentemente
engaosas.
Anlisis exploratorio de datos : es el tratamiento estadstico al que se
someten los datos obtenidos en un proceso de investigacin en
cualquier campo cientfico. Para mayor rapidez y precisin, todo el
proceso suele realizarse por medios informticos, con aplicaciones
especficas para el tratamiento estadstico (ejemplo: Excel)
Modelo matemtico: uno de los tipos de modelos cientficos que
emplea las matemticas para expresar relaciones entre variables y
as estudiar
el comportamiento de sistemas complejos ante
situaciones difciles de observar en la realidad.
Desarrollo
Deteccin eventuales anomalas o errores.
Se analiza el conjunto de datos en bsqueda de posibles errores en el
muestreo, con el fin de poder eliminarlos y realizar un mejor estudio de
stos. En primer lugar se observa que existe informacin errnea en la ley
de plata, donde hay valores negativos que indican la inexistencia de datos
en ese punto. Algunos de stos se presentan en la Tabla 2 y al no ser valores
razonables para una ley mineral, se decide eliminarlos. Se encuentra un
total de 24 porcentajes negativos.
10
Tabla 2. Datos errneos: Leyes negativas.
Se identificaron adems datos duplicados, para ello se procedi a

ordenarlos de menor a mayor (con respecto a la coordenada Norte) e
identificar aquellas entradas que coincidan en ambas coordenadas (Norte y
Cota, pues el Este no variaba). Se encontraron un total de 6 datos
duplicados, en donde 5 coincidan en su totalidad, por lo que se elimina
directamente el duplicado. En cuanto al restante, se acepta el que presenta
una mayor cercana a la media de las variables estudiadas. Un extracto de
este anlisis se presenta en la Tabla 3.
Tabla 3. Datos duplicados.
Una vez descartadas las entradas anteriores se realiza un histograma

de las distintas variables (Ver Anexo aslkdfjlfkj ACA van los histogramas
antes de eliminar datos aberrantes), de ellos se advierte que existen
algunos datos atpicos que eventualmente podran generar problemas al
construir los modelos predictivos. Para declarar estos valores extremos
como errneos y eliminarlos es necesario comprobarlo mediante el Test de
Grubbs. Como se requiere de una distribucin normal de los datos se
calcula el logaritmo de cada variable (Ver anexo dlkjdjlk histogramas con ln
y dist normal). Se calcula
para cada variable y se compara con un valor
crtico dado por el tamao de la muestra
(n)
y un
=5 .
Para la ley de oro se tiene un tamao de muestra igual a

por lo tanto un valor crtico de
3,266 . En la Tabla 4 se presentan
algunos clculos, no existen datos aberrantes.
11
n=708 , y
Tabla 4. Eliminacin de outliers: ley de oro.
Para la ley de plata se tiene un tamao de muestra igual a

un valor crtico de
n=684
3,265 . Se encontraron cero datos aberrantes, en
la Tabla 5 se muestra una parte.
Tabla 5. Eliminacin de outliers: ley de plata.
Para la potencia se tiene un tamao de muestra igual a

valor crtico de
n=708 y un
3,266 . Se encontraron 8 datos aberrantes y se
presenta el valor ms notable en la Tabla 6.
Tabla 6. Eliminacin de outliers: Potencia.
Para la Cota, al igual que en el caso anterior, se tiene un

valor crtico de
n=708 , un
3,266 , y un dato aberrante presentado en la Tabla 7.
Tabla 7. Eliminacin de outliers: Cota.
12
Para la coordenada Norte, se tiene un
n=708 , un valor crtico de
3,266 , y ningn dato aberrante (ver Tabla 8)
Tabla 8. Eliminacin de outliers: Norte.
Desviacin estndar en el error de acumulaciones.

La desviacin estndar en el error de la acumulacin de oro y plata se
determina mediante propagacin de error en trminos de la varianza. En
este caso se llega a:
2 A cumulacin=Ley 2i 2Potencia + Potencia2 2Ley
Frmula 8
Donde la desviacin estndar de la potencia corresponde a

y la desviacin estndar de las leyes corresponde al
10
0,1[m]
del valor medido.
Los valores obtenidos se muestran en la Tabla 9 y 10, para el oro y la plata

respectivamente.
Tabla 9. Desviacin estndar en el error de la acumulacin de oro.
13
Tabla 10. Desviacin estndar en el error de la acumulacin de plata.
Las tablas anteriores solo muestran una fraccin del total de los
resultados obtenidos. Es posible sealar que para ambos casos el porcentaje
del valor de la acumulacin es el mismo para cada fila de datos. Los
resultados numricos del porcentaje de acumulacin que representa la
desviacin estndar respectiva, nos da un valor promedio del
un mnimo del
10,06
y un mximo del
14
14,,2 .
10,55 ; con
Modelo predictivo de la ley de plata en funcin de la

ley de oro y la potencia
Para la construccin de este modelo se trabaj con tres variables
consideradas relevantes: la ley de oro, la potencia y la acumulacin de oro.
En primer lugar se analizan los datos directamente y son relacionados
mediante los modelos presentados en la Tabla 10, donde se incluye el
coeficiente de correlacin ajustado.
Se define previamente:
=Ley de plata
=Ley de oro
=Potencia
= Acumulacin de oro
A=Constante de la Regresin
Modelo
R2 Ajustado
= A+ +
0,567
= + +
0,735
= +
0,732
0,678
= + 2+ 3 + + 2 + 3+ + 2 + 3
0,763
Tabla 11. Modelos para ley de plata.
De la tabla anterior, es claro que los

valores muy bajos, a pesar del valor
0,763
ajustados presentan
que implica una regresin
aceptable. Es por esto que se decide trabajar con el logaritmo de las

variables (de esta manera distribuyen de forma lognormal), entonces se
definen:
Ley de plata
Y =ln
X =ln ( Ley de oro)
15
Z =ln ( Potencia )
M =ln ( Acumulacin de oro)

A=Constante de la Regresin
As,
se tienen los modelos creados junto a su coeficiente de
correlacin ajustado, que se presentan en la Tabla 12:
R2 Ajustado
Modelo
Y = A+Z + X
0,749
Y =Z+ X
0,966
Y =ZX
0,828
Y =M
0,941
Y =M + Z+ X
0,966
Y = X+ X 2 + X 3 + Z+ Z 2 +Z 3 + M + M 2+ M 3
0,981
Tabla 12. Modelos con logaritmo de las variables.
Se deduce entonces, a causa de lo cercano de los valores de
R2
ajustado a uno, que estos modelos describen de mejor manera la relacin

entre las variables estudiadas. Especficamente se tiene que el modelo con
mejor coeficiente de correlacin ajustado corresponde al ajuste polinomial
de grado 3 para todas la variables sin constante.
Anlisis de signifi cancia del modelo escogido

El modelo escogido corresponde a (se omiten los coeficientes):
Y = X+ X 2 + X 3 + Z+ Z 2 +Z 3 + M + M 2+ M 3
Frmula 9
Se desea determinar si un modelo de grado inferior es suficiente,

para ello se realiza un anlisis de varianza, donde se testea la hiptesis de
que el coeficiente de mayor grado es o no necesario. Se lleva a cabo este
anlisis con cada variable por separado y los resultados se presentan en las
tablas siguientes:
16
Tabla 13. Anlisis de varianza para
ln( Acumulacin oro)
ln(Potencia)
ln(Ley de Oro)
Se tiene finalmente uniendo los resultados, el siguiente modelo para

la ley de plata en funcin de la ley de oro, acumulacin de oro y potencia:
2
Y =8,57 X +1,91 Z7,57 Z + 9,34 M

Frmula 10
Con un
ajustado de
0,983
(Para ms detalles de la regresin ver
anexodsdakn()).
Modelo predictivo de la ley de oro en funcin de las

coordenadas
En la construccin de este modelo se utilizaron las variables Norte y Cota,
Las cuales fueron definidas de la siguiente manera:
L=Ley de oro
N=Norte
C=Cota
17
r=Constante de regresin
Para ver qu relacin existe entre la ley de oro y cada una de las
coordenadas se realizaron los siguientes grficos de dispersin:
Grfico 1 : ley oro v/s Norte
Grfico 2: ley oro v/s Cota
En ambos grficos se puede observar que la ley de oro no sigue tendencias

muy marcadas con respecto a cada variable , pero el caso ms extremo se
da en el grfico 2 en donde ley de oro no guarda ninguna relacin lineal
con la cota, a raz de esto se decidi en primer lugar desarrollar modelos
que solo utilicen la coordenada norte( variable que tiene mayor relacin con
la ley de oro segn grfico 1) y en segundo lugar , probar modelos que si
incluyan a la cota para ver cul es la real influencia que tiene esta variable
en la estimacin de la ley de oro, que segn el grafico 2 seria nula.
Modelo :ley de oro en funcin de la coordenada Norte.
18
En el desarrollo de este modelo slo se dispone de una variable(coordenada

Norte) por lo que se probaron modelos polinomiales de diferentes grados
para encontrar en cual se produca el mayor coeficiente de correlacin
ajustado (R2)
Los resultados fueron los siguientes:
Modelo
R2 ajustado
r + N=L
0,0033
r + N + N 2=L
0,1185
N + N =L
0,4048
r + N + N 2 + N 3=L
0,1463
N + N + N =L
0,4254
r + N + N 2 + N 3 + N 4 =L
0,1577
N + N 2 + N 3 + N 4 =L
0,4258
r + N + N + N + N + N =L
0,1697
N + N 2 + N 3 + N 4 + N 5 =L
0,4432
0,4448
N + N + N + N + N + N =L
Tabla 16: modelos para la ley de oro
En la tabla anterior se puede observar que todos los modelos probados

presentan un R2 ajustado muy bajo (inferiores a 0,5), incluso el mximo
alcanzado fue solo 0,4448 perteneciente al modelo de grado 6 para todas
las variables sin constante. A diferencia del modelo anterior, al aplicarle
ln
a la variable Norte esta no sigue una distribucin log normal, por lo
que se decidi utilizarla sin aplicar funcin.

Anlisis de significancia del modelo escogido
El modelo escogido corresponde a (se omiten los coeficientes
2
L=N + N + N + N + N + N
ai ):
Frmula 11

para ello se realiza un anlisis de varianza, donde se testea la hiptesis:
Ho:coeficiente ai=0
H 1 : coeficiente ai 0
19
Test de hiptesis 1
Se lleva a cabo este anlisis con cada variable y los resultados se

presentan en la siguiente tabla:
Tabla 17: Analisis de varianza para coordenada Norte
Uniendo los resultados, se tiene finalmente el siguiente modelo para la ley

de oro en funcin de la coordenada Norte:
Norte
Norte2
Norte3
Norte4
Norte5
Norte6
Coeficientes
3,48E-01
-4,69E-04
-7,88E-05
1,11E-06
-5,19E-09
7,80E-12
Smbolo
A
B
C
D
E
F
Tabla 18: coeficientes modelo final
L= A N + B N 2 +C N 3 + D N 4 + E N 5 + F N 6
Frmula 12
Con un R2 ajustado de 0,4448=0,45 aprox.
Modelo: Ley de oro en funcin de la coordenada Norte y

la Cota.
En primer lugar ambas variables (Norte y Cota) son relacionadas a la ley de
oro mediante los modelos presentados en la Tabla 19, donde se incluye el
coeficiente de correlacin ajustado.
r + N +C=L
R2 ajustado
0,047
N +C=L
0,336
Modelo
N + N +C+C =L
0,411
N C=L
0,283
20
N 2 +C2=L
0,330
N + N 2 + N 3 +C+C 2 +C 3=L
0,431
N + N + N + N +C +C +C +C =L
0,465
N + N 2 + N 3 + N 4 + N 5 +C +C2 +C3 +C 4 +C5 =L
0,470
N + N + N + N + N + N +C +C +C +C +C + N =L
0,474
Tabla 19: Modelos ley de oro en funcin de la coordenada Norte y la

Cota
En la tabla anterior se puede observar que todos los modelos probados

siguen presentando un R 2 ajustado muy bajo (inferiores a 0,5), incluso el
mximo alcanzado fue solo 0,474 perteneciente al modelo de grado 6 para
todas las variables sin constante.
Anlisis de significancia del modelo escogido
El modelo escogido corresponde a (se omiten los coeficientes
2
L=N + N + N + N + N + N + C+C +C + C +C + N
ai ):
Frmula 13

para ello se realiza un anlisis de varianza, donde se aplica el test de
hiptesis 1.
Se lleva a cabo este anlisis con cada variable y los resultados se
presentan en la siguiente tabla:
Tabla 20: Anlisis de varianza para coordenada Norte
Tabla 21: Analisis de varianza para la Cota.
21
Uniendo los resultados, se tiene finalmente el siguiente modelo para la ley

de oro en funcin de la coordenada Norte y la Cota:
Coeficient
es
Smbolo
Norte
-1,2383 A
Norte2
0,04006 B
3
Norte
-0,00054 C
4
Norte
3,74E-06 D
Norte5
-1,24E-08 E
Norte6
1,55E-11 F
Cota
-0,1452 G
9,05926ECota2
05 H
Tabla 22: Coeficientes del modelo final
L= A N + B N 2+ C N 3+ D N 4 + E N 5+ F N 6+G C+ H C 2
Frmula 14
Con un R2 ajustado de 0,469=0,47 aprox.
Anlisis del modelo predictivo para Ley de plata en

funcin de Ley de oro y Potencia.
En este modelo predictivo, se busca encontrar la correlacin entre la Ley de
Plata con los datos de Espesor y Ley de oro entregadas en el archivo
Datos.xls, adems de la adicin del dato acumulacin, mediante un ajuste
polinomial de grado 1 ,2 y 3.
Luego de realizadas estas regresiones, se obtuvieron los coeficientes de
correlacin de la tabla X de la cual se puede observar que la ley de plata se
correlaciona de mejor forma con la Acumulacin y la Ley de Oro ya que sus
coeficientes son cercanos a 1, no as la Potencia que presenta coeficientes q
tienden a cero, dejando ver que su correlacin en el modelo es mala.
Luego se procedi a realizar el ajuste de los coeficientes para el polinomio
del modelo final a travs del anlisis de significancia de cada variable,
donde para el caso de la acumulacin el ajuste entrego que le corresponde
una correlacin lineal con respecto a la ley de plata, para la variable de
Potencia una correlacin cuadrtica y para la acumulacin una correlacin
lineal (ver tablas 13,14,15).
Con estos datos se concluye que para el modelo final, si se considerar la
variable Potencia a pesar de que su correlacin con la ley de plata sea poca,
ya que en el modelo final se prob que si influye y mejora levemente su R 2
ajustado. Finalmente, realizando la regresin del modelo concluido se lleg
a que el R2 para la regresin con constante distinta de cero es 0,748 con un
error tpico de 0,646, y para la regresin con constante igual a cero el R 2 es
22
0,98 con un error tpico de 0,684 indicando que es una muy buena
aproximacin.
Ahora resta ver cun semejante son los resultados del modelo respecto a los
datos entregados para la ley de plata, para eso se observa el grfico 3
donde se presentan la distribucin Lognormal de los datos originales y los
obtenidos por el modelo planteado. En el grfico es posible apreciar que los
valores entregados por el modelo se asemejan en gran parte a la realidad,
pero tiende a subestimar algunos valores.
Grfico 3:modelo final v/s datos
Anlisis del modelo predictivo para Ley de oro en

funcin de las coordenas Norte y Cota.
En este modelo predictivo se busca relacionar la ley de oro en funcin de las
coordenadas Norte y Cota. En primer lugar se observan los grficos 1 y 2 de
dispersin de la ley de oro en funcin de cada variable, de los cuales se
deduce que la Cota no presenta ningn tipo de relacin lineal con la ley de
oro.
Se decide separar el procedimiento en dos partes diferentes, en la primera
se realizan modelos considerando solo la variable Norte que es la que
presenta un mayor grado de relacin con la ley de oro (grafico 1), y en la
segunda se prueban modelos que si incluyan a la variable cota teniendo
como objetivo ver cul es la real influencia que tiene esta variable en la
estimacin de la ley de oro, que segn el grfico 2 seria nula.
Parte 1 :Modelo de la ley de oro en funcin de la

coordenada Norte.
Se realizan varios modelos predictivos con la ley de oro en funcin de la
coordenada Norte con el fin de encontrar el que presentara un mayor
coeficiente de correlacin ajustado. Los resultados obtenidos son los
23
expuestos en la tabla 16, en el que el mejor modelo es el de grado 6 para

todas las variables sin constante con un R 2 =0,4480.
Luego se procede a realizar un anlisis de significancia del cual se obtiene
que el mejor modelo sigue siendo el de grado 6 sin constante (formula 12)
por lo que el R2 del modelo final se mantiene (0,448).
En el grafico 4 se observa la relacin entre los datos de la ley de oro y los
calculados por el modelo. A simple vista el modelo final tiende a subestimar
a la mayora de los datos, situacin concordante el bajo R 2 del modelo ya
que solo un 45% de los datos calculados concuerda con los de la ley de oro
real. Adems el error tpico del modelo fue superior al 27%, indicando una
muy mala relacin entre las variables y el parmetro a estimar.
Grfico 4 : Modelo ley de oro v/s datos
Parte 2: Modelo de la ley de oro en funcin de la

coordenada Norte y Cota.
Se desarrollan diferentes modelos considerando la variable Norte y la Cota
obteniendo como resultado la tabla 19, de donde se escogi el modelo con
el mayor coeficiente de correlacin ajustado (R2) que corresponde al de
grado 6 para todas las variables sin constante(R2= 0,474).
Luego se procede a realizar un anlisis de significancia, del cual se obtiene
que el mejor modelo es de grado seis para la variable Norte y de grado dos
para la variable cota (Formula 14) R2 del modelo final es 0,47.
En el grafico 5 se observa que el modelo final tiende a sobreestimar a la
mayora de los datos, situacin que se corrobora con el bajo ndice de
correlacin ajustado (R2 ) del modelo ya que solo un 47% de los datos
calculados concuerda con los de la ley de oro real. Ademas el error tpico fue
superior al 25%, indicando una muy mala relacin entre las variables y el
parmetro a estimar.
24
Grfico 5: modelo ley de oro v/s datos
Aunque ambos modelos son considerados los mejores entre todos los que
fueron probados, no cumplen con calcular ni siquiera el 50% de los datos de
manera correcta ya que los subestiman (considerando solo coordenada
Norte) o sobrestiman (considerando coordenada Norte y cota ). Adems los
coeficientes de cada modelo (tabla 18 y 22) dan muy cercanos a cero ,lo
cual es otro indicador de la baja relacin existente entre las variables.
La incorporacin de la coordenada Cota en los modelos es indiferente, ya
que los R2 ajustados y los errores tpicos son muy parecidos. (0,45 y 0,47 ,
27% y 25% respectivamente).
Ante todo lo expuesto, se puede deducir que la ley de oro no tiene ningna
relacin con las coordenadas, por lo que aunque se perfeccionen aun ms
los modelos, jams alcanzaran un R2 aceptable para su utilizacin.
Conclusin.
Los modelos predictivos tienen una gran utilidad ya que permiten deducir
valores en base a la correlacin de datos conocidos, adems de tener
nocin de una distribucin demasiado compleja que se quiera estudiar.
El primer paso que se debe realizar para desarrollar un modelo predictivo
es contar con una base de datos confiable, sin datos aberrantes ni errneos,
lo cual sirve para evitar distorsiones en la muestra, incrementando la
confiabilidad del modelo a desarrollar.
A lo largo de este informe se desarrollaron 2 modelos predictivos, utilizando
el mtodo del polinomio para la interpolacin de los datos y aplicando
anlisis de varianzas (ANOVA) ,herramientas con las cuales se obtuvieron las
mejores relaciones factibles entre las variables con las que se contaba.
25
Aunque existen otros mtodos relacionados, estos fueron descartados dado

el gran numero de datos estudiados, lo cuales los hacan impracticables.
Uno de los modelos predictivos fue el de la ley de plata en funcin de la ley
de oro y la potencia, con el cual se alcanzo un R^2 ajustado de 0,98, valor
que indica la gran precisin en la estimacin de la ley de plata, por lo que
puede ser considerado como un muy buen modelo predictivo. La variables
que presentaba mayor influencia en el modelo fue la ley de oro ustedes
saben mas de esrte modelo
El segundo modelo fue el de la ley de plata en funcin de las coordenadas
Norte y Cota, en donde el mayor R^2 alcanzado fue de un 0,47 y un error
tpico de 27%, , valores que indican la mala calidad del modelo predictivo ,
esto se explica por la nula relacin entre la cantidad de mineralizacin y las
coordenadas del lugar analizado .
Por lo tanto para determinar la ley de un mineral en especfico, se
recomienda utilizar las leyes de minerales que comnmente se encuentren
juntos o en lugares cercanos en una veta. As, si existe una gran cantidad
de un mineral a una profundidad X puede que tambin exista su mineral
asociado.
Para finalizar, los modelos se pueden ir complejizando cada vez mas y
as alcanzar valores ms exactos y precisos, pero esto trae consigo un
mayor requerimiento computacional y gasto econmico , razn por la cual
se trata de buscar un equilibrio , desarrollando un modelo con error
asociado aceptable y as evitar gastos de mas.
Bibliografa
Material disponible en internet
1. Xavier Emery, Clase 1, anlisis geoestadstico de datos.
2. Xavier Emery, Clase 2, anlisis geoestadstico de datos .
3. Xavier Emery, Clase 3, anlisis geoestadstico de datos .
26
Pagina web
1. http://www.mathematicsdictionary.com/spanish/vmd/full/o/outlier.htm
2. http://es.wikipedia.org/wiki/Valor_at%C3%ADpico
3. http://es.wikipedia.org/wiki/Modelo_matem%C3%A1tico
4. http://www.sonami.cl/files/presentaciones/242/04.%20Etapas%20en
%20la%20vida%20de%20un%20proyecto%20minero.pdf
Referencias
Tabla grajsdaksjf
27
a
b
c
d
9,343
1,911
-7,569
-8,568
()
Tabla a (acum)
Tabla b (potencia)
Tabla c (oro)
28

Informe Analisis Geoestadistico

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Informe Analisis Geoestadistico

Uploaded by

Copyright:

Available Formats

TOSHIBA

[Type the document

Construir un modelo predictivo de la ley de plata en funcin de

Construir un modelo predictivo de la ley de oro en funcin de

Objetivos especfi cos

Realizar un estudio exploratorio de los datos; detectar

Analizar la significancia de los modelos predictivos generados.

Familiarizarse con conocimientos sobre minera y el proceso de

estas ltimas a travs de un modelo matemtico que modela una relacin

Y para comparar si se aprueba no la hiptesis a un determinado nivel de

Con N nmero de datos y la incertidumbre asociada al grado de confianza

Distribucin Normal o Gaussiana

La distribucin normal estndar corresponde a aquella de media 0 y

Bajo la hiptesis nula (H 0) de que las muestras provienen de distribuciones

Tabla 1 , S: suma de cuadrados ; MS: la media

De forma general, la propagacin de un error a travs de una funcin puede

Outliers o datos aberrantes: Un elemento que es significativamente

Tabla 2. Datos errneos: Leyes negativas.

Se identificaron adems datos duplicados, para ello se procedi a

Tabla 3. Datos duplicados.

Una vez descartadas las entradas anteriores se realiza un histograma

para cada variable y se compara con un valor

crtico dado por el tamao de la muestra

Para la ley de oro se tiene un tamao de muestra igual a

3,266 . En la Tabla 4 se presentan

algunos clculos, no existen datos aberrantes.

Tabla 4. Eliminacin de outliers: ley de oro.

Para la ley de plata se tiene un tamao de muestra igual a

3,265 . Se encontraron cero datos aberrantes, en

la Tabla 5 se muestra una parte.

Tabla 5. Eliminacin de outliers: ley de plata.

Para la potencia se tiene un tamao de muestra igual a

3,266 . Se encontraron 8 datos aberrantes y se

presenta el valor ms notable en la Tabla 6.

Tabla 6. Eliminacin de outliers: Potencia.

Para la Cota, al igual que en el caso anterior, se tiene un

3,266 , y un dato aberrante presentado en la Tabla 7.

Tabla 7. Eliminacin de outliers: Cota.

Para la coordenada Norte, se tiene un

n=708 , un valor crtico de

3,266 , y ningn dato aberrante (ver Tabla 8)

Tabla 8. Eliminacin de outliers: Norte.

Desviacin estndar en el error de acumulaciones.

2 A cumulacin=Ley 2i 2Potencia + Potencia2 2Ley

Donde la desviacin estndar de la potencia corresponde a

del valor medido.

Los valores obtenidos se muestran en la Tabla 9 y 10, para el oro y la plata

Tabla 9. Desviacin estndar en el error de la acumulacin de oro.

Tabla 10. Desviacin estndar en el error de la acumulacin de plata.

Modelo predictivo de la ley de plata en funcin de la

Tabla 11. Modelos para ley de plata.

De la tabla anterior, es claro que los

que implica una regresin

aceptable. Es por esto que se decide trabajar con el logaritmo de las

M =ln ( Acumulacin de oro)

Tabla 12. Modelos con logaritmo de las variables.

Se deduce entonces, a causa de lo cercano de los valores de

ajustado a uno, que estos modelos describen de mejor manera la relacin

Anlisis de signifi cancia del modelo escogido

Se desea determinar si un modelo de grado inferior es suficiente,

Tabla 13. Anlisis de varianza para

ln( Acumulacin oro)

Tabla 14. Anlisis de varianza para