Professional Documents
Culture Documents
[Type the abstract of the document here. The abstract is typically a short
summary of the contents of the document. Type the abstract of the
document here. The abstract is typically a short summary of the contents
of the document.]
Resumen
Mediante el presente informe se buscara construir modelos predictivos de la
ley de plata y ley de oro en funcin de variables geometalrgicas y
coordenadas respectivamente, obtenidas de un yacimiento aurferoargentfero ubicado a una altura promedio de 1800 m.s.n.m.
En primera instancia se analiz el archivo Datos.xls que contaba con un
poco ms de 700 datos con informacin de muestras de produccin
tomadas en galeras de explotacin de una veta. Pero antes de modelar lo
anteriormente descrito se debe lidiar primero con los datos de leyes
negativas que no son lgicos, los duplicados que aportan la misma
informacin y los outliers, que corresponden a datos muy alejados del
promedio. Para resolver estos problemas, primero se sac los datos
duplicados junto a las leyes negativas. Luego se procedi a la realizacin de
histogramas para ver si los datos tenan una distribucin normal antes de
aplicar el test de Grubbs para outliers. Tras el anlisis de grficos se
concluy que para los datos de Espesor y leyes se aplicara una distribucin
Lognormal y las coordenadas sin modificar. Con estas modificaciones se
realiz el test de Grubbs en los datos restantes bajo el criterio de sacar
datos muy alejados del promedio.
Para crear un modelo predictivo de la ley de plata se realiz un test de
regresin polinomial, en el cual se estudi la correlacin con las variables de
Potencia y Ley de cobre por separado para ver la influencia de cada una y
su importancia con respecto a la ley de plata, donde se concluy que ambas
entregan informacin al modelo final.
Para el segundo modelo correspondiente a la ley de oro en funcin de las
coordenadas Norte y Cota se realizaron los mismos pasos que en el caso
anterior creando 2 modelos diferentes, uno solo con la coordenada Norte y
el otro incluyendo a la cota. Ambos modelos dieron una baja correlacin
entre las variables por lo que se concluy que ambas coordenadas no
poseen relacin con la ley de oro y no son variables eficientes para la
construccin de un modelo predictivo de la ley de un mineral.
Como conclusin general se ha logrado la comprensin de la aplicacin de
las regresiones, el uso de tests y sus distintos criterios, adems y los
modelos respondieron de forma efectiva con unas leves excepciones.
Abstract
Through this report a predictive model for the silver and gold law will be
built, in terms of geometallurgical variables and coordinates respectably,
obtained of from a auriferous-silvery deposit located to an average height of
1800 m.s.n.m.
On first instance Datos.xls was imported which contained approximately
700 values with information of samples taken from galleries of an exploited
vein. But before modeling what was explained, dealing with negative laws,
duplicates and outliers (data that is too apart from the average) is needed.
To solve this problems, in first place the duplicates and the negative laws
were removed. Then histograms were made to analyze if the data had a
normal distribution in order to apply the Grubbs test. In conclusion, the
Potency and the laws of gold and silver had a lognormal distribution, and the
coordinates North and Coat (?) werent modified. Whit this changes the test
of Grubbs was made to the remaining data to remove the outliers.
To create a predictive model for the silver law a polinomial regression test
was made, studying the correlation of the potency and the gold law
separately too observe the influence and significance with respect to the
silver law. It was concluded that both of the variables gave information to
the final model.
For the second model corresponding to the gold law according to the
coordinates North and Cota , the same steps above were performed,
creating two different models ,one only with North and the other including
Cota. Both models gave a low correlation between the variables, for this
reason, it was concluded that both coordinates does not have relationship
with gold law and aren't variables efficient to create a predictive model of
the law of a mineral
As a general conclusion, the understanding of the application of the
regressions models, and the use of the Tests and their criteria was achieved.
Also the model responded effectively with some minor exceptions.
Introduccin
La vida de un proyecto minero est compuesta por varias etapas:
prospeccin, exploracin, evaluacin de proyecto, construccin, explotacin
y cierre de faena. En algunas de estas es necesario estimar diferentes
variables que permitan, por ejemplo, visualizar la factibilidad de la
extraccin del mineral existente.
Para realizar una buena estimacin de los recursos o de alguna variable
minera importante es necesario contar con datos correctos y precisos que
permitan realizar modelos predictivos con el fin de obtener mayor
informacin sobre las variables que estn en estudio.
En el presente informe se analiza una base de datos pertenecientes a un
yacimiento aurfero -argentfero que contiene muestras de produccin con
informacin sobre las coordenadas geogrficas (Norte y cota en metros) de
su centro de gravedad, potencia de la veta (metros) y las leyes de oro y
plata (gramo/tonelada).
El anlisis realizado consta de un estudio exploratorio de datos en donde se
detectan anomalas y errores que puedan entorpecer la posterior formacin
de dos modelos predictivos en los que se relacionan de distinta manera las
variables contenidas en la base de datos.
Con los dos modelos predictivos generados se busc encontrar que
combinacin de variables son las que tienen mayor influencia en la
estimacin de la Ley de plata, el primer modelo toma en cuenta la ley de
oro y la potencia, y el segundo solo las coordenadas geogrficas (norte, este
y cota). Y para finalizar se analiz la real significancia de los modelos
desarrollados basado en parmetros estadsticos y la influencia lgica y real
de las variables usadas en la prediccin de la ley de plata.
.
Objetivos
Objetivos generales
Antecedentes
Datos de entrada
Los datos utilizados en el informe se obtienen de la planilla de Excel:
Datos.xls, la cual contiene informacin de un yacimiento aurferoargentfero ubicado a 1800 m.s.n.m en el que la mineralizacin se
ubica en una veta aproximadamente vertical de poca potencia
(espesor) en la direccin este-oeste. Los datos fueron obtenidos de
muestras de produccin generadas a medida que la explotacin de la
veta iba avanzando.
En el archivo hay almacenados 714 datos de cada variable, entre las
que se encuentran las coordenadas geogrficas (Norte y Cota [m]),
las leyes de oro y plata [g/T] y la potencia (espesor de la veta [m]).
Las leyes de las especies se midieron con un error cuya desviacin
estndar es de un 10% del valor medido, mientras que la potencia se
midi con un error que presentaba una desviacin estndar de 10 cm
Marco Terico
Para el desarrollo de este informe se har uso de Microsoft Excel 2010 para
respaldar cada clculo requerido adems de contar con la herramienta de
Anlisis de Datos y con esta desarrollar Histogramas y Regresiones, donde
5
Frmula 1
Frmula 2
Frmula 3
Grfico 1
Distribucin Lognormal
X tiene distribucin log-normal cuando su logaritmo sigue una distribucin
normal. La densidad de probabilidad es:
Frmula 3
Grfico 2
Test de Fisher
Se busca dos varianzas experimentales S 12 y S22 y de dos muestras
gaussianas independientes de tamao n 1 y n2. Definindose:
Frmula 4
Ajuste polinomial:
Supongamos que se ha ajustado un modelo polinomial con un determinado
grado . Se quiere saber si un modelo de grado inferior hubiese sido
suficiente. Se suele proceder de forma iterativa:
1. Se testea la hiptesis de que el trmino de mayor grado no es
necesario: = 0.
2. Si se rechaza esta hiptesis, entonces el modelo de grado es
necesario. Si no, se contina el testeo, buscando si un modelo an
ms simple sera suficiente. El paso siguiente es testear la hiptesis =
= 0.
3. Si es preciso, continuar hasta testear = = = = 0. Si se acepta esta
ltima hiptesis, esto significa que la variable no sirve para modelar
la variable.
Los resultados de estos tests pueden presentarse en una tabla de anlisis
de varianza.
Regresin Polinomial
Determina la combinacin lineal de varias variables X 1 XM que mejor
explica una variable Y. La calidad de la regresin se puede cuantificar con el
coeficiente de determinacin mltiple (R 2): este coeficiente, comprendido
entre 0 y 1, mide cunto se explica la variable al utilizar el modelo de
regresin con las variables regresin con las variables.
Propagacin de Errores
Es importante saber cmo los errores se propagan a travs de los clculos
que uno realiza. En trminos de varianzas de las mediciones, se tiene:
Frmula 5
Frmula 6
En trminos de varianzas:
Frmula 7
Conceptos Bsicos
Datos atpicos: Datos con valores extremos que
afectan
considerablemente las estadsticas bsicas y generan problemas al
aplicar regresin o construir modelos
Predictivos. Estos pueden ser datos errneos o aberrantes (outliers)
Datos errneos: no son considerados como lgicos. Por ejemplo las
leyes negativas., el porcentaje de cobre soluble que sea mayor al
porcentaje de cobre total,etc.
Desarrollo
Deteccin eventuales anomalas o errores.
Se analiza el conjunto de datos en bsqueda de posibles errores en el
muestreo, con el fin de poder eliminarlos y realizar un mejor estudio de
stos. En primer lugar se observa que existe informacin errnea en la ley
de plata, donde hay valores negativos que indican la inexistencia de datos
en ese punto. Algunos de stos se presentan en la Tabla 2 y al no ser valores
razonables para una ley mineral, se decide eliminarlos. Se encuentra un
total de 24 porcentajes negativos.
10
(n)
y un
=5 .
11
n=708 , y
n=684
n=708 y un
n=708 , un
12
Frmula 8
10
0,1[m]
13
Las tablas anteriores solo muestran una fraccin del total de los
resultados obtenidos. Es posible sealar que para ambos casos el porcentaje
del valor de la acumulacin es el mismo para cada fila de datos. Los
resultados numricos del porcentaje de acumulacin que representa la
desviacin estndar respectiva, nos da un valor promedio del
un mnimo del
10,06
y un mximo del
14
14,,2 .
10,55 ; con
=Ley de plata
=Ley de oro
=Potencia
= Acumulacin de oro
A=Constante de la Regresin
Modelo
R2 Ajustado
= A+ +
0,567
= + +
0,735
= +
0,732
0,678
= + 2+ 3 + + 2 + 3+ + 2 + 3
0,763
0,763
ajustados presentan
Ley de plata
Y =ln
X =ln ( Ley de oro)
15
Z =ln ( Potencia )
As,
se tienen los modelos creados junto a su coeficiente de
correlacin ajustado, que se presentan en la Tabla 12:
R2 Ajustado
Modelo
Y = A+Z + X
0,749
Y =Z+ X
0,966
Y =ZX
0,828
Y =M
0,941
Y =M + Z+ X
0,966
Y = X+ X 2 + X 3 + Z+ Z 2 +Z 3 + M + M 2+ M 3
0,981
R2
Y = X+ X 2 + X 3 + Z+ Z 2 +Z 3 + M + M 2+ M 3
Frmula 9
16
ln(Potencia)
ln(Ley de Oro)
Con un
ajustado de
0,983
anexodsdakn()).
L=Ley de oro
N=Norte
C=Cota
17
r=Constante de regresin
Para ver qu relacin existe entre la ley de oro y cada una de las
coordenadas se realizaron los siguientes grficos de dispersin:
18
Modelo
R2 ajustado
r + N=L
0,0033
r + N + N 2=L
0,1185
N + N =L
0,4048
r + N + N 2 + N 3=L
0,1463
N + N + N =L
0,4254
r + N + N 2 + N 3 + N 4 =L
0,1577
N + N 2 + N 3 + N 4 =L
0,4258
r + N + N + N + N + N =L
0,1697
N + N 2 + N 3 + N 4 + N 5 =L
0,4432
0,4448
N + N + N + N + N + N =L
ln
L=N + N + N + N + N + N
ai ):
Frmula 11
Ho:coeficiente ai=0
H 1 : coeficiente ai 0
19
Test de hiptesis 1
Norte
Norte2
Norte3
Norte4
Norte5
Norte6
Coeficientes
3,48E-01
-4,69E-04
-7,88E-05
1,11E-06
-5,19E-09
7,80E-12
Smbolo
A
B
C
D
E
F
L= A N + B N 2 +C N 3 + D N 4 + E N 5 + F N 6
Frmula 12
r + N +C=L
R2 ajustado
0,047
N +C=L
0,336
Modelo
N + N +C+C =L
0,411
N C=L
0,283
20
N 2 +C2=L
0,330
N + N 2 + N 3 +C+C 2 +C 3=L
0,431
N + N + N + N +C +C +C +C =L
0,465
0,470
N + N + N + N + N + N +C +C +C +C +C + N =L
0,474
L=N + N + N + N + N + N + C+C +C + C +C + N
ai ):
Frmula 13
21
L= A N + B N 2+ C N 3+ D N 4 + E N 5+ F N 6+G C+ H C 2
Frmula 14
0,98 con un error tpico de 0,684 indicando que es una muy buena
aproximacin.
Ahora resta ver cun semejante son los resultados del modelo respecto a los
datos entregados para la ley de plata, para eso se observa el grfico 3
donde se presentan la distribucin Lognormal de los datos originales y los
obtenidos por el modelo planteado. En el grfico es posible apreciar que los
valores entregados por el modelo se asemejan en gran parte a la realidad,
pero tiende a subestimar algunos valores.
24
Aunque ambos modelos son considerados los mejores entre todos los que
fueron probados, no cumplen con calcular ni siquiera el 50% de los datos de
manera correcta ya que los subestiman (considerando solo coordenada
Norte) o sobrestiman (considerando coordenada Norte y cota ). Adems los
coeficientes de cada modelo (tabla 18 y 22) dan muy cercanos a cero ,lo
cual es otro indicador de la baja relacin existente entre las variables.
La incorporacin de la coordenada Cota en los modelos es indiferente, ya
que los R2 ajustados y los errores tpicos son muy parecidos. (0,45 y 0,47 ,
27% y 25% respectivamente).
Ante todo lo expuesto, se puede deducir que la ley de oro no tiene ningna
relacin con las coordenadas, por lo que aunque se perfeccionen aun ms
los modelos, jams alcanzaran un R2 aceptable para su utilizacin.
Conclusin.
Los modelos predictivos tienen una gran utilidad ya que permiten deducir
valores en base a la correlacin de datos conocidos, adems de tener
nocin de una distribucin demasiado compleja que se quiera estudiar.
El primer paso que se debe realizar para desarrollar un modelo predictivo
es contar con una base de datos confiable, sin datos aberrantes ni errneos,
lo cual sirve para evitar distorsiones en la muestra, incrementando la
confiabilidad del modelo a desarrollar.
A lo largo de este informe se desarrollaron 2 modelos predictivos, utilizando
el mtodo del polinomio para la interpolacin de los datos y aplicando
anlisis de varianzas (ANOVA) ,herramientas con las cuales se obtuvieron las
mejores relaciones factibles entre las variables con las que se contaba.
25
Bibliografa
Material disponible en internet
1. Xavier Emery, Clase 1, anlisis geoestadstico de datos.
2. Xavier Emery, Clase 2, anlisis geoestadstico de datos .
3. Xavier Emery, Clase 3, anlisis geoestadstico de datos .
26
Pagina web
1. http://www.mathematicsdictionary.com/spanish/vmd/full/o/outlier.htm
2. http://es.wikipedia.org/wiki/Valor_at%C3%ADpico
3. http://es.wikipedia.org/wiki/Modelo_matem%C3%A1tico
4. http://www.sonami.cl/files/presentaciones/242/04.%20Etapas%20en
%20la%20vida%20de%20un%20proyecto%20minero.pdf
Referencias
Tabla grajsdaksjf
27
a
b
c
d
9,343
1,911
-7,569
-8,568
()
Tabla a (acum)
Tabla b (potencia)
Tabla c (oro)
28