1.

3 - PRINCIPAIS APLICAÇÕES DA GEOESTATÍSTICA
1.4 – FREQÜÊNCIA
1.5 - PONTO CENTRAL DA CLASSE
1.6 – FREQÜÊNCIA ACUMULADA E FREQÜÊNCIA ACUMULADA RELATIVA
1.7 - REPRESENTAÇÃO GRÁFICA DOS DADOS NUMÉRICOS
1.7.1 – Histograma, Polígono de freqüência e Polígono de freqüência acumulada
1.7.2 - Gráficos Estatísticos
1.7.2.1 - Gráficos de Barras e de Linhas
1.7.2.2 - Gráficos em colunas superpostas ou porcentagens complementares
1.7.2.3 - Gráfico Circular ou Gráfico em Setores
1.7.3 - Diagrama de Roseta
1.7.4 - Estereogramas
1.7.5 - Pictogramas
1.7.6 - Cartogramas
1.7.7 - Box-and-Whisker Plots
1.7.8 – Diagrama Triangular
I.7.9 – Ogiva
1.7.10 – Diagramas Retangulares
1.7.11 – Logs
1.7.12 - Hidrogramas
1.8 – CURVAS DE FREQÜÊNCIAS
1.9 – CURVAS DE PROBABILIDADE NORMAL OU GAUSSIANA E LOGNORMAL
1.10 – CANAL DE TOLERÂNCIA




Capítulo 01
REPRESENTAÇÃO ESTATÍSTICA DOS DADOS NUMÉRICOS



1.1 - CONCEITOS BÁSICOS

Estatística é à parte da matemática responsável pela coleta, organização, resumo e
análise dos dados numéricos, e em geologia ela é extensivamente aplicada recebendo a
denominação especifica de geoestatística.

A geoestatística envolve análise e inferência de fenômeno espacial e ou temporal, tal
como concentração de poluentes, variação do teor de zinco no solo, preço do petróleo no
tempo, etc. A geoestatística teve sua origem na área de mineração (Krige, 1951).

Em quase todas as amostragens geológicas é possível recolher um número praticamente
ilimitado de dados - exemplo: um número infinito de fragmentos de rocha em um
batólito granítico para exame petrográfico, ou um número incomensurável de pedaços de
calcário para a determinação do teor de CaO e MgO em uma formação carbonática, mas
no lugar de examinar todo o grupo, chamado de população ou universo, usualmente só
se estuda um pequeno número de dados, denominados de amostra*, inferindo a partir
deles o caráter, as características médias e a regularidade de toda a população. Nos raros
casos em que é manipulada toda a população, esta operação é chamada de censo.

Em geologia, segundo LANDIM (1993), onde normalmente os dados são coletados
segundo um plano de amostragem com coordenadas definidas, torna-se muito
importante, quando da análise desses dados, que a configuração espacial seja
considerada. Aliás, essa é uma característica inerente aos dados geológicos que exige
para a sua análise uma metodologia estatística específica e diferente daquela usualmente
utilizada.

A natureza dos dados geológicos pode ser qualitativa (cor do solo, grau de alteração da
rocha mineralogia, litologia, textura da rocha e estrutura) ou quantitativa (teor de
elemento químico maior e/ou traço, propriedades físicas das rochas, espessura de
camadas e medidas geofísicas).

Os dados geológicos também podem ser discretos ou contínuos. Àqueles que são
descritos por uma variável que pode assumir qualquer valor entre determinados limites,
chama-se de dado contínuo.

Um exemplo é o teor de ferro nas amostras de uma jazida de hematita: um fragmento aí
coletado pode apresentar qualquer teor entre 0%Fe (ausência de hematita) e 70,0%Fe
(que corresponde à hematita pura), tais como 56,74%Fe, 61,14%Fe, 31,06%Fe etc. Os
dados discretos são aqueles expressos unicamente por números inteiros, sendo exemplos:
os níveis de arenito em uma certa formação (que pode ser 0, 1, 2, 3, ..., mas nunca 1,5 ou
2,3), os filões mineralizados de uma jazida etc.

Por outro lado, os dados geológicos podem ser dimensionados de três formas diferentes
(nos níveis: nominal, ordinal e intervalar), embora alguns autores citem um quarto tipo
de mensuração, o nível de razão, que é um caso particular da escala intervalar.

No nível nominal cada dado da amostra (chamado de individuo, sujeito ou dado
individual da amostra) é colocado em uma certa categoria da população e expresso por
um nome, símbolo ou número, contando-se então a freqüência com que eles ocorrem na
amostragem. Nos estudos paleontológicos, por exemplo, é comum agrupar as amostras
ou os perfis geológicos numa escala hierárquica de associação, sendo que em cada
indivíduo coletado verifica-se apenas a presença (n
0
1) ou a ausência (n
0
2) de um
determinado fóssil. Por outro lado, a distinção entre dois arenitos de uma bacia
sedimentar às vezes pode ser feita em função da freqüência de turmalina verde (n
0
1),
amarela (n
0
2) ou rosa (n
0
3) nesses clásticos, como demonstra Till (1974).

(*) Note-se que existe uma diferença acentuada entre o termo amostra usado pelos
estatísticos (que expressa um conjunto de dados colhidos de uma população) e pelos
geólogos (que significa um fragmento ou uma espécie de minério, rocha ou fóssil,
representativo do local amostrado). Nesta apostila, na maioria das ocasiões a palavra
amostra terá o significado estatístico.

No nível ordinal da mensuração procura-se ordenar os indivíduos da amostra em função
de uma característica fácil de ser avaliada. Um bom exemplo de escala ordinal é a de
Mohs (tabela 1.1), onde os minerais estão ordenados em escala crescente de dureza.


Espécie mineral Dureza
Talco 1
Gipsita 2
Calcita 3
Fluorita 4
Apatita 5
Feldspato 6
Quartzo 7
Topázio 8
Coríndon 9
Diamante 10














Tabela 1.1 - Escala de Dureza de MOHS


Convém notar que a diferença de dureza entre o diamante e o coríndon não é fisicamente
igual à diferença de dureza entre a calcita e a gipsita ou entre o quartzo e o feldspato,
embora na escala ordinal essa diferença seja sempre igual a 1. Isso significa que o nível
ordinal de mensuração fornece informações sobre a ordenação das categorias, mas não
indica a magnitude das diferenças entre os valores. Ou seja, um mineral que risca o
feldspato e é riscado pelo quartzo, apresenta uma dureza entre 6 e 7, não sendo possível
estabelecer apenas por esse teste se a sua dureza é 6,2, 6,5 ou 6,8.

O nível intervalar de mensuração ordena as categorias e indica também a distância entre
elas. Ou seja, as escalas intervalares são expressas em unidades constantes de medidas,
tais como: o metro, o centímetro, a unidade de teor (%, grama/tonelada, grama/metro
cúbico, quilate/metro cúbico) e o grau centígrado.



1.2 - SUBDIVISÕES DA ESTATÍSTICA E DA GEOESTATÍSTICA

A estatística geralmente é utilizada como instrumento de descrição ou de decisão e daí a
subdivisão dessa ciência em estatística descritiva e estatística indutiva.

A estatística descritiva, também chamada de estatística dedutiva, busca organizar,
resumir e analisar os dados da amostra sem estabelecer qualquer conclusão acerca da
população amostrada.

Já a estatística indutiva, ou a inferência estatística, tem por objeto definir as
características de toda a população com base nesses dados amostrais. Isto é, a partir de
uma amostra, a estatística descritiva caracteriza essa amostra e define, por exemplo, a
sua média, enquanto a inferência estatística procura caracterizar toda a população
amostrada, inferindo o seu valor médio e os limites de confiança desse valor médio, uma
vez que a média real da população quase nunca é obtida por mais preciso que seja o
trabalho de amostragem.

Por outro lado, em função do nível de mensuração dos dados amostrais e do caráter da
população* a estatística é subdividida em paramétrica e não-paramétrica. Quando os
dados amostrais estão mensurados a nível intervalar e o caráter gaussiano ou lognormal
da população é conhecido ou pode ser deduzido com uma boa margem de segurança,
usa-se a estatística paramétrica. Entretanto, quando não se pode honestamente
determinar o caráter da população amostrada, ou quando se define que esse caráter é
diferente da distribuição normal ou lognormal, ou ainda quando os dados estão
dimensionados nas escalas ordinal ou nominal, usa-se a estatística não-paramétrica, que
pode ser aplicada para qualquer tipo de população e de dado.
A geoestatística, por sua vez, é subdividida em geoestatística clássica e geoestatística
mineira.

A geoestatística clássica, também chamada geoestatística bernoulliana, utiliza os
fundamentos da estatística descritiva e da estatística indutiva para a resolução dos
problemas geológicos.

A geoestatística mineira aplica extensivamente os fundamentos da teoria das variáveis
regionalizadas na resolução dos problemas geológicos. Ela é usada principalmente para a
resolução de problemas mineiros, tais como: a definição dos valores médios de um
minério pesquisado, o cálculo de suas reservas etc.

(*) As populações geológicas em geral são normais ou gaussianas e lognormais, mas
isso precisa ser testado em cada caso.


1.3 - PRINCIPAIS APLICAÇÕES DA GEOESTATÍSTICA

O número de amostras a ser coletada em um batólito granítico, a definição da
eqüidistância de uma malha de sondagem ou do espaçamento na amostragem de um veio
mineralizado, depende da regularidade dos corpos que estão sendo estudados. Por outro
lado, ao curso de qualquer estudo geológico, freqüentemente são levantadas hipóteses de
trabalho que precisam ser testadas, tais como: há um aumento progressivo do teor no
minério estudado com a profundidade, ou os resultados analíticos do laboratório X não
são confiáveis etc.

Essas e inúmeras outras questões geológicas podem ser solucionadas empiricamente,
mas a experiência tem demonstrado que as conclusões mais acertadas são aquelas
baseadas em cálculos matemáticos que se lastreiam em geoestatística, sendo que as
principais aplicações dessa técnica de avaliação são:

(1
0
) Confecção de gráficos e tabelas de freqüência, condensando os dados
numéricos disponíveis e permitindo a visualização do caráter e da dispersão da amostra.
(2
0
) Determinação do grau de regularidade da população amostrada, estabelecendo
a partir desse valor: o número de amostras que deve ser recolhido numa campanha de
amostragem, a eqüidistância ideal para uma malha de sondagem, o espaçamento na
amostragem de um corpo linear etc.
(3
0
) Os valores ótimos das curvas de mesmo valor (as isolinhas) nos mapas de
isoteores, de isópocas, de isoanomalias etc.

(4
0
) Estimativas de parâmetros populacionais a partir de dados de amostragem, tais
como: a composição química e mineralógica média de uma rocha ultrabásica: a
espessura, o teor, a acumulação e a densidade média de um minério etc.
(5
0
) Cálculos de erros de amostragem, permitindo: (i) a classificação das reservas
minerais de acordo com a classe do erro de computação; (ii) a avaliação do processo de
amostragem e dos limites de confiança dos valores médios calculados.
(6
0
) Definição de background e valor limiar dos trabalhos de geofísica, geoquímica
e prospecção de minerais pesados.
(7
0
) Identificação das populações existentes em um lote de dados de amostragem.
(8
0
) Desenhos de mapas de tendências e de médias móveis, para melhor localização
de zonas anômalas.
(9
0
) Comprovação sobre hipóteses de trabalho, notadamente na definição de
diferenças ou similaridades significativas entre as propriedades medidas na amostra.
Exemplos: comparação dos teores encontrados em dois setores diferentes de uma jazida
mineral, ou entre as composições modais de amostras coletadas em dois batólitos
graníticos mapeados.
(10
0
) Identificação de correlação estatística significativa entre as propriedades de
uma população e quantificação do grau de correlação. Um exemplo prático de correlação
estatística é o da prospecção pedogeoquímica para ouro. Esse elemento, em amostras de
solo, em geral apresenta teores muitos baixos e mostra um halo anômalo relativamente
pequeno devido a sua baixa mobilidade. Entretanto, como ele freqüentemente aparece
associado a outros elementos com maior mobilidade e/ou com teores mais elevados, o
passo inicial dessa prospecção consiste em definir quais os elementos farejadores do
ouro na área a pesquisar, por testes de correlação estatística. Definidos esses elementos,
as amostras de solo são dosadas para ouro e para os farejadores; que são elementos
químicos associados ao ouro e capazes de indicar a sua presença.
(11
0
) Identificação de tendências de comportamento em uma população. São
exemplos: a determinação do preço provável de comercialização de um minério em um
futuro definido, a partir de retas ou curvas de tendências traçadas com base nos preços
registrados em uma série histórica do passado. Cálculos de demandas de um bem
mineral a partir de dados de mercado e da série histórica.
(l2
0
) Identificação da função de distribuição dos atributos da população,
expressando essa função na forma gráfica e matemática, possibilitando, com isso, a
previsão do comportamento do minério em áreas desconhecidas ou em blocos ainda não-
amostrados.






















1.4 – FREQÜÊNCIA

O passo inicial de toda técnica estatística consiste na ordenação dos dados disponíveis, já
que normalmente o geólogo trabalha com uma quantidade considerável de informações,
principalmente sobre o teor, a densidade e a espessura da rocha ou do minério que está
sendo pesquisado. Se os dados forem apresentados em um quadro contendo cada uma
das observações recolhidas, será difícil a sua compreensão tal como se observa na tabela
1.2, onde estão relacionados os teores de chumbo encontrados em 569 amostras de solo
colhidos durante uma prospecção geoquímica em Caicó-RN.

A primeira idéia acerca do caráter dos valores encontrados já se obtém com a construção
da tabela de freqüência, onde os dados sofrem um arranjo por classes. A sistemática para
a elaboração dessa tabela consiste:
1
0
– Determina-se entre os valores verificados os dados extremos, que na tabela 1.2 são:
5ppm - teor mais baixo encontrado - e 150ppm - teor mais elevado.

2
0
- Calcula-se a amplitude da população, representada pela diferença entre os valores
extremos. No caso da tabela 1.2, a amplitude é de 145ppm (150ppm - 5ppm).

Tabela 1.2a - Teores de Chumbo (ppm) em Amostras de Solo Coletadas na Fazenda
Ponta da Serra - Caicó-RN.

66 50 76 43 41 45 16 68 50 45 42 47 50 24 24 34
36 14 22 32 34 26 16 37 34 32 39 45 32 47 21 18
19 36 32 16 37 32 42 19 16 19 34 36 25 16 11 11
13 18 26 24 13 18 24 24 42 21 82 16 74 13 45 26
45 118 68 18 25 50 16 104 11 21 21 11 11 18 21 13
18 16 25 43 18 11 5 16 24 34 16 54 13 8 5 8
8 5 5 36 21 25 29 34 29 25 13 5 13 5 13 16
21 21 13 21 11 13 11 21 18 18 29 25 25 18 16 13
32 63 11 8 11 16 13 11 5 26 13 16 21 11 18 13
16 16 32 25 29 26 29 26 32 21 26 16 21 26 18 24
20 39 32 26 29 11 21 21 18 18 24 13 16 8 11 18
18 24 13 16 18 11 13 8 26 26 26 34 29 26 16 21
21 39 24 24 24 32 26 31 21 25 16 28 25 27 13 19
22 22 22 13 16 19 22 18 92 79 74 47 42 16 21 16
16 26 24 24 34 34 39 21 29 50 53 39 37 24 79 39
42 53 42 45 21 34 63 39 47 37 37 63 50 37 50 36
14 14 14 21 28 28 50 23 35 36 23 21 31 42 25 6
22 31 53 31 78 33 19 39 19 28 29 20 17 22 22 6
28 28 40 28 36 28 33 14 10 22 14 14 14 17 17 28
33 17 44 22 33 20 22 36 17 14 22 28 28 14 50 28
36 22 14 31 34 44 47 33 29 15 21 12 12 18 18 18
15 27 38 27 35 21 18 18 22 80 37 27 20 23 18 6
15 15 9 12 12 6 6 12 6 132 15 12 47 31 21 22
10 24 23 9 12 28 37 41 28 34 19 28 31 47 31 10
25 13 13 30 23 17 37 20 20 7 17 17 13 23 17 27
27 27 20 33 13 30 37 53 23 23 20 17 23 17 13 13
14 23 40 13 20 27 27 23 30 87 150 30 27 27 40 27
17 13 33 33 27 27 23 23 20 17 20 27 83 70 53 43
57 67 40 27 33 30 30 57 30 30 26 37 17 20 33 30
33 30 121 92 67 33 83 33 37 25 37 21 21 33 25 17
42 17 13 13 21 17 33 36 100 55 55 36 50 18 23 23
18 23 23 23 41 18 18 23 27 45 18 64 45 18 23 50
23 18 27 18 36 23 50 36 32 59 27 36 36 32 36 27
41 55 27 18 23 32 32 27 27 32 50 23 18 77 23 18
27 36 14 36 23 36 50 23 27 41 23 23 32 45 18 27
14 32 23 32 14 27 32 23 27 - - - - - - -

Fonte: Maranhão (1982).

3
0
- Divide-se os dados verificados em um número conveniente de classes. Essa
subdivisão pode ser realizada de forma empírica de modo que as informações fiquem
agrupadas entre 4 e 15 classes, como mostra a tabela 1.3, ou pode ser encontrada pela
expressão de Sturges dada a seguir:
It = A / 1 + 3,32 log N
Onde:
A é a amplitude da população;
log N é o logaritmo decimal do número N de informações;
It é o intervalo de classe, procurado.

No caso dos teores de chumbo relacionados na tabela 1.2, os dados devem ser agrupados
em 10 classes com intervalo de 14,5ppm para cada classe, utilizando a tabela 1.3
(l45ppm: 10 = 14,5ppm), ou em 11 classes com intervalo de 14,3ppm pela expressão de
Sturges, como se demonstra a seguir:

It = 145 / 1 + 3,32 log 569 = 14,3 ppm

Tabela 1.2b - Teores de Chumbo (ppm) em Amostras de Solo Coletadas na Fazenda
Ponta da Serra - Caicó-RN, em Ordem Crescente.

5 11 13 16 18 19 21 23 25 27 29 32 35 39 45 63
5 11 13 16 18 19 21 23 25 27 29 32 35 39 45 63
5 11 13 16 18 20 21 23 25 27 29 32 36 39 47 64
5 11 13 16 18 20 21 23 25 27 29 32 36 39 47 66
5 12 14 16 18 20 21 23 25 27 29 32 36 39 47 67
5 12 14 16 18 20 21 23 25 27 29 32 36 39 47 67
5 12 14 16 18 20 21 23 25 27 29 32 36 39 47 68
6 12 14 16 18 20 22 23 25 27 29 32 36 40 47 68
6 12 14 16 18 20 22 23 25 27 30 32 36 40 47 70
6 12 14 16 18 20 22 23 25 27 30 33 36 40 50 74
6 12 14 16 18 20 22 23 25 27 30 33 36 40 50 74
6 13 14 16 18 20 22 23 26 27 30 33 36 41 50 76
6 13 14 16 18 20 22 23 26 27 30 33 36 41 50 77
7 13 14 17 18 20 22 23 26 27 30 33 36 41 50 78
8 13 14 17 18 21 22 23 26 27 30 33 36 41 50 79
8 13 14 17 18 21 22 23 26 27 30 33 36 41 50 79
8 13 14 17 18 21 22 23 26 27 30 33 36 42 50 80
8 13 14 17 18 21 22 24 26 27 30 33 36 42 50 82
8 13 14 17 18 21 22 24 26 27 31 33 36 42 50 83
8 13 15 17 18 21 22 24 26 28 31 33 36 42 50 83
9 13 15 17 18 21 22 24 26 28 31 33 36 42 50 87
9 13 15 17 18 21 22 24 26 28 31 33 37 42 50 92
10 13 15 17 18 21 23 24 26 28 31 33 37 42 50 92
10 13 15 17 18 21 23 24 26 28 31 33 37 42 53 100
10 13 16 17 18 21 23 24 26 28 31 34 37 43 53 104
11 13 16 17 18 21 23 24 26 28 31 34 37 43 53 118
11 13 16 17 18 21 23 24 26 28 32 34 37 43 53 121
11 13 16 17 18 21 23 24 27 28 32 34 37 44 53 132
11 13 16 17 18 21 23 24 27 28 32 34 37 44 54 150
11 13 16 17 18 21 23 24 27 28 32 34 37 45 55

11 13 16 18 19 21 23 24 27 28 32 34 37 45 55

11 13 16 18 19 21 23 24 27 28 32 34 37 45 55

11 13 16 18 19 21 23 24 27 28 32 34 37 45 57

11 13 16 18 19 21 23 25 27 28 32 34 37 45 57

11 13 16 18 19 21 23 25 27 29 32 34 38 45 59

11 13 16 18 19 21 23 25 27 29 32 34 39 45 63



4
0
- Definem-se os limites de cada classe, que são encontrados acrescentando-se o
intervalo de classe calculado ao menor valor observado e, a partir daí, mais um intervalo
de classe ao limite superior da classe anterior.

Dessa forma, para os dados da tabela 1.2, utilizando-se o intervalo de 14,5ppm, a
população ficaria subdividida nas seguintes classes conforme quadro a seguir:





Classe
Intervalo de Classe
Limite
Inferior
Limite Superior It = 14,5 ppm
Primeira 5ppm 19,5ppm (5 + 14,5 = 19,5)
Segunda 19,5ppm 34ppm (19,5 + 14,5 = 34)
Terceira 34ppm 48,5ppm (34 + 14,5 = 48,5)
Quarta 48,5ppm 63,0 ppm
Quinta 63,0ppm 77 ,5ppm
Sexta 71,5ppm 92,0ppm.
Sétima 92,0ppm 106,5ppm.
Oitava 106,5ppm 121,0ppm.
Nona 121,0ppm 135,5ppm
Décima 135,5ppm 150,0ppm

Convém notar que com essa subdivisão existe a possibilidade de uma informação
pertencer a duas classes diferentes: urna amostra com 34ppm por exemplo, poderia ser
incluído na segunda ou terceira classe, o mesmo ocorrendo com 92ppm, que poderia ser
enquadrado na sexta ou na sétima classe, e com 121ppm, na oitava ou nona classe.

Quantidade de Observações

Número de Classes
6 a 11 4
12 a 22 5
23 a 45 6
46 a 90 7
91 a 181 8
182 a 362 9
363 a 724 10
725 a 1448 11
1449 a 2896 12
2897 a 5792 13
5793 a 11584 14
Acima de 11584 15
Tabela 1.3 – Número de classes em função da quantidade de observações.


Para evitar essa situação, três caminhos usualmente são seguidos: (i) utiliza-se um
intervalo de classe tal que os valores-limites de cada classe nunca coincidam com os
dados da população. Assim ocorreria se fosse utilizado o valor de 14,3ppm calculado
pela expressão de Sturges; (ii) acrescenta-se 0,1 (ou 0,01 se os dados da população já
têm casa decimal) ao limite inferior de cada classe.

Assim, em relação aos valores da tabela 1.2, os seguintes intervalos de classe seriam
considerados:

Primeira classe: 6 a 19,5ppm.
Segunda classe: 19,6 a 34,0ppm.
Terceira classe: 34,1 a 48,5ppm.
Quarta classe: 48,6 a 63,0ppm;

e assim sucessivamente; (iii) considera-se que os limites nominais de capa classe são
números inteiros, enquanto que os limites reais ocupariam o centro entre os limites
nominais das classes adjacentes, como mostra a tabela 1.4, onde se considerou um
intervalo de classe de 14ppm.


Classe Limites Nominais Limites Reais
Primeira 5 a 19 4,5 a 19,5
Segunda 20 a 34 19,5 a 34,5
Terceira 35 a 49 34,5 a 49,5
Quarta 50 a 64 49,5 a 64,5
Quinta 65 a 79 64,5 a 79,5
Sexta 80 a 94 79,5 a 94,5
e assim sucessivamente
Tabela 1.4 - Limites Nominais e Reais para a Confecção da Tabela de Freqüência
dos Dados da Tabela 1.2

5
0
- Conta-se às observações que caem dentro de cada intervalo de classe, como mostra a
tabela 1.5.

Intervalo de Classe Número de Observações

5 a 19,5ppm
⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠
⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠ ⊏ 183
19,6 a 34,0ppm ⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠
⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊏
248
34,1 a 48,5ppm ⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊠⊏ 83
48,6 a 63,0ppm ⊠⊠⊠⊠⊠⊏ 28
63,1 a 77,5ppm ⊠⊠ − 11
77,6 a 92,0ppm ⊠⊠ 10
92,1 a 106,5ppm − − 2
106,6 a 121,0ppm − − 2
121,1 a 135,5ppm − 1
135,6 a 150,0ppm − 1
Tabela 1.5 - Cálculo das Freqüências de Observações Verificadas em cada Classe
dos Dados da Tabela 1.2

6
0
- Quando nos dados amostrais aparece um ou alguns valores anômalos, estes não
devem ser levados em consideração na definição da amplitude da população, embora
devam ser considerados na tabela de freqüência. Por exemplo: se entre os dados da tabela
1.2- existisse um teor de 420ppm e um outro de 600ppm, a amplitude da população, a ser
utilizada na expressão de Sturges continuaria a ser de 145ppm, só que na tabela de
freqüência haveria uma décima-primeira classe englobando os dados com mais de
150ppm de Pb.


1.5 - PONTO CENTRAL DA CLASSE

Vários parâmetros estatísticos de uma população numerosa de dados são calculados a
partir de tabelas de freqüência, só que nesse caso utiliza-se nos cálculos matemáticos o
ponto médio ou central de cada classe, que representa a média aritmética dos extremos
reais da classe. Sendo assim, na tabela anterior o teor central da classe que vai de 63,1 a
77,5ppm é 70,25ppm, como mostra a expressão seguinte:
Tc = 63,0* + 77,5 / 2 = 70,25ppm
(*) Como visto anteriormente. embora o limite inferior nominal dessa classe seja
63,1ppm, o seu valor real é de 63,0ppm.

Os demais pontos centrais da tabela de freqüência 1.5 estão relacionados na tabela 1.6.



Teores Extremos
da Classe: ppm
Teor Central da
Classe: ppm
Freqüência das
Observações
5 19,5 12,25 183
19,6 34,0 26,75 248
34,1 48,5 41,25 83
48,6 63,0 55,75 28
63,1 77,5 70,25 11
77,6 92,0 84,75 10
92,1 106,5 99,25 2
106,6 121,0 113,75 2
121,1 135,5 128,25 1
135,6 150,0 142,75 1

Tabela 1.6 - Tabela de Freqüência dos Teores de Chumbo Relacionados na Tabela 1.2




1.6 – FREQÜÊNCIA ACUMULADA E FREQÜÊNCIA ACUMULADA RELATIVA

Muitas vezes. nas interpretações estatísticas são usadas tabelas de freqüência acumulada
ou de freqüência acumulada relativa em conjunto com as tabelas de freqüência das
observações. As tabelas de freqüência acumulada são construídas somando-se as
observações registradas em cada intervalo de classe com os dados verificados
anteriormente. Assim, por exemplo, na tabela 1.7, construída a partir dos valores da tabela
1.6, a freqüência acumulada da classe compreendida entre 92,1 e 106,5ppm resulta da
adição das observações da classe com as quatro verificadas anteriormente, entre 106,6 e
150ppm.

As freqüências acumuladas relativas resultam da divisão das freqüências acumuladas em
cada classe pelo total de observações, sendo o resultado multiplicado por 100 para
expressá-lo em porcentagem. Por isso, a freqüência acumulada relativa da classe limitada
pelos teores de 92,1 e 106,5ppm é igual ao número de observações acumuladas (6)
dividido pelo total das observações (569), multiplicando o resultado por 100. As tabelas
de freqüência acumulada e de freqüência acumulada relativa dos dados da tabela 1.2,
estão na tabela 1.7.

A freqüência acumulada e/ou acumulada relativa podem ser calculadas tanto no sentido
crescente como decrescente, só que no tratamento dos dados geoquímicos e na maioria
dos dados geofísicos é aconselhável o cálculo em ordem decrescente;. uma vez que em
vários testes estatísticos a última classe é abandonada e os maiores erros de dosagens, por
exemplo, aparecem normalmente na classe que engloba os menores valores, enquanto que
os resultados anômalos, indicativos dos alvos para detalhamento, ocorrem nas classes com
valores mais elevados. Existem outras situações em que é mais vantajosa a construção das
tabelas em ordem crescente, como será visto mais adiante.


Teores Extremos
da Classe: ppm
Freqüência das
Observações
Freqüência
Acumulada
Freqüência Acumulada
Relativa (%)
5,0 – 19.5 183 569 100,00
19,6 – 34,0 248 386 67,84
34,1 - 48,5 83 138 24,25
48,6 - 63.0 28 55 9,70
63,1- 77,5 11 27 4,75
77.6 - 92,0 10 16 2,81
92,1 - 106,5 2 6 1,05
106,6 – 121,0 2 4 0,70
121,1 - 135,5 1 2 0.35
135,6 - 150.0 1 1 0.18
Tabela 1.7 - Tabela de Freqüência Acumulada e de Freqüência Acumulada Relativa
dos Valores Relacionados na Tabela. 1.2


1.7 - REPRESENTAÇÃO GRÁFICA DOS DADOS NUMÉRICOS

Os resultados numéricos expressos, por exemplo, nas, tabelas de freqüência, são mais bem
visualizados nas representações gráficas e, por isso, serão descritas a seguir as principais
formas gráficas de representação dos dados numéricos em geologia.

1.7.1 – Histograma, Polígono de freqüência e Polígono de freqüência acumulada

Em todos os gráficos acima utilizamos o primeiro quadrante do sistema de eixos
coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos
os valores da variável e na linha vertical (eixo das ordenadas), as freqüências.

O histograma é formado por um conjunto de retângulos justapostos, cujas bases se
localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com
os pontos médios dos intervalos de classe. A área de um histograma é proporcional à
soma dasfreqüências simples ou absolutas.
Frequências simples ou absolutas: são os valores que realmente representam o número
de dados de cada classe. A soma das freqüências simples é igual ao número total dos
dados da distribuição.
Frequências relativas: são os valores das razões entre as freqüências absolutas de cada
classe e a freqüência total da distribuição. A soma das freqüências relativas é igual a 1
(100 %).

O histograma de freqüência, como se vê na figura 1.1, é constituído por um conjunto de
retângulos que apresentam as seguintes características: (a) as bases sobre um eixo
horizontal, tendo cada retângulo uma largura igual ao intervalo real de classe da tabela
de freqüência; (b) alturas proporcionais às freqüências das classes.

O polígono de freqüência é um gráfico em linha, sendo as freqüências marcadas sobre
perpendiculares ao eixo horizontal, levantados pelos pontos médios dos intervalos de
classe. Para realmente obtermos um polígono (linha fechada), devemos completar a
figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à
primeira e da posterior à última, da distribuição.

O polígono de freqüência acumulada é traçado marcando-se as freqüências
acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos
correspondentes aos limites superiores dos intervalos de classe.
Freqüência simples acumulada de uma classe é o total das freqüências de todos os
valores inferiores ao limite superior do intervalo de uma determinada classe.
Freqüência relativa acumulada de um classe é a freqüência acumulada da classe,
dividida pela freqüência total da distribuição.

O polígono de freqüência é a figura geométrica que se obtém ligando os pontos médios
do topo de cada retângulo do histograma, como mostra também a figura 1.1.



(a)

(a)





(b)

(b)






Fig. 1.1 - Exemplos de histogramas e polígonos de freqüência: (a) dos teores de chumbo
relacionados na tabela 1.2; (b) das espessuras de um minério de fosfato sedimentar
situado na bacia costeira Pernambuco - Paraíba, em uma campanha de sondagem.
Fonte: Maranhão (1982; 1984).

1.7.2 - Gráficos Estatísticos
São representações visuais dos dados estatísticos que devem corresponder, mas nunca
substituir as tabelas estatísticas.
Características:
Uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade.
Gráficos de informação: São gráficos destinados principalmente ao público em geral,
objetivando proporcionar uma visualização rápida e clara. São gráficos tipicamente
expositivos, dispensando comentários explicativos adicionais. As legendas podem ser
omitidas, desde que as informações desejadas estejam presentes.
Gráficos de análise: São gráficos que se prestam melhor ao trabalho estatístico,
fornecendo elementos úteis à fase de análise dos dados, sem deixar de ser também
informativos. Os gráficos de análise freqüentemente vêm acompanhados de uma tabela
estatística. Inclui-se, muitas vezes um texto explicativo, chamando a atenção do leitor
para os pontos principais revelados pelo gráfico.
Uso indevido de Gráficos: Podem trazer uma idéia falsa dos dados que estão sendo
analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um
problema de construção de escalas.

Classificação dos gráficos: Diagramas, Estereogramas, Pictogramas e Cartogramas.

Diagramas São gráficos geométricos dispostos em duas dimensões. São os mais usados
na representação de séries estatísticas. Eles podem ser :

1- Gráficos em barras horizontais.
2- Gráficos em barras verticais (colunas).
3- Gráficos em barras compostas.
4- Gráficos em colunas superpostas.
5- Gráficos em linhas ou lineares.
6- Gráficos em setores e circulares

1.7.2.1 - Gráficos de Barras e de Linhas

Nos gráficos de barra, quando as legendas não são breves usam-se de preferência os
gráficos em barras horizontais. Nesses gráficos os retângulos têm a mesma base e as
alturas são proporcionais aos respectivos dados. A ordem a ser observada é a
cronológica, se a série for histórica, e a decrescente, se for geográfica ou categórica.

Os gráficos em linha são freqüentemente usados para representação de séries
cronológicas com um grande número de períodos de tempo. As linhas são mais
eficientes do que as colunas, quando existem intensas flutuações nas séries ou quando há
necessidade de se representarem várias séries em um mesmo gráfico.

Quando representamos, em um mesmo sistema de coordenadas, a variação de dois
fenômenos, a parte interna da figura formada pelos gráficos desses fenômeno é
denomidada de área de excesso.

Esses gráficos são construídos da mesma forma que o histograma e o polígono de
freqüência, só que eles não expressam tabelas de freqüência como mostra a figura 1.2,
elaborada a partir dos dados da tabela 1.8.

Anos Produção (t) Anos Produção (t)
1970 28.022 1977 108.395
1971 27.773 1978 167.614
1972 35.626 1979 212.503
1973 42.397 1980 247.954
1974 69.898 1981 166.338
1975 111.869 1982 164.060
1976 143.218 1983 128.694
Tabela 1.8 - Produção Brasileira de Bentonita Beneficiada entre 1970/1983 Fonte:
DNPM



(a)



(b)

Fig. 1.2 - Exemplos de diagrama de barra e gráfico de linha


1.7.2.2 - Gráficos em colunas superpostas ou porcentagens complementares

Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de
apresentar cada barra ou coluna segmentada em partes componentes. Servem para
representar comparativamente dois ou mais atributos.

Esse gráfico, quando desenhado em barras isoladas, aplica-se a praticamente todos os
campos da geologia; entretanto,nas avaliações econômicas de jazidas minerais, ele
freqüentemente é usado para demonstrar as variações verificadas nos atributos
dimensionados (produção, por exemplo), durante uma serie histórica.

Nas barras isoladas, inicialmente traça-se um primeiro retângulo de altura (H) qualquer,
subdividindo-o em retângulos menores de acordo com a participação de cada
componente da amostra ou da tabela de dados. Usando os componentes da tabela 1.10
como exemplo, verifica-se que a microclina deve ocupar uma área equivalente a 41,24%
da área global do retângulo original e, para tal, traça-se uma primeira linha horizontal
numa altura iguala 0,4124 H. Para o plagioclásio ser representado por uma área
correspondente a 25,89% da área do retângulo original, traça-se uma segunda linha
horizontal com altura h = 0,2589 H, altura esta contada a partir do topo do retângulo
indicativo da participação da microclina. Da mesma forma procede-se para os demais
minerais, como mostra a figura 1.3a.

Para a construção do gráfico em barras de uma série histórica, inicialmente são
desenhados os retângulos correspondentes a cada ano da série. Por exemplo: tendo com
base os dados da tabela 1.9, primeiramente são elaborados os retângulos com alturas
proporcionais às produções totais de concentrado de tungstênio em cada ano. Em
seguida, cada um desses retângulos é tratado como uma barra isolada e, por isso, na sua
subdivisão utiliza-se à sistemática descrita anteriormente (fig. 1.3b).







Figura 1.3 - (a) Diagrama de barras em porcentagem da composição modal do granito de
Brejo da Madre de Deus. (b) Diagrama de barras em porcentagem da produção de
concentrado de tungstênio no Brasil entre 1977 e 1982. Fonte DNPM.

Estados da Federação
Ano
1977 1978 1979 1980 1981 1982
Rio Grande do Norte 2.026 1.937 1.934 1.897 2.001 2.031
Pará - - - - 459 515
Paraíba - - - - 90 56
Total: 2.026 1.937 1.934 1.897 2.550 2.602

Tabela 1.9 – Produção Brasileira de Concentrados de Tungstênio entre 1977 e 1982 (em
t.).
Fonte: DNPM


1.7.2.3 - Gráfico Circular ou Gráfico em Setores

Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos
ressaltar a participação do dado no total. O total é representado pelo círculo, que fica
dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são
respectivamente proporcionais aos dados da série. O gráfico em setores só deve ser
empregado quando há, no máximo, sete dados.
Obs: As séries temporais geralmente não são representadas por este tipo de gráfico.

Neste caso parte-se do princípio de que a amostra corresponde a um arco de 360° e que
cada classe de dados ocupa um arco proporcional ao seu valor, em relação ao conjunto
total dos dados. Por exemplo: se a composição modal média de um granito é a descrita
na tabela 1.10, o seu gráfico é construído da seguinte forma:

Mineral Percentual
Microclina 41,24%
Plagioclásio 25,89%
Quartzo. 17,88%
Biotita 11,55%
Hornblenda 1,95%
Acessórios 1,49%
Total: 100,00%
Tabela 1.10 - Composição Modal Média do Granito Pórfiro
de Brejo da Madre de Deus-PE. Fonte: Maranhão (1983).

1º passo - Cálculo do arco ocupado pela microclina.
100% correspondem a 360°
41,24% correspondem a X
X = (41,24 x 360°): 100 = 148°28'

2° passo - Cálculo dos arcos relacionados com os outros minerais.

Mineral Cálculo do arco ocupado pelo mineral Resultado
Plagioclásio (25,89 x 360°) : 100 93°12'
Quartzo (17,88 x 360°) : 100 64°22'
Biotita (11,55 x 360°) : 100 41°35'
Hornblenda (1,95 x 360°) : 100 07°01'
Acessórios ( 1,49 x 360°) : 100 05°22’

3º' passo - Desenho do gráfico circular.

Como mostra a figura 1.4, após o desenho do circulo com um diâmetro qualquer, traça-
se um raio arbitrário marcando a partir dele os arcos correspondentes aos minerais
relacionados.











Figura 1.4 – diagrama circular da composição modal do granito
descrito na tabela 1.10. Fonte DNPM.
A figura 1.5 exibe a representação gráfica de uma amostra de água, representada por um
círculo de raio proporcional aos Sólidos Totais Dissolvidos em meq/L, subdividido em
partes proporcionais às concentrações, em meq/L, dos seus constituintes iônicos.


Figura 1.5 – Diagrama circular simples dos iônicos principais de uma amostra
de água subterrânea.











Fig. 1.5.1 -Diagrama de Carlé
1.7.3 - Diagrama de Roseta

Esse gráfico é usado principalmente nos trabalhos de geologia estrutural, de
geotecnologia e de hidrogeologia, uma vez que permite correlacionar as freqüências das
observações com as direções observadas nas fraturas, foliações, eixos de dobras e etc.,
possibilitando, desta forma, interpretar as direções de esforços, identificar as direções
principais de fraturamento e etc.

O processo de elaboração do gráfico é simples e será ilustrado com os dados da tabela
1.11, contendo as fraturas verificadas em uma área de migmatito escolhida para a
construção de uma barragem hidrográfica na região de Bom Conselho - PE.
1º passo – Inicialmente traça-se um arco de 180º com raio arbitrário e marca-se ao longo
desse semicírculo os diferentes intervalos de classe, tendo, no caso, 10º de amplitude,
como mostra a figura I.4.
2º passo – Considerando que o comprimento do raio arbitrário (R) corresponde ao
número de dados agrupados na classe de maior freqüência, cada classe da tabela de
freqüência tem um raio (r) proporcional ao seu número de observações e ao raio
arbitrário. Por exemplo: na tabela 1.11 a classe de maior freqüência tem 159
observações, por isso o raio corresponde à classe de N 0º a 10º E terá um raio r=(47
dados x R) : 159 observações = 0,296 R. Da mesma forma,o raio correspondente à classe
de N 50º01´´ a 60º W = (3 observações x R) : 159 = 0,019 R.
3º passo – De posse dos diferentes raios marca-se em cada classe o seu limite, como
mostra a figura 1.6.

Convém notar que nos casos em que importa o sentido do dado numérico (por exemplo o
mergulho da camada), o arco deve ter 360º, mas o gráfico de roseta é construído da
mesma maneira.

Intervalo de Classe Freqüência Intervalo de Classe Freqüência
N 0º a 10º E 47 N 0º a 10º W 26
N 10º01’ a 20º E 55 N 10º01’ a 20º W 8
N 20º01’ a 30º E 56 N 20º01’ a 30º W 35
N 30º01’ a 40º E 55 N 30º01’ a 40º W 16
N 40º01’ a 50º E 159 N 40º01’ a 50º W 49
N 50º01’ a 60º E 42 N 50º01’ a 60º W 3
N 60º01’ a 70º E 56 N 60º01’ a 70º W 18
N 70º01’ a 80º E 90 N 70º01’ a 80º W 13
N 80º01’ a 90º E 109 N 80º01’ a 90º W 43
Tabela 1.11 – Tabela de Freqüência das Direções de Fraturas Verificadas nos
Migmatitos
de Bom Conselho – PE. Fonte: Maranhão (1983).

Figura 1.6 – Diagrama de roseta das fraturas do migmatito em Bom Conselho-PE,
relacionados na tabela 1.11, indicando a principal direção de esforço (σ
1
) verificado na
área. (fonte Maranhão, 1983).

1.7.4 - Estereogramas:
São gráficos geométricos dispostos em três dimensões, pois representam volume. São
usados nas representações gráficas das tabelas de dupla entrada. Em alguns casos este
tipo de gráfico fica difícil de ser interpretado dada à pequena precisão que oferecem.
.
1.7.5 - Pictogramas
São gráficos construídos a partir de figuras representativas da intensidade do fenômeno.
Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua
forma é atraente e sugestiva. Os símbolos devem ser auto-explicativos. A desvantagem
dos pictogramas é que apenas mostram uma visão geral do fenômeno, e não de detalhes
minuciosos. Veja o exemplo da figura 1.7.

Figura 1.7 – Pictograma de número de visitantes da UFPE.

1.7.6 – Cartogramas
Cartogramas são ilustrações relativas a cartas geográficas (mapas). O objetivo desse
gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas
geográficas ou políticas.
1.7.7 - Box-and-Whisker Plots
Box-and-Whisker plots ou simplesmente box-plots são simples representações
diagramáticas dos cinco números sumários: (mínimo, quartil inferior, mediana, quartil
superior, máximo). Um box-plot para os dados geoquímicos fica como mostrado na
figura 1.8 a seguir.


Figura 1.8 – Box-and-Whisker Plots

1.7.8 – Ogiva
Esse gráfico é construído colocando-se no eixo das abcissas os limites de cada classe e
nas ordenadas as freqüências acumuladas relativas correspondentes, como mostra a
figura 1.9, construídas a partir dos dados da tabela 1.7.
Convém notar que o limite de cada classe neste gráfico pode ser o limiar inferior ou o
superior, dependendo se a tabela de dados acumulados esta em ordem crescente ou
decrescente. No caso da tabela 1.7, construída em ordem decrescente, usa-se o limite
inferior real de cada classe,uma vez que 569 observações, por exemplo, representam o
número de elementos com teor superior ou igual a 5 ppm. Da mesma forma, as 27
observações acumuladas na classe de 36,1 a 77,5 ppm expressam que existem 27 dados
na amostra com mais de 63,0 ppm de Pb.


Figura 1.9 – Ogiva correspondente aos dados da tabela 1.7


1.7.9 – Diagrama Triangular

Esse gráfico é muito usado nos trabalhos de petrografia para a classificação de rochas
ígneas, em sedimentologia para estudos granulométricos de sedimentos, na avaliação de
rocha carbonática e etc.
Como mostram a figura 1.10, esse gráfico é constituído por um triangulo eqüilátero
subdividido em partes iguais, tendo os vértices ocupados pelos três componentes
principais da amostra, os quais aparecem numa proporção de cem (no próprio vértice)
por cento. Essa proporção é indicada pela reta perpendicular à bissetriz imaginaria
traçada no ângulo correspondente ao vértice ocupado por cada atributo. Dessa forma, a
amostra 1 da figura 1.10 tem (i) 30% do atributo A, já que a reta horizontal
perpendicular à bissetriz de A (ângulo A) corresponde a esse valor; (ii) 10% do atributo
B, uma vez que a perpendicular à bissetriz do ângulo B é a reta de 10% em relação ao
vértice B; (iii) 60% do atributo C, já que a perpendicular à bissetriz C mostra esse valor.
Quando na amostra aparecem mais de 3 componentes, agrupam-se os atributos ou
recalculam-se as porcentagens dos componentes a serem graficamente representados
para que eles representem 100%. Como exemplo, examinemos o seguinte problema:
represente graficamente em um diagrama triangular uma amostra caracterizada por seu
volume de quartzo-plagioclásio e álcali-feldspato, sabendo que a sua composição modal
é a seguinte: quartzo = 51,67%, álcali-feldspato = 21,38%, plagioclásio = 16,04%,biotita
= 6,21%, hornblenda = 3,93% e acessórios = 0,77%.


Figura 1.10 – Representação gráfica de amostras no diagrama triangular
Resolução:

1º passo – Cálculo da participação dos atributos a serem graficamente
representados.
Quartzo = 51,67%
Álcali-feldspato = 21,38%
Plagioclásio = 16,04%
Total = 89,09%

2º passo – Definição da porcentagem de quartzo em relação ao volume de quartzo
+ feldspato.
89,09% de quartzo + feldspato correspondem a 100%
51,76% de quartzo correspondem a A
A = (51,76 x 100) : 89,09 = 58,00%

3º passo – Determinação da porcentagem de plagioclásio e álcali-felsdpato em relação ao
volume de quartzo + feldspato.
Álcali-feldspato = B = (21,38 x 100) : 89,09 = 24,00%
Plagioclásio = C = (16,04 x 100) : 89,09 = 18,00%

4º passo – Apresentação gráfica da amostra.

Inicialmente procura-se a horizontal referente a 58,00% que representa o teor de quartzo
(A na figura 1.10). Depois, a linha de direção NNE com 18% correspondente ao
plagioclásio. A interseção destas duas linhas dá a posição da amostra 2 no diagrama
triangular, uma vez que este ponto tem 24% de álcali-feldspato.

Algumas vezes o diagrama triangular é usado também para identificar grupos de
amostras com composições semelhantes.

Este diagrama também é utilizado para representar os constituintes iônicos principais de
análise química de água (figura 1.11). A água neste diagrama é caracterizada por dois
pontos (representando os ânions e os cátions) ligados por uma reta.
.

Figura 1.11 – diagrama triangular da composição de uma água subterrânea.

Diagrama Triangular de Durov

Os pontos que representam as concentrações dos cations e dos anions respectivamente
são projetados no quadrado formado pelas bases dos triângulos (Fenzl, 1988). O ponto
obtido caracteriza a água analisada ( fig. 11a).



Fig. 11a -Diagrama de Durov










Diagrama Triangular de Piper

O diagrama de Piper é utilizado freqüentemente quando se trabalha com grande número
de análises químicas das águas, serve para classificar e comparar os distintos grupos de
águas quanto aos íons dominantes em cloretada, sódica, carbonatada, magnesiana, etc.

Para plotar no diagrama, transforma-se os valores de cada íon (constante no gráfico em
meq/l) em percentagem do total de anions e do total de cations separadamente (fig
1.11b).





Fig. 1.11b - Diagrama de Piper
1.7.10 – Diagramas Retangulares

Como assinala Tinoco (inédito) “os vários tipo de diagramas retangulares se prestam
para a representação de numerosas amostras em um perfil vertical ou horizontal”,
possibilitando a rápida identificação das variações verticais ou laterais,ao longo do perfil
estudado.


A figura 1.12.a, por exemplo, é um diagrama retangular construído a partir de amostras
recolhidas em um furo de sonda com 15 m de profundidade, executado em uma rocha
carbonática situada na ilha de Itamaracá – PE. A simples observação do diagrama
evidencia que nesse furo de sonda: (i) o calcário é sempre impuro, mas o teor de
CaCO
3
aumenta com a profundidade, a não ser no intervalo de 7,2 a 9,1 m composto por
uma argila calcária; (ii) o conteúdo de resíduo insolúvel chega a atingir 30% nos
primeiros 3 m de sondagem,provavelmente por efeito do intemperismo, mas decai
gradativamente com a profundidade, ocorrendo apenas um aumento brusco ao longo da
intercalação argilosa; (iii) o teor de MgCO
3
varia entre 4 e 20%,não tendo sido
observada uma tendência na variação do seu teor com a profundidade.
Algumas vezes utiliza-se um gráfico retangular composto para descrever as variações, ao
longo do perfil, de vários atributos. No diagrama 1.12.b, por exemplo, apresenta-se a
composição mineralógica media do fosforito de Olinda – PE, em relação à rocha total, e
também, na fração com menos de 2 micra de diâmetro.



Figura 1.12a - Diagrama retangular simples em relação à composição química de
amostra recolhidas em furo de sonda em Itamaracá-PE.





Figura 1.12b – Gráfico retangular composto mostrando a composição do fosforito de
Olinda-PE, na rocha total e na fração com menos de 2 micra de diâmetro (fonte
Maranhão 1981).


São utilizados também para comparar as proporções dos constituintes iônicos principais
de águas superficiais e subterrâneas (figura 1.13), a altura das colunas representa a
concentração ou % dos íons em miliequivalente por litro ou miligrama por litro.





Fig. 1.13 – Diagramas colunares dos resultados de análises químicas de água subterrânea
expresso miliequivalente por litro e em percentagem de miliequivalente por litro.








Diagrama para Classificação da Água para Irrigação(da US Dept. of Agriculture)

Este diagrama é utilizado para classificar e comparar as águas para irrigação com base
na condutividade elétrica e na razão de adsorção de sódio (SAR), ver fig. 1.13a.





Fig. 1.13a - Diagrama da US Dept. of Agriculture
1.7.11 – Logs

Como mostra a figura 1.14, os logs são gráficos compostos, onde cada atributo
dimensionado fica contido em uma coluna própria, permitindo de imediato a verificação
das variações verticais ou laterais dos dados numéricos e as correlações existentes entre
eles.




Diagrama Semi-logarítmico de Schoeller

As concentrações (em meq/l) de uma amostra de água são plotadas num papel semi-
logarítmico. Esta forma de apresentação dos dados hidroquímicos é bastante flexível e
permite aumentar ou reduzir o número de elementos representados, de acordo com as
necessidades e os objetivos da interpretação (fig.1.14a ).





Fig. 1.14a - Diagrama Semi-logarítmico de Schoeller


1.7.12 – Hidrogramas

São gráficos que mostram a variação de uma certa característica em função do tempo. É
a forma mais clara de se visualizar as variações de composição da água subterrânea com
o tempo. Normalmente representam-se várias características num mesmo hidrograma.
Na figura 1.15 é apresentado um exemplo típico de um hidrograma.


Figura 1.15 - Hidrograma











Outras formas gráficas
Diagrama de Stiff

Todas as concentrações iônicas em meq/l ou % meq/l são representadas sobre linhas
paralelas horizontais. Ligando todos os pontos respectivos, obtém-se uma figura
geométrica característica para a água analisada ( fig. 1.16).






Fig. 1.16- Diagrama Stiff

































1.8 – CURVAS DE FREQÜÊNCIAS

Já foi visto que o intervalo de classes próprio em cada tabela de freqüência é
matematicamente calculado pela expressão: It = A:(1+3,32 log N). Dessa forma, se o
numero N de dados numéricos tende ao infinito, o intervalo de classes – It – terá
amplitude infinitesimal e, por isso, o polígono de freqüência resultante aproximar-se-á
de uma curva, chamada curva de freqüência ou curva de distribuição.

A experiência obtida com a analise de milhões de amostras geológicas diferentes
evidenciam que as curvas de freqüência mais comuns, constituídas a partir de
populações numerosas de dados geológicos são:

i. Curvas simétricas, caracterizadas por um único pico e a forma de sino como mostra a figura
1.16.a . Neste caso, se os dados numéricos são contínuos, essa curva de distribuição chama-
se normal ou gaussiana.

ii. Curvas assimétricas, com um único pico, tendo um ramo mais alongado do que o outro,
ramo este que pode ser o do lado direito ou o do lado esquerdo (figura 1.16.b). Se os dados
numéricos da curva são contínuos, ela se chama lognormal.

iii. Curvas caracterizadas pela existência de vários picos, como mostra a figura 1.16.c, chamada
de multimodal.



Figura 1.16 – Curvas de distribuição de freqüências (a) Curva normal ou gaussiana,
(b) Curva log-normal, (c) Curva multimodal.
As populações constituídas pelos teores de minérios em jazidas de baixos teores (ouro,
prata, platina, etc.) ou resultante de amostragem geoquímica, via de regra apresentam
curva assimétricas com um único pico, da mesma forma que o caráter da distribuição dos
teores e espessuras em jazidas de alto teor (ferro, manganês, calcário, fosfato, gipsita,
argilas e etc.) é, na maioria doa casos, simétrica ou unimodal. É o que acontece, por
exemplo, quando se analisam todos os teores em uma jazida de cobre contendo faixas de
minérios supergênicos (óxidos de cobre) e faixas de sulfetos primários.





1.9 – CURVAS DE PROBABILIDADE NORMAL OU GAUSSIANA E
LOGNORMAL

A determinação do caráter da distribuição de toda a população amostrada a partir dos
dados da amostra é muito útil, uma vez que permite a definição do modelo matemático
que rege a dispersão dos dados numéricos na população e facilita a manipulação e
avaliação dos resultados. Sendo assim, é necessário que o padrão de distribuição da
amostra seja aferido em cada caso estudado, para poder aplicar as leis e expressões
matemáticas próprias de cada distribuição da população.

Quando o número de dados é grande, é relativamente fácil de definir a curva de
freqüência correspondente e como a freqüência relativa tende à probabilidade da
população, pode-se inferir com uma boa margem de segurança o modelo de distribuição
da população. Entretanto, para um número relativamente pequeno de dados numéricos, a
determinação gráfica da curva de distribuição da população a partir dos dados de
freqüência não é fácil, e cada geólogo tende a construir uma curva diferente, dificultando
a avaliação dos resultados. Para minimizar os erros pessoais, as curvas de freqüência são
substituídas por curvas de probabilidades, de construção bem mais simples e de
interpretação muito mais fácil, e que podem ser desenhadas desde que existam no
mínimo 30 a 50 dados numéricos na amostra.

Essas curvas são construídas a partir de tabela de freqüência acumuladas relativas,
utilizando papéis especiais, chamados papéis de probabilidade, que apresenta no eixo das
abcissas uma escala aritmética – papel de probabilidade normal – ou logarítmica – papel
de probabilidade lognormal – e no eixo das ordenadas uma escala de probabilidade, que
corresponde às freqüências acumuladas relativas das observações* (*Nos anexos 1.1 e
1.2 estão reproduzidos, respectivamente, os papéis de probabilidade normal e
lognormal). De posse do papel especial, a construção da curva de probabilidade é
semelhante à da curva de freqüência acumulada relativa, só que a ultima classe da tabela
de freqüência é abandonada, uma vez que no papel de probabilidade não há um local
correspondente à freqüência acumulada relativa de 100%. Em sendo assim, a tabela de
freqüência acumulada deve se elaborada de forma a ser abandonada a classe com menor
número de observações. Pra exemplificar o processo de construção desta curva, vamos
utilizar os dados apresentados na tabela I.6, vista anteriormente.






















1º passo – Construção da tabela de freqüência acumulada relativa.

Na tabela 1.6 verifica-se que a primeira linha tem 183 observações e a ultima classe (de
135,6 a 150 ppm de Pb) tem apenas um dado. Por isso a tabela acumulada relativa deve
ser construída em ordem crescente, como mostra a tabela 1.12, para desprezar a classe
com uma informação e não aquela com 183 dados.

2º passo – Escolha do limite de cada classe.

Como se pode ver no papel de probabilidade, na abcissa usa-se o limite real de cada
classe, e como a tabela foi construída em ordem crescente, aplica-se o limite superior da
classe e a freqüência acumulada relativa correspondente, uma vez que qualquer valor
acumulado está correlacionado a esse limite superior. Por exemplo: 80,33% das
observações tem valores inferiores ou iguais a 48,5 ppm Pb, que é o limite real da classe
correspondente, da mesma forma, 99,82% dos dados tem menos que 135,6 ppm Pb.

3º passo – Uso do papel de probabilidade.

Na figura 1,17 são apresentados as curvas de probabilidade normal e lognormal
construídas a partir dos dados da tabela 1.12.

Intervalo de Classe
Freqüência das
Observações
Freqüência
Acumulada
Freqüência Acumulada
Relativa (%)
5,0 – 19,5 183 183 32,16
19,6 – 34,0 248 431 75,75
34,1 – 48,5 83 514 80,33
48,6 – 63,0 28 542 95,25
36,1 – 77,5 11 553 97,10
77,6 – 92,0 10 563 98,95
92,1 – 106,5 2 565 99,30
106,6 – 121,0 2 567 99,65
121,6 – 135,5 1 568 99,82
135,6 – 150,0 1 569 100,00
Tabela 1.12 – Freqüência Acumulada Relativa dos Dados da Tabela 1.6


Uma das principais propriedades desses gráficos é que quando a população amostrada
apresenta uma população gaussiana, no papel de probabilidade normal os pontos
orientam-se segundo uma reta e apresentam-se dispersos no papel de distribuição
lognormal. Entretanto, quando as amostras são recolhidas de uma população com
distribuição lognormal, o fato se inverte e os pontos apresentam-se alinhados no papel de
distribuição lognormal e dispersos no papel normal. Quando os pontos mostram-se
dispersos nos dois papéis é porque se tratam de populações não-gaussianas e não-
lognormais, podendo ser ou não uma população com distribuição multimodal. Isso
significa que os dados da tabela 1.12 aproximam-se mais de uma população lognormal.


1.10 – CANAL DE TOLERÂNCIA

Freqüentemente, quando os pontos da curva de probabilidade estão aproximadamente
alinhados, ocorrem alguns desses pontos que se posicionam nas proximidades da reta de
probabilidade normal e/ou lognormal mas não sobre ela, tal como se vê na figura 1.17b.
Advém daí a dúvida se o caráter da população mesmo assim pode ser aceito. Em
estatística pequenas aproximações são aceitáveis, desde que elas se situem dentro de
determinados limites de tolerância. Esses limites podem ser calculados com precisão a
partir de alguns testes estatísticos, como o do qui-quadrado. Entretanto, nos casos onde
não se exige uma rigidez muito grande, costuma-se obter os limites de tolerância a partir
de processos gráficos, utilizando a construção de Liourzou, reproduzida na figura 1.18.














































Figura 1.18 – Gráfico para obtenção do intervalo de confiança de 95% para a
freqüência relativa acumulada de uma amostra.

Nessa construção gráfica os limites de tolerância são determinados a partir do número de
dados da população e das freqüências relativas. Assim sendo, numa amostra contendo
202 dados numéricos, os limites de tolerância para um ponto que deveria ter 60% de
freqüência acumulada relativa são: 53% e 66,5%, como mostra a figura 1.17. Em sendo
assim, determinam-se os limites de confiança para diferentes pontos da reta de
probabilidade, marcando-os no papel de probabilidade. Ligando estes valores limites
entre si estabelece-se um canal, chamado de canal de tolerância, como mostra a figura
1.18. Se todos os pontos estão situados no interior deste invólucro é porque os dados
numéricos não diferem significativamente da distribuição esperada, tal como acontece
com a figura 1.18, onde se evidencia que a população analisada é considerada como uma
população lognormal.
Par melhor ilustrar o uso desta sistemática de trabalho, vamos resolver o problema
seguinte: verifique se os dados da tabela 1.13 apresentam uma distribuição gaussiana,
com auxilio da reta de probabilidade e do respectivo canal de tolerância.

Intervalo de Classe
Freqüência das
Observações
Freqüência
Acumulada
Freqüência Acumulada
Relativa (%)
0,411 - 2,182 2 2 0,7
2,182 - 3,953 9 11 3,8
3,953 - 5,724 18 29 10,1
5,724 - 7,495 37 66 23,0
7,495 - 9,266 39 105 36,6
9,266 - 11,037 58 163 56,8
11,037
-
12,808
50 213 74,2
12,808
-
14,579
40 253 88,2
14,579
-
16,350
25 278 96,9
16,350
-
18,121
7 285 99,3
18,121
-
19,892
2 287 100,0
Tabela 1.13 – Quadro de Distribuição de Freqüência dos Teores de Matéria Orgânica
(%) em Amostras de Sedimentos Ativos de Corrente. Fonte: Melo (inédito).


Resolução

1º passo – Determinação dos limites de tolerância das freqüências acumuladas relativas.

Para as 287 observações contidas na amostra, com o auxilio da construção de Liourzou
são encontrados os limites de tolerância assinalados na tabela 1.14.

Freqüência
Acumulada Relativa
(%)
Limites de Tolerância
Superior Inferior
5 8,0 ?
10 14,0 7,5
20 25,0 15,6
30 35,8 25,0
40 46,0 34,5
50 56,0 44,5
60 66,0 54,5
70 75,0 64,5
80 84,0 75,0
90 93,0 87,0
95 ? 92,0
Tabela 1.14 – Limites de Tolerância das Freqüência Acumuladas Relativas para uma
Amostra com 287 Indivíduos.


2º passo – Desenho da reta de probabilidade normal e do canal de tolerância.

Inicialmente, plota-se no papel de probabilidade normal os pontos definidos pelos
limites superiores das classes de freqüências e pelas freqüências acumuladas relativas
correspondentes. A partir deste ponto traça-se visualmente a reta de probabilidade. Onde
esta reta corta as ordenadas de 5, 10, 20, 30, 40, 50, 60, 70, 80, 90 e 95% marcam-se os
valores limites definidos na tabela 1.14. ligando esses pontos limites desenha-se o canal
de tolerância da figura 1.18. nota-se que neste invólucro a sua amplitude cresce nas duas
terminações da reta de probabilidade, uma vez que só são levados em consideração os
pontos situados entre os percentis de 5 e 95%, já que a construção de liourzou só
contempla valores dentro deste intervalo.

3º passo – Conclusões
Como todos os pontos relativos à tabela 1.13 estão localizados no interior do canal de
tolerância da reta de probabilidade normal, se aceita a hipótese que os dados numéricos
reunidos na tabela 1.13 são provenientes de uma população gaussiana e como tal deve
ser tratada.