REGRESSÃO LINEAR

 Verificado, pelo valor de “r”, que ocorre uma significante
correlação linear entre duas variáveis há necessidade de
quantificar tal relação, o que é feito pela análise de
regressão.

 Cálculo da equação de uma reta que, disposta num
sistema de eixos cartesianos, com valores de yi (variável
dependente) na ordenada e xi (variável independente) na
ANÁLISE DE REGRESSÃO abcissa, a soma dos quadrados dos desvios verticais dos
pontos em relação a ela seja mínima.
LINEAR MÚLTIPLA
 Y = a +bX,
 onde Y é o valor estimado para um específico valor xi; “b”
revela a inclinação da reta, ou seja o acréscimo ou
decréscimo do valor de y em relação à x; “a” localiza o ponto
1
de interseção da reta em relação ao sistema de coordenada 2
retangulares.

VERIFICAÇÃO DO AJUSTE A UMA RETA PELO COEFICIENTE
DE DETERMINAÇÃO (R2)
 Proporção da variação total da variável dependente “zi”
que é explicada pela variação da variável independente “xi”

 Variação total dos dados: SQT = Z2 – (Z)2/n
 Variação devido à linha calculada: SQP = Z*2–(Z*)2/n
 Variação devido aos resíduos: SQR = SQT - SQP

 Porcentagem de ajuste da linha: R2 = (SQP/SQT)100

 O coeficiente de correlação “r” indica a relação entre
variáveis e “r2” indica o quanto uma variável “explica” a
outra, ou quanto a linha calculada se ajusta aos dados
originais.
3 4

REGRESSÃO CURVILÍNEA
FUNÇÃO QUADRÁTICA
Y*  a  a X  a X2  a X3  ...
0 1 2 3

• Variáveis independentes: potências crescentes de xi,
• Cálculo dos coeficientes ai
• Com potências crescentes de xi, curva mais complexa para ajuste
• Processo por etapas (stepwise)

• O modelo para a regressão polinomial de grau k é

Y  α  α X  α X2  ...  α Xk  ε 5 6
o 1 i 2 i k i

1

.+ e • A variância total de Y é em parte "explicada" pelas diversas variáveis X's e o restante pela variabilidade devido ao erro (e) • A proporção da variância dos Y observados "explicada" por uma equação de regressão ajustada é representada pelo coeficiente de determinação R². a presença de valores 9 anomalos 10 CÁLCULO DOS COEFICIENTES AI • Regressão múltipla é multivariada no sentido de que mais de uma variável é medida simultaneamente em cada observação N  X1   X m  a 0    Y        X 1  X12   X1 X m  a1   X1 Y  • Trata-se. isto é. • as relações entre as variáveis devem ser lineares  verificar. 11 [A] = [X]-1. • É verificada a contribuição pura de cada variável que tenham um alto coeficiente de correlação entre independente por comparações sucessivas entre os si diversos resultados. seja objeto de análise. fornece a taxa de mudança na variável dependente correspondente à  evitar um número inferior de casos em relação ao respectiva variável independente..FUNÇÃO CÚBICA REGRESSÃO LINEAR MÚLTIPLA • Testa dependências cumulativas de uma única variável dependente (Y) em relação à diversas variáveis independentes (Xi) • Y = a0 + a1X + a2X2 + a3X3 + a4X4 + . utilizando resíduos.. Xs. número de variáveis consideradas. sem que o comportamento das  X m  X1 X m   X m2  am   X m Y      variáveis independentes. pois o  X 2  X1 X 2   X 2 X m  a 2     X 2 Y       estudo é em relação à variação da variável          dependente Y.. variando entre 0 e 1 • O termo "explicada" tem apenas um significado numérico não implicando necessariamente em um conhecimento causa-efeito sobre o porque da relação existente 7 8 • Os coeficiente “ai”.[Y] 12 2 . é recomendado que tal relação seja da ordem de 10 a 20 vezes • Coeficientes de regressão parciais fornecem superior porcentagens explicadas da soma de quadrados de Y segundo 2k-1 combinações.. mantendo constantes as demais variáveis independentes. parciais de regressão. onde k é o número de variáveis independentes. porem de uma técnica univariada.  evitar variáveis independentes redundantes.

13 14 15 16 PEREIRA BARRETO/RESERVATÓRIO DE TRES IRMÃOS: Qual variável condiciona mais o Nivel Hidrostático? LOCALIZAÇÃO DOS PONTOS DE AMOSTRAGEM 7722000 494000 sa Pen 7718000 nte eto Po arr o aB eg da rr reir Co Aze Pe nja Lara go rre Co 486000 7714000 17 18 490000 Rio Tiete 3 .

503*Z (m) + 1. CONTRIBUIÇÃO PERCENTUAL DE CADA VARIÁVEL INDEPENDENTE COM RELAÇÃO À VARIAVEL DEPENDENTE H (SUPERFÍCIE EQUAÇÕES E COEFICIENTES DE DETERMINAÇÃO (R2) POTENCIOMÉTRICA DO AQÜÍFERO LIVRE).890) H = .842) H = .890) 19 20 SUPERFÍCIE POTENCIOMÉTRICA DO AQÜÍFERO LIVRE (NH) MAPA TOPOGRÁFICO 21 22 ESPESSURA DA FORMAÇÃO AQÜÍFERA CONTORNO DO TOPO DO BASALTO 23 24 4 .148E-03*X (m) .568 + 0.890 Coord.751E-03*FM (m) Topografia / Coordenada Y / Coordenada X / Espessura da Formação / Topo Basalto 0.9% (0.963 + 0.061 + 6.098E-03*Y (m) + 1.890-0.588*Z (m) + 2. aqüífero 0.890-0.0% (0.721 + 0.493*Z (m) + 2.694*Z (m) 0.0% (0. Y 3.890-0. H: VARIÁVEL DEPENDENTE Variável Contribuição Variável / Equação (R2) Topografia H = 91.0.49490.15369.890 Espess.110E-03*Y (m) + 1. X 0.454E-03*Y (m) 0.16687.0.567E-02*TB (m) .2% (0.215 + 0.105*FM (m) Topo basalto 0.881-0.9% (0.890 Topografia / Coordenada Y / Coordenada X / Espessura da Formação H = .881 Topografia / Coordenada Y / Coordenada X Coord.16597.842 Topografia 84.842) Topografia / Coordenada Y H = .941E-03*Y (m) + 1.881) 8.146E-03*X (m) - 9.114E-03*X (m) 0.

8104 múltipla em que as variáveis independentes 350 são as coordenadas geográficas E-W e N-S. yi )  n  xi  yi  a0    zi   x    i  x i2  x i y i   a1    zi x i   Dados interpolados a    y i  xi yi  y i2   2  zi y i  Dados originais [ XY ] [A] [ Z] [ A]  [ XY ]1[Z] 29 30 5 . ]  ei ( xi. Cota do Nível d'Água (m)  Com a aplicação dessa análise consegue-se 330 separar dados mapeáveis em duas 310 componentes: uma de natureza regional.. Y)  [a0  a1xi  a2yi  a3 xi2  a4 xi yi  a5 yi2  .. 390 A análise de superfícies de tendência é simplesmente um tipo de análise de regressão 370 y = 0.804x + 51. e outra 290 que revela as flutuações locais.259 R2 = 0. representada pela própria superfície. representadas 270 pelos valores residuais. TOPOGRAFIA E LENÇOL FREÁTICO superfície potenciométrica topografia 25 26 APLICAÇÃO DO MODELO LINEAR MÚLTIPLO À CONFECÇÃO DE MAPAS: ANÁLISE DE SUPERFÍCIES DE TENDÊNCIA. 270 290 310 330 350 370 390 Cota do Terreno (m) 27 28 Ajustando uma superfície de tendência de 1º grau zi ( X.

K+ (meq 100 g-1). silte (%). MO (%). Al3+ (meq 100 g-1).96 ha.  A segunda contem amostras retiradas de uma profundidade de 60-80 cm. Ca2+ (meq 100 g-1). silte (%). numa área de 1. Distribuição espacial dos pontos de amostragem cada uma. Coeficientes para uma superfície de 2º grau AMOSTRAGEM/RIO PARAIBA: PLANCTON 1 b0   n  xi  yi  x i2  xi yi  y i2    zi    b    xi x 2  xi y x 3  x yi 2  x i y i2    x i zi   1 i i i i   b 2   y  xi yi  y i2  x i2 y i  x i y i2  yi 3    y i zi  100      i     xi x x y x  x i3 y i  x i2 y i2    x i2 zi  2 3 2 4 b3  i i i i   b 4   x i y i  x i2 y  x i y i2  x i3 y i  x i2 y i2  x i y i3   x i y i zi    50   i b5    y2  xi y 2  yi 3 2  xi yi 2  xi yi 3  y i    y i zi  4 2  i i 0 0 500 1000 1500 2000 2500 31 32 Entrada de efluente SUPERFÍCIE LINEAR RESÍDUOS DA SUPERFÍCIE DE TENDÊNCIA Superfície linear ou de 1º grau Resíduos positivos e negativos da superfície linear 100 100 50 50 0 0 0 500 1000 1500 2000 2500 0 500 1000 1500 2000 2500 33 34 EXERCÍCIO 01 XLSTAT:  As matrizes de dados a serem analisadas são compostas. (Descrição de dados/Matrizes de Mg2+ (meq 100 g-1). Passimilável (ug cm-3). argila (%). localizado no município de Mogi-Guaçú/SP. MO (%). similaridades/similaridades) H+ (meq 100 g-1). pH. (Modelagem de dados/Ajuste de uma distribuição).573. Al3+ (meq 100 g-1). K+ (meq 100 g-1). H+ (meq 100 g-1).  A primeira matriz contem amostras retiradas de uma Matriz de coeficientes de correlação entre as variáveis profundidade de 0-20 cm. por 36 amostras provenientes de um (Visualização de dados/Scatter plots) levantamento de solos de parte do Horto Santa Terezinha. pertencente à Chamflora Histogramas e respectivo ajuste a uma distribuição normal Agricola Ltda. tendo sido obtidos valores de areia (%). tendo sido obtidos valores de areia (%). argila (%). 35 36 6 . pH. Ca2+ (meq 100 g-1). Passimilável (ug cm-3).

37 7 .