You are on page 1of 2

REPRESENTAÇÃO DE DADOS MULTIVARIADOS 1

3.1 O PROBLEMA DA REPRESENTAÇÃO DE MUITAS VARIÁVEIS EM DUAS


DIMENSÕES

Gráficos precisam ser apresentados em duas dimensões ou sobre papel ou na tela de um


computador.
Eixos horizontais e verticais representam variáveis
Ex.:
??????
Figura 3.1 Extensão alar representada contra o comprimento total para as 49 pardocas
- Permite mostrar uma ou mais características dos objetos como sobreviventes e não-
sobreviventes
- Gráficos tridimensionais permitem mostrar três variáveis
Ex.:
????????
Figura 3.2 O comprimento do bico e da cabeça representados contra o comprimento total e
a extensão alar (todos em mm) para as 49 pardocas medidos por Hermon Bumpus (● =
sobreviventes, ○ não-sobreviventes)
- Representação para mais de três variáveis são discutidos a seguir.

3.2 REPRESENTANDO VARIÁVEIS ÍNDICES


- Variáveis índices são variáveis não observadas obtidas por combinação linear das
variáveis originais.
- O principal objetivo de muitos métodos multivariados é a geração de variáveis índices
- Com os valores dos CP1, CP2, CP3 pode-se representar graficamente as relações entre
objetos.
Obs.: A desvantagem de representar muitas variáveis para duas ou três dimensões é que
alguma diferença-chave entre os objetos possa ser perdida na redução

3.3 A REPRESENTAÇÃO DE DRAFTSMAN (MATRIZ DE DISPERSÃO)


CONSISTE: na representação simultânea de todos os pares de variáveis
VANTAGEM: são necessárias apenas representações bidimensionais
DESVANTAGEM: não mostram aspectos dos dados que somente seriam aparentes quando
três ou mais variáveis são consideradas em conjunto e os objetos não são facilmente
identificados, dificultando assim a identificação de quais são similares e quais são
diferentes.
Ex.:
???????
Figura 3.3 Representação de draftsman do número de pássaros e cinco variáveis medidas
(mm) em 49 pardocas. As variáveis são:
Comprimento total, extensão alar, comprimento do bico e cabeça, comprimento do úmero e
da quilha do esterno, com uma variável adicional sendo o número de pardais (sobreviventes
1 a 21 e não-sobreviventes 22 a 49).
- Retas de regressão são incluídas nesses gráficos algumas vezes.
- Servem para mostrar relação também entre variáveis
- Servem para mostrar existência entre quaisquer objetos com valores estranhos (DADOS
DISCREPANTES)

Carlos Tadeu dos Santos Dias


REPRESENTAÇÃO DE DADOS MULTIVARIADOS 2

3.4 A REPRESENTAÇÃO DE PONTOS DE DADOS INDIVIDUAIS


CONSISTE na representação de cada um dos objetos para os quais as variáveis são
medidas por um símbolo, com características diferentes desse símbolo variando de acordo
com as diferentes variáveis.
Ex.:
???????
Figura 3.4 Representação gráfica de medidas da mandíbula em diferentes grupos caninos
usando (a) faces de Cernoff e (b) estrelas
CONEXÃO VARIÁVEIS → CARACTERÍSTICAS:
X1: Largura da mandíbula → tamanho do olho
X2: Altura da mandíbula → tamanho do nariz
X3: Comprimento do primeiro molar → tamanho da testa
X4: Largura do primeiro molar → tamanho da orelha
X5:Comprimento do primeiro ao terceiro molar → tamanho da boca
X6:Comprimento do primeiro ao quarto pré-molar → tamanho do sorriso
A variações nas diferentes características da face e estrelas pode ter diferentes impactos.
Recomenda-se fazer diferentes atribuições alternativas de variáveis às características
DESVANTAGEM:
- a natureza subjetiva desse tipo de processo é claramente insatisfatória
- dificilmente são encontradas em pacotes estatísticos.

3.5 PERFIS DE VARIÁVEIS


É outra forma de representar objetos agora por linhas que mostram o perfil dos valores das
variáveis
Ex.:
??????
Figura 3.5 Perfis de variáveis em ordem crescente de valores médios para as medidas da
mandíbula para sete grupos caninos
X1: Largura da mandíbula
X2: Altura da mandíbula acima do primeiro molar
X3: Comprimento do primeiro molar
X4: Largura do primeiro molar
X5:Comprimento do primeiro ao terceiro molar inclusive
X6:Comprimento do primeiro ao quarto pré-molar inclusive

Representação alternativa:
???????
Figura 3.6 Uma maneira alternativa de mostrar perfis das variáveis usando colunas ao invés
das linhas usadas na Figura 3.5

Carlos Tadeu dos Santos Dias

Related Interests