You are on page 1of 95

INPE-15211-TAE/71

ARQUITETURA DE UM SISTEMA BASEADO EM


CONHECIMENTO PARA A INTERPRETAO DE
DADOS DE SENSORIAMENTO REMOTO DE
MLTIPLOS SENSORES

Traduo:
Dr. Hermann Johann Heinrich Kux
Prof. Dr. Raul Queiroz Feitosa*

Reviso:
M.Sc. Gilson Alexandre Ostwald Pedro da Costa*

*PUC-Rio

Dissertao de Martin Pahl para obteno do ttulo de Doktor-Ingenieur


autorizada pela rea de Eletro-Tcnica e
Tecnologia de Informao da Universidade de Hannover em 2003.

INPE
So Jos dos Campos
2008
Informao bibliogrfica da Biblioteca Alem (Deutsche Bibliothek):

A Deutsche Bibliothek registrou esta publicao na Deutsche Nationalbibliografie.


Dados bibliogrficos detalhados podem ser baixados por Internet no seguinte endereo:
http://dnb.ddb.de

O documento original em idioma alemo desta verso para o portugus, encontra-se em:
http://www.tnt.uni-hannover/staff/pahl/diss.pdf
Arquitetura de um sistema baseado
em conhecimento para a interpretao de dados
de sensoriamento remoto de mltiplos sensores

Dissertao autorizada pela rea de Eletro-Tcnica e


Tecnologia de Informao da Universidade de Hannover

Para a obteno do ttulo de


Doktor-Ingenieur

por

Dipl.-Ing Martin Pahl

Nascido em 14.03.1968 em Oldenburg, Niedersachsen (Alemanha)

2003

Informao bibliogrfica da Biblioteca Alem (Deutsche Bibliothek):

A Deutsche Bibliothek registrou esta publicao na Deutsche


Nationalbibliografie. Dados bibliogrficos detalhados podem ser
baixados por Internet no seguinte endereo: http://dnb.ddb.de
O documento original em idioma alemo desta verso para o portugus,
encontra-se em: http://www.tnt.uni-hannover/staff/pahl/diss.pdf

Verso para o portugus por:

Dr. Hermann Johann Heinrich Kux


INPE-DSR

Prof. Dr. Raul Queiroz Feitosa


PUC-Rio

Reviso:

M.Sc. Gilson Alexandre Ostwald Pedro da Costa


PUC-Rio

2
Interpretao de Imagens baseada em conhecimento
Srie de Documentos do Instituto de Processamento de Informaes da Universidade (Institut
fr Informationsverarbeitung TNT) da Universidade Leibniz de Hannover.

Prefcio do editor
A interpretao de imagens constitui uma disciplina jovem no mbito do Processamento de
Informaes. A disponibilidade de novos e incrementados sensores e um aumento da
capacidade de processadores para a interpretao, levaram a uma ampla utilizao de
sistemas de processamento de imagens em quase todos os setores da moderna economia
partindo da tecnologia de comunicao e de diverso, passando pela tecnologia de medicina,
de segurana, de trfego, de automatizao, de qualidade e de sensoriamento remoto, at o
monitoramento e controle dos recursos naturais a nvel mundial.

As tarefas da interpretao de imagens originaram-se, via de regra, daquelas tarefas que,


numa etapa anterior, foram efetuadas pelo Homem com as suas capacidades visuais e
cognitivas. Os atuais sistemas tcnicos de interpretao de imagens por isso esto em
concorrncia direta com as capacidades visuais do Homem e so medidos/comparados com as
mesmas. Ainda est distante o momento da equalizao destes sistemas com a capacidade de
identificao e flexibilidade humanas. A vantagem dos sistemas automticos reside na sua
elevada capacidade de reproduo dos resultados, do no-cansao, da grande capacidade de
trabalho e de relativamente baixos custos. Tais vantagens, no momento, somente podem ser
utilizadas em cenas simples, bastante padronizadas e em seqncias de trabalho rgidas.
Quando estas condies no estiverem disponveis, o Homem com sua capacidade de
reconhecimento, bem superior interpretao pela mquina.

A superioridade do sistema visual humano baseia-se essencialmente no fato de que o Homem


usa conhecimento sistemtico para a interpretao de imagens. Ele est em condies de
aparentemente obter este conhecimento sem grande esforo e de aplic-lo em conformidade
com as respectivas exigncias feitas a ele. O objetivo da pesquisa atual , usando sistemas
automticos, obter-se uma capacitao idntica. Um enfoque dos trabalhos do Instituto de
Processamento de Informaes desenvolver procedimentos adequados para a
representao, utilizao e obteno do conhecimento aplicvel em sistemas de
processamento de imagens. Aqui desempenham um papel especial os procedimentos para
representao explcita do conhecimento, que levaro a uma interpretao de imagens
baseada em conhecimento. Esta srie de documentos aborda esta temtica, que pretende ser
uma contribuio importante para futuras tarefas de automatizao.

Hannover, Julho de 2003

Prof. Dr.-Ing. Claus-E. Liedtke

3
Resumo
Este trabalho trata do projeto da arquitetura de um sistema baseado em conhecimento, para a
interpretao de dados de sensoriamento remoto de mltiplos sensores. O sistema comanda a
seqncia da interpretao de fotografias areas e imagens de satlite e gera uma descrio
simblica de cenas. A descrio simblica da cena estruturada sob a forma de uma rvore.
Cada n da rvore corresponde a um objeto visual. A localizao geogrfica exata de cada
objeto indicada em imagens rotuladas atravs de um valor de identificao especfico. Com
ajuda da rvore e das imagens rotuladas possvel produzir mapas com diferentes graus de
detalhamento.

Para associar um significado aos objetos da cena, o sistema precisa de um modelo de


conhecimento sobre os objetos que se espera encontrar. Este modelo de conhecimento
preparado sob a forma de uma hierarquia de classes de objetos, que contm todas as classes
de objetos relevantes. Cada classe de objeto pode ser associada a um operador de
processamento de imagem, que tem condies de determinar os espaos de busca para
objetos da classe nos dados de sensoriamento remoto. Um outro operador associado classe
serve para avaliar e agrupar objetos das classes subordinadas.

A estratgia de anlise baseia-se no modelo de conhecimento hierrquico. Inicialmente a cena


representada nos dados de sensoriamento remoto subdividida em espaos de busca atravs
de operadores de processamento de imagens especficos. Para cada espao de busca
gerado um objeto hipottico da classe que provocou a busca. Este procedimento repetido
recursivamente at alcanar-se a base da hierarquia. Desta forma, origina-se uma hierarquia
de hipteses de objetos, sobre a qual se trabalha na fase de consolidao. Comeando na
base da hierarquia, as hipteses de objetos so avaliadas por um operador associado classe
de objetos do nvel superior na hierarquia e so agrupados em novos objetos da classe de
objetos do nvel superior. Alcanando-se o topo da hierarquia, ter sido criada uma hierarquia
de objetos que reflete o modelo de conhecimento aplicado cena coberta pelos dados de
sensoriamento remoto.

No projeto da arquitetura aqui apresentada, deu-se nfase especial criao de uma interface
simples e flexvel para a conexo com programas externos de processamento de dados. Tais
programas so aplicados tanto para a segmentao como para a classificao da imagem,
bem como para a avaliao e agrupamento das hipteses. Nesta arquitetura as funes e o
conhecimento especficos sobre o problema esto separados, de forma totalmente inovadora,
da estratgia de anlise, que independente do problema. Desta forma, o sistema adequado
a projetos em que rotinas de segmentao de imagens para diferentes classes de objetos j
esto disponveis, mas falta uma estratgia de anlise.

O potencial da arquitetura aqui desenvolvida apresentado neste trabalho a partir de dois


exemplos da rea de classificao de cobertura do solo. No primeiro exemplo realiza-se a
verificao de dados do ATKIS1 atravs de fotografias areas. O segundo exemplo demonstra
a aplicao em monitoramento ambiental atravs de imagens de satlite

Palavras-chaves: Sensoriamento Remoto, Interpretao de imagens, SIG, Interpretao


baseada em conhecimento, Estratgia de anlise hierrquica.

1
Sigla em alemo de Amtliches Topographisches-Kartographisches Informations-System,
Sistema de Informao Topogrfico-Cartogrfico Oficial da Alemanha (N.d.T.)

4
Prefcio
Este trabalho resultou da minha atividade como colaborador cientfico no Institut fr
Theoretische Nachrichtentechnik und Informationsverarbeitung (Instituto de Teoria de
Telecomunicaes e Tecnologia da Informao) da Universidade de Hannover2.

Agradeo especialmente ao Prof. Dr.-Ing C.-E. Liedtke pelas excelentes condies de trabalho,
a agradvel atmosfera de trabalho, bem como pela orientao. Com os seus numerosos
estmulos em relao a este tema bem como atravs de discusses motivadoras ele fomentou
fortemente o desenvolvimento deste trabalho e o acompanhou cientificamente.

Ao Prof. Dr.-Ing. H. Garbe agradeo por sua disposio em participar da minha banca
examinadora.

Colaboraram ainda para o sucesso deste trabalho especialmente a boa atmosfera de trabalho
e os simpticos colegas com as suas discusses crticas, a sua solicitude e as suas sugestes
tcnicas. Inicialmente quero mencionar aqui os meus colegas Jrgen Bckner e Oliver Stahlhut
e agradecer-lhes pelo excelente trabalho de equipe realizado. Tambm os meus colegas
Jochen Wingbermhle, Stefan Growe, Markus Gerke e Snke Mller estiveram a todo tempo
disponveis para as ajudas adequadas.

Agradeo firma TopoSys por disponibilizar os excelentes dados provenientes de mltiplos


sensores.

Neste perodo, Oliver Stahlhut, Niko Meine, Matthias Schuh e muitos outros, cuidaram de
disponibilizar de uma perfeita infra-estrutura, sem que para tanto sempre aparecessem
pessoalmente.

Finalmente o meu agradecimento vai para todos aqueles que, na fase quente do trabalho se
disponibilizaram para as leituras de correo e consulta. Nesta fase, tiveram especial realce os
meus colegas Daniel Schaper, Torsten Wiebesiek, Jrgen Bckner e Jochen Wingbermhle.
Meus pais Manfred e Elisabeth Pahl e minha irm Ulrike Pahl foram de grande ajuda nesta
etapa do trabalho.

Alm disso, h ainda a minha famlia que, durante um certo tempo, teve que renunciar um
pouco minha presena. Vai aqui mais uma vez um muito obrigado minha esposa Johanna
que neste perodo teve que cuidar mais intensivamente dos nossos trs filhos Magdalena (4),
Jonathan (2) e Tobias (0). E como do feitio de crianas, elas me lembravam do essencial:
conforme insistia Jonathan: papai temos que ir novamente ao Zoolgico....

Hannover, Abril de 2003.

5
ndice
Notaes___________________________________________________________________ 7
1. Introduo ________________________________________________________________ 8
1.1. Estado da arte _________________________________________________________ 9
1.2. Objetivos e estrutura do trabalho _________________________________________ 10
2. Fundamentos da foto-interpretao ___________________________________________ 12
2.1. Descrio dos possveis dados de sensoriamento remoto ______________________ 12
2.2. Procedimentos de segmentao __________________________________________ 17
2.3. Formas de representao do conhecimento _________________________________ 19
3. Concepo de um sistema de anlise de imagens eficiente baseado em ______________ 21
conhecimento ______________________________________________________________ 21
3.1. Caractersticas de sistemas de anlise de imagens existentes ___________________ 21
3.2. Concepo do novo sistema de anlise de imagens GeoAIDA __________________ 26
4. Arquitetura de um sistema de interpretao de cenas baseada em conhecimento
GeoAIDA__________________________________________________________________ 29
4.1 Biblioteca base para o processamento de dados de sensores remotos _____________ 29
4.2. Descrio funcional da anlise de dados ____________________________________ 36
4.3. Descrio do processo de interpretao de uma imagem _______________________ 41
4.4. Realizao tcnica _____________________________________________________ 46
4.5. Visualizao do resultado________________________________________________ 55
4.6. Requisitos aos operadores externos _______________________________________ 58
4.7. Sistema experimental para o projeto de operadores ___________________________ 62
5. Exemplos de aplicaes ____________________________________________________ 63
5.1. Operadores especiais___________________________________________________ 63
5.2. Exemplos de uma classificao de uso do solo baseada em foto-interpretao ______ 68
5.3. Exemplo de anlise de uso do solo apoiada em dados de satlite ________________ 73
6. Avaliao e Perspectivas ___________________________________________________ 75
6.1. Anlise multi-hierrquica ________________________________________________ 75
6.2. Seleo automtica de operadores ________________________________________ 75
6.3. Avaliao quantitativa da qualidade _______________________________________ 76
6.4. Interpretao multi-temporal de conjuntos de dados ___________________________ 76
7. Resumo ________________________________________________________________ 79
Glossrio__________________________________________________________________ 81
Bibliografia ________________________________________________________________ 86

6
Notaes

Digitalizao de imagens
r = Fluxo de radiao sobre um ponto na imagem
r,min = Fluxo de radiao mnimo sobre um ponto na imagem
r,max = Fluxo de radiao mxima sobre um ponto na imagem
b = Valor quantizado do fluxo de radiao sobre um ponto na imagem
D (x,y) = Intensidade (densidade de fluxo de radiao no ponto (x,y))

Retngulo envoltrio mnimo (coordenadas em pixels)


Xpll = Valor de X do vrtice inferior esquerdo (lower left)
Ypll = Valor de Y do vrtice inferior esquerdo (lower left)
Xpur = Valor de X do vrtice superior direito (upper right)
Ypur = Valor de Y do vrtice superior direito (upper right)
Xp = Valor de X em coordenadas de pixel
Yp = Valor de Y em coordenadas de pixel
Xsize = Tamanho de uma imagem na direo X
Ysize = Tamanho de uma imagem na direo Y

Retngulo envoltrio mnimo (coordenadas geogrficas)


Xg = Valor de X em geo-coordenadas
Yg = Valor de Y em geo-coordenadas.
XgW = Limite Oeste em geo-coordenadas
YgN = Limite Norte em geo-coordenadas
XgE = Limite Leste em geo-coordenadas
YgS = Limite Sul em geo-coordenadas
Xgll = Valor de X do vrtice inferior esquerdo em geo-coordenada
Ygll = Valor de Y do vrtice inferior esquerdo em geo-coordenada
Xgur = Valor de X do vrtice superior direito em geo-coordenada
Ygur = Valor de Y do vrtice superior direito em geo-coordenada

Rede semntica
N = N de uma rede TN
N = Sub-n de um n N
N = Sub-n de um n N
S = N de uma rede semntica TS
H = N de uma rede de instancias hipottica TH
I = N de uma rede de instancias TI
TN = rvore constituda de ns N
TS = Rede (rvore) constituda de ns S
TH = Rede (rvore) constituda de ns H
TI = Rede (rvore) constituda de ns I
P = Imagem parcial, associada a um n N
P = Recorte de uma imagem P
TPI = rvore

Custos de procura no algoritmo A*


Ctotal = Custo total estimados at se obter uma soluo
Caccum = Custo acumulado da procura realizada at o momento
Celement = Custos para a procura de um elemento
Cremain = Custos restantes estimados at se obter uma soluo
= Seo j percorrida em nmero de passos de interao
S = Profundidade mxima de procura em nmero de iteraes
= Fator de ponderao

Classificao baseada em textura


= Clique
V = Potencial de um clique

7
P1 = Probabilidade de ocorrncia de uma determinada luminncia
P2 = Probabilidade de que cada clique pertena mesma classe
P3 = Probabilidade para a diferena de luminncia de cada clique dentro de uma regio
P4 = Probabilidade de diferena de luminncia de cada clique no limite da regio
i = Ponderao para os potenciais P1

1. Introduo
Os dados de sensoriamento remoto so utilizados para as mais diferentes aplicaes.
Inicialmente estes dados serviam principalmente como apoio para a criao de mapas.
Atualmente as tarefas de monitoramento avanaram para reas como proteo ambiental [58]
[94], proteo a catstrofes, ecologia e desenvolvimento urbano [3], bem como reconhecimento
areo de regies em crise. Alm disso, h os Sistemas de Informaes Geogrficas (SIG) [53],
usados, por exemplo, para o planejamento de rotas e para o auxlio navegao, que
dependem fortemente de dados atualizados.

As foras propulsoras deste desenvolvimento so as alteraes causadas pelo Homem na


superfcie da Terra, que tornam necessria a obteno regular de dados para fazer
prognsticos para o futuro. Uma contnua obteno de dados, no entanto somente possvel
pela utilizao de sensores de alta resoluo, especialmente pelos embarcados em satlites.

A obteno de dados de sensoriamento remoto ocorre tanto atravs de levantamentos


aerofotogramtricos, como a partir de sensores orbitais. Aqui so utilizados sensores que
trabalham em diferentes faixas espectrais, visando registrar diferentes aspectos de uma cena.
Sensores com resoluo cada vez maior e o contnuo aumento de levantamentos
aerofotogramtricos bem como a contnua obteno de dados atravs de sistemas orbitais
esto gerando um gigantesco, e crescente, volume de dados. Conseqentemente, uma
interpretao exclusivamente visual muito onerosa, no econmica, no sendo portanto
vivel. Por isso j faz tempo que se trabalha na extrao automtica de determinadas
caractersticas dos dados de sensoriamento remoto para, desta forma, apoiar os foto-
intrpretes, ou seja, para direcionar a sua ateno a certos contedos de imagem. Aqui so de
interesse especial, ao lado da classificao de uso do solo, a deteco de objetos artificiais
como ruas [5] [102] ou prdios [32][36][45][51][63][37]. Alm disso, h esforos no sentido de
automatizar todo o processo de interpretao. Aqui necessrio representar o conhecimento
prvio do especialista humano utilizado na interpretao dos dados de sensoriamento remoto
relativo a cada contexto. Para poder se ajustar de forma flexvel aos diferentes contedos e
contextos, este conhecimento prvio mantido numa base de conhecimento externo. Tal
conhecimento contm informaes sobre os possveis objetos e as suas relaes recprocas
na cena em observao.

Antes do analista comear com a interpretao propriamente dita, ele procurar obter uma
primeira e grosseira viso de conjunto, atravs de informaes adicionais, tais como data e
local do levantamento. Ao observar a cena ele inicialmente reconhecer objetos maiores que
podero ser subdivididos em objetos cada vez menores, at as menores estruturas que se
pode observar, tendo em vista a resoluo finita dos dados usados [39]. Alguns objetos ento
somente so identificveis exatamente atravs da observao de seus objetos menores,
enquanto outros objetos so mais facilmente identificveis quando se considera um contexto
maior. A qualquer momento possvel introduzir informaes no processo de interpretao, por
exemplo, a partir de mapas ou de um SIG. Estas informaes direcionam a anlise e produzem
um contexto para o prosseguimento da interpretao.

O tema deste trabalho o projeto de uma arquitetura eficiente para a interpretao automtica
de dados de sensoriamento remoto, imitando o procedimento do especialista sobre o tema.
Uma base hierrquica de conhecimento, que reflete a condio multi-escala existente em
dados de sensoriamento remoto, deve ser aplicada aqui para comandar a anlise. Tal como o
observador humano que a qualquer tempo pode introduzir informao adicional disponvel, no
processo de interpretao, a anlise automtica tambm dever estar em condies de

8
direcionar a interpretao a partir de informaes adicionais. Para a deteco de classes de
objetos especiais nas imagens areas e de satlite, devero ser aplicados procedimentos j
disponveis. A integrao destes programas de interpretao de imagens deve ocorrer sobre
uma interface de configurao flexvel. Para a anlise estrutural, que agrupa partes de objetos
em objetos maiores, tambm est prevista uma interface para a conexo com programas
externos de avaliao, de modo a possibilitar a modelagem de relaes de objetos especiais,
que durante a realizao deste trabalho no podiam ser previstas. Atravs desta conceituao
aberta, a arquitetura a ser desenvolvida dever ser adequada a aplicaes posteriores, em
projetos existentes, de modo a permitir a agregao de componentes baseados em
conhecimento de mais alto nvel.

1.1. Estado da arte

A interpretao de imagens baseada em conhecimento realizada com o objetivo de


reconhecer objetos na imagem e lhes associar um significado. A interpretao de imagens
subdivide-se em dois campos, a saber: a segmentao de imagens, que extrai regies conexas
a partir de uma imagem, e o processamento simblico, que associa a estas regies um
significado especfico, baseando-se em suas caractersticas, podendo tambm gerar objetos de
nvel superior, levando em conta as relaes entre as regies.

Os primeiros sistemas da interpretao de fotografias areas baseados em conhecimento,


originaram-se nos anos 80 do sculo passado. Destacam-se dentre eles: ACRONYM [21], BPI
[70], ECHO [55], MESSIE [30], SIGMA [71][72], SPAM [73] e VISIONS [47]. Foram utilizados
inicialmente para reconhecer objetos individuais, como construes, estradas e avies. Para o
controle da interpretao, a maioria destes sistemas utiliza regras que esto contidas em bases
de regras. O volume destas bases de regras aumenta rapidamente com a complexidade das
cenas, o que as torna confusas. Isto vale especialmente para os sistemas SPAM e BPI que
tambm criam modelos de conhecimento a partir de regras. Os sistemas SIGMA e VISIONS,
por outro lado, descrevem o seu conhecimento de modelagem com ajuda de redes semnticas.
No sistema ERNEST [80] tambm usada uma rede semntica para a representao explcita
do conhecimento. Este conhecimento prvio avaliado com poucas regras independentes da
aplicao. Estas regras esto, no entanto, implcitas no algoritmo de controle. O sistema AIDA
[67] no apresenta este ponto fraco, pois nele as regras de controle so formuladas
explicitamente.

Para resolver as situaes de conflito e de ambigidades, tanto o ERNEST como AIDA utilizam
uma procura heurstica, continuando a anlise somente da alternativa mais promissora, para a
qual necessrio um sistema de avaliao. Os sistemas ACRONYM, SPAM e SIGMA por
outro lado consideram inicialmente todas as possveis alternativas e s no final procedem a
uma escolha. No entanto, este mtodo no aplicvel na maioria dos casos prticos, devido
complexidade das cenas do sensoriamento remoto. Em [42] e [83] o sistema AIDA foi ampliado
para a interpretao multi-temporal.

Novas concepes [19][7][8][74] tambm entraram nos produtos comercializados eCognition da


firma Definiens e o ExpertClassifier da firma ERDAS [35].

O ExpertClassifier da firma ERDAS apresenta um conceito baseado em regras, para a


classificao de imagens multi-espectrais, bem como para a posterior melhoria de uma
classificao inicial. A classificao consiste basicamente de uma hierarquia de regras, que
representa uma rvore de deciso. Tal rvore de deciso descreve as condies sob as quais
um conjunto de informaes pode ser transformado para um plano de abstrao mais elevado.
As informaes de entrada consistem de variveis definidas pelo usurio que podem, por
exemplo, ser derivadas direta ou indiretamente de dados de imagem. Podem ser usados
tambm dados vetoriais, p.ex. de um SIG. Uma regra uma instruo condicional ou uma lista
de instrues condicionais que, sendo aplicada s variveis definidas pelo usurio, leva ao
estabelecimento de uma hiptese. Vrias regras e hipteses podem ser relacionadas segundo
uma hierarquia, que define o caminho que leva dos dados de entrada a um conjunto final de

9
classes ou hipteses. A cada regra podero ser associadas medidas de confiabilidade, que
permitiro avaliar as classes produzidas como resultado da interpretao. Esta concepo
baseada exclusivamente em pixels no inclui relaes de vizinhana na anlise.
A idia fundamental em que se baseia o eCognition que informaes semnticas
importantes no se encontram em pixels, mas em objetos e em suas relaes mtuas [6].
Atravs de uma segmentao baseada na tcnica de evoluo fractal (Fractal Net Evolution),
que forma segmentos a partir de critrios de homogeneidade [18], constri-se uma rede
hierrquica de objetos de imagem. Desta forma, cada objeto de imagem conhece os seus
vizinhos, podendo ser definidas relaes entre eles. Isto ocorre com a ajuda de uma hierarquia
de classes, que pode ser denominada de rede semntica. A classificao propriamente dita
ocorre ou por associao a uma regio anteriormente definida ou atravs de algum
procedimento de clculo previamente estabelecido. As relaes entre ns de um mesmo nvel,
ou mesmo com ns de nveis superiores ou inferiores podem ser igualmente consideradas.
Uma desvantagem desta abordagem que o procedimento de segmentao, que at agora
no foi publicado, fixo. Alm disso, todos os dados de entrada precisam ter a mesma
resoluo. Uma classificao confivel somente pode ser efetuada atravs de uma boa base
de regras. Por isso, na referncia [13] aplica-se o Structural Analyzing and Mapping System)
[11] para avaliar atributos e relaes entre objetos a serem considerados para a construo da
base de regras no eCognition.

Tanto o eCognition como o ExpertClassifier so sistemas comerciais, estando direcionados a


criar clientes cativos, e so muito restritos quanto integrao com produtos de outras marcas.
Quando se decide pela aquisio de um sistema, fica-se na dependncia dos avanos
implementados pelo respectivo fabricante.

Nenhum dos sistemas mencionados adequado, no momento, para uma interpretao


totalmente automtica dos dados de sensoriamento remoto. Enquanto os sistemas comerciais
se concentram exclusivamente em conceitos orientados a pixels, que no consideram
explicitamente relaes de vizinhana, determinadas nos seus operadores de processamento
de imagens no que se refere segmentao, o sistema baseado em conhecimento AIDA
possui a desvantagem de que, aps uma extrao inicial das primitivas da imagem, ele
trabalha s estruturalmente. Contudo, para tratar adequadamente a complexidade de dados de
sensoriamento remoto, necessrio um conceito hierrquico multi-escala. Isto significa que,
com base numa hierarquia de objetos, fornecida na forma de um modelo de conhecimento,
procura-se logo de incio, reduzir o espao de busca dos objetos dos nveis mais altos da
hierarquia. Para isso utiliza-se o operador mais adequado para o respectivo contexto. De modo
inverso aplicado conhecimento sobre os atributos e relaes entre objetos, para identificar
nos espaos de busca objetos de uma determinada classe. Este procedimento eficiente
associado capacidade de integrao de algoritmos existentes, at agora no foi aplicado em
nenhum dos sistemas supracitados.

1.2. Objetivos e estrutura do trabalho


O objetivo deste trabalho desenvolver uma arquitetura eficiente para a interpretao de
dados de sensoriamento remoto, baseada em conhecimento. Um importante aspecto a ser
considerado a capacidade de integrao de programas j existentes de processamento de
imagens, para a deteco de classes de objetos especficos. O modelo de conhecimento deve
ser formulado numa rede semntica, que reflita com sua estrutura, a hierarquia de objetos
esperada nos dados de sensoriamento remoto e que servir ao mesmo tempo para o controle
da anlise.

Os procedimentos disponveis at hoje partem de uma imagem bruta (primitiva) agrupando-a


em objetos mais complexos, procurando encontrar a combinao que melhor adere ao modelo
de conhecimento. Em contraposio a isto, neste trabalho pretendemos reduzir o espao de
busca pela aplicao dos assim chamados operadores holsticos nos nveis mais elevados da
hierarquia do modelo de conhecimento, operadores estes que processam uma imagem na
escala mais adequada para a deteco dos objetos procurados. Posteriormente, nos nveis
mais baixos da hierarquia subjacente, entra somente o conhecimento contextual especfico.
Atravs da restrio do espao de busca obtido ao levar em conta o contexto, reduz-se

10
fortemente o nmero de combinaes a serem consideradas no nvel das primitivas da
imagem. Esta hierarquia de hipteses de objetos dever ser verificada em seguida, iniciando
pelos ns folha. Eventuais conflitos devem, na medida do possvel, ser resolvidos localmente
em cada rvore parcial, atravs de operadores de avaliao externos.

Uma outra parte do trabalho cuida do problema de como os resultados obtidos podem ser
apresentados sinteticamente a um usurio potencial. Para isso o modelo de conhecimento e a
hierarquia de objetos obtida, devem ser associados interativamente com uma representao
semelhante a um mapa.

Assim sendo, este trabalho est estruturado como segue:

O captulo 2 descreve a estrutura das imagens digitais utilizadas e suas caractersticas mais
importantes para a extrao automtica de objetos. O requisito bsico para uma interpretao
de imagens uma segmentao. Para tanto os mtodos fundamentais de segmentao so
apresentados. Considerando que a atribuio de significado somente possvel atravs da
incluso de conhecimento prvio, so apresentadas algumas importantes formas de
representao do conhecimento.

No captulo 3 apresentado o conceito do sistema de anlise de cenas baseado em


conhecimento GEOAIDA, originado no mbito deste trabalho, comparando-o com outros
sistemas disponveis.

O funcionamento e detalhes de implementao do sistema de anlise de cenas GEOAIDA so


tratados no captulo 4.

No captulo 5 so apresentados alguns operadores para a deteco de classes de objetos


especficas em dados de sensoriamento remoto, originados no mbito deste projeto, bem como
demonstrado, em dois exemplos de aplicao, a utilizao com sucesso do sistema.

No captulo 6 so indicadas novas possveis direes de desenvolvimento de trabalhos futuros,


aps uma sucinta avaliao da arquitetura desenvolvida no mbito deste trabalho.

O captulo 7 resume o contedo deste trabalho.

Explicaes de termos tcnicos bem como abreviaes encontram-se num glossrio no final
deste trabalho.

11
2. Fundamentos da foto-interpretao
A interpretao de dados de sensoriamento remoto envolve uma seqncia de passos. No
inicio est a aquisio de dados. Aqui diferentes procedimentos so usados que influenciam os
passos seguintes. Em todos os casos os dados, no entanto, precisam ser divididos em
segmentos com caractersticas similares, antes que, com ajuda de conhecimento prvio, possa
ser associado um significado aos mesmos. Nas prximas sees estes temas sero
apresentados detalhadamente. A Seo 2.1 trata das caractersticas importantes dos diversos
dados de entrada. Na Seo 2.2 so apresentados alguns algoritmos de segmentao
freqentemente usados. A Seo 2.3 fornece uma viso de conjunto de possveis
procedimentos sobre como introduzir conhecimento no processo de interpretao de imagens.

2.1. Descrio dos possveis dados de sensoriamento remoto

Dependendo das plataformas de aquisio, procedimentos de medida e meio de


armazenamento, os dados de sensores remotos podem ser subdivididos em diferentes classes.
As plataformas de aquisio podem ser aerotransportadas ou orbitais. Quanto ao procedimento
de medio, h medidas de intensidade e de tempo de transmisso. Os tempos de transmisso
dizem respeito fundamentalmente s a sensores ativos. Medidas de intensidade podem ser
executadas tanto ativa como passivamente. Como meios de armazenamento foram usados
antigamente filmes analgicos, que so adequados somente para arquivar sinais de
intensidade. Atualmente formas de registro digitais impem-se cada vez mais devido
facilidade para o posterior processamento computacional.

Imagens a cores, de nveis de cinza ou infra-vermelhos podem ser obtidas por sensores
passivos a bordo de aeronaves ou satlites. Os sensores diferenciam-se to-somente por sua
sensibilidade em determinadas faixas do espectro eletromagntico. Nos levantamentos
aerofotogramtricos para os escritrios alemes de geodsia regional, freqentemente so
ainda usadas cmeras mtricas (RMK) [59][96] que registram a fotografia area num filme.
Para poderem ser processados em computador, tais filmes precisam ser digitalizados.

Uma desvantagem destes procedimentos de medio passivos a sua dependncia do clima e


das condies de iluminao. Esta limitao levou ao desenvolvimento do radar com abertura
sinttica (SAR) [33][65][95]. Trata-se aqui de um sensor ativo. As microondas irradiadas
atravessam nuvens e chuva. Atravs da interpretao de caractersticas interferomtricas da
radiao refletida possvel at uma medio altimtrica.

2.1.1. Processo da digitalizao de imagens

Para poder processar imagens em computadores, tais dados devem estar disponveis em
forma digital. O processo de digitalizao das imagens feito atravs de sensores digitais
durante a aquisio da imagem, enquanto que em sistemas analgicos a digitalizao
realizada posteriormente atravs de um scanner. Este processo pode ser subdividido em 2
passos, a saber, a rasterizao da imagem e a quantizao dos nveis de brilho rasterizados,
ou, em imagens coloridas, da saturao e do valor da cor. A qualidade da posterior
interpretao da imagem depende essencialmente da qualidade do processo de digitalizao.

No caso da rasterizao, as intensidades de radiao que se encontram dentro de um ponto


rasterizado D (x,y) so integradas a um valor de radiao r que a seguir tambm designado
como valor de brilho:

r = D(x,y)dxdy

A conseqncia disso que estruturas geomtricas na imagem digital so transformadas numa


combinao de estrutura geomtrica e distribuio de brilho (vide Figura 2.1). Isto dificulta a
deteco de formas, j que na imagem no mais possvel reconhecer se um valor de

12
intensidade expressa a caracterstica do material ou estrutura. Espera-se que cada aresta real
na imagem provoque uma alterao de brilho com largura de pelo menos um pixel. (Figura
2.1).

Rasterizao

Fig. 2.1: Devido s caractersticas integradoras dos sensores sensveis luz, a rasterizao da geometria provoca a
suavizao das arestas.

Na quantizao, os valores de brilho rasterizados reais r so reproduzidos num valor de


brilho quantizado b compatvel com uma escala de valores prpria do computador.
Geralmente isto se faz atravs do seguinte mapeamento linear da faixa dos valores de brilho
[r, min , r ,max ]

Aqui n representa a largura mxima de um valor digital em bits, sendo que r, min o valor
de brilho real, que dever ser associado ao valor digital 0, o que via de regra constitui o brilho
mnimo disponvel. De modo similar r ,max , o brilho mximo, associado ao valor digital 2n 1.

13
Fig. 2.2: Quantizao da intensidade da imagem: (a) representao otimizada da dinmica
da imagem, (b) representao de um intervalo da dinmica real sobre a escala dinmica da
imagem, diminui o erro de quantizao, (c) mal aproveitamento da dinmica da imagem
com concomitante aumento do erro de quantizao.

A figura 2.2 ilustra este processo de quantizao. Para tanto, a curva (a) descreve o processo
de quantizao otimizado em relao dinmica de brilho completa. s vezes uma
quantizao conforme a curva (b) pode ser adequada, quando, p.ex. somente contedos
insignificantes da imagem desaparecem devido saturao na regio do preto ou na regio do
branco; neste caso, o erro de quantizao reduzido numa certa faixa de intensidades ao
mesmo tempo que detalhes se tornam mais visveis. Uma quantizao conforme a curva (c)
deve ser evitada na medida do possvel, visto que se perde parte da informao a ser
representada. Alm disso, o erro de quantizao ampliado desnecessariamente. O caso (c)
ocorre quando r, min escolhido for menor do que o brilho mnimo disponvel na imagem, e/ou
quando r ,max for maior do que o brilho mximo. Considerando que a forma otimizada da curva
somente pode ser determinada se o brilho mnimo e mximo forem conhecidos, via de regra
conveniente digitalizar com um nmero maior de bits do que o estritamente necessrio. Deve-
se, contudo, ter em mente que uma reduo da largura dos intervalos, provoca um erro no-
linear de quantizao.

Modelos Digitais de Elevao podem, desde que incluam a modelagem de objetos, ser muito
teis na interpretao de dados de sensoriamento remoto, visto que nestes dados podem ser
reconhecidas inequivocamente estruturas, enquanto nas fotografias areas textura e estrutura
se misturam. Em Modelos Digitais de Terreno produzidos a partir de uma medio geodsica
do terreno, objetos artificiais so desconsiderados propositalmente. A obteno destes
modelos custosa e praticamente no passvel de automatizao.

Modelos Digitais de Terreno. Mais adequados so os MDTs produzidos automaticamente a


partir de imagens estereoscpicas [4][10][9][64]. De modo similar viso espacial do Homem,
os procedimentos de interpretao estereoscpica baseiam-se em encontrar contedos de
imagem correspondentes num par estereoscpico. A partir do deslocamento dos contedos de
imagem correspondentes em ambas as imagens estereoscpicas, a assim denominada
disparidade, possvel derivar uma medida da profundidade do ponto no espao
representado na imagem, desde que se conhea a posio da cmera. Os mtodos de medida
de disparidade dividem-se em dois grupos. O primeiro grupo baseia-se diretamente nos valores
de intensidade da imagem e permitem a medida de disparidade em praticamente todos os
pontos da imagem. Contrastando com isso, os procedimentos baseados em feies avaliam a

14
disparidade, sobre feies extradas de ambas as imagens. Somente para as posies das
feies so determinados os valores de disparidade.

Modelos altimtricos calculados a partir de imagens estereoscpicas so adequados para o


clculo de modelos de terreno. Para a modelagem de objetos artificiais h necessidade de
cartas de profundidade das construes, com uma distncia dos pontos inferior a 2 m, cujo
clculo muito custoso, sendo quase impossvel de realizar a partir de procedimentos usados
pela fotogrametria. Por outro lado, os procedimentos desenvolvidos para a tcnica de
comunicao alcanam uma alta preciso de avaliao da disparidade, que em parte menor
do que o tamanho de um ponto da imagem, porm ficam sobre para imagens com as
dimenses usuais no sensoriamento remoto.

2.1.3. Obteno de dados com sistema de varredura a laser

Os modelos digitais de elevao de maior exatido e resoluo espacial so atualmente


obtidos por um sistema de varredura a laser (laser scanner) aerotransportado. Numa altura de
vo de 1000 m so possveis precises altimtricas melhores que 0,1 m, considerando uma
resoluo espacial de 1 m.

O sistema de varredura a laser um sensor ativo. O sensor envia um raio de luz e mede o
tempo que a luz leva para percorrer o caminho de ida e volta, do sensor ao alvo (vide Figura
2.3). O tempo do percurso da luz uma medida direta da distncia entre o sensor e alvo.
Repetindo-se as medies, desviando-se o raio de medio atravs de um espelho, linha a
linha, para diversas posies e movendo-se concomitantemente a plataforma do sensor
paralelamente superfcie e verticalmente clula de varredura, cria-se um mapa de
profundidade da cena observada.

Fig. 2.3:(a) No sistema de varredura laser a distncia da aeronave para o solo medida atravs do tempo de
percurso da luz. A partir da posio do sensor, da orientao da medio unitria e da distncia medida, determina o
local e a altitude de um objeto.(b) O sistema de varredura laser trabalha orientado por linhas, e por isso, no solo,
tambm se origina um padro de varredura linear. A distncia da fibra determinada pela distncia das clulas na
unidade de varredura. A densidade das linhas depende da velocidade de vo e da velocidade de rotao do espelho
de desvio (veja tambm Fig. 2.4).

Na Figura 2.4 est ilustrada a estrutura do sistema de varredura a laser da firma TopoSys
(http://www.toposys.de). Atravs de um espelho de rotao inclinado, o raio laser dirigido
para um feixe de fibra de vidro e de l para o solo. A cada lance de fibra de vidro do emissor
corresponde um lance do receptor, o qual registra o sinal refletido e que, atravs do segundo
espelho de desvio, que est rigidamente acoplado ao espelho emissor, altera o seu curso para
o receptor. A distncia dos lances de fibra de vidro individuais determina, junto com a altura de
vo, a distncia dos pontos de medio na superfcie da terra em direo linha de varredura.

15
Na direo do vo, o espaamento dos pontos de medio determinado pela velocidade do
vo.

Fig. 2.4: Princpio de uma unidade de varredura da Firma TopoSys. Com um espelho giratrio,inclinado, a luz do laser
direcionada para um feixe de fibra de vidro e de l para o solo, originando-se da o padro de varredura
apresentado na Fig. 2.3.

Visto que, ao contrrio de procedimentos de medio anteriores, est sendo medido um tempo,
no h necessidade de integrao sobre uma superfcie auxiliar e nem da funcionalidade de
passa baixa da integral. O sistema de varredura a laser representa bordas nitidamente.
Modelos altimtricos obtidos com sistemas de varredura a laser so, por isso, excelentes
dados de entrada para a deteco de objetos artificiais. Mesmo a medio de aglomeraes de
casas em reas centrais de cidades com alta densidade de construes possvel, visto que,
est se trabalhando com um ngulo de medio de 90 7 (vide Figura 2.5a).

Fig. 2.5: Caractersticas importantes de um sistema de varredura a laser: (a) quanto menor for o ngulo de varredura,
tanto mais ngremes podem ser as bordas mensurveis. O TopoSys Scanner com um ngulo de visada de 7
permite por exemplo medir inclinaes superiores a 800%. Por isso tambm possvel medir grandes
conjuntos de casas em zonas centrais de cidades com alta densidade de construes. (b) Devido a deteco do
primeiro e ltimo pulso de laser refletido, possvel a medio concomitante de dossis de rvores e solos florestais.

Ao deparar com uma borda, resultam vrias reflexes, das quais a primeira e a ltima so
registradas. Com essas medies designadas como First pulse e Last pulse possvel por
exemplo, medir vegetao semi-transparente luz, na qual o primeiro pulso se origina no
dossel da vegetao e o ltimo no solo (vide figura 2.5b).

16
2.2. Procedimentos de segmentao
Em princpio pode-se distinguir entre tcnicas de segmentao baseadas em arestas e regies,
e procedimentos de segmentao baseados num modelo fsico. Os procedimentos de
segmentao orientados por um modelo fsico possuem somente opes limitadas de
aplicaes (vide referncias [50][56]), enquanto os procedimentos baseados em arestas e
regies tm aplicao geral. Enquanto os procedimentos baseados em arestas permitem obter
aproximadamente os mesmos resultados tanto para imagens preto/branco como para coloridas
(vide referncias [79][81]), os procedimentos baseados em regies se beneficiam
significativamente do uso de imagens coloridas.

Os algoritmos de segmentao baseados em regies podem ser divididos em diferentes


classes no que tange sua metodologia. Haralick d uma boa viso de conjunto em [48] sobre
os diferentes mtodos de segmentao baseados em regies de imagens de nveis de cinza.
Os mesmos procedimentos tambm se encontram em publicaes sobre a segmentao de
cores (vide [98]) e podem ser divididos basicamente em anlise de aglomerados no espao de
atributos (clusterizao), crescimento de regies (region growing), dividir e mesclar (split and
merge) e combinaes destes procedimentos (vide [88]), como os procedimentos baseados no
cdigo de estrutura da cor (color structure code).

2.2.1. Anlise de cluster no espao de atributos

Na anlise de aglomerados (cluster analysis em ingls) no espao de atributos, os pixels so


representados por vetores num espao de atributos. Aps isto verificado se os vetores
formam aglomerados no espao de atributos. Admitindo-se que regies homogneas da
imagem possuem vetores de atributos similares e que por isso ocorrem aglomerados nestas
regies do espao de atributos [31], pode-se associar a cada pixel o rtulo (label) do
aglomerado ao qual este pertence. Todos os pixels com o mesmo rtulo formam ento um
segmento de imagem. No reconhecimento de padres clssico h muitos mtodos para a
deteco de aglomerados com caractersticas individuais prprias [54]. Freqentemente na
segmentao de imagens utilizada a anlise de histogramas para a deteco de
aglomerados. Num espao de atributos unidimensional (p.ex. em imagens de nvel de cinza),
obtm-se os aglomerados atravs da determinao dos intervalos de valores entre os vales
no histograma. Em aplicaes de reconhecimento de padres, freqentemente necessrio
representar a relao entre vrios pixels num espao de atributos multidimensional.
Eventualmente pode ser til determinar os aglomerados desejados atravs da anlise de
padres.

Um desdobramento desta anlise global de aglomerados o uso recursivo do procedimento,


sobre as imagens parciais segmentadas. Em [82] apresentada uma extenso deste
procedimento para imagens coloridas.

2.2.2. Crescimento de regies

No crescimento de regies (region growing), parte-se de uma regio inicial e determina-se para
cada pixel vizinho se h similaridade com relao a algum atributo da regio; em caso
afirmativo, o pixel agregado regio. A variante mais simples do crescimento de regio o
simples encadeamento. Aqui cada pixel considerado como um n de um grafo. Se em dois
pixels vizinhos o limiar de uma medida de similaridade for ultrapassado, ambos os pontos so
conectados por um arco. Visto que a existncia de um arco no grafo basta para fundir duas
regies, esta variante do crescimento de regio no adequada para cenas complexas.

No encadeamento hbrido, os pixels vizinhos so levados em conta na deciso se dois pixels


so ligados por uma borda e assim pertencero a uma regio. Aqui a cada pixel de uma
vizinhana k x k associado um vetor de atributos. Se as vizinhanas forem semelhantes, os
pixels so conectados com um arco.

17
No encadeamento de centride no so comparados pares de pixels, porm so comparados o
valor de um pixel com o valor mdio de um segmento ainda no necessariamente definido.
Cada pixel agregado leva a uma alterao do valor mdio do segmento. A vantagem deste
procedimento que todos os pixels de um segmento so considerados na deciso, se um novo
pixel deve ser agregado regio. A desvantagem, no entanto que o resultado depende do
ponto de partida da segmentao. Uma detalhada viso de conjunto das vantagens e
desvantagens de cada um dos procedimentos de crescimento de regies, encontra-se em
[106].

2.2.3. Dividir e mesclar

Diferentemente do procedimento de crescimento de regies, que desenvolvem os segmentos


de pequenas para grandes clulas, no procedimento de dividir e mesclar (split and merge) [52],
percorre-se o caminho contrrio. Inicialmente a imagem subdividida em 2n campos quadrados
de igual tamanho. Na fase de dividir, todos os campos que no preenchem um determinado
critrio de homogeneidade, so divididos em 4 campos quadrados. Esta diviso continuada
at que todos os campos satisfaam o critrio de homogeneidade. Na fase de mesclagem,
campos vizinhos so fundidos quando satisfazem juntos o critrio de homogeneidade. Desta
forma, possvel tambm tratar de regies que se estendem para fora dos limites do quadrado.

2.2.4 Cdigo de estrutura de cores

Um caminho alternativo o Cdigo de Estrutura de Cores [87][89], um sistema para a


segmentao rpida de imagens coloridas. O sistema trabalha numa estrutura de ilhas
hexagonal e hierrquica (vide Figura 2.6), descrita em [49]. Para tanto cada pixel com 6 dos
seus 8 vizinhos transformado nesta estrutura hexagonal. Nas fases de pr-processamento,
codificao e associao gerada uma quantidade de estruturas de dados (rvores), em que
cada uma representa um objeto colorido coerente.

Ilha do Plano 1

Ilha do Plano 0

Ilha do Plano 2

Pixel

Fig. 2.6: Diviso de uma imagem numa estrutura hierrquica com ilhas hexagonais que se sobrepem.

18
No pr-processamento o rudo das imagens suprimido atravs de um procedimento de
vizinho mais prximo simtrico [84]. O especial neste procedimento que, ao contrrio dos
procedimentos de suavizao simples, as arestas das imagens so preservadas, visto que o
clculo do valor mdio considera somente a metade dos pixels vizinhos, ou seja, a metade
cujos valores se encontram mais prximos ao pixel central.

Na fase de codificao, no nvel 0 os pontos da imagem so representados numa estrutura de


ilhas, que pertencem a uma mesma vizinhana e atendem a um critrio de similaridade
relacionado suas respectivas cores. Considerando que para formar uma regio so
necessrios pelo menos 2 pixels, no mximo 3 elementos de cdigo podem se originar.

Na fase de associao os elementos em cdigo do nvel n so representados por elementos de


cdigo do nvel n + 1. Um elemento do nvel n ento absorvido num elemento de cdigo do
nvel n + 1 quando tiver cor similar a um elemento de cdigo vizinho do nvel n e ambos os
elementos formarem uma regio conexa, o que facilmente verificvel atravs das reas de
sobreposio das ilhas. Aplicando-se a todos os nveis, origina-se dessa forma para cada
regio colorida conexa uma estrutura em rvore. O problema de propagao de erros, tpico de
procedimentos de crescimento de regio resolvido, na medida em que realizado em cada
nvel de associao, um teste adicional de cor que compara os valores mdios de cores de
duas superfcies adjacentes. Se a distncia das cores estiver acima de um determinado limiar,
as regies no so conectadas.

2.3. Formas de representao do conhecimento

A interpretao de dados de sensoriamento remoto associa significado aos contedos da


imagem, o que somente possvel atravs da introduo de conhecimento no processo de
interpretao. A representao do conhecimento est sujeita a duas exigncias em certo
sentido contraditrias. Por um lado dever ser possvel processar automaticamente o
conhecimento. Por outro, o conhecimento se origina de um especialista humano e precisa ser
por ele/ela formulado e atualizado.

Convm diferenciar conhecimento implcito de conhecimento explcito [40][69]. O conhecimento


implcito est contido diretamente no cdigo de um programa e descreve um rgido plano de
procedimento. O algoritmo no desenvolvido porque um determinado mtodo est sendo
procurado, mas porque no momento de sua elaborao sabia-se qual a funo a ser usada
naquela situao.

Trata-se de conhecimento explcito quando se conhecem as solues alternativas para uma


dada tarefa, para a qual o sistema deve escolher uma funo adequada, e estas solues
esto indicadas explicitamente.

Por sua vez, no conhecimento explcito deve-se discriminar entre conhecimento declarativo e
conhecimento de procedimento. O conhecimento declarativo descreve as relaes entre
objetos do mundo real. A vantagem desta forma de representao a sua fcil leitura. O custo
para se determinar uma soluo concreta , no entanto, muito maior do que na representao
atravs de conhecimento de procedimento. Tal conhecimento descreve o uso de conhecimento
e com isto fornece uma orientao direta de como resolver o problema. A execuo do mesmo
mais eficiente, por outro lado, porm, a descrio do conhecimento para tarefas complexas
muito custosa e pouco amigvel para a manuteno.

2.3.1. Sistemas baseados em conhecimento

Denomina-se de sistemas baseados em conhecimento aqueles sistemas que armazenam o


conhecimento especfico da aplicao de modo explcito e de modo separado da estratgia
geral de soluo de problemas. Para diferentes tarefas troca-se apenas a base de
conhecimento. Para a representao do conhecimento na base do conhecimento, h diversos

19
conceitos, dentre os quais, na rea da interpretao de dados de sensoriamento remoto, so
usados principalmente regras e redes semnticas.

Regras. Sistemas baseados em regras formulam conhecimento a partir de relaes Se Ento


(IfThen). A parte da ao executada quando a parte das condies for satisfeita. Se vrias
condies estiverem satisfeitas, uma instncia superior deve decidir qual regra dever ser
aplicada. Bases de regras volumosas logo se tornam confusas. Incoerncias lgicas dentro das
regras podero ocorrer.

Redes semnticas. Uma rede semntica um grafo orientado, no qual os ns representam


objetos, idias, acontecimentos ou fatos, ligados por arcos que descrevem a relao dos ns
entre si. Redes semnticas no so uma forma de representao do conhecimento em si. Elas
se prestam muito mais visualizao de outras formas de representao, que definem a
apresentao dos ns e dos arcos. Para a representao de conhecimento no sensoriamento
remoto por exemplo, freqentemente quadros (frames) so representados na forma de redes
semnticas. Frame uma forma de representao do conhecimento orientada a objeto.
Diferencia-se entre frames genricos, que representam um conceito de um objeto do mundo
real e instncias de frames que constituem objetos concretamente existentes do mundo real
(vide Fig. 2.7). Um frame genrico possui para cada atributo um slot. Se o frame genrico for
instanciado, associa-se aos slots o respectivo valor de atributo do objeto concreto. As relaes
entre objetos tambm so obtidas atravs de slots. Estes slots de relacionamento so
simbolizados por arcos na rede semntica.

Quadro Genrico Instncia


P
Casa Casa 1
Is a Is a Casa
Tipo Tipo Unifamiliar
Tamanho Tamanho 80
Cor Cor Vermelha
Localizao Localizao 5043 5859

Fig. 2.7: Exemplo de um frame genrico do tipo Casa e uma Instncia. Na Instncia os Slots recebem
valores concretos. No Slot Is-a o tipo de Instncia arquivado.

20
3. Concepo de um sistema de anlise de imagens
eficiente baseado em conhecimento
Numa considerao geral, para a soluo de problemas complexos h duas estratgias
distintas:

1. Inicia-se com a soluo de problemas parciais, na expectativa de que estas solues


parciais possam ser combinadas, mais adiante, numa estratgia de soluo geral. O
trabalho assim avana do especfico para o geral.

2. A estratgia oposta usa o conceito estrutural. Tenta-se reconhecer as estruturas


maiores de um problema e refin-las, na expectativa de que os problemas parciais
num certo momento sero to pequenos que permitiro uma soluo (ou ainda
desaparecero). Aqui est se considerando uma abordagem generalista.

No contexto de interpretao de dados de sensoriamento remoto, pertencem primeira


estratgia mencionada todos os procedimentos voltados especificamente para a deteco de
determinadas classes de objeto. Freqentemente estas abordagens utilizam um modelo
paramtrico dos objetos procurados. Encontrando um candidato potencial na imagem, tenta-se
ajustar os parmetros do modelo aos dados. Como exemplos mencionamos aqui os
procedimentos para a deteco de prdios [20][97][104][103] e ruas [5]]12][14][24].

A abordagem generalista realizada nos sistemas baseados em conhecimento para a


interpretao de dados de sensoriamento remoto de mltiplos sensores. A base de
conhecimento aqui pode ser entendida de modo puramente declarativo como conhecimento
factual bem como conhecimento de procedimento sobre a utilizao destes fatos. Diversos
formalismos para a representao explcita de conhecimento foram sugeridos na literatura
[105]. Para a interpretao de dados de sensoriamento remoto foram aplicadas regras e redes
semnticas.

Como exemplos de sistemas que utilizam regras para o controle da anlise podem ser
mencionados aqui os seguintes: ACRONYM [21], AIDA [67][43], BPI [70][100], ERNEST
[80][93], MESSIE [30], MOSES [85][86], SIGMA [72] e SPAM [73]. Os sistemas SPAM e BPI
tambm armazenam o conhecimento sobre a cena em regras, enquanto os sistemas AIDA,
ERNEST, MOSES, SIGMA e VISIONS [47] utilizam redes semnticas para isto.

3.1. Caractersticas de sistemas de anlise de imagens


existentes
Considerando que as volumosas bases de regras necessrias para a interpretao de dados
de sensoriamento remoto podem rapidamente tornar-se confusas, so analisados a seguir
alguns exemplos de sistemas que arquivam o seu conhecimento na forma de redes
semnticas.

3.1.1. VISIONS

VISIONS a sigla em ingls de Visual Integration by Semantic Interpretation of Natural


Scenes. O sistema est sendo desenvolvido desde 1975 na Universidade de Massachusetts
em Amherst. Inclui um conceito de um sistema geral de processamento de imagens que est
em condies de processar automaticamente imagens complexas, tais como fotografias
areas. O pr-processamento e a segmentao so independentes de aplicao, e trabalha
com algoritmos fixos, de acordo com um procedimento baseado em regies [78][17] e um
procedimento baseado em arestas [22][23]. Para a interpretao das imagens so utilizadas
tcnicas baseadas no conhecimento. O processamento de fotografias areas est descrito em
[46][34].

21
Esquema de Esquemas Instncias de
Rede Estratgicos Esquema
Funes de
Avaliao

Rotinas de Nvel Instncias de


Intermedirio Esquema

Instncias de
Rotinas de Nvel Esquema
Baixo

Conhecimento Processamento Dados


dependente do
Problema

Fig. 3.1: A arquitetura do sistema VISIONS divide-se em trs nveis diferentes de abstrao. O
processamento de imagem ocorre no nvel mais baixo. O nvel intermedirio resume dados brutos
dirigidos por modelos e dirigidos por dados (model- and data-driven) para unidades maiores. O nvel
superior contm o conhecimento aplicativo especfico e gerencia as instncias.

A figura 3.1 apresenta a arquitetura do sistema VISIONS. Divide-se em trs nveis de


abstraes.

No nvel inferior o trabalho dirigido por dados (data driven). A imagem segmentada e
descries simples dos assim chamados Tokensets (conjuntos de smbolos) so gerados. Para
determinados Tokensets as respectivas caractersticas so arquivadas.

No nvel intermedirio os Tokensets primitivos so agregados em Tokensets mais complexos.


Para esta tarefa esto disponveis diversos grupos de procedimentos: classificao baseada
em conhecimento [91][66], agrupamento perceptivo [90], relaes de Token [16][92] e re-
segmentao comandada por modelos (model driven) [57]. O agrupamento para Tokensets
maiores ocorre tanto dirigido por dados (data driven), aps a concluso do nvel mais baixo,
como tambm dirigido por modelos (model driven), atravs de estratgias de controle
dependentes do problema.

O nvel superior contm o conhecimento especifico da aplicao, na forma de uma rede


semntica. Os ns da rede so denominados de Esquemas e representam objetos que
ocorrem na imagem. Um esquema contm restries sobre valores possveis de determinados
tipos de token. Se for encontrado um token deste tipo com os valores adequados, ento
executado o teste de plausibilidade e, no caso de uma sada positiva, executada uma
conexo entre o objeto achado e o token. As hipteses de objeto assim achadas, so
arquivadas como instncias de esquema.

3.1.2. ERNEST

ERNEST [60][61] foi desenvolvido nas Universidades de Erlangen e Bielefeld. Trata-se de uma
linguagem de representao do conhecimento com uma estratgia de controle orientada a
problemas, baseada em redes semnticas. Contrastando com as redes semnticas usuais,
ERNEST utiliza um nmero fixo de tipos de ns e bordas com significado determinado. O
conceito de n representa uma classe de objetos. Uma instncia est diretamente associada a

22
uma parte do sinal. O conceito modificado representa um resultado intermedirio da anlise.
Os ns esto conectados com um dos trs tipos de arcos. A especializao (is-a) constitui o
mecanismo de hereditariedade. O arco parte-de (part-of) subdivide um conceito em seus
componentes. Um outro tipo de arco, parte-de (cdpart-of) conecta uma parte do conceito que
somente est definido num certo contexto. Para separar claramente o conhecimento em
diferentes planos de abstrao, foi introduzido um tipo de arco concretizao-de (con-of).

O objetivo da anlise associar o sinal de entrada aos conceitos, isto , devem ser geradas
instncias dos conceitos. Considerando que o sinal freqentemente ambguo, pode-se
esperar instncias concorrentes e conceitos modificados, que valem para diferentes opes de
interpretao do sinal de entrada. ERNEST utiliza o algoritmo A*, para poder tomar uma
deciso quanto melhor interpretao. Cada n do espao de busca representa uma
interpretao coerente do sinal do sensor e contm assim a base do conhecimento completa,
adaptada ao sinal. A inferncia no espao de busca, e com isso a gerao de instncias e de
conceitos modificados, baseia-se em seis regras independentes de problemas. Por exemplo
uma instncia somente pode ser gerada, quando todas as suas partes estiverem instanciadas.
As regras esto integradas implicitamente no algoritmo de controle, que tambm independe do
problema.

Automvel Automvel

Roda Roda Roda Roda Carroceria


Carroceria
da frente de trs da frente de trs

Elipse Polgono Elipse Polgono

Imagem imagem

Fig. 3.2: ERNEST: Exemplo simplificado de uma base de conhecimento ( esquerda) e base de conhecimento
instanciada ( direita) para um automvel.

A Figura 3.2 ( esquerda) mostra, a ttulo de exemplo, uma base de conhecimento simples e
muito pequena de um sistema para reconhecer um automvel. Neste modelo, o carro se
compe dos componentes: roda da frente, roda de trs e carroceria. Estes componentes so
associados aos dados brutos de imagem, elipse e polgono, que podem ser detectados numa
imagem de entrada. A Figura 3.2 ( direita) mostra a base de conhecimento instanciada para
uma associao concreta de instncias a uma imagem de entrada.

3.1.3. AIDA

O sistema AIDA (Automatic Image Data Analyzer) [67][101] foi desenvolvido na Universidade
de Hannover inicialmente para a interpretao baseada em conhecimento de fotografias areas
e imagens estreo [41] livremente escolhidas e, posteriormente, estendido para o
reconhecimento de estruturas multi-temporais [42]. Na Figura 3.3 est representada a
arquitetura de AIDA. Como dados de entrada AIDA aceita dados de diferentes sensores, como

23
de cmeras mtricas (RMK) e SAR (Synthetic Aperture Radar). O conhecimento sobre a cena
a ser interpretada gerenciado num modelo de cena genrico. Informaes sobre a cena a ser
interpretada podem ser obtidas de um SIG, sendo que foi implementada uma conexo especial
para o sistema ATKIS [62][44] (Sistema de Informao Topogrfico-Cartogrfico Oficial) usado
na Alemanha. No mdulo de processamento de imagens ocorre a segmentao dos dados do
sensor com a posterior extrao dos dados brutos da imagem. Estes dados brutos dos
diferentes sensores so fusionados na unidade de trabalho simblica e agrupados para
estruturas complexas. A estas estruturas associado um significado simblico. Ao lado desta
estratgia comandada por dados (data driven), a anlise tambm pode ser comandada por
modelos (model driven). Para tanto o sistema envia, a partir do modelo de cena genrico,
hipteses sobre os objetos esperados nos dados de sensoriamento remoto e os verifica a
seguir. O sistema finalmente fornece uma descrio simblica da cena.

Fig. 3.3: Arquitetura do sistema de interpretao de imagens baseado em conhecimento AIDA: os


dados de entrada so preparados para uma descrio simblica da cena.

De forma igual ao ERNEST, o sistema AIDA tambm usa uma rede semntica como base de
conhecimento (vide Figura 3.4). Esta constitui-se de ns e arcos. Os ns armazenam o
conhecimento de modelos sobre os objetos a serem esperados na cena. Os arcos modelam o
tipo do relacionamento entre os ns. Em AIDA diferenciam-se arcos hierrquicos de arcos
topolgicos.

24
Rua

Rodovia

Divisria Central Pista de rolagem

Linha Faixa

Fig. 3.4: AIDA diferencia na rede semntica entre diferentes tipos de arcos. Arcos
hierrquicos descrevem relaes entre objetos de diferentes nveis na hierarquia
(p.ex.rodovia uma rua). Arcos topolgicos descrevem relaes entre objetos do
mesmo nvel hierrquico (p.ex. chapa divisora central da rodovia encontra-se entre
pistas de rolagem).

Arcos hierrquicos descrevem a relao entre dois ns em nveis adjacentes da hierarquia.


AIDA oferece os seguintes tipos:

is-a: A hereditariedade clssica produzida com o arco is-a. O n filho herda todas as
caractersticas do n pai.

part-of: O n filho parte do n-pai. Um nmero mnimo e mximo de ns-filho deste tipo pode
ser indicado. A diferena entre mximo e mnimo descreve o nmero dos ns opcionais.

cdpart-of: Alguns objetos parciais exigem a existncia de uma determinada combinao de


outros objetos parciais, isto , precisam de um contexto especial. Estas relaes so realizadas
atravs de arcos part-of dependentes do contexto ou resumidamente cdpart-of.

concrete-of: Significados simblicos precisam ser associados a geometrias concretas na


imagem. A passagem entre dois nveis conceituais descrita pela relao concrete-of.

data-of: Atravs da relao data-of os ns de dados so associados ao nvel de


processamento de imagem.

Como extenso em relao a outros sistemas de interpretao baseados em redes


semnticas, AIDA introduz arcos topolgicos. Arcos topolgicos descrevem a relao entre
objetos do mesmo nvel da hierarquia. O tipo de relao topolgica para isto determinado
atravs dos atributos associados ao arco. Por isso o arco designado como relao atribuda
ou resumidamente att-rel.

Tal como em VISIONS e ERNEST o processamento de imagem parte do sistema, sendo


executado no nvel mais inferior. Novas rotinas de processamento de imagem podem ser
introduzidas atravs da linguagem de script TCL. Com as primitivas geradas no nvel de
processamento de imagens opera-se ento de modo puramente estrutural. A escolha da
melhor combinao de estruturas efetuada globalmente atravs de um algoritmo A*.

25
3.2. Concepo do novo sistema de anlise de imagens
GeoAIDA
Os sistemas aqui apresentados possuem muitas caractersticas comuns. Todos os sistemas
utilizam, por exemplo, uma rede semntica para a representao do modelo de conhecimento.
VISIONS combina os ns da rede atravs de arcos part-of. Conexes transversais entre os ns
so possveis atravs de estratgias de esquemas, que precisam ser novamente trabalhados
para cada problema. ERNEST disponibiliza dois outros tipos de arcos, is-a e con-of, que
implementam um mecanismo de hereditariedade, ou seja, que permitem a conexo de ns em
diferentes nveis de abstrao. AIDA finalmente amplia a rede semntica atravs da
representao de relaes de vizinhana, dentro de um plano de hierarquia, atravs de um
arco, que descreve relaes atribudas. A associao s primitivas da imagem se faz atravs
de um arco data-of. Tanto ERNEST como AIDA utilizam para a procura da melhor soluo, um
algoritmo A*, ou seja, processado preferencialmente o conjunto de solues mais promissor.
No sistema VISIONS o processamento de imagem um componente fixo. VISIONS e AIDA
conectam os dados respectivamente somente nos ns-folha da rede semntica. Em nveis
mais elevados continua se trabalhando estruturalmente com estes ns.

Para a interpretao de dados de sensoriamento remoto, AIDA o sistema mais adequado,


visto que permite especialmente tambm a incorporao de conhecimento prvio a partir de um
SIG. No entanto, a desvantagem que a conexo de dados ocorre no plano mais baixo da
rede semntica e posteriormente o trabalho exclusivamente estrutural. Nas grandes imagens
de entrada do sensoriamento remoto, originam-se grandes quantidades de dados brutos de
imagem, que precisam ser agrupados atravs do algoritmo A* para a soluo que melhor adere
ao modelo. Embora o algoritmo A* persiga a soluo parcial que entre todas as combinaes
a mais promissora, este procedimento no adequado para o processamento de grandes
imagens, como ocorre com freqncia na prtica, devido ao tempo de processamento muito
longo.

Por isso, para a aplicao na anlise de dados geogrficos foi desenvolvido um sistema
sucessor que utiliza as experincias obtidas com AIDA, e otimizado para dados de
sensoriamento remoto. Em funo da principal rea de aplicao do novo sistema, o programa
foi denominado GeoAIDA. As diferenas entre ambos os sistemas so resumidas a seguir:

GeoAIDA, mesmo em seu ncleo, constitui-se to-somente do gerenciamento de uma rede


semntica e do controle de seqncia da anlise. Durante a anlise GeoAIDA d partida a um
conjunto de programas externos, que cuidam da segmentao, classificao e avaliao
propriamente ditas. Os dados de sensoriamento remoto se encontram geocodificados num
conjunto de dados de imagem. A partir deste conjunto de dados de imagem, GeoAIDA gera as
imagens parciais necessrias para a execuo de um operador.

Atravs da total separao da avaliao em operadores externos, a implementao de


relaes especiais entre os ns da rede semntica desnecessria em GeoAIDA. Enquanto
em AIDA para a introduo de novas relaes como p.ex. na proximidade de eram
necessrias alteraes no sistema, em GeoAIDA esta tarefa executada por um programa
externo, que pode testar quaisquer relaes entre os ns que lhe so enviados. Para diferentes
tipos de relaes, existem aqui programas otimizados para a respectiva finalidade na
aplicao.

Em AIDA a associao com os dados ocorre conceitualmente no plano mais baixo. A anlise
ento rene os dados brutos reconhecidos na imagem em estruturas maiores. A escolha de
estruturas alternativas conformes ao modelo ocorre aqui atravs de um algoritmo A*. Isto pode
resultar, no entanto, no caso de um grande volume de dados brutos, num tempo
computacional muito longo. Em GeoAIDA a conexo de dados pode ocorrer em cada n da
rede semntica (vide Figura 3.5). Os assim chamados operadores holsticos segmentam os
dados de imagem em regies menores. Estas regies ento so processadas mais adiante por
operadores especficos de regies. Se num n no houver um operador de segmentao, a
anlise continua convencionalmente atravs dos componentes do n (estruturalmente).

26
Rede Semntica Conexo de Dados

Cena
Conhecimento Prvio

Regio SIG
Planos Hierrquicos

Povoamento rea Industrial Floresta rea Agrcola


Dados de Imagem

Casa rea Verde Prdio Estacionamento Campo

Telhado Telhado Carro Asfalto

Legenda: N de Conexo N de Folha


Fig. 3.5: Em GeoAIDA dados podem ser conectados em qualquer plano hierrquico da rede semntica.

Em AIDA o processamento de imagem propriamente dito executado na linguagem de script


TCL. GeoAIDA rene todo o processamento de imagem e a avaliao atravs de programas
prprios, que podem estar escritos em qualquer linguagem de programao. Assim, possvel,
por um lado utilizar programas eficientes em linguagens compiladas, e por outro lado usar
tambm programas comerciais, cujas fontes no esto disponveis. Isto inclui, dentre outros,
tambm as solues especiais para a deteco de determinadas classes de objetos,
mencionadas no incio deste captulo.
GeoAIDA foi estabelecido para a interpretao de dados de sensoriamento remoto. Por isso, a
cada objeto da rede de instncias est associada uma regio no espao bidimensional.

O projeto da rede semntica ocorre em GeoAIDA sob dois pontos de vista:

baseado na hierarquia de objetos desejada, como p.ex. consta num SIG e

baseado numa possvel estratgia de soluo.

Estratgia de soluo do problema. A interpretao de dados de sensoriamento remoto um


problema bastante complexo. O procedimento usual para a soluo de problemas complexos
a subdiviso do problema em problemas parciais, na medida do possvel, independentes um do
outro. Aqui podem ocorrer os trs seguintes casos (Figura 3.6):

Fig. 3.6: Subdiviso do problema em problemas parciais: (a) os problemas A1 e A2 so independentes um do outro,
podem ser resolvidos individualmente e levam a uma soluo total do problema A. (b) A1 depende de A2. Para a
soluo do problema A por isso inicialmente necessria a soluo do problema A2, e assim com a soluo do
problema A1, a soluo total de A pode ser obtida. (c) A1 e A2 dependem em ambas as direes um do outro. O
problema total A ento somente pode ser resolvido, via de regra, iterativamente.

1. Os problemas parciais podem ser resolvidos independentemente um do outro (Figura


3.6a). O conjunto de solues do problema completo resulta da unio dos conjuntos
de solues individuais, sendo que, no caso de conjuntos de solues parciais no-

27
disjuntos, ser necessrio tomar uma deciso a favor de uma soluo parcial. Com
relao interpretao de dados de sensoriamento remoto isto significa que duas
classes de objetos, podem ser reconhecidas de modo independente. O processamento
pode ocorrer em paralelo.

2. Os problemas parciais so unidirecionalmente dependentes um do outro (Figura 3.6b),


porm no formam uma estrutura circular. Os problemas parciais so resolvidos na
ordem definida pelas dependncias. Via de regra na anlise do problema seguinte
pesquisado somente o espao de soluo livre. Superposies de conjuntos de
solues precisam ser resolvidas, tais como no ponto 1.

3. Os problemas parciais so reciprocamente dependentes um do outro ou formam


estruturas circulares. A soluo neste caso, via de regra, somente poder ser
encontrada iterativamente. Concretamente isto significa que o reconhecimento de
ambas (ou todas) as classes de objetos ocorre dentro de uma anlise.

Em todos os trs casos podero ocorrer superposies dos conjuntos de solues. Por isso
desejvel que a soluo dos problemas parciais venha acompanhada de uma avaliao da
qualidade da sua classificao. Com base nisso pode ocorrer, na fuso de solues parciais,
uma resoluo de conflitos. No GeoAIDA tanto a soluo parcial como tambm a fuso de
solues parciais so efetuadas por programas externos..

Visualizao de resultados. Devido grande quantidade de dados de entrada, os resultados


calculados tambm so extremamente complexos. Coloca-se ento a questo de como estes
resultados podem ser apresentados ao usurio de forma mais adequada. Para tanto, GeoAIDA
disponibiliza um mapa interativo, a partir de trs componentes: redes semntica, redes de
instncias e imagens de rtulos (label image), as quais descrevem a posio dos objetos. A
rede semntica bem como a rede de instncias, gerada com ajuda dos dados, so
representadas na forma de uma rvore, onde ramos individuais podem ser eliminados.
Paralelamente a isto, num mapa so registrados os objetos atualmente visveis nas redes.
Como auxlio, os dados originais do mapa podem ser superpostos. Alternativamente, no mapa
podem ser escolhidos objetos cujas caractersticas podero ento ser avaliadas na rede de
instncias.

28
4. Arquitetura de um sistema de interpretao de cenas
baseada em conhecimento - GeoAIDA
O Sistema GeoAIDA consiste de vrios componentes, que podem ser utilizados
independentemente um do outro (veja Fig. 4.1). No nvel mais baixo so disponibilizadas
bibliotecas C e C++, que permitem a leitura e manipulao de imagens, assim como o
processamento simblico de conjuntos de objetos.

Os passos de processamento freqentes so implementados em pequenos programas


executveis, que operam como filtros parametrizados. Da combinao de vrios filtros resultam
operadores necessrios ao sistema de anlise de imagens baseado em conhecimento -
GeoAIDA. Para avaliao de dados de imagens so oferecidas algumas ferramentas grficas.
Um sistema experimental para o projeto de operadores, assim como o analisador de imagens
GeoAIDA com uma unidade de visualizao integrada constituem a ferramenta de alto nvel.

4.1 Biblioteca base para o processamento de dados de


sensores remotos
Na biblioteca bsica esto disponveis diversas funes que so utilizadas freqentemente.
Foram desenvolvidas bibliotecas para o armazenamento de dados de sensores remotos, para
a manipulao de imagens de diferentes tipos, para o clculo entre coordenadas da imagem e
do mundo, assim como para o processamento de conjuntos de objetos. Um parser para a
leitura de objetos baseados na linguagem XML e de seus atributos est disponvel.

29
Entrada/Sada de imagem
Bibliotecas
Classe da imagem, Manipulao da imagem, Reclculo das geo-coordenadas,
Processamento simblico dos volumes de objetos, Parser XML

Programas

Gerador de f
Banco de Filtro
Projeto
dados de
imagem

Sistema d
Recorte de Experimental para
Visualizao de
Dados de O Projeto do
Dados e Imagens
Imagem Operador

e
Mapa com - Editor para Rede Semntica; Operadores
Multi-detalhe - Comando da Anlise;
- Visualizao do Resultado

Figura 4.1: Viso geral do projeto GeoAIDA: Os dados relativos a imagens so mantidos num banco de dados
(a). Atravs do gerador de projetos (b) podem ser selecionados segmentos da imagem (c). O sistema
experimental (d) possibilita a criao interativa de operadores a partir de programas de filtragem prontos ou
desenvolvidos especialmente para a aplicao (f) ou o uso de operadores j existentes (e). Atravs do
programa de visualizao de imagens e dados (g) pode-se avaliar os resultados (c) do sistema experimental
(d), ou seja, o gerador de projetos (b) como tambm os resultados (i) do GeoAIDA (h).Para o processamento
de imagem todos os programas utilizam bibliotecas comuns.

4.1.1. Formato simples para a movimentao de dados de sensores


remotos

Dados de sensores remotos se apresentam como campos de dados bidimensionais. Para


alcanar uma exatido suficiente dos dados, a faixa dinmica excede freqentemente o
intervalo definido em 8 bits. Como freqentemente os dados so oriundos de diferentes fontes,
eles no se apresentam num formato uniforme. Contudo, em geral possvel transform-los
num formato raster simples, em que os dados esto organizados em linhas. Para a localizao
dos dados ainda importante indicar as coordenadas geogrficas e sua resoluo.

Formatos de imagens convencionais so tambm do tipo raster, em que os dados tambm


esto organizados em linhas. Contudo, a maioria dos formatos de imagem suporta apenas
valores de 8 bits, ou exigem uma indicao da ordem do byte quando se excede este limite.

Vrios algoritmos de processamento de imagens assumem certos intervalos de valores e tipos


de dados, de tal forma que dados de imagens freqentemente devem ser convertidos entre
diferentes formatos.

Para trabalhar com dados de sensores remotos foi desenvolvido, por isso, um formato de
dados, que independente da arquitetura do computador, do intervalo de valores em 8 bit, 16
bits, 32 bits e em ponto flutuante, de escala e translao, e que suporta a transformao de tipo
no momento da leitura do dado.

30
O formato consiste de um cabealho na forma de texto (ASCII), seguido dos dados raster (texto
ou binrio) linha-a-linha. Este formato tem a vantagem, de que o cabealho pode ser gerado
com qualquer editor. Um arquivo vlido consiste, portanto, da simples concatenao do
cabealho e dos dados primrios (raw data). O cabealho contm informao sobre o tipo do
dado, o tamanho e os valores mnimo e mximo dos dados. Opcionalmente, as coordenadas
geogrficas, assim como comentrios, podem ser acrescentadas. O arquivo como um todo
pode ser comprimido com o uso de programas corriqueiros de compresso para reduzir seu
tamanho.

Para o processamento destes formatos de dados disponibiliza-se uma biblioteca em C, que


suporta a leitura e escrita de dados. Na leitura os dados podem ser automaticamente
transformados a partir de diversos formatos. Em casos especiais at mesmo possvel
oferecer uma funo de transferncia, que pode ser utilizada com qualquer dado. Como o
formato de dados aqui descrito muito semelhante ao muito difundido formato PAM, a leitura e
escrita desse formato tambm so suportadas.

4.1.2. Classe de imagem para a manipulao de dados de sensores


remotos

Dados de sensores remotos se apresentam em diferentes estruturas de dados. Assim, imagens


em tons de cinza freqentemente so armazenadas em estruturas de dados de 8 bits,
enquanto imagens de altitude freqentemente se apresentam em 16 bits ou em ponto flutuante.
Um sistema experimental como o GeoAIDA deve, por um lado, ser capaz de processar estes
tipos de dados, e por outro lado, possibilitar a transformao de algoritmos criados visando um
determinado tipo de dados para outros tipos de dados.

Para passar da idia rapidamente para o prottipo, os tipos de imagens devem corresponder
tanto quanto possvel aos tipos mais simples de dados. O gerenciamento da memria
necessrio para as imagens deve estar encapsulado na classe imagem. Tendo em vista que os
dados de sensoriamento remoto so tipicamente volumosos, deve-se evitar a replicao dos
dados.

No sistema GeoAIDA este objetivo alcanado atravs da estrutura mostrada na figura 4.2

Figura 4.2: Na Classe Imagem GeoAIDA os tipos de dados so completamente encapsulados. Uma funo
desenvolvida para um determinado tipo de dados pode ser usada desta maneira utilizando um outro tipo de
dados. Atravs do uso de compartilhamento de dados implcito pode-se trabalhar de modo igualmente
simples, como com tipos de dados simples, sem se utilizar mais memria do que o estritamente
necessrio.

31
A independncia do tipo de dados deriva de uma classe base ImageBase, que contm todos os
mtodos da classe de tipo especfico na forma de mtodos virtuais. Destas derivam as classes
de tipo especfico ImageT<type>, para as quais se recomenda o uso de Templates, uma vez
que os textos fonte de classe de tipo especfico se distinguem apenas nos tipos de dados
utilizados. A classe de tipo especfico ImageT<type> contm, conforme o nmero de canais,
ponteiros do container de dados bidimensional Array2DT<type>, o qual contm os prprios
dados da imagem. Estes containers de dados so derivados da classe SharedData, atravs da
qual se faz o gerenciamento da memria. A cpia dos dados, p.ex. numa atribuio, se d
atravs de uma simples cpia dos ponteiros aos dados propriamente ditos e incremento dos
contadores de referncia. No caso de um acesso de escrita, verifica-se se h mais de uma
referncia aos dados. Em caso afirmativo, deve-se fazer uma cpia dos dados. Acessos de
leitura de vrias fontes mesma rea de dados so permitidos.

A estrutura de classes descrita permite o processamento de imagens de modo independente


do tipo de dados. O tipo do dado deve, no entanto, ser conhecido no momento da abertura de
uma imagem e no poder mais ser alterado. Quando, p. ex., uma imagem lida de um
arquivo, o tipo de dado no em todos os casos previamente conhecido. Por outro lado, a
classe bsica virtual sem tipo ImageBase no pode ser criada. A soluo oferecida pela
classe Image, que contm um ponteiro para a classe bsica virtual ImageBase, e que pode ser
criada independente do tipo. Somente quando o tipo definido, p. ex. atravs da leitura dos
dados da imagem, cria-se a correspondente classe de um tipo especfico ImageT<type>. Todos
os tipos de dados devem ser conhecidos da classe Image. Se o conjunto de tipos de dados a
serem processados for estendido, ser necessrio introduzir complementos a esta classe. A
restrio dos tipos de dados tem a vantagem de que, ao contrrio de uma biblioteca puramente
template class, uma biblioteca poder ser compilada previamente.

A classe imagem contm todas as funes fundamentais de manipulao de imagem, desde o


acesso a pixels individuais at diferentes algoritmos para a re-amostragem da imagem.
Havendo mais do que um usurio da classe imagem, novas funcionalidades no devem ser
integradas classe original Image ou s classes dela derivadas na forma de mtodos. Se o
usurio A implementa seus mtodos na classe derivada ImageA, e o usurio B na classe
ImageB, os mtodos correspondentes s podero ser usados pelo outro usurio numa classe
derivada tanto da classe ImageA quanto da classe ImageB. Deve-se fazer uso de um mtodo
da Standard Template Library (STL) j utilizado, isto , funes so escritas para serem
utilizadas na classe imagem. Desta forma possvel combinar funes de diferentes origens.
Enquanto na STL funes so realizadas como puramente funo template de tipo
configurvel, existem na classe imagem duas possibilidades de implementao. A primeira
atravs dos mtodos independentes de tipo da classe Image. Um mtodo mais eficiente
computacionalmente a implementao como uma funo template sobre a classe
ImageT<type>. Isso corresponde ao procedimento numa STL. Alm disso, deve-se instanciar
uma funo template para todos os tipos de dados em uma funo independente de tipo
atravs de uma j disponvel. Esta nova funo independente de tipo pode ser utilizada por
todos os usurios, sem que eles tenham que fazer modificaes nas suas prprias funes.
Este segundo mtodo adequado especialmente para aplicaes em que o tempo de
processamento crtico, como p.ex. nas operaes que so executadas pixel-a-pixel. Funes
como p. ex. gradiente e varincia, foram implementadas desta maneira.

4.1.3. Coordenadas geogrficas e da imagem

O sistema de anlise de imagens GeoAIDA opera internamente com um sistema


geodesicamente referenciado. Isso tem a vantagem de possibilitar uma descrio da posio
na imagem tanto em relao ao mundo externo como tambm entre os segmentos da imagem.
Desta maneira, a transformao das coordenadas da imagem em coordenadas geogrfica e
vice-versa relativamente simples. Deve-se, contudo observar que um pixel tem dimenso
enquanto um ponto em coordenadas geogrficas tem dimenso nula, isto , um pixel descreve
uma rea em coordenadas geogrficas; um intervalo de valores de coordenadas est
associado ao pixel. Quando se tem as coordenadas geogrficas do retngulo envolvente, surge
a questo sobre qual a posio exata do pixel na imagem. Admitindo que os eixos das
coordenadas geogrficas e das coordenadas da imagem so paralelos, existem em princpio
quatro possibilidades de se distribuir o pixel nas coordenadas geogrficas (veja Figura 4.3). Em

32
benefcio da simplicidade s se mostra uma dimenso da imagem. A imagem possui nesta
dimenso xsize pontos, que vo de 0 a xsize -1. A rea limitada pelas coordenadas geogrficas
xgW (West) e geogrficas xgE (East).

1. Pixel 0 fica no centro da coordenada xgW e o pixel a xsize -1 no centro da coordenada


xgE . Os demais pixels so distribudos linearmente entre estes (figura 4.3a). Isso tem a
desvantagem de que metade dos pixels num extremo extrapolam a rea descrita por
xgW... xgE . Alm disso, o clculo do tamanho do pixel atravs da frmula (xgW -
xgE)/(xsize-1) fica desnecessariamente complicado. O maior problema , contudo, que os
pixels extremos pertencem a dois segmentos adjacentes.

Coordenadas Geogrficas
Pixel

Figura 4.3: Vrias possibilidades de associao de pixels a coordenadas geogrficas: (a) pixel 0 e pixel xsize esto nos
limites das coordenadas, 9(b) O 0-simo pixel fica no limite xgW mais a esquerda das coordenadas, e direita fica o
pixel xsize (=0-simo pixel da prxima regio), (c) como b) com exceo de que o limite direito da imagem est sobre a
coordenada xgE , d) pixels se localizam no meio da grade de coordenadas geogrficas

2. O problema mencionado por ltimo no aparece na figura 4.3b. O pixel 0 est na


coordenada xgW . Na coordenada xgE est localizado o pixel xsize , que na verdade j
no pertence imagem. Esta configurao tem a desvantagem de que metade do pixel
0 pertence regio desenhada, enquanto que no lado direito falta metade de um pixel.

3. A configurao da figura 4.3c tem o mesmo problema, s que invertem-se os lados em


relao ao caso anterior.

4. A figura 4.3d mostra a associao tima dos pixels em coordenadas geogrficas. Os


pixels se localizam dentro das regies xgW... xgE . O tamanho do pixel se calcula como
(xgW - xgE)/xsize . Duas regies adjacentes no possuem reas de sobreposio.

33
Figura 4.4: Clculo da transformao entre coordenadas geogrficas e pixels com 3 exemplos de regies:
(a) mostra a bounding box em pixels e coordenadas geogrficas contendo os pixels por inteiro, (b) contm
pixels por inteiro, (c) a regio que tem um nico pixel associado.

Impondo-se a condio de que todo pixel esteja inteiramente contido na regio descrita e que
duas regies adjacentes no contenham pontos comuns, resulta o seguinte procedimento para
transformao entre coordenadas geogrficas e da imagem (veja Fig. 4.4):

34
A tabela 4.1 resume o procedimento de transformao entre coordenadas individuais
geogrficas e coordenadas da imagem, assim como entre retngulos envoltrios (bounding
boxes).

4.1.4. Biblioteca para o processamento de conjuntos de objetos

Uma biblioteca com funes para o processamento de conjuntos de objetos j foi desenvolvida
em [25]. Ela permite a leitura de conjuntos de objetos, a definio de parmetros de forma e de
vizinhana (que podem ser utilizados em algum clculo), o agrupamento de objetos, assim
como a disponibilizao de grupos de objetos para processamento subseqente no GeoAIDA.

A biblioteca foi expandida neste trabalho e seu campo de aplicao estendido classificao
de segmentos de imagem. Em particular um processamento simblico controlado por um
parser para o processamento de objetos foi aperfeioado (vide item 4.6.2).

Tabela 4.1: Procedimento para transformao de retngulos envoltrios (bounding boxes) entre
coordenadas da imagem e geogrficas de acordo com a Fig. 4.4.

4.1.5. Parser para a interpretao de arquivos XML

O GeoAIDA constitudo de vrios componentes independentes, que trocam informaes


entre si. Neste contexto convm diferenciar duas coisas: o meio atravs do qual se trocam
dados, e o formato dos dados. Como meio esto disponveis, pipes, sockets ou simples
arquivos ([99]). Pipes representam um mtodo eficiente para a troca de dados entre dois
processos, que so executados num mesmo processador. Sockets possibilitam a troca de
dados entre computadores. Pipes e sockets no tm lembrana/memria, isto , ao serem
solicitados por um processo que faz a leitura, os dados so perdidos. Arquivos tm a vantagem
de serem suportados por todos os programas para a leitura de dados. Como o GeoAIDA em
particular deve conter programas j existentes, esta forma de transferncia de dados se torna
adequada.

O meio de transferncia no impe restries ao formato de dados. Para a transferncia de


dados de imagem utiliza-se o formato descrito na seo 4.1.1, no qual dados podem ser
transformados facilmente. Caso um programa precise de um outro formato, um filtro dever ser
primeiro ativado. A troca de informaes adicionais ocorre atravs de um arquivo ASCII, que
pode ser lido sem dificuldade no caso de ocorrerem erros de qualquer tipo. Nestes arquivos
ASCII a informao registrada segundo o formato XML, j que XML foi criado especialmente
para a descrio de uma hierarquia de objetos com atributos. Cada n da hierarquia iniciado
por um marcador inicial (start-tag) e terminada por um marcador final (end-tag). Entre o
marcador inicial e o final podem-se descrever sub-ns.

35
Marcadores iniciais so iniciados com o caractere <. Logo aps o < tem-se o nome do
marcador. Pode-se seguir ao nome do marcador uma lista de atributos que definem certas
caractersticas ao n que est sendo descrito. O marcador inicial termina com o caractere >. Se
o n no contm sub-ns, o marcador inicial pode ser encerrado tambm com />. Neste caso
no necessrio ter nenhum marcador final.

O marcador final se inicia com os caracteres </. Segue-se o nome do marcador que deve
corresponder a um marcador inicial anterior. O marcador final no tem atributos.

A lista de atributos, definida no marcador inicial tem o formato AttributeName=Value, no qual


mltiplos atributos podem ser separados por espaos. AttributeName e Value podem ser
constitudos por quaisquer caracteres. No caso em que se utilizem caracteres que tambm so
usados para iniciar ou fechar o marcador, deve-se colocar a expresso entre aspas . O
caractere deve ser precedido de uma barra invertida \; o mesmo vale naturalmente tambm
para o smbolo \.

No exemplo a seguir so representados um total de trs ns. Dois do tipo region e um do tipo
subregion. Subegion filho do n region Knoten2. O n region com nome Knoten1 e o
n subregion so ns simples sem filhos. Portanto as suas descries podem ser fechadas
com />, enquanto que o segundo n requer um marcador final ( </region> ). Ambos os ns
region possuem respectivamente os atributos id e name; subregion possui id e label. O
atributo label Baum Oskar mostra, como se podem utilizar caracteres especiais integrando
o caractere \ (barra invertida) no valor do atributo.

<region id=5 name=Knoten1/>


<region id=3 name=Knoten2>
<subregion id=6 label=Baum \Oskar\/>
</region>

4.2. Descrio funcional da anlise de dados


A anlise baseada em modelo constitui o ncleo do projeto GeoAIDA. Na figura 4.5 so
apresentados os componentes do processo de anlise de dados realizado atravs do
GeoAIDA. No lado das entradas (direito) encontram-se a rede semntica, que representa o
modelo de conhecimento que descreve a cena a ser interpretada, e a base de dados, na qual
as imagens, dados altimtricos e dados de GIS (Geographic Information Systems) esto
armazenados. Entende-se aqui por dados de GIS tambm as informaes que foram sendo
levantadas ao longo do processo de interpretao e que foram sendo armazenadas no banco
de dados. Durante a interpretao da cena os dados de entrada so processados com o auxlio
de operadores top-down e bottom-up. Operadores top-down particionam uma regio da
imagem em sub-regies e geram as correspondentes hipteses de objetos. Operadores
bottom-up avaliam as hipteses e as rene em grandes unidades (grupos). O resultado da
interpretao tem a forma de um mapa interativo, composto de uma descrio simblica da
cena e de um mapa temtico. A partir do mapa interativo podem-se gerar diferentes mapas
dinmicos com diferentes contedos. O ncleo do GeoAIDA implementa o controle do sistema,
que manipula os dados de entrada e o modelo de conhecimento, que gera hipteses sobre a
cena com auxlio dos operadores top-down, que avalia tais hipteses atravs dos operadores
bottom-up e que constri uma rede de instncias com correspondentes imagens rotuladas, as
quais descrevem a posio dos ns na rede de instncias. A partir desta rede de instncias e
os correspondentes dados segmentados pode-se gerar mapas com diferentes graus de
detalhamento.

36
Operadores externos

Entrada Resultado

Rede semntica Rede semntica Hipteses Instncias Descrio simblica da cena

Base de dados Mapa temtico

Foto Floresta
area

Indstria

Comando do sistema Prdio

Figura 4.5: Construo do analisador de cena GeoAIDA: Como dados de entrada pode-se ter qualquer dado de
sensores remotos, assim como dados de GIS. Em conjunto com um modelo da cena representado numa rede
semntica e com o auxlio de operadores externos, o controle do sistema produz o resultado na forma de uma
descrio da simblica da cena e a label image associada, da qual se podem facilmente construir mapas
temticos.

4.2.1. Base de Dados

Entende-se neste texto como base de dados todos os dados de entrada disponveis para a
interpretao da cena. Estes podem ser imagens de diversos sensores, como VIS, Laserscan,
IR ou SAR. Por outro lado podem ser utilizados tambm informaes de bancos de dados
como GIS ou resultados de uma interpretao anterior. Considerando que a ligao entre estes
dados feita por operadores externos, restries podem resultar apenas dos operadores de
imagem e de processamento de dados. O GeoAIDA gerencia apenas regies bidimensionais,
que esto associadas aos ns de uma rede de hipteses ou rede de instncias.

37
4.2.2. Rede Semntica

O modelo de conhecimento sobre a cena a ser interpretada est representado numa rede
semntica (figura 4.6). A associao dos ns estritamente hierrquica, isto , cada n tem
exatamente um n superior (n pai). O n mais superior o n cena. Cada n corresponde a
uma classe de objeto potencialmente presente na cena. Pode-se associar atributos a cada n.
Alm de atributos genricos como Name e Class, pode-se associar a cada n um operador top-
down e um operador bottom-up. Idealmente o operador top-down deve ser capaz de detectar
na imagem objetos do tipo da classe do n, tais operadores so chamados de operadores
holsticos

Cena

Regio

Vila rea til

Aglomerao Indstria Campo agrcola Grama Floresta

Casa Jardim Prdio Estacionamento

N N
Com operador Top-down holstico Sem operador Top-down holstico
.
Figura 4.6: Exemplo de uma rede semntica conceitual. A rede conceitual no GeoAIDA construda de forma
estritamente hierrquica. Nos ns faz-se distino entre objetos que podem ser encontrados por operadores de
processamento de imagens diretamente na imagem (holstico), e objetos que podem ser definidos apenas
estruturalmente, isto atravs de seus componentes. O significado dos arcos atravs da estrutura hierrquica
corresponde genericamente a uma relao part-of, a qual inclui a relao is-a como subconjunto.

Em relao a ele os ns sem operador holstico precisam ser reconhecidos estruturalmente a


partir dos seus sub-ns. A partir dos objetos detectados so gerados ns instncia hipotticos.
O operador bottom-up procura relaes entres os sub-ns e os agrupa em objetos da classe do
n. A partir destes objetos so gerados ns instncia parciais. Os operadores top-down e
bottom-up podem ser configurados atravs dos atributos especficos de cada operador.

38
Node: Casa
General Attributes:
Name: Casa
Objectclass: Casa
Color: 255:0:0
TopDown-Operator: Detect_Building
TopDown MultiClass: False
BottomUp-Operator: None
TopDown Attributes:
Input-Data: Laserscan
Height-Step[m]: 2
Min-Size[m 2]: 30
Max-Size[m 2]: 200
BottomUp Attributes:

Figura 4.7: Ns de uma rede semntica com atributos gerais e


especficos para a configurao dos operadores top-down e
bottom-up associados.

A figura 4.7 mostra um exemplo de um n Casa de uma rede semntica. O atributo Name
define o nome com o qual o n aparece na rede. O atributo Class usado pelo GeoAIDA para
a identificao das regies classificadas, segundo as quais os operadores top-down e bottom-
up so executados. A cor definida atravs do atributo Color usada para representar objetos
deste tipo na rede semntica e no mapa resultante da interpretao. Os atributos operador-
bottom-up e operador-top-down definem os operadores que devem ser ativados para a
deteco e validao de objetos desta classe na correspondente posio na anlise. Quando o
atributo Top-Down-Multi-Class ativado, significa, que o operador top-down capaz de
detectar classes distintas. Com este tipo de operador pode-se instanciar objetos da classe do
n como tambm objetos de classes descendentes (filhas) do mesmo n superior (pai). Os
atributos Top-Down-Attributes servem para a configurao do operador top-down selecionado.
O operador top-down mencionado no exemplo requer uma imagem de altitude como dado de
entrada, um degrau de altura a ser detectado, assim como os tamanhos mximo e mnimo da
regio a ser reconhecida. Como o n apresentado um n folha, no se requer um operador
bottom-up.

4.2.3.. Operadores Top-Down

Operadores top-down (Fig. 4.8) so operadores externos de processamento de imagens, que


identificam regies associadas a objetos de uma ou mais classes. Alm disso, tais operadores
recebem uma mscara, que descreve o segmento da imagem a ser analisado. Se o operador
de processamento de imagem no consegue processar mscaras, o procedimento de
mascaramento da segmentao pode tambm ser desativado. Um operador top-down produz
como sada uma lista de regies classificadas e a correspondente imagem rotulada, que
descreve a posio das regies.

Em princpio, um operador top-down no est limitado ao processamento de dados de


imagens. possvel fornecer as coordenadas geogrficas a serem processadas e com isso, p.
ex., procurar objetos em bases de dados GIS. Necessariamente o resultado deve se constituir
de uma lista de regies e da correspondente imagem rotulada.

39
P Figura 4.8: Funcionamento de um operador top-down: o operador top-down recebe como entrada o segmento de
imagem a ser processado. Uma mscara pode restringir mais ainda a rea a ser trabalhada. Ele gera como sada
uma imagem rotulada e a correspondente lista de regies classificadas que descreve os objetos encontrados mais
detalhadamente.

4.2.4. Operadores Bottom-Up

A avaliao e o agrupamento de conjuntos de objetos ocorrem nos operadores externos


Bottom-Up (figura 4.9). Tais operadores recebem uma lista de objetos e imagens rotuladas de
suas correspondentes regies, das quais se pode extrair a posio exata e a forma dos
objetos. Com estas informaes e outros atributos que foram associados ao objeto na fase top-
down, assim como informaes de fontes externas, tais como bases GIS, o operador pode ser
executado e, quando for o caso, ajustar a forma de objetos, ou simplesmente descartar objetos.
Outras caractersticas como vizinhana e freqncia podem ser repassadas ao processo
subseqente de agrupamento, no qual objetos das classes de objetos superiores so reunidos.
O operador bottom-up gera para estes novos objetos uma imagem rotulada, que descreve sua
localizao. No final, a descrio dos grupos juntamente com a imagem rotulada so
repassadas ao GeoAIDA. Dentro do GeoAIDA os objetos verificados se tornam apenas
instncias parciais. Quando mais de um grupo reconhecido, o n hiptese original, cujo n
filho foi avaliado no operador bottom-up, dividido de modo correspondente.

40
Figura 4.9: Operao de um operador bottom-up: este operador recebe uma lista de ns hipotticos com a
imagem rotulada correspondente. Estes ns so avaliados, o que pode alterar as correspondentes imagens
rotuladas e agrupar em classes de objeto de nvel superior. Uma imagem rotulada gerada com os grupos
produzidos .

4.2.5. Mapa interativo

A anlise com o GeoAIDA produz uma rede de instncias que contm todos os objetos
verificados. A ordenao dos ns estritamente hierrquica, ou seja, as regies associadas
aos ns de nvel mais baixo esto completamente contidas nas regies associadas aos ns de
nvel mais alto. Adicionalmente, os ns de um nvel da hierarquia so disjuntos no que diz
respeito s regies associadas. Por isso possvel representar todos os objetos de uma rvore
de instncias num mapa 2D (veja seo 4.5.1).

Com o auxlio da rede semntica, da rede de instncias e do mapa correspondente, possvel


construir mapas interativos. A abertura e o fechamento de rvores parciais na rede semntica
e/ou na rede de instncias leva ao detalhamento ou generalizao do mapa ou de partes do
mapa (veja seo 4.5.2).

4.2.6. Controle da anlise

A tarefa fundamental do GeoAIDA o controle do processo de anlise. A anlise ocorre em


dois passos. Inicialmente, na fase top-down, so geradas hipteses para os objetos
encontrados na cena. Para a gerao de hipteses so usados operadores holsticos de
processamento de imagens. Surge assim uma rede de instncias. Na fase bottom-up, estas
hipteses so verificadas com base nas caractersticas dos objetos, tais como a rea, e em
relaes estruturais entre objetos, como p.ex. relaes de vizinhana. Constri-se assim a rede
de instncias (seo 4.3).

4.3. Descrio do processo de interpretao de uma imagem


Seja S um n da rede semntica, H um n hipottico e I um n instanciado. Seja N um n
genrico, e sejam N um sub-n de N, N um sub-n de N, e assim por diante. Denota-se com
TN uma rede de ns N, onde TN hierarquicamente estruturada, ou seja, na verdade uma
rvore.

41
P descreve uma imagem parcial, qual o n N est associado. P est, portanto, associado ao
n N. Na rede de hipteses TN todos os P so subconjuntos de P. Na rede de instncias
todos os pares Pk e Pl so disjuntos.

O objetivo do GeoAIDA agora aplicar o conhecimento da rede semntica TS imagem parcial


P e produzir uma rede de instncias associada imagem parcial TPl.

Processamento top-down da rede semntica. O processamento top-down est apresentado


na parte superior da figura 4.10. Inicialmente o n S da rede semntica criado associando-se
a imagem parcial P ao n hipottico H.

O n hipottico H produz ento com o auxlio do n semntico Si da rede e da imagem parcial


P o n hipottico Hik, ao qual esto associados as imagens parciais PHik. Assim, podem surgir
de um Si mltiplos ns Hi de tipo Si , aos quais diversos PHik estaro associados. Se no
houver um operador top-down para o n Si , ser gerado um n hipottico Hi1 de tipo Si que
estar associado a toda a regio da imagem. Este procedimento ser denominado como
execuo top-down de Si. Se Si possui outros sub-ns S, o procedimento que acabamos de
descrever ser repetido para todos os Hik . Decorre da descrio do processamento top-down
da rede semntica, que os ns folhas S requerero sempre um operador top-down, uma vez
que somente assim se obter um particionamento dos dados da imagem em subconjuntos.

Processamento bottom-up da rede de hipteses. Durante o processamento top-down a


imagem foi subdividida em primitivas. A avaliao bottom-up (figura 4.10, parte inferior) inicia
agora no n folha H. Para isso H inicia o operador bottom-up de S . Este avalia os ns H i e
decide qual destes ns se tornaro ns de instncia I. As regies de imagem P associadas
ao n instncia I so neste momento disjuntas.

Figura 4.10: Seqncia da interpretao da cena: a fase top-down trabalhada comandada por modelos. A partir da rede
semntica TS gerada a rede de hipteses TH e tenta-se, atravs dos operadores top-down, encontrar os objetos
correspondentes no material de dados P. Na fase bottom-up os conflitos entre os objetos encontrados so dissolvidos
(comandados por dados), de modo que as regies Pi correspondentes so disjuntas, que por sua vez so agrupadas
para objetos antepostos.Resulta uma rede de instncias parcial.

42
Ao mesmo tempo o operador bottom-up agrupa a nova rede de instncias parcial I e gera
novos ns hipotticos Hk, ou seja, de um n Hi podem surgir neste passo mltiplas hipteses
Hk. O controle ento passado ao n superior H, que realiza a avaliao e agrupamento para
o n H. Este procedimento chamado avaliao bottom-up de H. A avaliao bottom-up
repetida at que o n mais superior da rede de hipteses seja alcanado. Com a confirmao
do n raiz hipottico, chega-se rede (de instncias) resultado, com a confirmao das
instncias parciais daquele ponto para as folhas.

4.3.1. Exemplo de interpretao

O exemplo a seguir mostra com se pode produzir um mapa temtico com o GeoAIDA a partir
de imagens de sensoriamento remoto (visuais), imagens de altitude (laserscan) e dados GIS. A
rede conceitual apresentada na figura 4.6. O objetivo classificar a imagem (veja figura 4.15
parte de cima) em indstria,assentamento, floresta, gramneas e plantao. Esto disponveis
como operadores de segmentao um operador para o reconhecimento de edificaes, assim
como um classificador baseado em textura para floresta, pastagem e plantao. Os ns da
rede semntica que tm operadores holsticos associados aparecem em cinza. As classes
assentamento e indstria so reconhecidas a partir de suas caractersticas estruturais.

Cena

Regio

Figura 4.11: Exemplo do particionamento da imagem em regies


delimitadas por ruas (Regio 1 ...5) com o auxlio de dados GIS.

A anlise se inicia com o n S Cena. A partir deste n S se gera um n H Cena_1. Para criar
hipteses para seus ns filhos ativam-se os operadores top-down de todos os sub-ns neste
caso Regio. A figura 4.11 mostra o resultado do operador top-down, que neste exemplo
atravs de uma consulta a uma base GIS subdividiu Cena_1 nas regies 1 at 5. O GeoAIDA
gera a partir da os ns H Regio_1 at Regio_5.

43
Figura 4.12: Exemplo de aplicao do algoritmo de extrao de edificaes para diferenciar nas regies da figura
4.11 entre rea Habitada 1...2 (edificaes presentes) e Agricultura 1...3 (sem edificaes).

No prximo passo procura-se gerar hipteses para os sub-ns dos ns Regio 1 at Regio 5.
Como sub-ns, de acordo com a rede conceitual podem surgir as hipteses rea Habitada e
Agricultura. Para cada regio chamam-se os operadores top-down associados aos ns S rea
Habitada e Agricultura (veja figura 4.12). O operador top-down para rea Habitada verifica se
h edificaes na rea analisada. Em caso afirmativo a regio classificada como Vila. O
operador para Agricultura executa a funo inversa, ou seja, ele classifica regies sem
edificaes como Agricultura. Desta maneira formam-se as regies 2 e 5 que se tornam reas
Habitadas, enquanto as Regies 1, 3 e 4 se tornam Agricultura. GeoAIDA gera a partir das
regies encontradas ns H vila rea habitada 1, rea habitada 2, agricultura
1, agricultura 2 e agricultura 3 .

rea
Urbana

Assentamento

Casa

Figura 4.13: Exemplo para a diferenciao de reas habitadas e reas industriais, atravs da procura de
2
pequenas edificaes (30-150 m ).

44
O texto considera daqui para diante somente o ramo rea Habitada. De acordo com a rede
conceitual uma rea habitada pode ser um Assentamento ou uma Indstria. Tendo em vista
que no h nenhum operador top-down associado a Assentamento e a Indstria, so gerados
para cada rea habitada as hipteses Assentamento e Indstria (figuras 4.13 e 4.14). Um
assentamento consiste de casas e jardins. Por isso os ns H Assentamentos chamam os
operadores top-down para Casa e Jardim. A figura 4.13 mostra um exemplo de resultado da
segmentao de Casa. O operador j utilizado para distinguir rea Habitada e Agricultura a
partir de dados de laser (laserscan) novamente utilizado aqui. Seus parmetros so agora
ajustados para a deteco de edificaes (casas) com terrenos entre 30 m2 e 150 m2. Na
regio rea habitada 1 detecta-se apenas uma casa. Na regio rea habitada 2 detectam-se 9.

O mesmo operador ajustado para a deteco de edificaes com terrenos entre 150 m2 e 500
m2 para a deteco de edifcios utilizados com fins comerciais (figura 4.14).

rea
Urbana

Indstria

Edifcio

Figura 4.14: Exemplo o reconhecimento de edifcios usados para fins comerciais atravs de uma procura por
2
objetos de tamanho entre 150 e 500 m .

Na regio rea_habitada_1 detectam-se 5 edifcios com esta caracterstica, na regio


rea_habitada_2 no se detecta nenhum.

Quando o processo alcana as folhas da rede conceitual, inicia-se a etapa de avaliao


(bottom-up). Casas e Jardins so reunidos em Assentamentos, enquanto Edifcios e
Estacionamentos so reunidos em Indstrias. Na avaliao entre Assentamento e Indstria
surge em rea_habitada_1 um conflito. Este decidido em favor de Indstria, uma vez que
Indstria tem a maior proporo da rea. Tambm seria possvel aqui pensar numa diviso em
sub-regies. D-se prosseguimento avaliao at que o n Cena_1 seja alcanado. Todos
os ns H reconhecidos ao longo desta avaliao bottom-up so transformados em instncias
(ns I). A partir da rvore de instncias gerada e as correspondentes regies na imagem
rotulada pode-se gerar mapas temticos. A figura 4.15 mostra um tal mapa, no qual alm das
classes de uso do solo esto indicadas as edificaes encontradas.

45
Figura 4.15: Vista geral de uma imagem de entrada e de sada para uma interpretao de cena: acima, dados
de entrada (imagem, laserscan, GIS) abaixo: resultados dos operadores (operador de textura, procura de
edificaes), resultado final.

4.4. Realizao tcnica


A realizao tcnica do GeoAIDA apresentada esquematicamente na figura 4.16. Nesta
figura no apresentada a interface com o usurio, qual pertence o editor da rede e a
unidade de visualizao. Para aumentar a eficincia do sistema como um todo so aplicadas
tcnicas como o processamento paralelo e mecanismos de caching no processamento de
imagens. O mdulo principal o controle da anlise. Ele gerencia a rede de instncias, que
construda inicialmente a partir das informaes da rede modelo (rede semntica). Para o
desenvolvimento da rede de instncias requerem-se informaes sobre os operadores
externos. A execuo dos operadores externos controlada pelo gerenciador de tarefas,
que cuida para que a carga computacional seja otimizada, acompanhando a carga do
processador atravs de um timer. Informaes sobre a forma de chamada dos operadores so
obtidas pela anlise do mdulo lista de operadores. Este mdulo inicializado antes do incio
da interpretao juntamente com a rede modelo a partir de arquivos interpretados por um
parser XML. O uso eficiente da memria suportado por um cache de imagem. Todos os
dados de imagens so carregados atravs do cache, que evita a duplicao de dados e retira
da memria dados de imagens que h muito tempo no so utilizados. A troca de dados com
operadores externos ocorre atravs de descritores de regio, tambm controlados pelo
parser XML, assim como atravs das imagens rotuladas. Arquivos de imagem adicionais so
criados para os operadores top-down. Tais arquivos contm os dados do segmento (regio) a
ser processado a cada momento.

46
Figura 4.16: Viso geral esquemtica das funes do GeoAIDA

4.4.1. Gerenciador de tarefas

GeoAIDA capaz de iniciar vrios processos em paralelo. Quando processos so de fato


iniciados simultaneamente pode vir a ocorrer rapidamente uma sobrecarga do processador.
Por isso, a anlise no inicia diretamente processos externos, mas passa-os ao gerenciador de
tarefas. O gerenciador de tarefas contm um fila. Quando a execuo de um programa
solicitada, a linha de comando juntamente com o objeto que faz a chamada so introduzidos na
fila de espera. Um temporizador monitora a carga do processador. Assim que a carga do
processador permita, o programa iniciado, sendo retirado da fila de espera e transmitido a um
container de dados que mantm a relao dos programas em execuo. No final da execuo
do programa o gerenciador de tarefas recebe um sinal, e em seguida informa ao objeto que
provocou a execuo do programa. O objeto em questo pode ento prosseguir o seu trabalho.

4.4.2. Controle da anlise

O controle da anlise recursivo e realizado atravs de uma Mquina de Estados Finita (FSM
sigla de Finite State Machine) associada a cada n instncia. Graas implementao atravs
de FSM a anlise paralelizvel, uma vez que cada fase a ser executada independente de
eventos externos. Eventos externos podem ser p. ex. a execuo de um operador ou a gerao
de uma rede de instncias de nvel mais baixo. O FSM pode estar nos estados TD_START,
TD_EVALUATE, START_CHILDREN, BU_START e BU_EVALUATE e passa no caso mais
comum por estes estados nesta ordem. H ainda os estados de erro, que no sero tratados
aqui para no prejudicar a compreenso do texto. Na fase TD_START o operador top-down
iniciado, a fase TD_EVALUATE calcula o resultado do operador top-down. Na prxima fase
START_CHILDREN so geradas hipteses iniciais para os ns inferiores, para os quais foram
geradas novas hipteses a partir do resultado da ltima execuo do operador top-down. Nesta
fase as FSM para os ns inferiores so colocadas em operao. Segue-se a fase BU_START,
na qual a avaliao das hipteses iniciada atravs da ativao de operadores bottom-up. Na
ltima fase BU_EVALUATE os resultados desta avaliao so computados.

Os passos do programa a serem executados em cada fase so apresentados nas figuras 4.14,
4.18, 4.19, 4.20 e 4.21 em pseudocdigo. O programa INode denota a classe de um n

47
instanciado. snode o n modelo da rede semntica correspondente ao n instncia atual.
state armazena a fase para a qual deve passar a FSM na prxima chamada.

Fase START_CHILDREN. Inicialmente o n cena da rede semntica instanciado. A FSM


desse n est no estado START_CHILDREN. A chamada da FSM especfica do n age sobre
a execuo do programa mostrado na figura 4.17. Primeiro inicializa-se um contador count,
que contabiliza o nmero de sub-ns que esto em execuo. Ento, para cada sub-n da rede
semntica, incrementa-se o contador, cria-se uma rede de hipteses com ns instncia hnode
que ligada rvore de instncias, assim como se estabelece a rea de busca para o
operador top-down do n recm criado aqui definido pela associao um retngulo
envoltrio (boundingbox). O estado da FSM hnode.state setado para TD_START e a FSM
do novo n ativada. O estado da FSM alterado para BU_START para a prxima chamada.

Figura 4.17: FSM: Fase START_CHILDREN.

Fase TD_START_ Na fase TD_START (veja figura 4.18) so gerados os comandos para o
operador top-down e o recorte da imagem, necessrios para a execuo do operador top-
down. O estado da FSM alterado para TD_EVALUATE. Finalmente a linha de comando a ser
executada juntamente com o objeto que deseja executar esta operao registrada no
gerenciador de tarefas. Isto leva o programa a ser executado assim que houver capacidade
suficiente de memria disponvel. Ao ser concludo o programa externo, o gerenciador de
tarefas chama a FSM do n hipottico requisitante, que se encontrar a partir da na fase
TD_EVALUATE.

Figura 4.18:FSM: Fase TD_START.

Fase TD_EVALUATE. A tarefa da fase TD_EVALUATE avaliar os resultados dos operadores


top-down. Primeiramente lida a lista de regies escritas pelo operador top-down com auxlio
do parser XML e, a partir desta descrio, gerada uma lista de ns instncia hipotticos.

48
Estes novos ns so pendurados agora na rede de instncias, e incrementado o contador
dos sub-ns do n de nvel superior a serem processados. O estado da FSM do novo n
alterado para START_CHILDREN. Caso o n da rede semntica possua sub-ns, sero
criadas para estes hipteses atravs da ativao do n FSM hnode.fsm(). Se, ao contrrio,
o n hipottico um n folha, inicia-se a FSM do n de nvel superior. Depois que a lista dos
novos ns tiver sido processada, as hipteses so eliminadas da rede de instncias,
chamada a FSM do n de nvel superior e as hipteses so finalmente apagadas.

Figura 4.19: FSM: Fase START_EVALUATE.

Figura 4.20: FSM: Fase BU_START.

49
Figura 4.21: FSM: Fase BU_EVALUATE.

4.4.3. Troca de informaes com componentes externos

A funcionalidade de processamento de imagens propriamente dita acrescentada ao GeoAIDA


atravs dos chamados operadores. Estes so programas autnomos que se comunicam com o
GeoAIDA atravs de uma interface pr-definida.

A troca de informaes entre os componentes individuais do GeoAIDA ocorre atravs de


parmetros de linhas de comando e de arquivos ASCII, nos quais os dados so armazenados
num formato consistente com XML. A passagem de parmetros de configurao a programas
externos fica facilitada por chamadas atravs de linhas de comando. Estes procedimentos so
aplicados ao serem chamados os operadores top-down e bottom-up.

Hierarquias complexas de objetos que so transmitidas, p.ex., para os operadores top-down,


ou ainda de ou para os operadores bottom-up, podem ser facilmente representadas em XML.
Cada n da hierarquia aberto com um marcador inicial e fechado com um marcador final.
Entre os marcadores inicial e final pode-se descrever sub-ns, que por seu turno tambm
podem ser ramificados.

4.4.3.1. Descrio de dados de imagem

Os dados de imagem usados no GeoAIDA como dados de entrada so descritos com o


marcador geoimage. Os seguintes atributos devem ser definidos:

File: o nome do arquivo dos dados raster relativos a uma imagem.

geoType: define o tipo de coordenadas geogrficas. At aqui somente GK/1, GK/2 e GK/3
(Gauss-Krger) so suportados. Outros tipos, como UTM, seriam desejveis.

geoNorth, geoSouth, geoWest, geoEast: descrevem as coordenadas dos dados raster no


sistema de coordenadas definido com geoType. As coordenadas geogrficas descrevem os
pontos da imagem (-0.5, size_y-0.5) e (size_y-0.5,-0.5) (veja tambm 4.13).

type: define o tipo da imagem. No momento so suportados os tipos LASER, VIS, SAR, IR e
VIDEO. Em princpio qualquer tipo de imagem pode ser utilizada, desde que haja imagens
deste tipo para a regio escolhida.

Key: serve para identificar a imagem inequivocamente dentro da sua classe type.

50
Name: o nome da imagem.

4.4.3.2. Descrio de regies

Uma descrio de regio surge como resultado de um operador top-down. Ela consiste de uma
lista de marcadores de tipo regio. Os seguintes atributos devem ser definidos.

Class: define a classe a que pertence a regio. Somente as regies que correspondem
classe do n que fez a chamada podem ser transferidas para a rede de instncias.

id: a partir do id pode-se encontrar a regio na imagem rotulada (valor dos pixels
correspondentes).

File: o nome do arquivo da imagem que contm esta regio. Mltiplas regies podem utilizar
uma mesma imagem rotulada. A diferenciao se faz atravs do id.

llx, lly, urx, ury: descrevem o retngulo envoltrio (bounding box) da regio em pixels no
arquivo da imagem rotulada dada. Neste caso valem as relaes llx <= x<=urs e ury<=y<=lly,
isto , a regio est completamente contida no retngulo envoltrio.

geoNorth, geoSouth,geoWet, geoEast: descreve o retngulo envoltrio da regio. O


retngulo descrito em coordenadas geogrficas fica exatamente sobre o limite da regio e
desta forma em todas as direes, meio pixel maior do que os limites do retngulo. As
coordenadas geogrficas no so necessariamente fornecidas. Ento, se admite que as
coordenadas geogrficas e o tamanho da imagem (file) correspondem ao da regio de nvel
superior.

Name; o prefixo do nome da regio. Tem utilidade apenas para a visualizao. Caso no
seja dado nenhum name, um nome automaticamente definido a partir do nome da classe e
de um nmero seqencial.

51
4.4.3.3. Lista de ns

Uma lista de ns transferida para um operador bottom-up. O papel desta lista :

Agrupar os ns;
Gerar a imagem rotulada dos ns;
Gerar a imagem rotulada dos grupos de ns.

No arquivo de descrio das regies (XML), as descries dos ns so abertas com o


marcador <node, e ns-grupos so abertos com <group.

Como entrada o operador bottom-up recebe uma lista de nodes:

<node name=... file=... id=... addr=.../>


<node name=... file=... id=... addr=.../>
<node name=... file=... id=... addr=.../>

Alm disso, o operador bottom-up gera uma lista agrupada na forma:

<group id=... file=... llx=... ...>


<node name=... file=... id=... addr=.../>
<node name=... file=... id=... addr=.../>
<node name=... file=... id=... addr=.../>

</group>
<group id=... file=... llx=... ...>

</group>

nodes e groups podem ter qualquer atributo. Os seguintes atributos esto presentes em
todos os nodes de um arquivo de entrada.

Class: define a classe a que pertence esta regio.

id: a partir do id pode-se encontrar a regio na imagem rotulada (valor dos pixels).

File: o nome do arquivo da imagem rotulada que contm esta regio. Mltiplas regies
podem utilizar uma mesma imagem rotulada. A diferenciao se faz atravs do id.

llx, lly, urx, ury: descrevem o retngulo envoltrio da regio em pixels no arquivo da imagem
rotulada dado. Neste caso valem as relaes llx <= x<=urs e ury<=y<=lly, isto , a regio est
completamente contida no retngulo envoltrio.

geoNorth, geoSouth,geoWet, geoEast: descrevem o retngulo envoltrio da regio. O


retngulo descrito em coordenadas geogrficas fica exatamente sobre o limite da regio e
por isso meio pixel maior do que o retngulo envoltrio em pixels em todas as direes.

file_geoNorth, file_geoSouth, file_geoWest, file_geoEast: descreve o retngulo envoltrio


da imagem definida atravs de file.

Name: o nome do n.

Addr: fornece o endereo deste atributo na memria. Este atributo no pode ser alterado sob
nenhuma hiptese, por que ele quem indica a associao deste n rede de instncias.

Em cada n, o operador bottom-up para ns que foram agregados deve definir o valor, o
atributo addr e, quando for o caso, definir o valor dos atributos alterados. Quando novos ns
so gerados, deve-se definir o valor dos atributos id, file, llx, urx, lly, e ury. Os ns grupo

52
recebem pelo menos os atributos id, file, llx, urx, lly e ury. Qualquer atributo pode ser definido
tanto para os ns individuais como para os ns grupo. Estes fluem para dentro do processo de
interpretao.

4.4.4. Descrio dos operadores externos

Para que o GeoAIDA tome conhecimento das formas corretas de chamada de operadores,
todos os operadores disponveis so descritos em arquivos XML, que so lidos na inicializao
do GeoAIDA. O marcador <operator> serve para descrio de operador. Caractersticas dos
operadores, tais como nome programa executvel, so descritos atravs de atributos. No caso
em que o operador permite a configurao atravs de parmetros de linhas de comando, esta
descrita atravs do marcador <attribute>. O parmetro definido com <attribute >
pode ser indicado no editor do GeoAIDA como atributos especficos de operandos.
O elemento <attribute > est associado ao correspondente operador:

<operator name=... cmd=...>


<attribute name=... type=...>
</operator>

O objeto operator tem os seguintes atributos:

type: o tipo de um operador pode ser topdown ou bottomup.

class: operadores podem ser subdivididos em classes. Se a quantidade de operadores for


elevada, eles podem ser agrupados em sub-menus.

name: operadores so identificados inequivocamente atravs de nomes, e por estes nomes


visualizados no menu do usurio.

tip: o atributo tip pode conter um texto de ajuda em formato HTML, que ser mostrado ao
usurio quando o ponteiro do mouse est posicionado sobre o nome do operador na lista
apresentada pelo sistema. (Balloon-Help).

cmd: o formato da chamada para execuo (linha de comando) definido neste atributo.
Atributos da rede semntica ou da rede de instncias podem ser passados ao comando
emoldurando-os com @. Atributos especficos de operadores so associados da mesma
maneira, sendo que devem ser definidos dentro da descrio do operador com o tag marcador
<attribute> .

runglobal: pode assumir os valores true or false. Se o runglobal tiver o valor true,
toda a imagem ou todas as imagens sero repassadas ao operador correspondente para
processamento. Isto faz sentido para operadores que trabalham melhor sobre grandes recortes
de imagem, pois exploram, por exemplo, a distribuio estatstica dentro da imagem.

Os objetos attribute aninhados no operador possuem as seguintes caractersticas:

name: o nome de um atributo necessrio para a substituio dentro do atributo ou dentro do


comando do operador.

label: define o nome que identifica o atributo na GUI (Graphic User Interface).

tip: o tipo pode auxiliar o usurio quanto ao significado do atributo.

cmd: quando a caracterstica cmd est ativada, as variveis so primeiramente substitudas no


valor (texto) do atributo cmd, antes que este texto seja ento utilizado (linha de comando) para
a chamada do operador. Desta maneira possvel ter argumentos opcionais no comando do
operador. Caso no se associe nenhum valor ao atributo, a caracterstica cmd fica vazia.

53
value: atravs da caracterstica value pode-se atribuir um valor inicial ao atributo, que ser
assumido, caso o usurio no defina nenhum valor.

type: o tipo de um atributo pode ser STRING, INT, DOUBLE, ENUM, BOOL ou IMAGE.
Dependo do tipo, podem ser estabelecidas outras caractersticas especficas ao atributo.

min: pode-se determinar os valores mnimos para atributos do tipo INT e DOUBLE.

max: define o valor mximo admissvel para atributos INT e DOUBLE.

imagetype: esta caracterstica s pode ser definida para atributos do tipo IMAGE. Imagetype
determina que tipo de imagem que est associada ao atributo. No momento os tipos
suportados so LASER, VIS, SAR, IR e VIDEO. Em princpio possvel operar com qualquer
tipo de imagem, desde que haja no banco de dados imagens deste tipo para a regio
selecionada.

options: Num atributo do tipo ENUM pode-se definir as possveis alternativas. Trata-se de uma
lista de valores separados por vrgula.

Alm dos atributos especficos de operadores, que podem ser definidos por <attribute>
dentro do objeto operator, h atributos oriundos da rede semntica e da rede de instncias
que podem ser passados ao operador atravs das linhas de comando. Estes so atributos que
em geral descrevem os dados a serem processados, como p. ex.:

geoWest, geoNorth, geoEast, geoSouth : coordenadas geogrficas do retngulo envoltrio


da regio a ser processada.

minRes, maxRes: resoluo mnima e mxima das imagens disponveis.

input: arquivo de entrada para a descrio dos ns nos operadores bottom-up.

output: arquivo de sada para a descrio das regies nos operadores top-down, ou para a
descrio de ns nos operadores bottom-up.

Por outro lado, h atributos que descrevem a imagem solicitada pelo operador. Os nomes
abaixo devem ser complementados com um prefixo que o nome do atributo IMAGE do
operador a ser chamado.

_file: nome do arquivo de imagem.

_res_x,_res_y: resoluo da imagem

_size_x,_size_y: dimenses da imagem

Exemplo de descrio de operador. Existe um operador para a deteco de ruas chamado


findStreet. O nome do programa executvel find_streets. Atravs da linha de comando
pode-se definir a largura mnima e mxima das ruas. Se a opo gis for utilizada, o operador
utiliza dados de GIS disponveis no banco de dados para a extrao de ruas. O programa
chamado da seguinte maneira:

find_streets min <valor> --max <valor> [--gis Server] <vis-image> <output>

As linhas seguintes descrevem o operador:

<operator name=findStreet class=bv type=topdown


tip=Encontra Ruas em Imagens visuais<br>
Idealmente pode se utilizar um banco de dados GIS
cmd=find_streets min @min@ --max @max@ @gis@ @vis@ @output@>
<attribute name =min type=INT value=1.0 min=1.0 max=5.0 />
<attribute name =max type=INT value=3.0 min=1.5 max=20.0 />

54
<attribute name =gis type=STRING cmd=-- gis @gis@/>
<attribute name =vis type=IMAGE imagetype=VIS/>
</operator>

O operador definido entre o marcador inicial <operator> e o marcador final </operator>.


Ele recebe o nome findStreet e associado classe bv. Quanto ao tipo, trata-se de um
operador top-down. O texto em tip, em formato HTML, serve para informar o usurio sobre o
seu significado. O atributo cmd descreve a forma de chamada do programa. Os parmetros
entre @...@ so substitudos antes da chamada do programa pelos atributos correntes do n
na rede semntica. Nos objetos <attribute> so descritos os parmetros especficos para
este operador. Eles aparecem na interface com o usurio do editor da rede como atributos
especficos de operadores top-down.

Quando o operador chamado num processo top-down so definidos, alm dos atributos
especficos do operador min, max, gis, os atributos gerais geoWest, geoNorth, geoEast,
geoSouth, minRes, maxRes e output e os atributos especficos da imagem vis_file,
vis_x_res, vis_y_res, vis_size_x e vis_size_y, que derivam do atributo
especfico de operando vis. Os valores destes atributos so introduzidos na posio que lhes
corresponde na linha de comando.

4.5. Visualizao do resultado


Como resultado da anlise o GeoAIDA produz uma rede de instncias, na qual todos os
objetos confirmados esto indicados bem como uma label image, na qual a localizao
espacial dos objetos est descrita. Esta rede de instncias pode ser bastante complexa mesmo
para cenas pequenas, de tal modo que faz sentido pensar sobre como apresentar esta
informao ao usurio de modo adequado e como armazenar esta informao de modo
eficiente e sem perdas.

4.5.1. Constituio dos dados

Como a rede de instncias final estritamente hierrquica, isto os ns inferiores esto


espacialmente contidos no n superior correspondente, possvel representar a localizao
espacial de todos os objetos numa nica imagem rotulada bidimensional. Cada objeto deve
conhecer, alm de seu prprio ID, pelo qual ele identificado na imagem rotulada, tambm os
IDs dos seus sub-objetos. A maneira mais eficiente de codificar isso, associar a cada objeto
um bloco de IDs, em que so indicados seus sub-objetos.

O n raiz, que em geral a cena, recebe o ID 1. A distribuio de IDs ocorre recursivamente


atravs do processamento do n I e do seu sub-n I. Desta forma distribuem-se IDs
crescentes. No n I o prprio ID ser armazenado como seu Start_ID, e o ID gerado aps o
processamento do ltimo de seus sub-ns ser armazenado como End-ID. Todas as regies
com IDs no intervalo do Start-ID e do End-ID pertencem regio do n I.

55
Rede Hierrquica Padres

Figura 4.22: Distribuio de IDs para a produo do mapa de resultado: no n superior so


indicados o intervalo de IDs de todos os seus sub-ns (esquerda). Isto possvel, por que os
sub-ns esto completamente contidos no n superior correspondente (direita).

A figura 4.22 ilustra o procedimento descrito. O n raiz recebe primeiramente o ID 1. O sub-n


esquerda recebe o ID 2. Seus sub-ns so processados em seguida e recebem os IDs 3 a 5.
5 o ltimo ID gerado neste ramo, motivo pelo qual o ID 5 aparece no n 2 como End-ID.
Todos os ns de 2 a 5 pertencem regio 2. Em seguida processado o segundo sub-n do
objeto 1 que recebe o ID 6. Seguem-se recursivamente os seus sub-ns, de modo que, ao
final, os IDS 6 a 9 so associados ao n 6, enquanto que ao n da cena todos os ns esto
associados.

4.5.2. Mapa Interativo

O mtodo de constituio dos dados descrito na seo anterior permite agora uma
implementao simples de um mapa interativo. O mapa consiste de 3 componentes: da rede
semntica, da rede de instncias, e da imagem rotulada, que descreve a localizao espacial
de todos os objetos (veja figura 4.23).

Rede Semntica Imagem rotulada

Rede de Instncias

Figura 4.23: Interface com o usurio do GeoAIDA com a visualizao da funo mapa interativo.

As seguintes funes esto implementadas:

56
Seleo do nvel de detalhamento na rede semntica com a adaptao automtica da
imagem rotulada da rede de instncias;

Seleo do nvel de detalhamento para cada regio individual da rede de instncias


com adaptao automtica da imagem rotulada;

Visualizao de tipos de objetos e atributos de objetos atravs da seleo de um objeto


na imagem rotulada.

Nas figuras 4.24 e 4.25 demonstra-se o efeito da superposio das rvores parciais da rede
semntica e o correspondente resultado sobre a imagem rotulada.

Figura 4.24: Mapa interativo para a visualizao do estado com a superposio sobre a imagem (direita) e a
correspondente rede semntica (esquerda).

Figura 4.25: Mapa interativo para a visualizao dos resultados com a superposio sobre a imagem (direita) e a
correspondente rede semntica (esquerda).

57
A figura 4.26 mostra um mapa em que apenas uma regio foi aberta na rede de instncias. Em
seguida so fechadas as classes subordinadas rea habitada atravs da rede semntica e
posteriormente aquelas mesmas classes so novamente abertas na rede de instncias.

Figura 4.26: Mapa de vista geral com a superposio sobre a imagem e


representao de uma regio em detalhe.

4.6. Requisitos aos operadores externos


O processamento de imagens no GeoAIDA transferido para programas externos que so
chamados operadores. A associao de operadores ocorre sob quatro pontos de vista.

1. Deve ser facilmente possvel, integrar ao GeoAIDA rotinas de processamento de


imagem j existentes.

2. Muitas rotinas de processamento de imagens no foram desenvolvidas para operar


sobre dados de sensores remotos. Por isso, caractersticas especficas de dados de
sensores remotos, como p.ex. a manipulao de coordenadas geogrficas, no podem
ser condio para que uma rotina de processamento de imagem possa ser integrada.

3. Muitas rotinas de processamento de imagens trabalham melhor sobre imagens


grandes do que sobre recortes, pois fazem uso de caractersticas estatsticas. A
manipulao de recortes de imagem deve assim ser assumida pelo GeoAIDA.

4. As rotinas de processamento de imagens devem ser configuradas dentro do GeoAIDA,


no contexto do sistema.

A maneira como se fazem tecnicamente a ligao e a configurao dos operadores


internamente ao GeoAIDA j foi descrita na seo 4.4.1. A seguir ser esclarecida melhor a
funcionalidade dos operadores.

Basicamente o GeoAIDA considera dois tipos de operadores, aos quais se impem diferentes
exigncias:

1. Operadores top-down devem encontrar objetos de uma dada classe numa determinada
rea geogrfica. Esta rea apresenta-se tanto em coordenadas geogrficas quanto na
forma de recortes de imagem.

2. Operadores bottom-up recebem objetos hipotticos de uma regio e devem agrup-los


em objetos do nvel mais alto que pertencem a uma dada classe.

58
4.6.1. Operadores de interpretao de imagens

Muito embora aplicaes como a consulta a um banco de dados GIS sejam possveis, a
aplicao mais corriqueira de operadores top-down a interpretao de imagens. Muito
freqentemente a interpretao pode ser subdividida nos passos mostrados na figura 4.27.

Figura 4.27: Estrutura interna de um operador top-down: as imagens de entrada so primeiramente


segmentadas. Ento determinam-se os atributos de cada segmento individualmente. Com base nos atributos
obtidos associam-se os segmentos a classes.

A interpretao da imagem consiste dos passos: segmentao, atribuio e classificao. A


segmentao particiona a imagem em regies com a mesma caracterstica relativamente a um
atributo. Dependendo do que se analisa, os limites das regies ou a similaridade dos pixels
dentro de uma regio, tem-se os procedimentos baseados em contorno ou baseados no interior
da regio, alguns dos quais foram descritos na seo 2.2. A atribuio determina o valor de
parmetros de forma ou textura. Com base nestes parmetros a classificao procura atribuir
algum significado s regies.

Freqentemente rotinas de processamento de imagens do conta apenas do passo de


segmentao. Os demais passos podem ser, contudo, agregados de modo simples com o
auxlio dos mdulos para atribuio e classificao existentes no GeoAIDA.

A segmentao tambm se constitui freqentemente de passos parciais. Com freqncia os


dados de entrada so submetidos a um filtro para reduo de rudo, antes de iniciar a
segmentao. A fuso de vrias imagens de entrada exige um filtro de fuso, e assim por
diante. Cada uma destas unidades funcionais pode ser vista como um filtro, no qual os dados
de entrada so submetidos a uma transformao e aparecem numa forma mais adequada para
a obteno de informaes especiais. Para os passos complexos da segmentao vrios
destes filtros so aplicados seqencialmente para produzir o resultado desejado. Esta viso do
acoplamento de filtros de diferentes tipos detalhada na seo 4.7.

A atribuio uma seqncia de passos para determinar os parmetros de uma regio, e pode
ser executada de forma relativamente independente da formulao do problema. A

59
classificao exige uma estreita adaptao ao resultado que se espera da interpretao. Por
isso, no existe uma estratgia geral de soluo, e faz sentido deixar a cargo de um intrprete
o passo da classificao, como se procede na avaliao e agrupamento da fase Bottom-Up
(veja seo 4.6.2).

Conforme mencionado no incio desta seo, alguns procedimentos de processamento de


imagens no so capazes de processar pequenos recortes da imagem, uma vez que
dependem de caractersticas estatsticas que s podem ser medidas quando se tem uma
amostra grande. Neste caso, toda a imagem interpretada. O resultado da interpretao pode
ser consultado atravs de um banco de dados criado como resultado deste processo.

No escopo do projeto GeoAIDA foram implementados alguns operadores top-down:

Um operador baseado na varincia dos dados da imagem, que diferencia entre objetos
artificiais e naturais;

Segmentao de textura baseada no procedimento descrito em [38];

Extrao de rua baseada no procedimento descrito em [24];

Extrao de edificaes, surgida no escopo deste trabalho (veja a seo 5.1.1).

4.6.2. Operadores de avaliao e agrupamento

Os operadores bottom-up fazem uma avaliao de uma lista de ns disponibilizada como


entrada e agrupam esta em unidades maiores. Para a avaliao dos ns necessrio obter
determinadas caractersticas dos ns em si ou das relaes entre eles. Em [25] j foi
desenvolvida uma biblioteca capaz de extrair valores de forma e de relao. Com base nestes
atributos procede-se avaliao e ao agrupamento. Enquanto a extrao de atributos segue
regras fixas, as regras de clculo subseqentes so especficas de cada caso e no
parametrizveis. Por isso foi desenvolvido um interpretador, que com auxlio de uma linguagem
em notao polonesa reversa, processa conjuntos em uma pilha. Para isso se utiliza a
estrutura de dados mostrada na figura 4.28.

60
Figura 4.28: Estrutura de dados do interpretador para o processamento de conjuntos de objetos: na
estrutura de dados global (a) h uma pilha (b), que pode receber elementos de diferentes tipos, entre os
quais, uma lista de ns (d) que por seu turno podem tambm conter uma pilha (b), assim como seus ns
podem t-las.

O prprio interpretador possui uma estrutura de dados global (a), na qual esto contidos
atributos, uma pilha (b) e a lista de ns lidos (e). A lista de ns contm os ns (f). Cada n por
seu turno contm atributos e uma pilha local (b). A pilha (b) pode agora receber elementos (c)
do tipo String, Number, NodePointerList (d) e Stack (b). A estrutura de dados NodePointerList
(d) serve como container de grupos para os ns. Os ns (f) so aqui gerenciados apenas como
ponteiros, isto cada n s existe fisicamente uma vez na memria, mesmo que
eventualmente vrios grupos (NodePointerList) pertenam a ele. Adicionalmente o
NodePointList pode conter atributos e uma pilha.

O interpretador recebe uma linha de comando, que ele inicialmente subdivide em elementos
individuais (tokens). Em seguida determina-se o tipo do token. Tratando-se de um dado
(Number, String) armazenado na pilha global. Tratando-se, ao contrrio de uma funo, ela
executada.

A funes buscam seus operandos da pilha global, processam-nos e escrevem os resultados


de novo na pilha global. A funo especial nodelist coloca na pilha um elemento do tipo
NodePointeList que contm todos os ns. As funes que possuem o prefixo nl. contam com
um elemento do tipo NodePointerList no topo da pilha e executam sua funcionalidade sobre a
pilha deste elemento. O mesmo vale para comandos com o prefixo node., contudo, a
funcionalidade executada em todas as pilhas dos ns que se encontram no grupo.

Alm das operaes bsicas, como + , -, *, /, < ,<, = h funes que processam a pilha. dup
produz uma cpia do elemento mais alto da pilha. As variantes nl.dup e node.dup trabalham
no local correspondente da pilha. drop elimina o elemento mais alto da pilha (possui variantes
com em dup).

O comando select serve para selecionar ns com determinadas caractersticas. Com set e
get (e suas variantes nl. e node.) pode-se definir e ler atributos. Com as funes
node.run e nl.run pode-se executar sub-rotinas em pilhas de ns e pilhas de grupos.

61
Funes especiais calculam atributos como parmetros de forma de objetos ou a relao entre
objetos.

O exemplo a seguir mostra como segmentos de uma imagem colorida podem ser subdivididos
em Unknown, Greenland e Shadow. Escreve-se uma lista de ns no agrupados, na forma
como se espera ter o resultado de um operador top-down:

( 1) nodelist
( 2) Unknownnode.push class node.set
( 3) meancolor node.get
( 4) dup 80 > swap 280 < * node.run
( 5) select
( 6) Greenland node.push class node.set.
( 7) drop
( 8) nodelist
( 9) meanbrightness node.get 10 < select
(10) Shadow node.push class node.set
(11) drop
(12) nodelist

Inicialmente a lista de ns trazida pilha (linha 1). Na linha 2 atribui-se o valor Unknown ao
atributo class de todos os ns. A linha 3 carrega o valor do atributo meancolor, que contm o
canal C da cor no sistema CSV, para a pilha local de cada n. Na linha 4 executa-se um
comando local na pilha do n que determina, se a cor est no intervalo do verde. O resultado
deste comando leva na linha 5 seleo dos ns que sero associados classe Greenland.
Para estes ns o valor do atributo class definido como Greenland. A linha remove os ns
classificados como Greenland da pilha. Na linha 8 uma lista de todos os ns novamente
trazida para a pilha. Desta vez analisa-se o brilho dos ns (linha 9) e se atribui os ns escuros
classe Shadow (linha 10). A linha 11 tambm remove esta lista da pilha. A linha 12 garante
que no final haja na pilha uma lista com todos os ns, a qual ento ser transmitida para o
arquivo de sada.

4.7. Sistema experimental para o projeto de operadores


Muitos operadores podem ser vistos como uma combinao de mltiplos filtros. Para
propsitos experimentais apropriado implementar os filtros como programas autnomos e
execut-los individualmente. Desta maneira pode-se controlar os resultados intermedirios e
otimizar passos parciais, sem que seja necessrio executar toda a cadeia de processamento.
Uma vez que os filtros so executados como programas independentes, natural produzir a
combinao dos filtros numa interface de usurio e nela controlar tambm a execuo. A idia
no nova [1] [2], mas os sistemas conhecidos exigem um treinamento sobre as bibliotecas de
processamento de imagens que fazem parte destes sistemas. difcil combinar rotinas para
alm dos limites do sistema.

62
Figura 4.29: No sistema experimental para projeto de operadores, cada caixa corresponde a um programa
executvel, o qual pode ser ativado atravs de um clique. Verifica-se a dependncia a outros programas e
estes so iniciados na ordem correta.

No sistema experimental aqui implementado pode-se integrar quaisquer programas. Programas


so integrados interface atravs de uma descrio XML. A descrio feita conforme a
descrio de operadores do GeoAIDA (veja seo 4.4.4). Os parmetros para a execuo dos
programas podem ser alterados na prpria interface. O sistema reconhece sozinho, que parte
da rede projetada deve ser processada de novo quando se alteram parmetros. Quando se usa
um filtro no final da cadeia de processamento que produz uma sada compatvel com o sistema
GeoAIDA, a cadeia de processamento pode ser facilmente transformada em um operador
usando um script. Na figura 4.29 a interface com o usurio do sistema experimental pode ser
vista contendo uma rede bem grande.

63
5. Exemplos de aplicaes
GeoAIDA constitui a implementao de uma arquitetura de um sistema baseado em
conhecimento, para controlar a interpretao automtica de dados de sensoriamento remoto.
Assim sendo, no contm nenhuma funcionalidade para o processamento de imagens ou
avaliao. Estas funcionalidades precisam ser disponibilizadas atravs de mdulos externos.
Para mostrar a capacidade de trabalho do sistema, necessria a utilizao do GeoAIDA em
reas de aplicao da interpretao de dados de sensoriamento remoto. Neste captulo so
apresentados dois exemplos de aplicao nos quais GeoAIDA utilizado: o primeiro vem da
rea de classificao de uso do solo e baseia-se em fotografias areas combinadas com dados
de SIG, o segundo da rea de interpretao de imagens de satlite. Antes porm sero
descritos alguns operadores para o processamento de imagens e avaliao de hipteses,
desenvolvidos no mbito do Projeto GeoAIDA, que foram aplicados em diferentes pontos dos
exemplos de aplicao escolhidos.

5.1. Operadores especiais


No mbito do Projeto GeoAIDA foram preparados e desenvolvidos procedimentos de
segmentao:

para a deteco de prdios a partir de dados altimtricos de sistemas de varredura a


laser (Laserscan);
para a deteco do traado de ruas a partir de fotos areas e imagens SAR;
para a classificao de texturas sob a forma de um procedimento de aprendizagem.

Alm disso, foi desenvolvido um conceito geral para a avaliao de hipteses, usado como
operador bottom-up. Considerando que estes operadores sero utilizados nos exemplos de
aplicaes posteriormente descritos, eles sero sucintamente descritos a seguir.

5.1.1. Deteco de prdios com dados de Laserscan

A varredura a laser j se tornou um procedimento padro, para se produzir um Modelo Digital


de Terreno denso. Devido boa resoluo espacial e alta preciso das medidas, estes dados
so excelentes para a deteco de alvos artificiais. Por isso, diversos trabalhos tm feito a
extrao de prdios a partir de dados altimtricos [104][103][20][97]. Via de regra estes
procedimentos utilizam modelos paramtricos que so ajustados aos dados medidos, ou
utilizam as plantas dos prdios como dados de entrada.

No mbito do Projeto GeoAIDA foi desenvolvido um procedimento que precisa para a deteco
de prdios to-somente dos dados altimtricos e que no trabalha com modelos paramtricos.
Trata-se de um procedimento de crescimento de regies (Region Growing). Partindo dos dados
altimtricos do Laserscan, inicialmente so detectados saltos de altitudes. Regies contnuas,
nas quais os valores altimtricos vizinhos se diferenciam por menos do que um determinado
limiar, recebem um rtulo. Regies muito pequenas, que ocorrem p.ex. em reas de florestas,
permanecem no-classificadas; regies grandes demais so associadas ao plano de fundo.

64
Fig. 5.1: Segmentao de prdios com dados de Laserscan: comea-se esquerda em cima na imagem,
com as direes de partida mostradas na tabela. A direo de trabalho mantida, enquanto os pixels
estiverem no caminho para a regio. Posteriormente feita a escolha da prxima direo de trabalho de
acordo com a tabela.

A segmentao ocorre conforme apresentado na Figura 5.1. A procura iniciada com o pixel
superior esquerdo na imagem. A Tabela da direita apresenta a seqncia da alterao de
direo. A partida dada na linha Start com direo para a esquerda. Se isto no for possvel,
ocorre a mudana para baixo. Sendo alcanado o limite da regio, procede-se mudana
segundo a ordem da Tabela de Direes, cuja coluna esquerda contm a direo atual. As
direes ali indicadas como contrrias so testadas. Este procedimento recursivo repetido
at que no seja mais possvel nenhuma alterao de direo e o mais alto nvel de recurso
tenha sido alcanado. Ento o prximo pixel que ainda no pertena a uma regio procurado
na imagem e a partir dele procede-se de modo correspondente.

Na Figura 5.2 mostrada a aplicao do procedimento aos dados laser no centro da cidade de
Karlsruhe (Alemanha). Os dados altimtricos se encontram num raster de 0,5 m (resoluo
espacial) com uma resoluo (altimtrica) de 0,1 m. Aqui foi usado o valor de limiar de altitude
de 1 m. No mnimo 100 e no mximo 10.000 clulas no raster formam uma regio. Conforme
mostrado por esta figura, atravs desta escolha de parmetros so reconhecidos
essencialmente prdios com ptios internos fechados. reas de florestas bem como reas
verdes geralmente no so consideradas porque no representam reas conectadas
suficientemente grandes.

65
Fig. 5.2: Resultado da segmentao de plats de altitude em dados de
Laserscan

Um ptio interno fechado caracteriza-se pelo fato de estar rodeado por plats mais elevados.
Para delimitar a classe Ptio (Hof) da classe Prdio (Gebude), precisam ser determinadas
inicialmente as regies vizinhas de uma regio. Se as regies vizinhas forem todas elas mais
altas que a regio observada, ento a respectiva regio ser classificada como Ptio. A
Figura 5.3 mostra o resultado desta classificao tendo como exemplo o centro da cidade de
Karlsruhe. A classe Prdio est em vermelho, a classe Ptio est representada em verde.

Fig. 5.3: Segmentao de dados do Laserscan com posterior classificao


em Prdio (vermelho) e Ptio (verde).

66
5.1.2. Classificao baseada em textura

Imagens de superfcies naturais (no alteradas) podem ser descritas eficientemente atravs de
modelos de textura, que se baseiam em processos estocsticos bidimensionais. Uma possvel
implementao de um modelo estocstico para a classificao supervisionada de textura foi
descrita em [38]. Supervisionada neste contexto significa que se analisa uma amostra de
textura contendo as classes esperadas na imagem, com relao s suas caractersticas
estocsticas de primeira e segunda ordem. O modelo de primeira ordem aqui descreve a
densidade de probabilidade do processo de textura. A densidade calculada a partir do
histograma de luminncia de todos os elementos de cada classe de treinamento.

Geralmente a ocorrncia de um determinado valor de luminncia depende estatisticamente dos


valores dos seus vizinhos. O modelo de textura de segunda ordem considera por isso a
dependncia entre pares de pixels vizinhos, as assim chamadas cliques e descreve estas
dependncias locais atravs de campos aleatrios de Gibbs. Somente tipos de cliques
significativos estatisticamente so escolhidos para a definio do sistema de vizinhana . O
modelo de textura constitudo de quatro probabilidades:

probabilidade de luminncia P1 para cada classe (1 ordem);

probabilidade P2 para cada clique, que pertenam mesma classe;

probabilidade P3 para a diferena de luminncia de cada clique dentro de uma regio; e

probabilidade P4 para a diferena de luminncia de cada clique no limite das regies.

Em imagens com vrios canais pesquisada, alm disso, a dependncia dos canais entre si.
As probabilidades Pi formam o potencial VK de uma clique K. O logaritmo da probabilidade
utilizado como funo potencial, de modo a transformar a multiplicao de probabilidades
conjuntas, em soma dos potenciais ponderados:

Campos aleatrios de Gibbs descrevem a probabilidade de combinao de uma segmentao


de um sistema vizinho K:

A tarefa da segmentao maximizar a probabilidade conjunta para toda a imagem. Trata-se


de um processo iterativo devido s relaes de vizinhana.

5.1.3. Classificao baseada na varincia

A varincia de uma imagem pode ser utilizada como medida de sua estrutura. Com a
diminuio da resoluo da imagem, uma elevada varincia um indicador de estruturas
maiores. Verificou-se empiricamente que objetos artificiais, como por exemplo prdios,
provocam varincias particularmente elevadas em imagens com resoluo maior do que um
pixel/metro.

Por isso, no mbito deste projeto, foi desenvolvido um operador de segmentao baseado em
varincia, que permite determinar espaos de busca para objetos artificiais. Para tanto,
inicialmente determinada a varincia numa janela de tamanho pr-definido para toda a
imagem. Atravs de uma anlise do histograma da varincia (vide item 2.2.1) executada uma
segmentao inicial.

67
Considerando que a varincia em reas edificadas tambm muito grande, a segmentao
assim originada bastante esburacada. Estes buracos so fechados na medida em que
pequenas reas contguas so fundidas s suas redondezas.

Para obter um espao de busca o mais contnuo possvel, o prximo passo fundir regies
prximas. Se duas regies esto ligadas em vrios pontos, originam-se novamente buracos
que so novamente fechados. No ltimo passo as estruturas finas so eliminadas.

Este procedimento simples especialmente interessante para restringir rapidamente o espao


de busca na classificao de reas urbanas. A interpretao assim proposta pode ser
confirmada ou rejeitada por operadores mais especializados e custosos, p.ex. atravs da
deteco de prdios.

5.1.4. Deteco de estradas

Para a deteco de estradas e caminhos foi desenvolvido um procedimento em [24] e


integrado no mbito de [25] como operador top-down no GeoAIDA. Este procedimento utiliza o
perfil tpico de luminncia na direo transversal e a homogeneidade e continuidade na direo
longitudinal, com as quais as ruas e caminhos aparecem nas imagens. O algoritmo divide-se
em 3 partes. No primeiro passo calculada uma imagem com o gradiente e direo. Com
ajuda desta informao so identificadas regies que correspondem a um perfil paramtrico de
uso pr-definido. Por exemplo, candidatos a sees de estradas abaixo de um determinado
comprimento pr-determinado no so aceitos. Outros parmetros tpicos so um intervalo de
largura de estradas, um intervalo de brilho, bem como um perfil de gradiente, conforme mostra
a figura 5.4 .

Fig. 5.4: Gradiente do perfil vertical de estradas.

Na segunda parte do procedimento, os candidatos a estradas calculados no primeiro passo,


so ampliados atravs de um algoritmo de procura A*. Atravs desta procura tenta-se
encontrar o melhor caminho, atravs da imagem de gradiente, em relao ao modelo de
estradas paramtrico pr-definido. A procura efetuada iterativamente, at que uma
profundidade de procura s pr-determinada seja alcanada.

A Figura 5.5 explicita o procedimento de procura. Neste exemplo h trs alternativas para a
extenso da seo de estrada. Uma extenso da estrada termina quando um determinado
valor de custo for ultrapassado (vide equaes 5.1 a 5.3 abaixo). Os custos totais ctotal
compem-se da soma dos custos de procura j acumulados caccum e uma avaliao ponderada
dos custos restantes cremain . w designa aqui a profundidade de procura permitida e l um fator
de ponderao. celement denota os custos de um elemento da estrada.

68
Fig. 5.5: Procura do percurso de estrada otimizado

No ltimo passo do algoritmo, os segmentos lineares encontrados so vetorizados. Em


combinao com isto h uma suavizao ajustvel dos percursos de estradas.
Atravs da escolha de parmetros este procedimento aplicvel tanto em imagens de radar
(SAR) como em imagens de cmeras mtricas.

5.1.5. Um operador de avaliao genrico

De modo geral quaisquer operadores de avaliao podem ser introduzidos no GeoAIDA. A


prtica demonstrou, no entanto, que muitas tarefas de avaliao e agrupamento podem ser
resolvidas com um pequeno conjunto de funes com diferentes combinaes. Isto levou ao
desenvolvimento de um operador de avaliao genrico.

O seguinte problema precisava ser resolvido: embora o conjunto de funes necessrias seja
relativamente fixo, a combinao necessria depende, no entanto, da aplicao. Isto levou
soluo de implementar de modo eficiente em C++ as funes para a determinao de
atributos de objetos como forma e cor e para o agrupamento com base nas relaes entre
objetos tais como prximo um do outro, e transportar a combinao das funes atravs do
editor de redes semnticas interno ao GeoiAIDA, para o interpretador descrito na seo 4.6.2.
Visto que a biblioteca de funes e o interpretador so unidades separadas, que esto
conectadas entre si atravs de uma interface, extenses de funes so facilmente integrveis
ao interpretador.

5.2. Exemplos de uma classificao de uso do solo baseada


em foto-interpretao
Em [25] descreve-se detalhadamente como a arquitetura desenvolvida neste trabalho para a
interpretao de dados de sensoriamento remoto pode tornar mais eficiente a anlise do uso
do solo usando como base as classes de objeto do ATKIS. Aqui so considerados os seguintes
problemas: procedimento de anlise, avaliao de hipteses atravs de um operador genrico
de avaliao, tratamento de alternativas, diviso de regies a partir de dados, relaes
topolgicas de objetos de um nvel e especializao de objetos.

Como preparo para a anlise de uso do solo, inicialmente projetada uma rede semntica
baseada na hierarquia ATKIS (vide Figura 5.6). As classes de objetos rea Urbana, rea de
cultivo, Vila, Indstria, Campo Agrcola, Gramado e Floresta derivam diretamente do catlogo
ATKIS.

69
Fig. 5.6: Objetos do ATKIS transformados numa rede semntica; A classe
Regio serve como classe auxiliar para a diviso inicial da cena. Os objetos
Indstria e Assentamento sob as classes ATKIS so utilizados para uma
anlise estrutural, visto que as classes no podem ser diretamente
reconhecidas.

Freqentemente diferentes usos do solo so delimitados por ruas. Por isso foi inserido o n
Regio. As regies iniciais podem ser introduzidas atravs da rede viria, a qual retirada ou
de um SIG ou procurada pelo algoritmo de deteco de estradas descrito no item 5.1.4.
Locais de procura para as classes de objetos rea Urbana e Agricultura podem ser
determinados atravs de uma anlise de varincia conforme consta no item 5.1.3, j que a
varincia em resolues de imagem menores, maior em reas habitadas do que em reas
desabitadas devido a construes artificiais. Uma outra opo para se obter indicaes para
uma rea Urbana analisar a regio quanto a possveis prdios existentes (vide item 5.1.1).

A discriminao entre as classes Plantao, Gramneas e Floresta efetuada com auxlio


do procedimento descrito no item 5.1.2 sobre a classificao baseada na textura. Este
procedimento tambm utilizado para a deteco das classes Jardim e Estacionamento. As
classes Edifcio e Casa, que se distinguem atravs do tamanho e forma, so classificados
com ajuda do procedimento descrito no item 5.1.1. O reconhecimento das classes
Assentamento e Indstria ocorre s estruturalmente atravs dos seus componentes.

5.2.1. Seqncia de anlise hierrquica e avaliao de alternativas

Da cena representada na Figura 5.7, de Koblenz (Alemanha), esto disponveis uma fotografia
area, a informao altimtrica, bem como informaes sobre a rede viria, obtidas do ATKIS.

70
Fig. 5.7: Dados de entrada da cena Koblenz: foto area e Laserscan.

A Figura 5.8 apresenta alguns resultados parciais da interpretao. Inicialmente a imagem


dividida em sub-regies atravs da rede viria. Uma dessas sub-regies est ilustrada na
Figura 5.8a. Atravs de uma anlise de varincia (vide item 5.1.3), o espao de busca para a
regio mostrada limitado para a hierarquia parcial rea Urbana, de modo que uma deciso
ter que ser tomada entre Assentamento e Indstria. Para a sub-regio por isso ativada a
deteco de edificaes. O resultado mostrado na Figura 5.8b com a foto area sobreposta,
bem como na Figura 5.8c como mapa. A avaliao, se a sub-regio mostrada uma rea de
Assentamento, agora executada atravs de um operador de avaliao genrico, conforme
consta na seo 5.1.5 . Este inicialmente avalia o tamanho e a forma das casas encontradas. A
seguir calculada a rea total da componente construda. Isto finalmente leva deciso de
instanciar a regio como Assentamento, de acordo com a Figura 5.8d. A interpretao da
regio como rea industrial fracassou em funo da deteco de edificaes, que leva em
conta as medidas prprias de instalaes industriais.

Fig. 5.8: Interpretao parcial da cena de Koblenz: (a) sub-diviso inicial da regio com base na rede viria, (b) objetos
de um Assentamento superpostos na foto area, (c) objetos de uma Vila em forma de mapa, (d) resultado final da
anlise de uso do solo.

Na Figura 5.9 encontram-se tanto indcios de uma rea de assentamento ( esquerda) como
de instalaes industriais ( direita). A legenda destes mapas encontra-se na Figura 5.6. Neste
caso, duas estratgias de soluo so possveis: pode ser tomada uma deciso a favor de uma
das duas alternativas, ou a regio dividida. No caso em que o nmero de casas relativamente
extenso das instalaes industriais desempenha um papel meramente secundrio, deve-se
ento assumir que mesmo assim se trata de uma rea industrial, porque mesmo em reas
industriais ocorrem isoladamente pequenos prdios. Esta a soluo para a situao
apresentada. A segunda opo de soluo seria a diviso da regio em Assentamento e

71
Indstria. Ambas as alternativas de soluo so realizveis atravs do operador de avaliao
genrico descrito em 5.1.5.

Fig. 5.9: Interpretao alternativa de uma regio parcial como rea de assentamento ( esquerda) ou rea de indstria
( direita).A legenda se encontra na Figura 5.6.

5.2.2. Comparao de um resultado de interpretao com ATKIS


Os sensores mais recentemente disponveis permitem a deteco simultnea de informaes
altimtricas do Laserscan, imagens infravermelhas e coloridas numa s plataforma, na medida
em que sincronizam um scanner a laser com uma cmera multi-canal imageadora linha por
linha. Isto tem duas vantagens. Por um lado o georeferenciamento dos dados entre si
desnecessrio, como acontecia quando a deteco era feita separadamente ou mesmo em
instantes diferentes por vrios sensores. Por outro lado, atravs da deteco concomitante dos
dados de imagem e altimetria, a correo geomtrica dos dados de imagem muito facilitada,
visto que o sensor utilizado, em toda a faixa varrida, possui um ngulo de incidncia muito
inclinado e, alm disso, em cada ponto da imagem a altitude conhecida.

Na Figura 5.10 observa-se uma seo de um conjunto de dados multi-sensor de uma cena de
Ravensburg. Trata-se de uma imagem na regio do visvel e de outra no infravermelho com
uma resoluo de 1Pixel/25 cm e de um modelo altimtrico do Laserscan com uma resoluo
de 1 Pixel/m. Pela disponibilidade do canal no infravermelho a anlise de uso do solo torna-se
mais confivel, visto que, em combinao com a imagem visual, reas vegetadas se
diferenciam bem de superfcies impermeabilizadas. Alm disso, a associao com dados
Laserscan permite calcular a altura da vegetao, visto que a vegetao parcialmente
transparente luz e assim parte da radiao laser refletida em diferentes alturas da
vegetao. um padro no sistema de varredura a laser que o primeiro e o ltimo pulso sejam
registrados, de modo que a partir disso seja possvel derivar uma medida de altura da
vegetao.

72
Fig. 5.10: Dados de entrada da cena de Ravensburg: imagem no visvel, infravermelho e Laserscan.

A figura 5.11 mostra esquerda as reas de construo de residncias (Wohnbebauung) e


reas construdas (Ortslage). obtidas do ATKIS. direita est o resultado da interpretao
automtica. Aqui se verifica uma grande concordncia no que se refere forma de reas
construdas com os Assentamentos (Siedlung) detectados automaticamente. No obstante,
observa-se tambm que o conceito reas construdas aparentemente deve ser entendido
administrativamente e que de modo algum classifica o uso do solo, visto que algumas reas
dentro de reas construdas so utilizadas inequivocamente para agricultura. Alm disso
parece que ATKIS, com a identificao de reas de construo de residncias, no est mais
atualizada, pois em muitos setores de reas de construo de residncias

Fig. 5.11: Cena de Ravensburg: esquerda ATKIS, direita a interpretao. Legenda: Straen= estradas, Wege =
caminhos, Wohnbebauung = Construo de residncias, Ortslage = reas construdas, Siedlung = Assentamento,
Acker = Campo agrcola, Grasland = Gramneas, Forst = Reflorestamento,

73
5.3. Exemplo de anlise de uso do solo apoiada em dados de
satlite
As interaes entre desenvolvimentos na rea do meio ambiente e atividades na agricultura e
indstria so um tema fundamental da Agenda 21 (da Repblica Federal da Alemanha n.d.t.).
Para estimular o uso no-destrutivo de recursos naturais, so absolutamente necessrios um
controle coordenado do meio-ambiente e um planejamento ambiental sistemtico. Um
monitoramento contnuo da superfcie terrestre atravs de satlites um instrumento til para
dar conta destas tarefas. No entanto, via de regra no h pessoal qualificado suficiente para
interpretar os dados de sensoriamento remoto. A aplicao de um sistema de interpretao
automtica permite reconhecer o tipo e volume das alteraes de uso do solo.

Em [76] est descrita a interpretao de imagens de satlite de uma rea com


aproximadamente 850 km2 do Estado do Rio de Janeiro (Brasil), usando GeoAIDA. O
estabelecimento do sistema de interpretao ocorreu aqui por um especialista, que configurou
o sistema de acordo com dados de entrada de um analista de imagem qualificado. Em
funcionamento operacional, o sistema futuramente dever ser operado por pessoal sem
conhecimentos especiais de interpretao de imagens. O objetivo do sistema reconhecer
alteraes de uso do solo e interpret-las. As reas de maior interesse podero ento ser
analisadas mais detalhadamente por especialistas.

Os dados de entrada so imagens em 3 bandas espectrais (nas faixas do vermelho, verde e


infravermelho prximo) do satlite SPOT XS4 com uma resoluo espacial de 20 m (vide
Figura 5.12). Para segmentar estes dados foram utilizados dois operadores distintos de
processamento de imagens. O primeiro operador utiliza as reflectncias de diferentes
intensidades de vrios objetos, reflectncias essas que variam espectralmente. Assim por
exemplo uma vegetao sadia reflete mais fortemente nas faixas do verde e infravermelho,
enquanto a faixa do vermelho permite a determinao de diferentes tipos de solo e de plantas
em funo do seu contedo mineral. O segundo operador consiste num procedimento de
segmentao de textura, descrito no item 5.1.2 e que anteriormente foi treinado para os
diferentes tipos de objetos. Alm disso, foi adicionado conhecimento disponvel sobre a rede
viria e hidrogrfica no processo de interpretao.

Fig. 5.12: Trs bandas (vermelho, verde e infravermelho prximo) de


uma imagem de satlite SPOT em representao falsa-cor.

Para avaliar o resultado da interpretao automtica, foi elaborado um mapa de referncia pelo
especialista humano. A Figura 5.13 mostra esquerda o mapa de referncia e direita o
resultado da interpretao automtica. Aqui apareceram boas concordncias acima de 90%
para as classes Rocha e Floresta. A classificao errnea para Pastagem com 55% est
relativamente elevada, visto que Pastagem, em setores de sombras, foi classificada
erroneamente como Floresta. A incluso de informaes altimtricas aqui pode ajudar na

74
deteco inicial de reas sombreadas. Regies urbanas com baixa densidade populacional
tambm causam problemas, visto que aqui a informao textural muito fraca e por outro lado
a resoluo da imagem no suficiente para classificar estruturalmente estes setores, atravs
da deteco de prdios. Assim sendo 13% das reas urbanas foram classificadas
erroneamente como Pastagem e 33% como Floresta. Ao avaliar estes resultados h que se
considerar que o analista da imagem freqentemente utiliza um amplo conhecimento prvio,
que no pode ser obtido da imagem, como p.ex., o conhecimento do local, e assim diferentes
analistas de imagem chegam a diferentes resultados.

Fig. 5.13: Interpretao manual e automtica de uma imagem de satlite

Devido a fcil integrao com programas externos de processamento de imagem em GeoAIDA,


o operador de segmentao disponvel, baseado nas caractersticas espectrais dos objetos,
pde ser rapidamente integrado ao sistema, e combinado com o operador de textura, que foi
desenvolvido totalmente independente deste projeto. Alm disso, a interpretao de relaes
de vizinhana, em combinao com as informaes disponveis sobre ruas e rede de
drenagem, permite uma melhoria adicional da classificao.

75
6. Avaliao e Perspectivas
Os exemplos apresentados nos itens 5.2 e 5.3 demonstram que, a arquitetura desenvolvida
neste trabalho satisfaz o objetivo de controlar a interpretao de dados de sensoriamento
remoto. Contrastando com os sistemas baseados em conhecimento disponveis at o
momento, a anlise de grandes cenas tambm possvel de forma eficiente. Isto por um lado
est fundamentado na estratgia de anlise hierrquica, a qual pode delimitar de antemo as
reas de busca para determinadas classes de objetos. Por outro lado foi otimizada uma
implementao que permite o paralelismo dos passos de anlise, o que possibilita uma
utilizao eficiente dos recursos computacionais. Alm disso, a concepo aberta para a
conexo de operadores externos de processamento de imagens e de avaliao, facilita o
preparo de aplicaes complexas em equipe, especialmente porque solues parciais
existentes so facilmente integrveis.

Apesar destes resultados positivos, o desenvolvimento da arquitetura originada no mbito


deste trabalho no deve ser considerado como concludo. Como possveis direes de
desenvolvimentos posteriores, deve ser mencionado aqui o projeto de uma anlise multi-
hierrquica, a escolha automtica de operadores, a avaliao quantitativa da qualidade dos
resultados obtidos com a anlise automtica, bem como a utilizao de conjuntos de dados
multi-temporais.

6.1. Anlise multi-hierrquica


No GeoAIDA utiliza-se como modelo de conhecimento uma hierarquia dos objetos que se
esperam numa cena. Isto corresponde a uma percepo da cena. Via de regra existem porm
vrias percepes, cuja combinao somente ento resulta no que conhecemos geralmente
como imagem do mundo. Assim, por exemplo, uma rua pode ser parte de uma rea Urbana.
Paralelamente a isto, ela tambm um componente de uma rede viria.

Num sistema multi-hierrquico vrias hierarquias de modelos seriam construdas


paralelamente. A anlise se iniciaria paralelamente em todas as hierarquias. Se no exemplo
acima mencionado as estradas na hierarquia da rede viria somente podem ser detectadas no
contexto da hierarquia de uso do solo, ento na hierarquia de rede viria seriam geradas
hipteses at o nvel de segmentos de estradas (exclusive). Na hierarquia de uso do solo a
cena seria dividida nas diferentes classes de objeto, at que finalmente seja alcanado o nvel
correspondente aos segmentos de estradas. Assim que as hipteses de segmentos de
estradas forem geradas a partir do contexto, pode-se prosseguir na hierarquia da rede viria,
ou com a procura por mais classes de objetos subordinadas ou com a anlise estrutural dos
segmentos de estradas, para reuni-los em estradas num nvel superior.

Os problemas a serem considerados so, por um lado, o complexo design da anlise, que
estaria numa ordem superior atual, e por outro lado questes referentes visualizao. O
usurio precisar ter por um lado vises individuais da cena, e por outro lado a visualizao
das associaes entre as hierarquias.

6.2. Seleo automtica de operadores


A seleo de operadores para a segmentao e classificao atualmente manual e demanda
conhecimentos, por parte do usurio, sobre a disponibilidade e funcionalidade bsica dos
operadores. Em princpio a escolha do operador a ser usado depende da classe de objeto
procurada e dos dados disponveis, de modo que tal seleo poderia ser automatizada. Desta
forma, o sistema poderia reagir no caso de falta como tambm de agregao de uma nova
fonte de dados, e a interpretao seria ajustada independentemente e de forma otimizada s
condies de contorno alteradas.

Uma ampliao do sistema nesta direo , em princpio, bastante simples. Aos operadores
precisa ser agregada uma descrio detalhada dos tipos de dados aceitveis, tal como agora j

76
est disponvel de forma incipiente. Alm disso, sero complementados por uma medida de
qualidade, que descreve a sua adequao com relao deteco de uma determinada classe
de objetos. No design dos operadores deve-se observar que os valores para os parmetros
sejam calculados, na medida do possvel, a partir dos prprios dados, para que uma
configurao manual se torne desnecessria. Eventualmente seriam adequados para a sua
execuo, sistemas baseados em agentes, tal como esto descritos em [25] como uma forma
de aproveitamento do conhecimento.

6.3. Avaliao quantitativa da qualidade


Com respeito automatizao de procedimentos que at o momento vinham sendo feitos
manualmente, coloca-se naturalmente a questo sobre a qualidade do procedimento
automtico em relao ao manual. Isto pode ser feito qualitativamente atravs da sobreposio
j implementada dos mapas de resultados com quaisquer outros conjuntos de dados. Do ponto
de vista quantitativo aqui seria necessria uma sobreposio de duas hierarquias de objetos,
baseadas na mesma rede-modelo para ento determinar em cada nvel a interseco com
dados de referncia.

6.4. Interpretao multi-temporal de conjuntos de dados


Conjuntos de dados multi-temporais so via de regra analisados para verificar alteraes nas
cenas observadas (change detection). Dependendo da aplicao, podem ser importantes
alteraes em objetos artificiais como p.ex. o desenvolvimento urbano ou alteraes da
vegetao, p.ex. devido a alteraes no balano hdrico.

Comparaes baseadas em pixel so inadequadas para o sensoriamento remoto. Uma


soluo natural para a deteco de alteraes em seqncias de imagens multi-temporais a
comparao baseada em pixels. No entanto, um pr-requisito para isto um posicionamento
exato do pixel e condies de iluminao constantes, o que no ocorre durante a deteco de
dados de sensoriamento remoto. A comparao baseada em pixels mais adequada para
tarefas de controle em espaos fechados, visto que a podem ser produzidas condies de
iluminao constantes. Alm disso, um posicionamento com exatido de pixel efetivado pela
montagem da cmera sobre um trip, de modo que a nica grandeza perturbadora o rudo da
imagem. Se as condies quanto estabilidade da iluminao e posio da imagem forem
preenchidas, a comparao baseada em pixels constitui uma possibilidade de fcil execuo
para a deteco automtica de alteraes. O procedimento adequado especialmente para o
controle semi-automtico, no qual as imagens somente so registradas em caso de grandes
mudanas. O intrprete ento precisa somente testar as imagens com movimento. Para a
aplicao em dados de sensoriamento remoto a comparao baseada em pixels inadequada
devido variao das condies de iluminao e do posicionamento inexato do material das
imagens.

Comparao atravs de dados estatsticos locais. Quando se pretende fazer uma


comparao no nvel da imagem, uma comparao com base em estatstica local um
procedimento vivel; isto , calculam-se valores estatsticos dentro de uma janela mvel sobre
a imagem, e os resultados so comparados entre si. Dentre as grandezas estatsticas devem
ser considerados, por exemplo, a mdia (momento de 1 ordem) a mediana e a varincia
(momento de 2 ordem). Aqui deve ser dada preferncia, em princpio, a grandezas sem
valores mdios como a varincia, j que eles possuem um comportamento mais tolerante em
relao s condies de iluminao. Embora com tal procedimento seja possvel determinar as
probabilidades da alterao de regies, no possvel fazer quaisquer afirmaes sobre o tipo
de alterao, visto que no foi agregada nenhuma semntica.

Comparao estrutural. Na comparao estrutural, inicialmente os conjuntos multi-temporais


de dados so interpretados. A comparao ento ocorre no nvel semntico. Isto pressupe
que contedos de imagens no-alteradas possam ser imediatamente classificados. Por isso em
[42] prope-se introduzir probabilidades de transio entre as classes para, desta forma,
conduzir a deteco de alteraes em direes plausveis. Assim por exemplo improvvel
que numa rea agrcola dentro de um ano ocorra uma rea de reflorestamento denso,

77
enquanto que a criao de um novo bairro residencial numa rea agrcola com construes na
vizinhana, bastante provvel. Neste procedimento, uma classificao inicial correta torna-se
mais importante. Alm disso, uma nica classificao errnea pode levar a um desvio nas
classificaes subseqentes.

Utilizao de conjuntos de dados multi-temporais em GeoAIDA. Fundamentalmente a


utilizao de conjuntos de dados multi-temporais em GeoAIDA imaginvel de trs formas
diferentes: para o controle de expectativa e para a adaptao de parmetros na fase top-down,
bem como para a deteco de alteraes durante o passo bottom-up. Em todas as
possibilidades de integrao de conjuntos de dados multi-temporais aqui apresentadas, no
necessria a apresentao de seqncias de imagens mais antigas.

Avaliao de expectativa. Uma avaliao de expectativa poderia ser obtida, por exemplo,
atravs de uma avaliao modificada, da lista de objetos originada pelo operador top-down
utilizando uma interpretao anterior e probabilidades de transio. As probabilidades de
transio aqui podem ser integradas como atributos dos objetos. A avaliao na interpretao
dos resultados top-down precisaria ser complementada.

Adaptao de parmetros. O trabalho [77] cuida da adaptao de parmetros de algoritmos


de processamento de imagens em ambiente industrial. At que ponto os resultados ali obtidos
podem ser transferidos para a interpretao de dados de sensoriamento remoto, deveria ser
inicialmente melhor pesquisado, visto que as condies de contorno no processamento de
imagens industriais so, via de regra, bem mais constantes. Fundamentalmente a adaptao
de parmetros precisaria ser integrada nos operadores top-down, sendo que nestes
operadores uma parte da interpretao j estaria previamente includa. Dentro do operador top-
down precisaria ser acionado um circuito que ajusta os parmetros at que, com os novos
dados, seja obtida a mesma interpretao na seo de imagem selecionada, na expectativa de
que, para as demais sees da imagem tambm possam ser obtidos resultados corretos com
este ajuste.

Deteco de mudanas. Em princpio a deteco de mudanas possvel durante a fase top-


down ou bottom-up. Uma deteco durante o andamento da fase top-down teria, em resumo,
aproximadamente a seguinte seqncia.

Inicialmente as regies de nvel superior so comparadas, por exemplo, atravs de valores


estatsticos locais. Se forem detectadas mudanas, comparam-se as sub-regies com mais
detalhes. Considerando que improvvel regies em duas imagens diferentes sobreporem-se
exatamente, devero ser observadas tolerncias. Estas tolerncias podem ser relativas ao
tamanho da imagem, com a desvantagem que, desta forma, regies muito pequenas no
podero ser reconhecidas. Como exemplo, mencionamos aqui a sede de uma propriedade
rural, que foi ampliada por um celeiro, sobre um campo agrcola. Em relao ao tamanho do
campo agrcola, a nova construo do um celeiro aparece como uma alterao muito pequena
que eventualmente no ser detectada. Em relao ao tamanho da sede da propriedade rural,
a regio tomada pelo celeiro no pode ser desprezada.

Se por outro lado forem permitidas tolerncias absolutas, coloca-se a questo quanto ao valor
mximo aceitvel para estes desvios. Se numa grande rea florestal for cortada uma rvore,
esta alterao ser de pequeno interesse. Se, no entanto l for construda uma casa, trata-se
ento de uma mudana do uso do solo.

As mudanas na cena so melhor detectveis durante a fase bottom-up, visto que comeando
com as menores estruturas vo se formando objetos contguos cada vez maiores. Na maioria
das vezes as mudanas so visveis inicialmente nas pequenas estruturas, ao passo que
alteraes detectadas nos nveis mais elevados da hierarquia de objetos decorrem de
imprecises da interpretao, como pequenos deslocamentos das bordas dos objetos.

Visualizao de mudanas. Alm de detect-las, ser necessrio apresentar as mudanas,


ao usurio de modo adequado. Vale portanto visualizar a comparao de duas hierarquias e
direcionar a ateno para as regies alteradas. Aqui se coloca a questo da relevncia de
alteraes que via de regra depende do contexto. Se em reas florestais europias forem

78
cortadas rvores, isto ocorre por motivos de economia florestal. Nas florestas tropicais da
Amrica do Sul por outro lado isto pode ser um indcio do incio de um desmatamento ilegal.

79
7. Resumo
O contedo do presente trabalho o projeto de uma arquitetura de um sistema baseado em
conhecimento para a interpretao automtica de dados de sensoriamento remoto. O sistema
controla a seqncia de interpretao de fotos areas e imagens de satlite e gera uma
descrio simblica de cenas, que agrega uma semntica aos objetos na imagem. A descrio
simblica de cenas efetuada na forma de uma rvore. Cada n corresponde a um objeto nos
dados (imagens) de entrada. A posio exata de cada objeto registrada com um valor de
identificao especifico do objeto em imagens rotuladas. Com ajuda da rvore de objetos
(instncias) e das imagens rotuladas, podem ser produzidos mapas com diferentes graus de
detalhamento.

A interpretao de dados de sensoriamento remoto atualmente feita, na maioria das vezes,


manualmente, para as mais diferentes reas de aplicao. Estas reas podem ser de interesse
civil ou militar. Dentre as tarefas civis destacam-se a obteno de mapas, o planejamento
urbano, o uso do solo, a proteo ao meio ambiente, a proteo a catstrofes, o preparo,
verificao e atualizao de sistemas de geoprocessamento bem como a modelagem
tridimensional de cidades. As tarefas militares so o reconhecimento areo e a confeco de
mapas. Com o aumento do nmero de aplicaes e o desejo de se obter continuamente
informaes atualizadas, a utilizao de procedimentos automticos para a interpretao de
dados de sensoriamento remoto est ganhando importncia. Esta tendncia foi considerada no
procedimento aqui apresentado, na medida em que tenta integrar procedimentos j conhecidos
e comprovados para a interpretao de certas classes de objetos, ampliando-os para um
sistema integral adequado a aplicaes prticas.

Alm dos dados de sensoriamento remoto propriamente ditos, o sistema precisa para a
interpretao dos dados, de um modelo das classes de objetos esperados. Este modelo
estabelecido na forma de uma rvore, na qual sub-objetos estejam totalmente contidos em
super-objetos. Estas classes so designadas de ns. A cada n pode ser associado um
operador de processamento de imagem, que est em condies de extrair objetos daquela
classe do material de imagem disponibilizado, ou que pelo menos tenha a possibilidade de
indicar previamente as possveis reas de procura para objetos daquela classe.

A estrutura desta hierarquia de objetos espelha assim o procedimento de um observador que


se aproxima de uma cena e que inicialmente reconhece super-objetos Quanto mais ele se
aproximar da cena, tanto mais estrutura reconhecida na cena e os objetos parciais tornam-se
visveis. Alguns objetos ento somente so identificveis pela estrutura de seus objetos
parciais, enquanto outros por sua vez somente so reconhecveis num contexto superior.

A estratgia de anlise do sistema aqui apresentado, opera segundo o mesmo princpio.


Inicialmente tenta-se dividir a cena em partes cada vez menores. Aqui so utilizados
operadores de processamento de imagem especficos para cada classe de objetos, para
delimitar setores de busca de objetos subjacentes. Para cada um dos setores de busca
estabelecido um n numa rede de instncias hipottica, estruturalmente similar rede do
modelo. Se no estiver disponvel nenhum operador especifico para uma classe de objetos, a
rea de busca completa da instncia superior considerada. Se os ns das folhas da rede-
modelo forem alcanados, ocorre uma verificao da rede hipottica de instncias, comeando
pelo n folha. Para tanto ativado um operador de avaliao, que pesquisa a estrutura de seus
objetos parciais subjacentes, elimina ou modifica objetos parciais individuais e agrupa os
objetos parciais em objetos maiores. A anlise prossegue desta forma at que o n raiz seja
alcanado. Aps a concluso da interpretao, com ajuda da rede de instncias, as imagens
rotuladas produzidas durante a interpretao so introduzidas num mapa e codificadas de tal
forma que, com ajuda da rede de instncias ou da rede-modelo, possam ser produzidos
interativamente mapas em diferentes graus de detalhe. Combinaes em vrios graus de
detalhamento em diferentes setores do mapa so possveis, bem como o acesso aos atributos
de um objeto, atravs de sua seleo no mapa.

80
As abordagens propostas at o momento para a interpretao de dados de sensoriamento
remoto podem ser subdivididas em duas categorias. Por um lado trabalha-se no
desenvolvimento de algoritmos que possam detectar poucas classes de objetos num
determinado contexto. Por outro lado h sistemas integrados, que tentam interpretar cenas
inteiras. Os sistemas mais promissores desta segunda categoria mantm o conhecimento
sobre a cena em redes semnticas. Tais redes semnticas correspondem a um modelo da
cena. Cada n da rede corresponde a um objeto que pode ocorrer na cena. As relaes entre
os objetos so modeladas em arcos, que conectam os ns. Para realizar uma anlise baseada
em regras, associam-se determinados significados aos arcos. Alguns sistemas permitem
somente a descrio de relaes hierrquicas como part-of, is-a, etc. Outros introduzem
relaes topolgicas para, por exemplo, descrever a vizinhana de objetos. A caracterstica
comum a todos estes procedimentos que o processamento de imagem propriamente dito
est somente vinculado no nvel dos ns folha. A interpretao efetuada atravs de anlise
estrutural a partir dos objetos brutos obtidos das imagens. Em funo do grande nmero de
objetos brutos existentes em dados de sensoriamento remoto e das muitas possibilidades de
combinaes da resultantes, estes procedimentos so pouco adequados para a interpretao
de dados de sensoriamento remoto.

O sistema apresentado neste trabalho tambm utiliza uma rede semntica para a descrio do
modelo de conhecimento. A rede semntica rigorosamente hierrquica e utilizada
concomitantemente para o controle da anlise. Os arcos tem uma importncia especial. Eles
conectam somente objetos em diferentes planos hierrquicos. O seu significado est vinculado
a operadores de avaliao, que, de acordo com cada exigncia especfica, podem ser
reproduzidos para todos os tipos de arcos possveis. Assim, relaes part-of podem ser
modeladas da mesma forma que relaes topolgicas entre objetos em um mesmo nvel
hierrquico.

A conexo com os dados ocorre em cada n da rede semntica, desde que se conhea um
procedimento capaz de restringir o espao de busca para objetos do correspondente tipo de
n. Estes procedimentos no esto limitados ao processamento de imagens. De modo
equivalente, por exemplo consultas em bancos de dados tambm podem ser integradas num
SIG. Atravs da restrio prvia do espao de busca nos nveis de objetos superiores, no
necessria uma busca completa de todas as combinaes de primitivas da imagem, procura
de solues apropriadas. Obtm-se assim um aumento de eficincia.

A estratgia de anlise orientada ao modelo hierrquico dividiu a cena inicial em setores cada
vez menores, os quais podem ser tratados independentemente. Atravs disso, obtm-se um
grau elevado de paralelismo, que viabiliza a utilizao do sistema em computadores com
mltiplos processadores ou em clusters de computadores.

Deu-se grande nfase na criao de uma interface simples e flexvel para o acoplamento a
programas externos de processamento de dados. Tais programas so utilizados tanto para a
segmentao e classificao como tambm para a avaliao. Por isso o sistema
especialmente adequado para projetos cooperativos, para coordenar a fuso de resultados
parciais de diferentes processos de anlise. Em projetos de verificao do ATKIS e na
interpretao de imagens de satlite referentes a mudanas de uso do solo em reas florestais
da Amrica do Sul, o conceito aqui elaborado comprovou a sua aplicabilidade universal.

Atravs da estratgia de soluo, que consiste em dividir cenas hierarquicamente e tratar


problemas parciais localmente, a arquitetura aqui apresentada, constitui uma contribuio
simples, abrangente, robusta e eficiente para a utilizao prtica de sistemas de interpretao
automtica na rea de sensoriamento remoto.

81
Glossrio
Nota do Tradutor: Neste glossrio mantida a seqncia do original em alemo.

A*

Com A* designado um algoritmo de busca, que procura de um nmero de solues a soluo


tima, na medida em que ele continua desenvolvendo aquela que a mais promissora.
A escolha da soluo mais promissora passa pela avaliao dos custos totais, que se
compem dos custos acumulados somados aos custos restantes. A busca concluda,
assim que um caminho de soluo tenha encontrado o seu objetivo. (vide Notaes).

American Standard Code for Information Interchange (ASCII) Codificao para a


transmisso de seqncias simples de sinais. Vide item 4.1.1.

Amtlich Topographisch-Kartographisches Informationssystem (ATKIS) Sistema de


Geoinformaes oficial da Repblica Federal da Alemanha. Vide item 3.1.3.

Balloon-Help Balloon-Help designa uma posio de ajuda em superfcies de usurio, que


parecem com um balo, quando o indicador do mouse posicionado num elemento da
superfcie do usurio.

Bottom-Up-Operator O operador Bottom-Up contm uma lista de objetos com as respectivas


regies. Esta lista ele deve avaliar, resolver conflitos entre objetos e agrup-los.

Boudingbox Boudingbox designa o retngulo que envolve uma regio, direcionada


paralelamente aos eixos de coordenadas.

Byteorder Dados que ultrapassam a faixa de valores [0...255], somente podem ser
armazenados em mais que um byte. Se os dados devem ser guardados num arquivo,
precisa ser decidido se inicialmente os bytes de valor mais elevado (Big-Endian-
System) ou os bytes de valor mais baixo (Little-Endian-System) sero arquivados. De
que forma os tipos de dados so arquivados, depende de como o processador trabalha
com os dados. No caso de processadores Intel por exemplo trata-se de Little-Endian-
Systems, enquanto a arquitetura Power PC, bem como muitos processadores RISC
utilizam Big-Endian. Ocorrem dificuldades na entrada dos dados de sistemas com
diferentes Byteorders. Somente quando o tamanho dos tipos de dados for conhecido,
os dados podem ser corretamente transformados.

Cache Como cache designa-se um arquivo de dados com curtos perodos de acesso, que
anteposto a um arquivo de dados mais lento. Dados frequentemente usados so
colocados no cache e podem ser rapidamente disponibilizados em caso de
necessidade. Caso os dados no estejam disponveis no cache precisa ser acessada a
memria principal. Os dados so transmitidos ao cache para que, no caso de novo
acesso, eles possam ser rapidamente disponibilizados. Aps cada acesso ao cache o
valor dos dados correspondentes aumentado. Caso o cache estiver cheio, aqueles
dados de menor valor so retirados.

Compiler Um compilador serve para transformar um texto de programa numa descrio


prxima ao hardware, que pode ser executada diretamente do processador (vide
Interpreter).

82
CSV CSV um espao de cor, nos quais as cores so representadas pelas componentes
Cor (C), Saturao (S) e Valor de brilho (V). Este espao de cor mais indicado para
tarefas de segmentao, visto que nveis de cinza e cores esto separados.

Digitales Gelndemodell (DGM) Um Modelo Digital de Terreno (MDT) descreve o perfil de


uma cena. H diversas opes para se produzir um MDT, como p.ex. o clculo a partir
de dados estereoscpicos, a varredura da superfcie com um laser ou a medio
atravs de mensurao local.

E
eXtended Markup Language (XML) Em XML podem ser armazenadas hierarquias de objeto
com atributos. XML uma linguagem que pode ser designada como uma
generalizao de Hypertext Markup Language (HTML). Enquanto o HTML conhece um
conjunto fixo de objetos, em XML o significado dos objetos definido num arquivo
auxiliar. GeoAIDA no precisa destes arquivos auxiliares. O significado dos objetos
determinado especificamente no contexto.

F
FIFO FIFO sigla de First In First Out e significa que o dado que foi colocado inicialmente no
container de dados, deixa o container primeiramente. Isto corresponde ao modo de
trabalho de uma correia transportadora. O objeto que colocado primeiro na correia
transportadora, chega primeiro o seu final (vide LIFO).

Filter Um filtro um programa que submete dados a uma transformao, para torn-los mais
acessveis em relao a certas informaes.

Finite State Machine (FSM) Designa-se de Finite State Machine um autmato que somente
pode aceitar um nmero limitado de condies. Estas condies via de regra percorrem
uma seqncia pr-determinada, na qual ocorrncias externas podem alterar a
seqncia do trabalho.

Footprint Designa-se como Footprint a projeo bidimensional de um objeto num plano.

G
GeoAIDA a sigla de Geo Automatic Image Data Analyzer e designa geralmente um projeto
com ferramentas para a avaliao de dados de sensoriamento remoto.
Especificamente GeoAIDA consiste num procedimento que, com ajuda de
conhecimento de modelos, interpreta automaticamente dados de sensoriamento
remoto.

Geoinformationssystem (GIS) Um Sistema de Informaes Geogrficas ou SIG designa um


sistema que disponibiliza informaes localizadas. Geralmente estas informaes so
mantidas em bancos de dados, que foram ampliados pela opo do questionamento
espacial.

Geocoordenadas Geocooordenadas a designao reduzida para um sistema de


coordenadas geodsicas. Num sistema de coordenadas geodsicas possvel
descrever inequivocamente posies na superfcie terrestre.

Holistic O termo holistic designa algo como totalidade. No sistema GeoAIDA este termo
usado em conjunto com operadores. Um operador holstico um programa que permite

83
a deteco de uma ou vrias classes de objeto de modo
mgico, isto atravs de uma considerao total, no especificada em detalhe dos
dados de entrada, tendo como objetivo delimitar o nmero das possveis hipteses.

Hypertext Markup Language (HTML) A Hypertext Markup Language serve para descrever
textos estruturalmente.

Instanznetz A rede de instncias o resultado da aplicao do modelo de rede numa cena


concreta. Objetos do modelo que esto disponveis na cena so instanciados. Um
objeto de modelo pode ser instanciado uniformemente vrias vezes ou no instanciado
na rede de instncias. Durante a anlise os ns da rede de instncias so designados
de hipteses. Somente com a verificao do n da cena, toda a rede de instncias
confirmada.

Interaktive Karte Um mapa interativo o resultado da anlise com GeoAIDA. Constitui-se de


um rede de modelos, uma rede de instncias e uma imagem bidimensional, nas quais
os mapas esto arquivados, codificados em diferentes detalhes, bem como um
programa, o qual, com ajuda dos dados, faz o mapa pedido pelo usurio.

Interpreter Um intrprete executa um programa, interpretando o texto do programa e o conduz


diretamente para a execuo (vide Compiler).

Labelbild Uma imagem rotulada serve para descrever a posio e a extenso de objetos com
a preciso exata de um pixel, na medida em que aos pixels que se encontram dentro
dos limites do objeto associado um valor de identificao.

LIFO LIFO a sigla de Last In First Out e significa que a ltima data ajustada no continer de
dados, a primeira que deixa novamente o continer. Isto corresponde forma de
trabalho de uma pilha. O objeto que foi colocado por ltimo na pilha, dever ser o
primeiro novamente retirado (vide FIFO).

Modellnetz vide semantisches Netz (rede semntica)

Operator Como Operador designa-se no sistema GeoAIDA um programa prprio que


executa, atravs de uma interface definida, passos especficos de processamento de
dados. Em GeoAIDA diferencia-se entre operadores Top-Down e Bottom-Up.

Pipe Como Pipe designa-se uma forma especial de arquivo, acessado por dois processos
que atuam simultaneamente: um processo registra seu resultado no arquivo enquanto
o outro l este arquivo. Pipes servem para a troca de dados entre dois processos que
ocorrem no mesmo computador. Pipes normalmente no possuem nome, ou seja eles
somente podem ser estruturados atravs de hereditariedade entre dois processos. Os
assim chamados Named Pipes no tm esta desvantagem. Aparecem no sistema de
arquivos e podem ser abertos por dois processos, como arquivos normais. Informaes
mais detalhadas encontram-se em [99].

84
Pixel Pixel a forma curta de Picture element e descreve um ponto da imagem.

Portable-Any-Map-Format (PAM-Format) O formato PAM um formato de dados para


arquivar imagens. Constitui-se de um cabealho ASCII que descreve os dados de
imagem subseqentes e que, via de regra, nos dados propriamente ditos so
arquivados em modo binrio. Na sua verso original o formato apia dados em 8 bits.
Mais recentemente o formato foi ampliado para tipos de dados maiores. Valores de
vrgulas flutuantes no entanto no esto previstos. So apoiadas imagens coloridas
(Pixmap = PPM), imagens em nveis de cinza (Grey = PGM) e Bitmaps (PBM).

Prozess Um processo designa uma programa com desenvolvimento prprio que, ao contrrio
de um Thread, est ativado e encapsulado por outros programas ativos simultnea
mente do ponto de vista da tcnica de armazenamento.

Queue Uma fila um continer de dados FIFO.

Reihenmesskamera (RMK) Abreviatura de cmeras mtricas que so utilizadas para a


obteno de fotografias areas. A foto area aqui registrada em filme. So possveis
fotos coloridas, em nveis de cinza e infravermelho.

S
Script Um Script designa uma seqncia de linhas de comando que, sendo chamado o Script,
so executadas pelo Intrprete.

semantisches Netz A rede semntica em GeoAIDA descreve o conhecimento sobre a cena.


Trata-se aqui de um modelo genrico sobre os objetos esperados. A rede por isso
tambm designada como rede de modelo ou rede de conceitos. GeoAIDA utiliza
redes rigorosamente hierrquicas, isto , a rede possui a forma de uma rvore.

Socket Contrastando com Pipes, atravs de Sockets possvel a troca de dados entre
processos, que esto rodando em diversos computadores. Para isto, de cada lado
aberto um Socket, sobre o qual ocorre a transferncia de dados. Sockets so por
exemplo aplicados em diversos protocolos de redes. Informaes mais detalhadas
encontram-se em [99].

Spatial Espacial.

Stack Uma pilha um continer de dados LIFO.

Standard Template Library (STL) STL uma coleo de continers de dados Template e das
funes Template que podem ser utilizadas sobre os mesmos.

Synthetic Aperture Radar (SAR) O radar de abertura sinttica designa um mtodo para
ampliar a abertura de uma antena sinteticamente para emitir e receber microondas em
fase coerente ao longo de um longo percurso de vo. Sistemas SAR podem ser
aerotransportados ou orbitais.

Szene A cena sempre o n superior na rede de modelo ou na rede de instncias e designa a


quantidade de todos os objetos na rea observada.

85
T

Task Task designa uma tarefa a ser resolvida. No contexto de computao considerado
como sinnimo de processo.

Template Sob classes Template e funes entende-se texto de programa parametrizado.


Templates so quase um modelo de programa que somente aps o estabelecimento
dos parmetros, instanciado e assim torna-se um cdigo de programa compilvel. Os
parmetros freqentemente so utilizados para estabelecer tipos de dados. Uma
biblioteca de classes de Template contm somente modelos de classe e funo.
flexibilidade da possvel tipificao se contrape a desvantagem de que a biblioteca
no compilvel por si em primeiro lugar. Por isso os tempos do desenvolvimento do
programa aumentam no processo de compilao.

Thread O processamento de um programa pode ocorrer em vrios Threads operando


simultaneamente, que porm dividem os dados entre si. Tratando-se de um Thread de
um programa prprio, que do ponto de vista da tcnica de armazenamento, roda
encapsulado de outros programas, temos um Processo.

Timer Um timer um equipamento ou objeto que regularmente emite um sinal.

Token Como Token designa-se um smbolo que representa um certo assunto ou um certo
objeto.

Top-Down-Operator A tarefa de um operador Top-Down , a partir dos dados que lhe so


colocados disposio, gerar uma lista de regies atribudas e classificadas.

Umgekehrt Polnische Notation (UPN) Uma UPN (Notao Polonesa Invertida) uma
notao ps-fixada, isto , so sempre indicados primeiro os operandos e depois os
operadores a serem usados sobre estes. O resultado colocado no local do operador e
continua-se com o processamento.

Visulelles Bild (VIS) Imagem visual. Com VIS designada uma imagem da faixa do visvel no
espectro da luz. Pode tratar-se aqui de uma imagem colorida ou de nvel de cinza.

Widespace Como Widespace so designados todos os sinais que produzem um espao


vazio. Incluem-se aqui sinal de espaamento, tabuladores ou tambm rupturas de
linhas.

Wissensbasiert Como baseados em conhecimento so designados os procedimentos, que


interpretam os dados com base num certo conhecimento prvio. Este conhecimento
prvio pode entrar implicitamente, por exemplo atravs de codificao do conhecimento
num algoritmo, ou explicitamente, por exemplo na forma de uma base de
conhecimento, que pode ser trabalhada independentemente do procedimento de
processamento de dados.`s vezes o conhecimento est presente s no operador, que
utiliza o procedimento somente num determinado contexto. Num certo sentido
GeoAIDA um sistema deste tipo.

86
Bibliografia

[1] HALCON. URL http://www.mvtec.com/halcon/.

[2] Khoros. URL http://www.khoral.com.

[3] Achen, M.: Untersuchungen ber Nutzungsmglichkeiten von Satellitenbilddaten


fr eine kologisch orientierte Stadtplanung am Beispiel Heidelberg.
Selbstverlag des Geographischen Institutes der Universitt Heidelberg,
Heidelberg, 1993.

[4] Ackermann, F.: Digital Image Correlation: Performance and potential Application
In Photogrammetry. In Photogrammetric Record, Bd. 11, S. 429439. 1985.

[5] Aviad, Z., Carnine, P.: Road Finding for Road-Network Extraction. In
Computer Vision and Pattern Recognition, S. 814819. IEEE, 1988.

[6] Baatz, M., Heynen, M., Hofmann, P., Lingenfelder, I., Mimler, M., Schpe,
A., Willhauck, G.: eCognition User Guide. Definiens AG, Mnchen, 2000.

[7] Baatz, M., Schpe, A.: Object-oriented and multi-scale image analysis in
semantic networks. In Proc. 2nd International Symposium on Operationalisation
of Remote Sensing Conference and Exhibition. ITC, Enschede, 1999.

[8] Baatz, M., Schpe, A.: Multiresolution segmentation an optimization


approach for high quality multi-scale image segmentation. In Strobl, J.,
B. T. G. G., Hg., Angewandte Geographische Informationsverarbeitung
Beitrge zum AGIT-Symposium Salzburg, S. 1223. Wichmann, Karlsruhe,
2000.

[9] Baillard, C. et al.: Segmentation of Urban Scenes from Aerial Stereo Imagery.
In Proc. of 14th Int. Conf. on Pattern Recognition. Brisbane, Australia, 1998.

[10] Baltsavias, E. P.: Hierarchical Multiphoto Matching and D.T.M Generation.


In Int. Archives for Photogrammetry and Remote Sensing, Bd. 27, Com.III.
Kyoto, 1988.

[11] Barnsley, M., Barr, S.: A graph-based structural pattern recognition system
to infer land use from fine spatial resolution land cover data. Computers,
Environment and Urban Systems, Bd. 21:209225, 1997.

[12] Barzohar, M., Cooper, D.: Automatic Finding of Main Road in Aerial Images
by Using Geometric - Stochastic Models and Estimation. In Computer
Vision and Pattern Recognition, S. 459464. IEEE, 1993.

[13] Bauer, T., Steinnocher, K.: Per-parcel land use classification in urban
areas applying a rule-based technique. GIS, Vol. 6:2427, 2001.

[14] Baumgartner, A., Eckstein, W., Heipke, C., Hinz, S., Mayer, H., Radig, B.,
Steger, C., Wiedemann, C.: TUM-Research on Road Extraction. Christian
Heipke and Helmut Mayer, 1999.

[15] Baumgartner, A., Steger, C., Mayer, H., Eckstein, W., Ebner, H.: Automatic
Road Extraction based on Multi-Scale, Grouping, and Context.
In Photogrammetric Engineering & Remote Sensing, Bd. 65, S. 777786.
1999.

87
[16] Belknap, R., Hanson, A., Riseman, E.: The information fusion problem
and a rule-based hypotheses applied to complex aggregations of image
events. In Proc. of the IEEE Conference on Computer Vision and Pattern
Recognition, S. 2226. Miami, 1986.

[17] Beveridge, R., Hanson, A., Riseman, E.: Segmenting images using localized
histograms. Coins technical report, University of Massachusetts at
Amherst, 1986.

[18] Blaschke, T.: Objectextraction und regelbasierte Klassifikation von Fernerkundungsdaten:


Neue Mglichkeiten fr GIS-Anwender und Planer. In Schrenk, M., (Hg)., Beitrge zum 5.
Symposium zur Rolle der Informationstechnologie in der und fr die Raumplanung, 153
162, Wien, 2000.

[19] Blaschke, T., Lang, S., Lorup, E., Strobl, J., Zeil, P.: Object-oriented image processing in
an integrated GIS/remote sensing environment for environmental applications. In Cremers,
A., Greve, K., Hg., Umweltinformatik 00. Metropolis, Bonn, 2000.

[20] Brenner, C.: Dreidimensionale Gebuderekonstruktion aus digitalen Oberflchenmodellen


und Grundrissen. Dissertation, Fakultt fr Bauingenieur- und Vermessungswesen,
Universitt Stuttgart, Stuttgart, 2000.

[21] Brooks, R. A.: Model-Based Three-Dimensional Interpretations of Two-Dimensional


Images. In IEEE Trans. on Pattern Analysis and Machine Intelligence [80], 140150.

[22] Burns, J., Hanson, A., Riseman, E.: Extracting linear features. In 7th International
Conference on Pattern Recognition, Bd. I, 482485. Montreal, 1984.

[23] Burns, J., Hanson, A., Riseman, E.: Extracting straight lines. IEEE Trans on Pattern
Analysis and Machine Intelligence (PAMI), vol. 8:425455, 1986.

[24] Bckner, J.: Model Based Road Extraction for the Registration and Interpretation of
Remote Sensing Data. In ISPRS Commission IV Symposium on GIS - Between Visions
and Applications. Stuttgart, Germany, 7.9.- 10.9.98, 1998.

[25] Bckner, J.: Ein wissensbasiertes System zur automatischen Extraktion von semantischen
Informationen aus digitalen Fernerkundungsdaten. Dissertation, Institut fr Theoretische
Nachrichtentechnik und Informationsverarbeitung, Universitt Hannover, Hannover, 2002.

[26] Bckner, J., Mller, S., Pahl, M., Stahlhut, O.: Semantic Interpretation of Remote Sensing
Data. In Proc. ISPRS2002. Graz, Austria, 2002.

[27] Bckner, J., Pahl, M., Stahlhut, O.: Radiometric Equalization of Remote Sensing Data by
Utilization of Laserscan Data. In CCECE-2001 Canadian Conference on Electrical and
Computer Engineering. Toronto, Canada, 2001.

[28] Bckner, J., Pahl, M., Stahlhut, O., Liedtke, C.-E.: GeoAIDA - A Knowledge Based
Automatic Image Data Analyser for Remote Sensing Data. In CIMA 2001. Bangor, Wales,
UK, 2001.

[29] Bckner, J., Pahl, M., Stahlhut, O., Liedtke, C.-E.: A Knowledge-Based System for Context
Dependent Evaluation of Remote Sensing Data. In Pattern Recognition, 24th DAGM
Symposium, Nr. 2449 in LNCS, p. 5867. Springer, Zrich, Switzerland, 2002.

[30] Clement, V., Giraudon, G., Houzelle, S., Sadakly, F.: Interpretation of Remotely
Sensed Images in a Context of Multisensor Fusion Using a Multi-specialist
Architecture. IEEE Trans. on Geoscience and Remote Sensing, vol. 31(4):779791, 1993.

[31] Coleman, G. B., Andrews, H. C.: Image segmentation by clustering. Proceedings IEEE,
Vol. 67:773785, 1979.

88
[32] Collins, R. T., Jayens, C. O., Cheng, Y.-Q.,Wang, X., Stolle, F., Riseman, E. M., Hanson,
A. R.: The Ascender System: Automated Site Modeling from Multiple Aerial Images. In
Computer Vision and Image Understanding, Bd. 72, S. 143162. 1998.

[33] Curlander, J. C., McDonough, R. N.: Synthetic Aperture Radar, Systems and Signal
Processing. John Wiley & Sons, New York, 1991.

[34] Draper, B., Collins, R., Brolio, J., Hanson, A., Riseman, E.: The Schema System.
International Journal of Computer Vision, Bd. 2(3):209250, 1989.

[35] ERDAS Inc. - Atlanta,: ERDAS Field Guide, 1999.

[36] Fischer, A., Kolbe, T. H., Lang, F., Cremers, A. B., Frstner, W., Plmer, L., Steinhage, V.:
Extracting Buildings from Aerial Images Using Hierarchical Aggregation in 2D and 3D. In
Computer Vision and Image Understanding, vol.72, 185203. 1998.

[37] Gerke, M., Heipke, C., Straub, B.-M.: Building extraction from aerial imagery using a
generic scene model and invariant geometric moments. In Proceedings IEEE/ISPRS Joint
Workshop on Remote Sensing and data fusion over urban areas, S. 8589. 2001.

[38] Gimelfarb, G. L., Zalesny, A. V.: Probabilistic models of digital region maps based on
Markov random fields with short and long-range interaction. In Pattern Recognition Letters,
Vol.14, 789797. 1993.

[39] Gorte, B.: Probabilistic Segmentation of Remotely Sensed Images. Dissertation, ITC,
Twente, 1998.

[40] Gottlob, G., Frhwirt, T., Horn, W.: Expertensysteme. Springer Verlag, Wien, 1990.

[41] Grau, O.: Wissensbasierte 3D-Analyse von Gebudeszenen aus mehreren frei gewhlten
Stereofotos. Dissertation, Institut fr Theoretische Nachrichtentechnik und
Informationsverarbeitung, Universitt Hannover, Hannover, 2000.

[42] Growe, S.: Wissensbasierte Interpretation multitemporaler Luftbilder. Dissertation, Institut


fr Theoretische Nachrichtentechnik und Informationsverarbeitung, Universitt Hannover,
Hannover, 2000.

[43] Growe, S., Tnjes, R.: A Knowledge Based Approach to Automatic Image Registration. In
Proceedings of International Conference on Image Processing (ICIP97), vol. III. Santa
Barbara, USA, 1997.

[44] Grnreich, D.: ATKIS - A Topographic Information System as a Basis for a GIS and Digital
Cartography in West Germany. Geol. Jb., Bd. A122:207215, 1992.

[45] Haala, N., Brenner, C.: Interpretation of Urban Surface Models Using 2D Building
Information. In Computer Vision and Image Understanding, vol. 72, S. 204214. 1998.

[46] Hanson, A., Riseman, E.: The VISIONS Image-Understanding System. In Brown, C., (ed.),
Advances in Computer Visions, p.1114. Lawrence Erlbaum Associates, Hillsdale, 1988.

[47] Hanson, A., Riseman, E. M.: Computer Visions Systems, Chapter VISIONS: A Computer
System for Interpreting Scenes, S. 303334. Academic Press, New York, 1978.

[48] Haralick, R. M., Riseman, E. R.: Image segmentation techniques. In Computer Vision,
Graphics, and Image Processing, Bd. 29, S. 100132. 1985.

[49] Hartmann, G.: Recognition of Hierarchically Encoded Images by Technical and Biological
Systems. In Biological Cybernetics, Bd. 57, S. 7384. 1987.

89
[50] Healey, G., Binford, T. O.: The role and use of color in a general vision system. In DARPA
Image Understanding Workshop, p. 599613. Los Angeles, 1987.

[51] Henricsson, O.: The Role of Color Attributes and Similarity Grouping in 3-D Building
Reconstruction. In Computer Vision and Image Understanding, Vol. 72, 163184. 1998.

[52] Horowitz, S. L., Pavlidis, T.: Picture segmentation by a tree traversal algorithm. Journal of
the ACM, Vol. 23:368388, 1976.

[53] Illert, A.: Konzepte zur Fortfhrung des ATKIS. Nachrichten aus dem Karten- und
Vermessungswesen, p. 6174, 1994. Reihe 1, Heft 111.

[54] Jain, A. K., Dubes, R. C.: Algorithms for Clustering Data. Prentice Hall, Englewood Cliffs,
NJ, 1988.

[55] Kettig, R. L., Landgrebe, D. A.: Computer Classification of Remotely Sensed Multispectral
Image Data by Extraction and Classification of Homogeneous Objects. In IEEE
Transactions on Geoscience Electronics, Vol. GE-14, p. 1926. 1976.

[56] Klinker, G. J., Shafer, S. A., Kanade, T.: A physical approach to color image
understanding. International Journal of Computer Vision, Vol. 4:738, 1990.

[57] Kohl, C., Hanson, A., Riseman, E.: A goal-directed intermediate level executive for image
interpretation. In 10th International Joint Conference on Artificial Intelligence, Vol. II, p.
811814. Milan, 1987.

[58] Kollewe, M., Spitzner, H.: A Link between Multispectral Remote Sensing Image Processing
and Ecological Analysis of Landscape Elements. In Proceedings of IGARSS95, p. 291
293. IEEE, 1995.

[59] Kraus, K.: Photogrammetrie. Dmmlerbuch, Bonn, 1996.

[60] Kummert, F.: Flexible Steuerung eines sprachverstehenden Systems mit homogener
Wissensbasis. Infix Verlag, Sankt Augustin, 1992.

[61] Kummert, F.: Interpretation von Bild- und Sprachsignalen Ein hybrider Ansatz. Shaker
Verlag, 1998.

[62] Landesvermessungsamt Nordrhein-Westfalen, Bonn: ATKIS Gesamtdokumentation,


Arbeitsgemeinschaft der Vermessungverwaltungen der Lnder der Bundesrepublik
Deutschland (AdV), 1989.

[63] Lang, F.: Geometrische und semantische Rekonstruktion von Gebuden durch Ableitung
von 3D Gebudeecken. Dissertation, Universitt Bonn, 1999. Reihe Informatik, Shaker
Verlag.

[64] Le Besnerais, G., Oriot, H.: Disparity estimation for high resolution stereoscopic
reconstruction using the GNC approach. In Proc. IEEE Conf. on Image Processing.
Chicago, Illinois, 1998.

[65] Leberl, F. W.: Radargrammetric Image Processing. Artech House, Norwood, MA, 1990.

[66] Lehrer, N., Reynolds, G., Griffith, J.: Initial hypothesis formation in image understanding
using an automatically generated knowledge base. In Proc. DARPA Image Understanding
Workshop, 521537. Morgan Kaufmann Publishers, Inc., 1987.

[67] Liedtke, C.-E., Bckner, J., Grau, O., Growe, S., Tnjes, R.: AIDA: A System for the
Knowledge Based Interpretation of Remote Sensing Data. In 3rd Int. Airborne Remote
Sensing Conference & Exhibition, Vol. II, 313320. Copenhagen, Denmark, 1997.

90
[68] Liedtke, C.-E., Bckner, J., Pahl, M., Stahlhut, O.: Knowledge based system for the
interpretation of complex scenes. In Third International Workshop on Automatic Extraction
of Man-Made Objects from Aerial and Space Images. Ascona, Schweiz, 2001.

[69] Liedtke, C.-E., Ender, M.: Wissensbasierte Bildverarbeitung. Springer-Verlag, 1989.

[70] Ltjen, K.: BPI: Ein Blackboard-basiertes Produktionssystem fr die automatische


Bildauswertung. In Hartmann, G., Hg., Mustererkennung 1986, 8. DAGM-Symposium,
164168. Springer-Verlag, Berlin, 1986.

[71] Matsuyama, T.: Knowledged-Based Aerial Image Understanding Systems and Expert
Systems for Image Processing. In IEEE Transactions on Geoscience and Remote
Sensing, Bd. GE-25, 305316. 1987.

[72] Matsuyama, T., Hwang, V. S.-S.: SIGMA: A Knowledge-Based Aerial Image


Understanding System. Plenum Press, New York/London, 1990.

[73] McKeown, D., Harvey, W. A., McDermott, J.: Rule-Based Interpretation of Aerial Imagery.
IEEE Trans. on Pattern Analysis and Machine Intelligence (PAMI), Vol. 7(5):570585,
1985.

[74] Meinel, G., Neubert, M., Reder, J.: Pixelorientierte versus segmentorientierte Klassifikation
von IKONOS-Satellitenbilddaten ein Methodenvergleich. Zeitschrift fr Photogrammetrie,
Fernerkundung und Geoinformation, (3), 2001.

[75] Musser, D. R.: The STL Tutorial and Reference Guide: C++ Programming with the
Standard Template Library. Longman Publishing Group, 2001. ISBN 0-201-37923-6.

[76] Mller, S., Feitosa, R. Q., Mota, G. L. A., da Silva, V. V., da Costa, D. P., Tanisaki, K.:
GeoAIDA applied to SPOT satellite image interpretation.In 2nd GRSS/ISPRS Joint
Workshop on Data Fusion and Remote Sensing over urban areas, Berlin, Germany,
Proceedings 2003, 220-224.

[77] Mnkel, H.: Bewertung von Adaptionsstrategien bei Bildsegmentierungsverfahren.


Dissertation, Universitt Hannover, Stuttgart, 2001.

[78] Nagin, P., Hanson, A., Riseman, E.: Studies in global and local histogram guided
relaxations algorithms. IEEE Trans. on Pattern Analysis and Machine Intelligence (PAMI),
Vol. 3:263277, 1982.

[79] Nevatia, R.: A color edge detector and its use in scene segmentation. IEEE Transactions
on Systems, Man, Cybernetics, Vol. 7(11):820826, 1977.

[80] Niemann, H., Sagerer, G., Schrder, S., Kummert, F.: ERNEST: A Semantic Network
System for Pattern Understanding,. IEEE Trans. on Pattern Analysis and Machine
Intelligence, Vol. 12(9):883905, 1990.

[81] Novak, C., Shafer, S.: Color edge detection. In Proc. Image Understanding Workshop,
p. 3537. 1987.

[82] Ohlander, R., Price, K., Reddy, D. R.: Picture segmentation using a recursive region
splitting method. Computer Graphics and Image Processing, vol. 8:313333, 1978.

[83] Pakzad, K.: Wissensbasierte Interpretation von Vegetationsflchen aus multitemporalen


Fernerkundungsdaten. Dissertation, Bayerische Akademie der Wissenschaften, Mnchen,
2001.

[84] Pietikinen, M., Harwood, D.: Segmentation of color images using edge preserving
filters. In Cappellini, V., Marconi, R., Hg., Advances in Image Processing and Pattern
Recognition, p. 9499. North-Holland, 1986.

91
[85] Quint, F.: Kartengesttzte Interpretation monokularer Luftbilder. Dissertation,
Universitt Karlsruhe, Karlsruhe, 1997.

[86] Quint, F.: MOSES: A structural approach to aerial image understanding. In Gruen, A.,
Baltsavias, E., Henricsson, O. P., Hg., Automatic Extraction of Man-Made Objects from
Aerial and Space Images (II), p. 323332, Birkhuser, Basel, 1997.

[87] Rehrmann, V.: Stabile, echtzeitfhige Farbbildauswertung. Verlag Flbach, Koblenz, 1994.

[88] Rehrmann, V.: Segmentierung von Farbbildern. In 1. Heidelberger Bildverarbeitungsforum.


Universitt Koblenz-Landau, Universitt Heidelberg, 1995.

[89] Rehrmann, V., Priese, L.: Fast and Robust Segmentation of Natural Color Scenes. In 3rd
Asian Conference on Computer Vision. Hong Kong, 1998.

[90] Reynolds, G., Beveridge, J.: Searching for geometric structure in images of natural scenes.
In Proc. DARPA Image Understanding Workshop, 257271. Morgan Kaufmann Publishers,
Inc., 1987.

[91] Riseman, E., Hanson, A.: A methodology for the development of knowledge-based vision
systems. In Proc. of the IEEE Workshop on Principles of Knowledge-Based Systems.
Denver, 1984.

[92] Riseman, E., Hanson, A., Belknap, R.: The information fusion problem: forming token
aggregations across multiple representations. Coins technical report, University of
Massachusetts at Amherst, 1987.

[93] Sagerer, G., Niemann, H.: Semantic Networks for Understanding Scenes. In Advances in
Computer Vision and Machine Intelligence. Plenum Press, New York/London, 1997.

[94] Schneider, W., Bartl, R., Burger, H., Steinwendner, J., Suppan, F. Aerial Photo
Interpretation and Satellite Image Analysis in Agricultural Sciences. Vermessung &
Geoinformation, Vol. 84(2):164173, 1996.

[95] Schreier, G.: SAR Geocoding: Data and Systems. Wichmann, Karlsruhe, 1993.

[96] Schwiedefsky, E., Ackermann, F.: Photogrammetrie. B.G.Teubner, Stuttgart, 1976.

[97] Shahrabi, B. A.: Automatic Recognition and 3D Reconstruction of Buildings from Digital
Imagery. Dissertation, Fakultt fr Bauingenieur- und Vermessungswesen, Universitt
Stuttgart, Stuttgart, 2000.

[98] Skarbek, W., Koschan, A.: Color Image Segmentation - A Survey. Techn. Ber. 94-32,
Fachbereich Informatik, TU Berlin, 1994.

[99] Stevens, W.: Programmieren von UNIX-Netzwerken. Hanser Fachbuch, 2000. ISBN 3-446-
21334-1.

[100] Stilla, U., Michaelsen, E.: Semantic modelling of man-made objects by production nets. In
Gruen, A., Baltsavias, E., Henricsson, O. P., (eds.) Automatic Extraction of Man-Made
Objects from Aerial and Space Images (II), 4352. Birkhuser, Basel, 1997.

[101] Tnjes, R.: Wissensbasierte Interpretation und 3D-Rekonstruktion von Landschaftsszenen


aus Luftbildern. Dissertation, Institut fr Theoretische Nachrichtentechnik und
Informationsverarbeitung, Universitt Hannover, Hannover, 1998.

[102] Vosselmann, G., de Knecht, J.: Road Tracing by profile matching and Kalman filtering. In
Grn, A., Kbler, O., Agouris, P., Hg., Automatic Extraction of Man-Made Objects from
Aerial and Space images, 265274, Birkhuser, Basel, 1995.

92
[103] Weidner, U.: Digital Surface Models for Building Extraction. In Grn, A., (ed.) Automatic
Extraction of Man-Made Objects from Aerial and Space Images (II), 193202. Ascona,
1997.

[104] Weidner, U., Frstner, W.: Towards Automatic Building Extraction from High-Resolution
Digital Elevation Models. PandRS, Vol. 50(4):3849, 1995.

[105] Winston, P. H.: Artificial Intelligence - 3rd Edition. Addison-Wesley, Massachusetts,


1992.

[106] Zucker, S. W.: Region growing: Childhood and adolescence. In Computer Graphics and
Image Processing, Vol. 5, 382399. 1976.

93