You are on page 1of 100

UNIVERSIDADE FEDERAL DO RIO GRANDE

CENTRO DE CINCIAS COMPUTACIONAIS


PROGRAMA DE PS-GRADUAO EM COMPUTAO
CURSO DE MESTRADO EM ENGENHARIA DE COMPUTAO

Dissertao de Mestrado

Um Sistema de Deteco de Fogo Baseado em Vdeo


Cristiano Rafael Steffens

Dissertao de Mestrado apresentada ao Programa


de Ps-Graduao em Computao da Universidade Federal do Rio Grande, como requisito parcial para a obteno do grau de Mestre em Engenharia de Computao

Orientador:

Prof. Dr. Ricardo Nagel Rodrigues

Rio Grande, 2015

Dados de catalogao na fonte:


Bibliotecrio Clriston Ribeiro Ramos CRB- 10/1989
Biblioteca Central FURG

A999a

Steffens, Cristiano Rafael


Um Sistema de Deteco de Fogo Baseado em Vdeo / Cristiano Rafael Steffens. Rio Grande, 2015. 100 f: grf. Dissertao (Mestrado) Programa de Ps-Graduao em Computao. Universidade Federal do Rio Grande. Centro de Cincias
Computacionais. Rio Grande, 2015. Orientador Ricardo Nagel
Rodrigues.
1. Deteco de fogo. 2. Aprendizado de mquina. 3. Viso
computacional. I. Rodrigues, Ricardo Nagel. II. Ttulo.
CDD: 999.9

Banca examinadora:

Prof. Dr. Ricardo Matsumura de Arajo

Profa . Dra . Silvia Silva da Costa Botelho

Prof. Dr. Ricardo Nagel Rodrigues

AGRADECIMENTOS

Aos meus pais, por sempre terem colocado a minha educao em primeiro lugar e
por sempre terem se esforado para que eu pudesse realizar os meus objetivos. Aos meus
irmo pelo apoio, carinho, suporte e incentivo.
Aos colegas e amigos do Centro de Cincias Computacionais, por terem ajudado a
colocar em prtica as ideias e auxiliado de alguma forma na realizao do presente trabalho, dedico o meu apreo. Em especial, agradeo ao companheirismo e colaborao dos
colegas do grupo de Sistemas Computacionais e Tecnologias para Percepo.
Ao meu orientador, Prof. Dr. Ricardo Nagel Rodrigues, pela confiana em mim
depositada, pelos ensinamentos, pelo apoio e ajuda no desenvolvimento deste trabalho.
Por no ter medido esforos para, com dedicao, permitir uma argumentao clara e
concisa, tornando o trabalho mais tcnico e estimulante.
Aos professores Dra . Slvia Silva da Costa Botelho (FURG) e Dr. Ricardo Matsumura
de Arajo (UFPEL), pela disponibilidade e participao na banca de avaliao
Ao coordenador, aos professores e tcnicos do Centro de Cincias Computacionais C3 - FURG.
Migrate Company Sistemas de Informao LTDA por flexibilizar meu horrio de
trabalho, permitindo-me conciliar o trabalho com o curso de ps-graduao. CAPES
pelo apoio financeiro que permitiu que eu me dedicasse integralmente s atividades de
pesquisa.

Everything that I can spy


Through the circle of my eye.
Everything that I can see
Has been woven out of me.
I have sown the stars ; I threw
Clouds of morn and noon and eve
In the deeps and steeps of blue ;
And each thing that I perceive.
Sun and sea and mountain high.
Are made and moulded by my eye :
Closing it, I do but find
Darkness, and a little wind.
JAMES S TEPHENS

RESUMO

STEFFENS, Cristiano Rafael. Um Sistema de Deteco de Fogo Baseado em Vdeo.


2015. 100 f. Dissertao (Mestrado) Programa de Ps-Graduao em Computao.
Universidade Federal do Rio Grande, Rio Grande.
A deteco automatizada de fogo foco de pesquisa em viso computacional desde o
incio da dcada de 90. Neste trabalho, um novo mtodo para a identificao de fogo
baseado em vdeo proposto e analisado. Algoritmos de deteco de fogo utilizando
viso computacional so normalmente aplicados em cenrios que utilizam cmeras
estticas, tais como circuitos fechados de TV utilizados em sistemas de vigilncia. O
mtodo proposto, no se restringe apenas a estas condies, mas tambm possibilita a
deteco automtica de fogo em vdeos obtidos a partir de cmeras mveis. A utilizao
de cmeras mveis adiciona uma complexidade significativa ao incluir variao no
background, movimento em trs eixos, trepidao e iluminao no controlada. O mtodo proposto utiliza caractersticas estatsticas do fogo e Random Forests para detectar
potenciais regies com fogo, suprimindo a dependncia da dinmica do movimento.
Estas caractersticas incluem a cor, o formato, a disperso e assimetria da intensidade.
Para complementar a classificao atingida a partir das propriedade espaciais, o sistema
utiliza-se tambm das propriedades de oscilao e pulsao ao longo de um curto
perodo de tempo. Estas caractersticas temporais so fatores discriminantes, largamente
empregados na bibliografia consultada, resultando em classificadores robustos. Os
resultados apresentados demonstram a aplicabilidade do mtodo, superando outros
mtodos anteriormente propostos.

Palavras-chave: Deteco de fogo, aprendizado de mquina, viso computacional.

ABSTRACT

STEFFENS, Cristiano Rafael. A Video Based Fire Detection System. 2015. 100 f.
Dissertao (Mestrado) Programa de Ps-Graduao em Computao. Universidade
Federal do Rio Grande, Rio Grande.
Automated fire detection is a research focus in computer vision since the early
90s. In this paper, we introduce and evaluate a new Video Fire Detection method that
aims to produce good results on steady and mobile cameras. Usually, computer vision
based fire detection algorithms are applied in scenarios with static cameras, such as
closed-circuit TV used in surveillance systems. The method we are proposing here, in
contrast, was developed so that it can be used not only in these conditions, but also for
automatic fire detection in videos obtained from mobile cameras. The use of mobile
cameras adds a lot of complexity by bringing variation in background, movement in
three axes, camera vibration and uncontrolled lighting conditions. The proposed method
uses statistical characteristics of fire like regions as input data for a Random Forests
classification model, frame-by-frame, in order to detect fire regions. These characteristics
are the color, the shape, the color skewness and dispersion measures considering pixel
value. In order to increase results given by the spatial properties,our method also uses
the flickering over a short period of time. The flickering properties are widely used as
a discriminant in the related bibliography, resulting in robust classifiers. The presented
results illustrate the applicability of the method, significantly increasing the precision and
recall metrics.

Keywords: fire detection, probabilistic fire detection, active-vision, hand-held camera.

LISTA DE FIGURAS

Figura 1
Figura 2

Reflexo da luz . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Passo a passo da segmentao por Split and Merge . . . . . . . . . .

20
30

Figura 3
Figura 4
Figura 5

Filtro passa-banda dois estgios . . . . . . . . . . . . . . . . . . . .


Mtodo de deteco de MUELLER et al. (2013) . . . . . . . . . . .
Histograma normalizado das direes do fluxo ptico utilizando NSD

42
45
45

Figura 6

Anotaes de ground truth no dataset . . . . . . . . . . . . . . . . .

57

Figura 7
Figura 8
Figura 9
Figura 10
Figura 11
Figura 12
Figura 13
Figura 14
Figura 15
Figura 16

Segmentao manual das regies de chama anlise estatstica .


Histogramas de regies de fogo RGB . . . . . . . . . . . . .
Boxplot de regies de fogo RGB . . . . . . . . . . . . . . . .
Histogramas de regies de fogo HSV . . . . . . . . . . . . .
Boxplot de regies de fogo RGB . . . . . . . . . . . . . . . .
Histogramas de regies de fogo Lab . . . . . . . . . . . . . .
Boxplot de regies de fogo Lab . . . . . . . . . . . . . . . .
Histogramas de regies de fogo YCbCr . . . . . . . . . . . .
Boxplot de regies de fogo YCbCr . . . . . . . . . . . . . . .
Histogramas de oscilao do valor de pxel no tempo . . . . .

.
.
.
.
.
.
.
.
.
.

63
64
65
67
68
69
70
71
72
74

Figura 17
Figura 18

Fluxograma do mtodo proposto . . . . . . . . . . . . . . . . . . . .


Distribuio das regies de chama . . . . . . . . . . . . . . . . . . .

75
78

Figura 19
Figura 20
Figura 21

Comparativo de segmentao de cor em imagens sem fogo . . . . . .


Comparativo de segmentao de cor em imagens com fogo . . . . . .
Mtodo de avaliao do classificador proposto . . . . . . . . . . . .

81
82
83

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

LISTA DE TABELAS

Tabela 1

Vdeos base do Dataset . . . . . . . . . . . . . . . . . . . . . . . . .

55

Tabela 2
Tabela 3
Tabela 4

Estatsticas de cor nas regies de fogo . . . . . . . . . . . . . . . . .


Estatsticas de cor nas regies de no-fogo . . . . . . . . . . . . . . .
Oscilao dos pxels no tempo . . . . . . . . . . . . . . . . . . . . .

66
66
72

Tabela 5
Tabela 6

Parmetros da Random Forest para classificao de cor . . . . . . . .


Parmetros da Random Forest para classificao de regies . . . . . .

77
79

Tabela 7
Tabela 8
Tabela 9

Resultados do mtodo proposto na avaliao frame a frame . . . . . .


Resultados do mtodo proposto considerando localizao . . . . . . .
Resultados do mtodo proposto na avaliao frame a frame para o
caso de teste II . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Resultados do mtodo proposto considerando localizao para o caso
de teste II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

85
86

Tabela 10

87
87

LISTA DE ABREVIATURAS E SIGLAS

ABNT

Associao Brasileira de Normas Tcnicas

ANN

Artificial Neural Network

CC

Creative Commons License

CCD

Charge-coupled Device

CUDA Compute Unified Device Architecture


OpenCV Open Computer Vision library
PCA

Anlise de Componentes Principais

HMM

Hidden Markov Models

MCMC Markov Chain Monte Carlo


LBP

Local Binary Pattern

NP

Non-Deterministic Polynomial time

FFT

Fast Fourier Transform

FLANN Fast Library for Approximate Nearest Neighbors


HMM

Hidden Markov Model

HSV

Hue Saturation Value colorspace

FDDB

Face Detection Database

FDRB

Funo de Distribuio de Refletncia Bidirecional

OMT

Optimal Mass Transport

RGB

Red Blue Green Colorspace

ROI

Region of Interest

SIMD

Single Instruction Multiple Data

SIFT

Scale Invariant Feature Transform

SURF

Speeded Up Robust Features

SVM

Support Vector Machine

SSLT

Subsurface Light Transport

VFD

Video Fire Detection

SUMRIO

1 INTRODUO . . . . . . . . .
1.1
Objetivo . . . . . . . . . . . .
1.2
Recursos . . . . . . . . . . . .
1.3
Estrutura Do Texto . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

. . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .

13
14
14
17

2 AQUISIO E PROCESSAMENTO DE IMAGENS


2.1
Fenmenos pticos . . . . . . . . . . . . . . . . . .
2.2
Processamento de imagens . . . . . . . . . . . . . .
2.2.1
Deteco de bordas, linhas e crculos . . . . . . . .
2.2.2
Detectores baseados em templates . . . . . . . . .
2.2.3
Detector de Marr-Hildreth . . . . . . . . . . . . . .
2.2.4
Detector de Canny . . . . . . . . . . . . . . . . . .
2.3
Segmentao . . . . . . . . . . . . . . . . . . . . .
2.3.1
Thresholding . . . . . . . . . . . . . . . . . . . .
2.3.2
Segmentao baseada em regio . . . . . . . . . .
2.4
Deteco de Movimento . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.

. . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .

19
19
21
21
23
24
25
28
28
29
31

3 TRABALHOS RELACIONADOS . . . . . . . . . . . . . . . . . . . . .
3.1
Deteco de Cor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2
Deteco de Movimento . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.1
Anlise da Oscilao no Domnio da Frequncia . . . . . . . . . . . . . .
3.2.2
Anlise da Oscilao Utilizando Fluxo ptico . . . . . . . . . . . . . . .
3.2.3
Anlise da Oscilao Utilizando Minerao de Dados . . . . . . . . . . .
3.2.4
Anlise da Oscilao com Base no Formato da Chama . . . . . . . . . . .
3.3
Deteco Baseada em Textura . . . . . . . . . . . . . . . . . . . . . . . .

34
35
40
41
43
46
47
49

4 DATASET E MTRICAS DE AVALIAO


4.1
Dataset . . . . . . . . . . . . . . . . . . .
4.1.1
Anotaes de Ground Truth . . . . . . . .
4.1.2
Artefatos de Software . . . . . . . . . . .
4.2
Metodologia de Avaliao . . . . . . . . .

. . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .

52
53
56
56
57

5 AVALIAO ESTATSTICA . . . . . . . . . . . . . . . . . . . . . . . .
5.1
Classificao De Cor . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2
Classificao da Oscilao . . . . . . . . . . . . . . . . . . . . . . . . . .

61
61
72

75

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

MTODO PROPOSTO . . . . . . . . . . . . . . . . . . . . . . . . . . .

7 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.1
Casos de teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

80
81

TRABALHOS FUTUROS . . . . . . . . . . . . . . . . . . . . . . . . . .

89

CONCLUSO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

91

REFERNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

93

INTRODUO

A deteco de fogo a partir de imagens algo recente quando comparada a outras


aplicaes dentro da viso computacional. Ao passo que tcnicas de reconhecimento de
faces e objetos foram minuciosamente estudadas permitindo que grande parte das aplicaes possam ser criadas apenas fazendo pequenas adaptaes e o uso de algoritmos j
validados, a deteco de fogo acaba caindo em uma categoria especfica de problemas da
viso computacional. Os motivos so claros quando faz-se uma rpida avaliao do que
indicativo de fogo em uma imagem e como as caractersticas do fogo se diferenciam das
de outros objetos.
Considerando o problema dentro de um contexto maior, pode-se rapidamente perceber a importncia de uma deteco rpida de incndios e outros incidentes envolvendo
fogo no controlado. Os incndios afetam a vida cotidiana em todo o mundo, colocando
pessoas em risco e gerando danos materiais. intuitivo afirmar que quanto antes o fogo
detectado, maiores sero as chances de evitar danos e em casos mais graves at mesmo
assegurar a sobrevivncia. Informaes como a localizao inicial do fogo, rea afetada,
direo de propagao da fumaa e a taxa de crescimento do fogo so parmetros importantes na anlise de segurana e combate a incndios, bem como a reduo dos impactos
decorrentes.
Recentemente as tcnicas de deteco de incndio atravs de vdeo (em ingls Video
Fire Detection - VFD) tm se mostrado teis para complementar as tcnicas de deteco
de incndio tradicionais, como as baseadas em sensores de fumaa, que so geralmente
limitados a ambientes fechados, no sendo aplicveis em grandes espaos abertos. Os
sensores tradicionais exigem uma proximidade com o fogo e a maioria deles no capaz
de fornecer informaes adicionais sobre a localizao do fogo, dimenso, etc. Outra
limitao dos sistemas de alarme de incndio convencionais o tempo de resposta alto,
visto que so acionados pelas partculas de carbono e fumaa para que chegam at o
detector.

14

1.1

Objetivo

Propr um detector de chamas com bons resultados no processamento de vdeos obtidos a partir de cmeras mveis e capaz de realizar deteco em tempo real minimizando
as taxas de falsos positivos e falsos negativos. No contexto, entende-se por deteco
o conjunto das atividades de detectar a existncia de chama na cena e apontar o local
onde ocorre. Ao final espera-se que os resultados do trabalho possam ser integrados ao
Framework CvWorks, um Framework para Viso Computacional de Alto Nvel que desenvolvido pela Universidade Federal do Rio Grande (FURG). De forma mais detalhada,
o trabalho enfatiza as seguintes questes:
Estudar os detectores utilizados em sistemas baseados em cmeras estacionrias;
Criar um dataset para deteco de fogo em vdeos com anotaes de ground truth;
Implementar alguns detectores de chama obtidos na bibliografia e verificar os resultados obtidos quando usados para deteco de imagens em vdeos de cmera
mvel;
Apresentar uma alternativa funcional para deteco e localizao de fogo a partir
de cmeras estticas;
Apresentar uma alternativa funcional para deteco e localizao de fogo a partir
de cmeras mveis;

1.2

Recursos

No desenvolvimento deste trabalho fez-se o uso da linguagem de programao C++


acompanhado das bibliotecas OpenCV e Boost. Os testes foram executados utilizando
um dataset composto por vdeos obtidos a partir de diversas fontes.
1.2.0.1

Dataset

No decorrer deste trabalho no possvel encontrar datasets para fazer a validao de


ground truth e comparao automatizada do mtodo proposto com os mtodos de deteco de chamas apresentados nos trabalhos relacionados. Com a finalidade de conseguir
uma validao dos resultados atingidos, verificando a acurcia, a taxa de positivos verdadeiros, a taxa de falsos positivos e falsos negativos, criou-se vdeos obtidos no site de
compartilhamento YouTube.com que esto licenciados pela Creative Commons License.
A criao do dataset e as mtricas de avaliao utilizadas so detalhadas no Cap. 4.
Nas fases iniciais do trabalho, foram utilizados tambm os vdeos disponibilizados na Bilkent VisiFire Sample Fire and Smoke Video Clips e KMU Fire
and Smoke Dataset.
Estes datasets foram amplamente utilizados para avaliar

15

sistemas de deteco de fogo baseados em cmeras de vdeo publicados anteriormente.


Bilkent VisiFire Sample Video Clips, disponvel atravs do link
http://signal.ee.bilkent.edu.tr/VisiFire/Demo/SampleClips.html, foi utilizado nos trabalhos publicados por TOREYIN; CETIN (2009), TOREYIN et al. (2005), ETIN et al.
(2013), TOREYIN; DEDEOGLU; CETIN (2006) e GNAY et al. (2010). O dataset
contm 30 arquivos, distribudos em quatro categorias:
1. Vdeos de fogo;
2. Vdeos de fumaa;
3. Vdeos de fumaa em floresta;
4. Vdeos sem incidncia de fogo nem fumaa visvel.
J a KMU Fire & Smoke database (http://cvpr.kmu.ac.kr/Dataset/Dataset.htm), utilizado em KO; HAM; NAM (2011), PARK et al. (2013) e SHIDIK et al. (2014), composto
por 38 vdeos de resoluo 340 x 240, com taxa de quadros por segundo variando entre
15 e 30 Herz. Os vdeos so distribudos nas seguintes categorias:
1. Fogo em ambientes abertos e fechados;
2. Fumaa em ambientes abertos e fechados;
3. Objetos com comportamento semelhante ao do fogo.
Tanto a KMU Fire & Smoke database quanto a Bilkent VisiFire Sample Video Clips
so compostos por vdeos de cmeras estacionrias. A cmera encontra-se sempre em um
lugar fixo e a trepidao da imagem insignificante. Um ponto que merece ser ressaltado que estes datasets no fornecem nenhuma anotao sobre a localizao da chama
na imagem, limitando a avaliao dos algoritmos propostos. Dado que objetiva-se construir um sistema capaz de funcionar tambm com sistemas de cmeras no estacionrias,
obtou-se pela criao de um dataset prprio composto por vdeos de cmeras mveis e
onde as regies de chama so anotadas individualmente.
1.2.0.2

Ferramentas de desenvolvimento

A prototipagem e desenvolvimento do trabalho feita, em sua maior parte, utilizando


a linguagem de programao C++ em conjunto com as bibliotecas Boost (BOOST C++
LIBRARIES, 2014) e OpenCV (BRADSKI, 2000). Boost uma coleo de bibliotecas
que estendem a funcionalidade da linguagem de programao C++ e sua licena permite
o uso em qualquer projeto. A Boost inclui funcionalidades para diversas reas dentre programao concorrente, estrutura de dados, anlise sinttica, grafos e funes para entrada
e sada de dados.

16

A OpenCV uma biblioteca Open Source de processamento de imagens com implementaes em C, C++ e Python. Ela implementa vrias funes de deteco de bordas,
reconhecimento de objetos, anlise de vdeos, fluxo ptico, descritores SIFT e SURF e
algoritmos de aprendizagem de mquina. Dentre as tcnicas de aprendizagem de mquina pode-se destacar Support Vector Machine, Redes Neurais com Back-Propagation,
K-means, K-Nearest Neighbors, Classificador Bayesiano e rvores de classificao.
Em algumas etapas, para descoberta de conhecimento utilizou-se tambm a ferramenta de minerao de dados WEKA (HALL et al., 2009). A WEKA foi utilizado para
seleo de melhores atributos e classificao utilizando rvores. A principal vantagem
de utilizar a WEKA que esta permite utilizar os mtodos de aprendizagem no dataset
e analisar os resultados obtidos com um tempo de setup mnimo. Utilizando a ferramenta possvel tambm encontrar a correlao entre os atributos. Em conjunto com a
WEKA (HALL et al., 2009) utilizou-se tambm editores de planilha e texto para prprocessamento.
Conforme citado na Sec. 1.1 os resultados deste trabalho devem ser integrados no
framework CvWorks. Trata-se de um framework de viso computacional desenvolvido
no Centro de Cincias Computacionais da Universidade Federal do Rio Grande (FURG)
que traz implementaes genricas, sendo voltado para uma ampla gama de aplicaes
independentes da representao dos objetos. O objetivo principal deste framework implementar cdigo reutilizvel, incluindo interface grfica, algoritmos de deteco de faces, tags de realidade aumentada, placas, instrumentos industriais, fogo e rastreamento de
objetos. O framework utiliza orientao a objetos e templates com o objetivo de se tornar
mais genrico e compatvel com outras bibliotecas de viso computacional.
Em nvel de aplicao o CvWorks dividido em trs partes assim definidas na arquitetura:
VisionGUI: Oferece uma interface grfica de uso geral que permite a visualizao
da sada do algoritmos de deteco e rastreamento.
C3 Scout: Voltado para aplicao em robs mveis utilizveis em ambientes externos e internos. O objetivo que o rob possa fazer uma ronda contnua, restrito
um ambiente pr-determinado, identificando ameaas e irregularidades. Nesta aplicao incluem-se funcionalidades de reconhecimento e rastreamento de pessoas,
deteco de armas, fogo e placas de automveis.
Field Vision: Voltado para a extrao de informao de plantas industriais a partir de
cmeras estticas e disponibilizao das mesmas atravs de protocolos industriais.
Esta aplicao inclui algoritmos para deteco e leitura de medidores analgicos,
status de registradores, leitura de nvel de tanque e deteco de fogo.

17

importante citar que como este no um software fechado ou voltado para uma finalidade especfica vrios fatores foram levados em considerao e impactaram nas decises
sobre o mtodo de deteco de fogo proposto. Quando trabalha-se com robs mveis e
viso ativa, como o caso da aplicao C3 Scout, torna-se impossvel fazer uma validao
utilizando como informao a variao no pixel ou na regio ao longo de uma sequncia
de frames. Tanto em cmeras acopladas a robs mveis quanto em cmeras estticas fazendo a superviso de uma planta industrial, o sistema ir se deparar com backgrounds
complexos e uma variedade de cenrios, com interao de pessoas, balanar de folhas, objetos deformveis, movimentao de equipamentos, atuadores e sinalizadores industriais.
As condies de iluminao no so controladas, o que aumenta o grau de dificuldade,
criando diferentes entradas dependendo de parmetros da cmera como balanceamento
de brancos e exposio.

1.3

Estrutura Do Texto

O captulo 1 introduz o problema da deteco de chamas baseada em vdeo, elucidando as principais dificuldades, objetivos e recursos utilizados, contextualizando assim,
o problema tratado neste trabalho.
No captulo 2 apresenta a evoluo dos sistemas de reconhecimento de objetos ao
longo dos anos e concebe uma viso geral das abordagens propostas. Faz-se um levantamento amplo das solues adotadas na tentativa de resolver o problema de viso,
considerando as subreas como representao de imagens, filtragem, deteco de bordas,
segmentao, anlise de texturas, reconhecimento de formas e objetos e da modelagem
matemtica dos principais descritores e matchers utilizados.
Na sequncia, o Captulo 3 faz a definio de termos e apresenta as tcnicas que
representam o estado da arte em sistemas VFD (Video Fire Detection). feita uma reviso
geral sobre o que o fogo e suas propriedades. Alm disso, so apresentadas as tcnicas
utilizadas na tarefa de detectar fogo usando apenas dados de vdeo. So apresentados os
trabalhos relacionados e discute-se seus resultados.
No captulo 4 apresenta-se o dataset utilizado para treinamento e avaliao dos detectores. Discute-se o processo de criao do ground truth, apresentando as caractersticas,
limitaes e convenes utilizadas. Na parte final, apresentam-se as mtricas pelas quais
os detectores so comparados.
A seguir, no captulo 5 faz-se uma detalhada avaliao sobre as propriedades e comportamento do fogo utilizando estatstica descritiva. Busca-se levantar dados para fundamentar a proposta de detector trazida no Captulo 5. Faz-se um estudo das caractersticas
que permitem que uma regio de fogo seja identificada atravs de um nico frame, avaliando apenas os dados espaciais e resultando em poucos falsos positivos.
O Captulo 6 apresenta a metodologia adotada neste trabalho, as tcnicas utilizadas

18

para segmentao, tratamento e extrao de caractersticas de cor e oscilao. Alm disso,


detalha-se e apresenta-se os resultados atingidos pelo sistema de deteco de fogo baseado
em vdeo proposto neste trabalho.
Continuando, o Capitulo 7 apresenta os resultados do trabalho atravs de uma perspectiva do que foi proposto, estudado e os resultados obtidos. Atravs de uma anlise
quantitativa e qualitativa busca-se identificar pontos de melhoria para trabalhos futuros.
Os captulos 8 e 9 trazem respectivamente as propostas para a continuao do trabalho
de pesquisa e as concluses com base nos objetivos do trabalho. Apresenta-se uma reviso
das principais dificuldades encontradas e possveis solues para super-las. Da mesma
forma so discutidas possveis melhorias de desempenho da soluo apresentada.

AQUISIO E PROCESSAMENTO DE IMAGENS

A viso depende fundamentalmente da luz. Nesta seo busca-se descrever como a


iluminao, as propriedades da superfcie dos objetos e a ptica da cmera interagem de
modo a produzir os valores de cor que se enquadram no sensor de imagem. Descrevese como imagens coloridas contnuas so transformadas em amostras digitais discretas
dentro do sensor de imagem e as deficincias decorrentes deste processo.
As imagens so formadas pelas cores e pela intensidade. A fotometria trata da medio da luz, em termos de como seu brilho percebido pelo olho humano. J a radiometria, um conjunto de tcnicas de medio da radiao eletromagntica que mede a luz
em termos de sua potncia absoluta no espao, desconsiderando sua iterao com o olho
humano. Dado que as propriedades da luz e os fenmenos pticos como reflexo, refrao, difuso, fluorescncia, fosforescncia, Subsurface Scattering e inter-reflexo impactam diretamente na aquisio das imagens estes fenmenos sero rapidamente estudados
neste captulo.
A luz um fenmeno de natureza ondulatria. uma radiao eletromagntica que
se propaga atravs de diferentes meios, como o ar, a gua ou mesmo o vcuo. A luz
constituda de ftons, minsculas partculas elementares que apresentam simultaneamente natureza de onda e partcula. Um fton surge quando ocorre a transio de um
eltron de um tomo entre dois estados de energia diferentes. Quando excitado o eltron
passa para um nvel de maior energia e, ao retornar para o estado inicial, emite a energia
correspondente diferena entre os dois nveis.

2.1

Fenmenos pticos

Os fenmenos pticos esto diretamente relacionados forma como percebemos a


imagem. Pelo fato de o fogo representar uma fonte de luz estes fenmenos esto diretamente associados aos resultados atingidos. A reflexo um dos fenmenos pticos mais
importantes para a fotografia (TRIGO, 1998). Na reflexo o ngulo de incidncia i
igual ao ngulo de reflexo r medido em relao a reta normal N . Esto no mesmo plano
os raios incidente e refletido, conforme pode ser observado na figura 1.

20

Figura 1: Reflexo da luz (FORSYTH; PONCE, 2002)


O modelo geral para reflexo local dado pela Funo de Distribuio de Refletncia
Bidirecional (FDRB) que modela a distribuio da refletncia em funo da posio da
fonte de iluminao e do observador. Assim, a reflectncia em uma determinada direo
dada pelo material que reflete, pelo comprimento da onda e pela geometria de iluminao
e de observao (FORSYTH; PONCE, 2002). A reflexo pode ser classificada em trs
tipos:
Especular ou Regular: Quando a reflexo ocorre em uma superfcie lisa. Especular
advm da palavra grega speculo que significa espelho.
Difusa: O feixe de raios paralelos incide na superfcie do objeto, os raios refletidos
perdem o paralelismo e so espalhados em todas as direes.
Lambertiana: A reflexo no est ligada ao ngulo de incidncia dos raios provenientes da fonte luminosa. Uma superfcie Lambertiana dispersa a luz igualmente
em todas as direes. Alguns materiais com este tipo de reflexo so roupas de
algodo, carpetes e papel fosco.
Outro fenmeno ptico a refrao. A refrao ocorre quando a luz passa de um material ptico para outro, sofrendo uma mudana na velocidade de propagao. Um exemplo
clssico desse fenmeno visto colocando-se um lpis em um copo com gua. Existe
uma tendncia de que a luz se aproxime da normal ao mudar de meio de propagao.
Alguns materiais tm a capacidade de fazer o Subsurface Scattering (tambm conhecido como o Subsurface Light Transport (SSLT)) onde a luz penetra na superfcie de um
objeto translcido, sendo dispersada por interao com o material, e sai da superfcie de
um ponto diferente. A luz penetra na superfcie e refletida algumas vezes em ngulos irregulares no interior do material, antes de sair do material em um ngulo diferente
daquele que teria se tivesse sido refletida diretamente para fora da superfcie. Como resultado desse efeito, os ftons penetram na superfcie e depois da disperso da luz, tem-se
ento reas dessa mesma superfcie com altos nveis de saturao. Isso faz com que a

21

superfcie parea iluminada diretamente do seu interior. um fenmeno que ocorre por
exemplo quando a luz atravessa uma orelha humana.
Por fim, tem-se a inter-reflexo, fenmeno em que a luz refletida de um objeto atinge
outros objetos na rea circundante, iluminando-os. A inter-reflexo difusa trata especificamente da luz refletida a partir de objetos que no so brilhantes ou especulares, ou seja,
onde que a luz refletida por superfcies no-brilhantes, como o cho, paredes ou tecido,
para chegar a reas que no tem visada direta da fonte de luz. Se a superfcie difusa colorida, a luz refletida tambm colorida, resultando em colorao semelhante nos objetos
prximos.

2.2

Processamento de imagens

Nesta seco so apresentados os conceitos fundamentais sobre imagens digitais, espaos de cores, contraste, brilho, suavizao, realce e segmentao.
2.2.1

Deteco de bordas, linhas e crculos

A deteco de bordas uma das operaes empregadas com maior frequncia na


anlise de imagens e provavelmente o tema mais maturado dentro desta rea de pesquisa.
O principal motivo de haver um grande nmero de pesquisas que trabalham a deteco de
bordas que, genericamente, pode-se afirmar que a melhor representao de um objeto
dada pelas suas bordas (PARKER, 2010).
Entende-se por borda um limite que separa o objeto do restante da cena contida na
imagem bem como indicar uma sobreposio de um objeto em relao a outro (ZIOU;
TABBONE et al., 1998). Em outras palavras pode-se afirmar que se as bordas de um
objeto podem ser identificadas precisamente ento todos os objetos podem ser localizados
e suas propriedades podem ser mensuradas. Sabendo que a viso computacional est
assentada sobre o conceito de objeto fcil notar que o seu reconhecimento essencial
para os passos seguintes do processo.
Pode-se considerar a deteco de bordas como uma parte do processo de segmentao
de imagens. O objetivo da segmentao de imagens identificar regies dentro de uma
imagem. Essas regies podem ser ento isoladas e posteriormente a aplicao de outros
algoritmos pode definir que tipo de objeto cada segmento isolado representa. A deteco de bordas usualmente requer suavizao e diferenciao das imagens. Uma borda
pode ser caracterizada por variaes significativas na refletncia, iluminao, orientao
e profundidade da cena. difcil criar um algoritmo detector de bordas genrico que
oferea bons resultados em diferentes condies e aplicaes. Isso obrigou os pesquisadores a criarem detectores, variando entre abordagens matemticas e algortmicas (ZIOU;
TABBONE et al., 1998).
Existem trs conceitos principais associados bordas (PARKER, 2010):

22

Deteco: o processo de localizao de pxeis de borda.


Realce: o processo de aumentar o contraste entre as bordas e a cena de forma a
deix-las mais visveis.
Rastreamento: o processo de seguir as bordas, geralmente criando listas de pxeis
podendo ser utilizada para identificao do modelo ou objeto.
A deteco de bordas em imagens digitais precisa contornar algumas dificuldades e
limitaes ao lidar com imagens digitais. A primeira delas diretamente decorrente do
processo de digitalizao que obriga a imagem a ser amostrada de forma que todos os
pxeis assumam um valor, normalmente entre 0 a 255 quando trabalhamos com o espao
de cor RGB. Isso significa que uma mudana gradual (analgica) da cor foi transformada
em uma sequncia de nmeros inteiros que se aproximam dos valores reais (PARKER,
2010). Neste caso, fica fcil perceber que existe uma perda de informaes que estavam
presentes na imagem original. Existe ainda o fator de uma borda ser distribuda em vrios
pxeis na imagem capturada.
A segunda limitao o rudo, que pode ser decorrente de diversos fatores como iluminao, tipo de lente, cmera utilizada para a captura da imagem, movimento, poeira
ou mesmo efeitos atmosfricos. O efeito deste rudo alterar valores de pxeis de forma
aleatria. Os efeitos podem ser minimizados utilizando mtodos estatsticos como a distribuio probabilstica, mas no existem garantias de que os dados se mantenham fiis
aos dados originais. Devido sua natureza aleatria, o rudo no pode ser previsto e difcil mensur-lo adequadamente. Para a viso computacional, considerando que a maior
parte dos algoritmos usa escala de cinza, o rudo pode ser classificado como independente
de sinal ou dependente de sinal (PARKER, 2010).
O rudo independente de sinal ocorre quando uma imagem transferida eletronicamente de um lugar para outro e caracteriza-se como um conjunto de pxeis em escala de
cinza que no tem uma ligao com os conjunto de dados originais so adicionados a
imagem original. Matematicamente, pode se definir este rudo como B = A + R, onde
A uma imagem perfeita, R o rudo que ocorre durante a transmisso e B a imagem
resultante. A e R no tem qualquer relao entre si, sendo que o rudo R pode ter propriedades estatsticas quaisquer, mas usualmente assume-se que segue uma distribuio
gaussiana normal com mdia 0 e um desvio padro mensurado ou presumido PARKER
(2010).
J o rudo dependente de sinal leva este nome porque cada pxel de rudo na imagem
pode ser calculado em funo dos pxeis vizinhos. Este o tipo de rudo que pode ser observado em algumas fotografias e mais complicado de ser trabalhado segundo PARKER
(2010). Por sua vez, geralmente tem um impacto menor nos resultados e gerencivel
quando a imagem amostrada apropriadamente.

23

Bons detectores de bordas devem ser capazes de tratar estes tipos de rudo fornecendo
resultados confiveis. Cabe salientar que tanto as bordas quanto o rudo independente de
sinal apresentam variaes locais bruscas na intensidade dos pxeis e por este motivo a
borda definida pela conexo entre vrios pxeis que poderiam definir uma borda. Genericamente, todo detector de borda composto pelas etapas de diferenciao para avaliar
as derivadas desejadas da imagem, suavizao da imagem para remoo de rudo e etiquetagem para encontrar as bordas e aumentar a tolerncia ao rudo, suprimindo falsas
bordas.
Em relao aos tipos, a borda degrau (ou step edge) definida como um ponto onde
ocorre uma descontinuidade na escala de cinza. Para fazer sua deteco precisa-se fazer
um tratamento do rudo presente na imagem capturada e obter a derivada de primeira
ordem (onde as bordas sero indicadas pela mxima positiva ou pela mnima negativa) ou
obter a derivada de segunda ordem (onde as bordas so dados pelos pontos onde existe
passagem por zero). J para bordas linha, que so resultado da iluminao mtua entre
objetos que esto em contato, ou objetos pequenos em frente a objetos maiores, bordas
correspondem a extremos locais na imagem. Eles so localizados como cruzamentos em
zero da primeira derivada, mximas locais da laplaciana, ou ainda como mximas locais
da variao dos nveis de cinza ZIOU; TABBONE et al. (1998).
Por fim, uma juno um tipo de borda obtida quando duas ou mais bordas se encontram e pode ser localizada normalmente como pontos com alta curvatura, pontos com
grande variao na direo do gradiente ou ainda como pontos de cruzamento em zero da
laplaciana que apresentem uma alta curvatura.
Desde seu surgimento o nmero de detectores de bordas vem crescendo continuamente fazendo com que seja praticamente impossvel fazer um levantamento completo
dos algoritmos existentes. O que diferencia um detector de outro so os filtros de suavizao utilizados, os operadores de diferenciao, o processo de etiquetagem, a complexidade computacional e o modelo matemtico utilizado.
2.2.2

Detectores baseados em templates

Os primeiros detectores de bordas baseados em gradiente ou em operadores Laplacianos, propostos a mais de 40 anos, se limitavam a operao de diferenciao. Os filtros
Sobel (SOBEL; FELDMAN, 1968) e Previtt (PREWITT, 1970) estimam o vetor de gradiente com base na operao de convoluo utilizando a mscara

1 0 1


x = a 0 a

1 0 1

para obteno das bordas em x, tendo a como um nmero real positivo (1 no caso de
Previtt e 2 para Sobel). J para deteco das bordas na direo y utilizado o seguinte

24

kernel de convoluo:


1 a 1




y = 0
0
0


1
a
1
Estas mascaras de convoluo resultam na primeira derivada parcial de uma rea de 3
x 3 pxeis. Para a estimativa Laplaciana utiliza-se a seguinte mscara:

0 1 0


= 1 4 1

0 1 0

Usualmente estas mscaras tem tamanho fixado em 3 x 3. Cabe salientar que a os


resultados destas operaes pioram quando existe muito rudo, dado que, ambas assumem
que o rudo aditivo e a imagem linear. ROSENFELD; THURSTON (1971) apresentam
a ideia de suprimir os problemas com rudo aplicando um filtro de suavizao e assim
melhorar o processo de diferenciao. Essa suavizao obtida alterando o valor de
cada pxel para um valor que represente a mdia dos pxeis naquela regio. Estes filtros
contudo, tem como contraponto o fato de no ser adaptveis ao tamanho da imagem e
mesmo depois de aplic-los no existe garantia de que o rudo foi removido. Precisa-se
deixar claro que a reduo de rudo traz como efeito negativo a perda de informao.
Estes filtros so uma abstrao daquilo que se imagina como uma borda. Note que
os pesos dos elementos na diagonal so menores que os pesos na horizontal e vertical.
Cabe salientar que esta abordagem utiliza convoluo de um template sobre a imagem. A
convoluo um processo de fcil implementao mas que tem um custo computacional
alto. Nesta categoria de detectores de borda baseado em template enquadra-se tambm o
filtro proposto por KIRSCH (1971).
2.2.3

Detector de Marr-Hildreth

O detector de Marr-Hildreth uma tentativa de unir o conhecimento da poca no que


se refere a viso biolgica em um modelo que pudesse ser utilizado na viso computacional. O objetivo era produzir uma primitiva, mas rica descrio de imagens que pudesse
ser utilizada para determinar a refletncia e a iluminncia de uma superfcie, bem como
determinar sua orientao e sua distncia com relao ao observador/cmera (MARR;
HILDRETH, 1980). Nesta pesquisa, os autores identificaram cinco pontos principais do
sistema visual dos mamferos. So eles:
Em imagens naturais as caractersticas de interesse ocorrem em diversas escalas e
no possvel criar um nico operador para trabalhar em todas elas. Assim, necessrio que sejam construdos vrios operadores e seus resultados sejam combinados
para obter resultados satisfatrios.

25

Uma cena natural no parece consistir de padres de difrao ou outros efeitos de


onda, e por este motivo podem ser necessrias tcnicas de suavizao.
O filtro de suavizao que mais se aproxima da viso dos mamferos o gaussiano.
Uma borda (mudana brusca de intensidade) representada pelos extremos da primeira derivada, ou ao que corresponde aos pontos de passagem por zero na segunda
derivada.
O operador invariante rotao de mais baixa ordem o Laplaciano.
Tendo por base estes pontos Marr e Hildreth quebram o processo de deteco de bordas nas etapas de convoluir a imagem com uma funo gaussiana bidimensional(horizontal e vertical), calcular a laplaciana da imagem resultante e por fim
encontrar os pxeis que representam bordas (onde existe passagem por 0). Para PARKER
(2010) este no um algoritmo difcil de implementar, mas , no entanto, mais difcil que
os que usam template simples.
Matematicamente a convoluo de uma imagem com uma funo Gaussiana G dada
pela Eq. 1:
I G(i, j) =

XX
n

I(n, m)G(i n, j m)

(1)

onde a funo G dada pela Eq. 2:



2

G (x, y) = e

x2 +y 2
2 2

(2)

Depois disso aplica-se o operador Laplaciano. Na prtica, como a ordem das operaes no altera o resultado, costuma-se computar o Laplaciano da Gaussiana e depois
convolu-lo com a imagem original. O Laplaciano da Gaussiana, representado na litep
x2 + y 2 .
ratura pela sigla LoG (log of gaussian) definido pela Eq. 3, onde r =
Conforme apresentado em PARKER (2010) os resultados so significativamente afetados
variando-se os parmetros de tamanho e desvio padro da funo gaussiana. Para atender
ao ponto listado no incio desta seco que afirma que a viso do mamferos ocorre em
vrias escalas, este mtodo utiliza dois ou mais filtros LoG, combinando-os de modo que
somente sejam aceitas as bordas detectadas em mais de uma escala.
2 G =
2.2.4

r2 2 2 r2
e 2
4

(3)

Detector de Canny

O detector de bordas de Canny provavelmente um dos mais conhecidos. Trata-se de


um detector pensado para atender a trs metas principais:

26

Taxa de erros: o detector deve encontrar somente bordas e deve encontrar todas
elas. Nenhuma borda deve ser ignorada.
Localizao: a distncia entre a borda detectada e a borda real deve ser a menor
possvel.
Resultado: o detector no deve identificar vrios pxeis de borda quando apenas
uma borda existe.
Assume-se que as bordas degrau esto sujeitas a rudo branco Gaussiano. O detector
de bordas uma mscara de convoluo que suaviza o rudo e localiza a borda (CANNY,
1986). O problema maior identificar um filtro que otimiza estes trs critrios previamente estabelecidos. Segundo PARKER (2010) usualmente faz se uma aproximao
da melhor relao sinal-rudo utilizando a primeira derivada da Gaussiana. Tendo que a
Gaussiana dada pela Eq. 4 a primeira derivada dada ela Eq. 5. A gaussiana bidimensional dada pela Eq. 2.
x2
(4)
G(x) = e 22
x ( x22 )
)e 2
(5)
2
Para PARKER (2010) a melhor aproximao para o filtro timo de Canny G0 e
assim, ao convoluir a imagem de entrada com G0 obtm-se uma imagem E com as bordas realadas, mesmo que a original apresente rudo. A convoluo em duas dimenses
pode, no entanto, ter uma complexidade alta e por este motivo computa-se cada uma das
dimenses separadamente. Por fim, o filtro de Canny apresenta os seguintes passos:
G0 (x) = (

1. Ler uma imagem de entrada para o processamento I.


2. Criar uma mscara gaussiana uni-dimensional G para convoluir com I. O desvio
padro desta Gaussiana um parmetro para o detector de bordas.
3. Criar uma mscara uni-direcional para a primeira derivada da Gaussiana nas direes x e y. Respectivamente Gx e Gy . O mesmo desvio padro do passo dois
utilizado.
4. convoluir G com I passando por todas as linhas obtendo Ix e colunas obtendo Iy .
5. convoluir Ix com Gx para obter Ix0 e Iy com Gy para obter Iy0 .
6. Calcular a magnitude da resposta de borda combinando os componentes em x e y.
Esta magnitude no ponto pode ser computada como
M (x, y) =

q
Ix0 (x, y)2 + Iy0 (x, y)2

27

Cada pxel da imagem filtrada processado nesta maneira, a grandeza de gradiente


calculada para duas posies, uma de cada lado do pxel, e a magnitude no pxel deve ser
maior que seus vizinhos. Segundo PARKER (2010) geralmente, existem oito casos importantes para verificar. Alguns atalhos que podem ser utilizados para aumentar a eficincia,
mas o mtodo acima , essencialmente, o que usado na maioria das implementaes do
detector de bordas Canny.
Por fim, depois de calcular a amplitude em cada pxel, faz-se uma supresso dos pxels que no so mximas locais e uma limiarizao (thresholding) utilizando dois filtros
distintos. O primeiro filtro obtm somente os pontos com amplitude elevada. O segundo
aceita amplitudes menores se, e somente se, estiverem prximos aos pxeis de borda identificados pelo filtro anterior.
Como j introduzido anteriormente, linhas correspondem a extremos locais da imagem em escala de cinza e so de grande valia para a identificao de algumas caractersticas em imagens, sendo utilizadas, por exemplo, para a identificao de rios e estradas no
sensoreamento remoto. A maior parte dos processos de deteco de linhas consiste em
algoritmos de afinamento criados para imagens binrias que, em alguns casos, podem ser
utilizados tambm em escala de cinza. O principal problema destes detectores que eles
normalmente no so precisos e no fornecem bons resultados em imagens complexas
(ZIOU; TABBONE et al., 1998).
A maioria dos trabalhos na rea de deteco de fogo focam exclusivamente na deteco de bordas em imagens em escala de cinza utilizando Canny. OSKOEI; HU (2010)
menciona que a deteco de bordas em imagens coloridas no vem recebendo a mesma
ateno. Para eles, a diferena fundamental est exatamente no fato de um pxel em uma
imagem colorida ser normalmente representado por um vetor (de 3 a 4 componentes nos
espaos de cor usualmente empregados) e em decorrncia disto as funes precisam trabalhar com vetores ao invs de valores escalares.
A deteco de bordas em imagens coloridas pode ser dividida de acordo com duas
tcnicas (KOSCHAN; ABIDI, 2005):
Tcnicas monocromtica tratando as informaes dos canais de cores individualmente (separadamente cada componente do vetor de cor) e depois combinando os
resultados obtidos.
Tcnicas que operam no espao vetorial tratando a informao de cor como vetores
em um espao vetorial e executando funes vetoriais.
A adaptao de tcnicas monocromticas a utilizada com maior frequncia, obtendo,
na maioria das vezes, resultados melhores que os obtidos quando as imagens so trabalhadas em escala de cinza. Contudo, KOSCHAN; ABIDI (2005) trabalham com um pxel
diretamente no espao vetorial. As tcnicas anteriores buscavam extrair os contornos em

28

imagens coloridas quebrando as imagens em canais e aplicando o filtro de Canny sobre


o canal da luminosidade (que tinha resultados pfios pois algumas bordas existentes no
so detectadas operando s em um canal), aplicando Canny em todos os canais individualmente e combinando os resultados (o que resultava em bordas imprecisas) ou ainda
em uma tcnica que calculava o gradiente de cada canal, somava os valores resultantes
e aplicava uma limiarizao para definir a presena das bordas (KOSCHAN; ABIDI,
2005).
Entre os detectores que apresentam melhores resultados na deteco de bordas em
imagens coloridas est o filtro proposto em CUMANI (1991). Este filtro sugere procedimentos com base nas segundas derivadas parciais das funes de imagem. Esta tcnica
pode em teoria ser aplicada em imagens com um nmero qualquer de canais. Neste
contexto, assume-se sempre que uma mtrica Euclidiana existe para o espao vetor ndimensional. Os resultados podem variar conforme a imagem que est sendo analisada e
nem sempre possvel fazer uma generalizao sobre os resultados obtidos (KOSCHAN;
ABIDI, 2005).

2.3

Segmentao

A segmentao de imagens pode ser entendida como uma matria complementar da


deteco de bordas. Na deteco de bordas faz-se uma segmentao da imagem com
base nos limites ou bordas de cada objeto. Na segmentao busca-se agrupar pxeis que
so similares de acordo com as propriedades de uma regio. Na segmentao de uma
imagem, segundo FORSYTH; PONCE (2002), busca-se obter sub-imagens agrupando,
geralmente, pxeis com valores prximos na escala de cinza. No entanto, esta no nica
abordagem possvel para a segmentao.
2.3.1

Thresholding

A distribuio dos nveis de cinza pode ser utilizada para definir os nveis de threshold
a serem utilizados para a imagem binria. Um histograma mapeia o nmero de pxeis em
uma imagem que apresentam determinado valor de cinza como uma funo dos nveis de
cinza da imagem (FORSYTH; PONCE, 2002). Imagens reais raramente contm bordas
claras entre o foreground e o background, mas apresentam variaes graduais na escala
de cinza, resultando em picos e depresses no histograma. A tcnica de segmentao
utilizando thresholding uma das mais antigas, simples e frequentemente utilizadas (PAL;
PAL, 1993).
Objetos com valores de cinza prximos formam uma classe. O histograma de uma
imagem apresenta picos para cada um dos objetos encontrados e provavelmente um pico
maior que indica o background. Para diferenciar entre k classes de objetos necessrio
definir k thresholds, cada um definido entre dois picos. FORSYTH; PONCE (2002) re-

29

foram ainda que importante ter claro que histogramas conseguem diferenciar apenas as
classes de objetos, ignorando completamente qualquer informao espacial, o que indica
que um tabuleiro de xadrez, que tem uma distribuio caracterstica de blocos brancos
e pretos ter o mesmo histograma que uma imagem gerada aleatoriamente com cores
brancas e pretas.
2.3.2

Segmentao baseada em regio

So facilmente perceptveis as limitaes de um procedimento de segmentao atravs de um thresholding da imagem com um histograma global. Por este motivo,
desenvolveram-se algoritmos de segmentao que consideram os componentes conectados. O uso de componentes conectados adiciona a informao espacial aos dados extrados. Essa conexo entre pxeis com nveis de cinza semelhantes feita por um algoritmo
que encontra grupos de pxeis conectados atravs dos seguintes passos:
1. Varrer a imagem binria da esquerda para a direita, de cima a baixo.
2. Se existe um pxel no marcado com o valor 1 ele deve receber uma marcao.
3. Varrer recursivamente os pxeis vizinhos deste e marc-los com o mesmo valor,
caso no estejam marcados com 1.
4. O processo termina quando todos os pxeis de valor 1 so marcados.
ZHANG (1996), PAL; PAL (1993), PARKER (2010), FORSYTH; PONCE (2002)
apresentam variaes deste algoritmo buscando obter melhores resultados em termos de
custo computacional e preciso da segmentao, mas a ideia essencial mantida, embora
busque-se fugir do uso de programas recursivos e utilizar algoritmos sequenciais. Duas
abordagens principais podem ser destacadas (HOROWITZ; PAVLIDIS, 1976):
Mesclando ou bottom-up: A imagem dividida em vrias pequenas regies (eventualmente coincidindo com um nico pxel), que so ento fundidas para formar
regies maiores. Enquadram nesta categoria o trabalho de BRICE; FENNEMA
(1970) e outros que buscam digitalizar sequencialmente, da esquerda para a direita,
a forma de onda para determinar o intervalo mais longo de tal forma que uma aproximao feita de acordo com uma tolerncia previamente estabelecida.
Dividindo ou top-down: A imagem dividida sucessivamente em regies cada vez
menores at que certos critrios esto preenchidos. Na poca em que HOROWITZ;
PAVLIDIS (1976) foi publicado, poucos algoritmos utilizavam esta abordagem.
O algoritmo de Split and Merge o mais simples para crescimento de regies, ou, em
ingls region growing. Uma apresentao feita na figura 2. Neste algoritmo as regies

30

so sequencialmente divididas e mescladas de acordo com certos predicados at chegar a


uma situao em que nenhuma nova alterao possa ser feita seguindo esses predicados.
Um exemplo de predicado simples pode ser: o valor dos pxels em escala de cinza
o mesmo. Para comear, toda imagem considerada uma regio. Como nem todos os
pxeis da imagem tem a mesma intensidade na escala de cinza, divide-se a imagem em
4 quadrantes. Em seguida faz-se uma tentativa de mesclar duas regies adjacentes, mas
nenhum dos quadrantes satisfaz este predicado, motivo pelo qual todos os quadrantes,
exceto o esquerdo superior, so novamente divididos em 4 regies menores. Faz-se uma
nova tentativa de combinar algumas divises e o processo repetido at que todas as
partes da imagem tenham sido unidas.

Figura 2: Passo a passo da segmentao por Split and Merge (MUBARAK, 1997)

Outro algoritmo bastante conhecido como Phagocyte Algorithm ou boundary melting. Neste algoritmo a ideia central relaxar os limites fracos entre duas regies permitindo que elas sejam mescladas. Primeiro, pares de pontos vizinhos so ligados para
formar um conjunto se tiverem o mesmo valor de cinza, ou assim chamadas, regies atmicas. Ou seja, se os pxeis tm a mesma intensidade e so 4-conectados, ento podem
ser unidos formando regies conexas. Na prxima etapa, heurstica da fagocitose, regies
menores so englobadas por regies maiores segundo o seguinte critrio: Sejam P 1 e P 2
os comprimentos das bordas de duas regies R1 e R2, respectivamente. Seja |I| o comprimento da fronteira I entre R1 e R2. Seja |W | o comprimento das partes "fracas" da
borda, por exemplo, o comprimento de W I onde a diferena absoluta entre os nveis
de cinza de R1 e R2 menor do que um certo 1 .Por este algoritmo, pode-se afirmar que
duas regies, R1 e R2 , so ligadas entre si se
|W |
>2
min(|P1 |, |P2 |)

31

onde a 2 usualmente igual a 21 . Na terceira etapa, regies adjacentes cuja fronteira


fraca so ligadas segundo o seguinte critrio:
|W |
>3
|I|
onde usualmente 3 igual a

3
4

(BRICE; FENNEMA, 1970).

De acordo com MUBARAK (1997), este mtodo produz uma segmentao aceitvel
para imagens simples com poucos objetos e pouca textura. Duas heursticas so utilizadas:
weakness e phagocyte. Se a relao entre o nmero de pontos em bordas fracas e o nmero
total de pontos na borda que separa uma regio da outra satisfaz a um threshold prdeterminado, ento essas regies so mescladas. Contudo essa heurstica tende a sobremesclar reas e por este motivo utiliza-se uma heurstica que faa um controle levando
em conta o modelo da regio resultante.
A semelhana LH entre as duas regies dada por
LH =

P (H1 )
P (H2 )

e as regies so mescladas se forem maiores que um threshold T .

2.4

Deteco de Movimento

Um dos principais objetivos da viso artificial emular caractersticas do sistema


visual humano, como a habilidade de reconhecer objetos e rastrear seu movimento em
ambientes complexos. O primeiro passo para os softwares de rastreamento detectar os
objetos que se movem, classificar os pxels que o representam agrupando-os em regies,
conhecidos no campo da viso computacional pelo termo blob. Atravs deste agrupamento diminui-se a complexidade do problema, dada uma percepo global da cena.
A maior parte dos trabalhos publicados voltada para aplicao em vdeos obtidos a
partir de cmeras perfeitamente estticas. Duas abordagens principais para o problema
so apresentados na literatura cientfica: image difference e subtrao de background.
A primeira consiste em uma diferena limiarizada entre o frame no tempo t e o tempo
t 1, se mostrando extremamente performtico em termos de custo computacional e
fornecendo uma deteco do movimento entre dois quadros. Este mtodo apresenta, no
entanto, duas desvantagens bem conhecidas causadas pela taxa de quadros por segundo
e a velocidade do objeto se movendo na cena: abertura do primeiro plano e deteces
fantasmas (COLLINS et al., 2000). Com a inteno de resolver este problema KAMEDA;
MINOH (1996) prope uma variao do mtodo utilizando 3 quadros fazendo a diferena
entre os frames no tempo t e t 1 e no tempo t 1 e t 2. Ao final as duas sadas so
combinadas atravs do operador lgico "AND". MIGLIORE; MATTEUCCI; NACCARI

32

(2006) fazem uma ressalva esta abordagem afirmando que se os objetos no tiverem
textura suficiente ela pode no permitir uma deteco precisa do movimento e a posio
do objeto no estimada em tempo real. Para tratar estes problemas, foi proposta uma
tcnica que considera a diferena entre os quadros t e t 1 e t e t 2 de modo a evitar
o surgimento de fantasmas que apresentado pelas tcnicas anteriores (COLLINS et al.,
2000). Este sistema amplamente utilizado em ambientes externos com imagens de baixa
profundidade de campo.
Por outro lado, a deteco de movimento utilizando background subtraction utiliza-se
de um modelo do plano de fundo para compar-lo com o quadro atual. Estes algoritmos
resolvem os problemas apresentados pelos mtodos que utilizam frame difference e usualmente gera bons resultados na segmentao dos objetos que apresentam movimento.
Um tratamento especial necessrio para lidar com os variaes na luminncia e os objetos que iniciam ou terminam seu movimento durante a sequncia de quadros. Isto inclui
por exemplo pessoas andando e automveis que param no meio da cena. Para resolver
este problema vrias tcnicas foram propostas, dentre as quais pode-se destacar os mtodos baseados em mdia e varincia como Weighted Moving Mean, Weighted Moving
Variance, Adaptive Background Learning, Temporal Mean, Adaptive Median apresentado em MCFARLANE; SCHOFIELD (1995) e Temporal Median proposto em STAUFFER; GRIMSON (1999). Entre os mtodos baseados em mistura de gaussianas pode-se
destacar as publicaes STAUFFER; GRIMSON (1999) e BOUWMANS; EL BAF; VACHON (2008). Na literatura pode-se ainda encontrar diversas propostas que utilizam
lgica Fuzzy, redes neurais ou modelos de cor e textura para separao entre o primeiro e
segundo plano.
As mais simples fazem uma composio do backgroud utilizando uma composio
convexa dos pxeis no segundo plano no tempo t 1 e os pxeis da imagem no tempo
t. Assume-se geralmente que o segundo plano menos dinmico do que o objeto a ser
rastreado e que este distribudo de acordo com uma Gaussiana unimodal. comum
que esta modelagem do segundo plano falhe ao lidar com mudanas bruscas ou casos em
que o fundo no possa ser dado por uma funo Gaussiana unimodal. Esta premissa
considerada no mtodo Pfinder apresentado em WREN et al. (1997).
Uma das tcnicas mais populares de background subtraction e amplamente conhecida
pela sigla MoG foi proposta em STAUFFER; GRIMSON (1999). A modelagem do backgroung utilizando mistura de gaussianas em nvel de pxel tornou-se muito popular devido
sua eficincia em modelar distribuies multi-modais do segundo plano, o que ocorre
por exemplo com rvores balanando, ondas no oceano e reflexo da luz. Uma segunda
caracterstica importante que ela se adapta bem s mudanas no fundo (MIGLIORE;
MATTEUCCI; NACCARI, 2006).
Cada pxel modelado como uma mistura de gaussianas e o modelo gerado atravs
de uma aproximao. As distribuies gaussianas so ento avaliadas para determinar

33

quais apresentam a maior probabilidade de serem do background. Cada pxel classificado como parte do plano de fundo de acordo com a distribuio gaussiana que o
representa, permitindo a obteno de resultados estveis em rastreadores outdoor, onde a
confiana depende das variaes na iluminao, movimentos desordenados repetitivos e
variaes na cena STAUFFER; GRIMSON (1999).
Para este trabalho foram testados alguns destes modelos com o objetivo de suprimir os
falsos positivos remanescentes das tcnicas de classificao de fogo, utilizando segmentao por cor, frequncia de oscilao e formato do contorno. Como a pesquisa se prope a
suprimir as dificuldades com segundo plano dinmico, condies distintas de iluminao,
variao de posio e oscilao das imagens obtidas atravs de cmeras no estacionrias,
espera-se que o mtodo tenha baixa sensibilidade aos parmetros da cmera e que possa
ser facilmente incorporado em outras solues. Consideraes mais detalhadas a respeito
dos resultados atingidos quando as tcnicas de deteco de movimento foram aplicadas
sobre o dataset introduzido na Sec. 1.2.0.1 so apresentados no Cap. 7.

TRABALHOS RELACIONADOS

As tcnicas de processamento de vdeo para deteco e anlise de fogo so relativamente novas quando comparadas com outras tcnicas dentro da viso computacional.
Considerando-se o problema dentro de um contexto maior de aplicaes, seja dentro da
indstria ou mesmo em sistemas de vigilncia, fcil perceber a importncia de uma deteco rpida de incndios e outros incidentes envolvendo fogo no controlado. Existe
uma necessidade de anlise inteligente de contedo em vdeo para auxiliar vigilantes a
identificar os eventos logo que eles ocorram. Quanto antes o fogo detectado, maiores
so as chances de evitar que este se alastre, causando danos e colocando a vida de pessoas
em risco.
Nos ltimos anos, tcnicas de deteco de fogo atravs de vdeo (em ingls Video
Fire Detection - VFD) tem sido alternativas viveis ou complementos para os sistemas de
deteco de incndio convencionais, como os baseadas em sensores de fumaa, e tm se
mostrado teis para resolver vrios problemas relacionados com os sensores tradicionalmente utilizados. Sensores convencionais so geralmente limitados a ambientes fechados
por exigirem uma proximidade com o fogo, o que os torna inadequados para ambientes
como centros comerciais, aeroportos, estacionamentos ou mesmo florestas. Outra limitao dos sistemas de alarme de incndio convencionais que pode levar um longo tempo
para partculas de carbono e fumaa acionem o detector, o que os autores costumam chamar de atraso do transporte. J quando so utilizadas cmeras de vdeo para a deteco,
este atraso no ocorre pois a cmera pode identificar as chamas imediatamente (ETIN
et al., 2013).
Os primeiros estudos neste campo de pesquisa ocorreram no final da dcada de 90.
Vrias abordagens, de maior ou menor complexidade de implementao, foram propostas
com a finalidade de criar um bom detector de fogo. Inicialmente existia uma nfase maior
na deteco da chama, mas atualmente vrios trabalhos vem abordando tambm a fumaa.
A maioria dos detectores atuais funciona combinando detectores de cor e caractersticas
de borda com uma anlise temporal do formato da chama e o seu comportamento. ETIN
et al. (2013) ressalta que, no entanto, devido a variedade de formas e comportamentos
que o fogo e a fumaa podem assumir (cor, transparncia, temperatura ou cintilao)

35

muitos dos detectores considerados como estado da arte continuam apresentando falsos
positivos. Devido a estas caractersticas, aliadas a outros fatores como o rudo, sombras e
mudanas de iluminao, a deteco de fogo permanece sendo um grande desafio para os
pesquisadores.
Apesar de ser um assunto relativamente novo, a deteco de fogo baseada em vdeo
j produziu resultados promissores. No entanto no um problema completamente resolvido, assim como a maior parte dos problemas de viso computacional. O comportamento
da fumaa e das chamas de um incndio no controlado varia com a distncia e iluminao. Alm disso, diferentes cmeras podem produzir diferentes imagens e vdeos para a
mesma cena por causa de suas configuraes internas e algoritmos (ETIN et al., 2013).

3.1

Deteco de Cor

A grande maioria dos detectores de chama tem na cor uma informao primordial
para seu funcionamento. A maioria dos filtros utiliza o esquema de cor RGB, e em alguns
casos, ele combinado com HSI/HSV, como por exemplo em CHEN; HE; WANG (2010),
CHEN; WU; CHIOU (2004), GNAY et al. (2010). Isto se deve, segundo ETIN et al.
(2013) ao fato de a maioria das cmeras trabalharem com RGB e existir uma associao
espectral bvia com este espao de cor. Da mesma forma trabalha-se com a ideia de
que reas de fumaa apresentam nveis prximos em cada um dos canais de cor quando
trabalhando com o esquema de cor RGB.
A cor da chama vista pelo olho humano geralmente algo entre vermelho e amarelo.
A maioria das tcnicas de classificao de fogo com base na cor partem deste pressuposto.
CHEN; WU; CHIOU (2004) propem um modelo de classificao utilizando o espao de
cor RGB, que aplica avaliao da crominncia e medidas de desordem de forma a extrair os pxels que representam regies de chama ou fumaa. O mtodo utiliza valores de
threshold fixados empiricamente. Um pxel pode ser considerado fogo se atender as condies da Eq. 6 onde ST e RT so os limiares de saturao e vermelho. A mesma equao
foi utilizada posteriormente em CHENEBERT; BRECKON; GASZCZAK (2011) para
separar segmentar as regies pela cor e ento extrair dados da textura.

R > RT

P (x, y) = R G > B

S ((255 R) S )/R )
T
T

(6)

PHILLIPS III; SHAH; VITORIA LOBO (2002) utiliza a informao do espao de cores RGB e a variao temporal dos pixeis para a deteco do fogo. O processo realizado
em 3 etapas:
1. Criao de pares de imagens em que cada par consiste em uma imagem colorida

36

contendo chamas e uma mscara binria que aponta onde o fogo est presente. Dez
imagens so utilizadas.
2. Construo de um histograma de cor onde para cada pxel marcado como chama
uma distribuio gaussiana ( = 2) das cores adicionada. Para os pxels marcados como no fogo uma distribuio gaussiana menor ( = 1) subtrada do
histograma.
3. Threshold do histograma de forma a resultar em uma funo que recebendo os
valores RBG de um pxel retorna um valor booleano que indica se o mesmo fogo
ou no.
Como o fogo pode ser translcido e, em alguns casos, dispersar-se de forma a no ser
detectvel atravs da tcnica proposta, uma mdia das estimativas de um curto perodo de
tempo utilizada. De forma resumida, somam-se as sadas do pxel durante n frames da
sequncia e divide-se por n. Atravs do mtodo de pesquisa experimental mostrou-se possvel utilizar um n entre 3 e 7 com vdeos gravados a 30 FPS. A mdia deve ser maior que
1
para que o pxel seja considerado como fogo (PHILLIPS III; SHAH; VITORIA LOBO,
2
2002).
HORNG; PENG; CHEN (2005), por sua vez, faz uma converso de RGB para HSI
utilizando uma equao prpria, mais conveniente para o processamento, utilizando uma
escala de 1 360 para cada canal HSI. Em seguida, aplicado um mtodo de segmentao
pela cor para classificar regies com aparncia semelhante fogo, removendo posteriormente os pxels saturados ou com pouca intensidade, tais como fumaa e regies com
reflexo da luz. Como os autores no fornecem maiores detalhes sobre como os valores
de threshold foram definidos acredita-se que o fizeram de forma emprica. Depois desta
classificao, espera-se que as regies tenham sido propriamente classificadas. Contudo,
faz-se um tratamento de falsos positivos considerando principalmente dois fatores:
1. Devido reflexo das chamas alguns objetos tem a sua aparncia alterada de forma
que as caractersticas de crominncia ou luminosidade (color shift).
2. Objetos com cores semelhantes ao fogo so erroneamente classificados (falsos positivos).
Mesmo aps a classificao atravs da cor e o uso de frame subtraction para remover
objetos estticos com cor de fogo muitas regies continuam sendo classificadas erroneamente. Isto pode no ser um problema se o objetivo for apenas detectar a presena ou no
de chamas, contudo, se o objetivo for extrair dados sobre a localizao das chamas, ento
estes falsos positivos precisam ser eliminados. Ao examinar cuidadosamente o fenmeno
de color shift foi constatado que, dado que a cor alaranjada um reflexo da cor do fogo

37

na fonte, sua intensidade e saturao devem ser inferiores quelas encontradas no fogo
verdadeiro (HORNG; PENG; CHEN, 2005).
Continuando com as tcnicas de classificao baseadas em cor, (CELIK et al., 2007)
propem um modelo estatstico de cor combinado com subtrao de background para
fazer a segmentao das reas de fogo. O plano de fundo modelado como uma gaussiana
unimodal. Para gerar o modelo estatstico de cor, os autores coletaram 150 imagens da
internet e as segmentaram em reges de fogo e no-fogo. Cinco regras so aplicadas
comparando o canal de cor vermelho (R) em cada pxel com a mdia na imagem e com os
outros canais de cor. O modelo proposto utiliza ainda um limiar no canal vermelho para
eliminar falsos positivos e tratar efeitos decorrentes da variao na iluminao. Um pxel
considerado como fogo se atender todas as condies apresentadas na Eq. 7:

R > Rm

R>G>B

P (x, y) = 0.25 G/(R + 1) 0.65

0.05 B/(R + 1) 0.45

0.20 B/(G + 1) 0.60

(7)

CELIK; DEMIREL (2009) propem o uso do color space YCbCr para deteco de
fogo a partir da cor. Este mtodo contri um modelo genrico de classificao atravs de
crominncia para os pxels contendo chama. Cada pxel normalizado conforme o valor
da intensidade. Os autores argumentam que o algoritmo proposto utiliza o espao de cor
YCbCr para separar a luminncia da crominncia de forma mais eficaz que outros espaos
de cor. O desempenho do algoritmo proposto testado em dois conjuntos de imagens, um
dos quais contm fogo. Alm disso, o modelo de cores proposto pode ser utilizado para
a deteco em tempo real de fogo em vdeos. O modelo proposto apresenta uma taxa de
falsos positivos de 31,5%.
Apesar do espao de cor RGB poder ser usado para a classificao, ele apresenta a
desvantagem de depender da iluminao. Isso significa que, se a iluminao da imagem
mudar, a classificao do pxel provavelmente falhar. Alm disso, no possvel separar
o valor de um pxel em intensidade e crominncia. A crominncia pode ser utilizada em
modelos de cor de fogo em vez de modelar a sua intensidade. Isso d a representao mais
robusta para pxels que representam chamas. Por isso necessrio converter a imagem
RGB para um espao de cor onde a separao entre a intensidade e crominncia mais
discriminante. Por causa da converso linear entre RGB e YCbCr utilizou-se YCbCr
para modelar os pxels de fogo (CELIK; DEMIREL, 2009). A converso de RGB para
YCbCr obtida atravs da Eq. 8 onde Y a luminncia e Cb e Cr so respectivamente a
crominncia azul e a crominncia vermelha:

38

Y
0.2568 0.5041 0.0979
R
16

Cb = 0.1482 0.2910 0.4392 G + 128


Cr
0.4392 0.3678 0.0714
B
128

(8)

O passo seguinte a obteno das mdias para cada canal no frame e a validao da
cor de acordo com as regras apresentadas na Eq. 9.

Y > Cb

Cr > Cb

Y > Y
mean
P (x, y) =

Cb < Cbmean

Cr > Crmean

|Cb Cr| >

(9)

O valor de uma constante determinada atravs da anlise de uma curva ROC sobre
um dataset de 1000 imagens, cuja segmentao do ground truth foi feita manualmente.
Para cada valor de a taxa de falsos positivos e falsos negativos foi calculada. Considerando o custo do falso negativo maior que o do falso positivo os autores obtaram por
utilizar = 40, o que garantiu uma taxa de deteco de 90% e uma taxa de falsos positivos de 40%. Todas as imagens utilizadas eram diurnas, de ambientes externos e foram
obtidas por cmeras instaladas em helicptero. (CELIK; DEMIREL, 2009)
Um modelo de segmentao por cor utilizando o color space Lab proposto em CELIK (2010). O color space Lab tem cores uniformemente distribudas (cromaticidade
uniforme). A sua distribuio perceptualmete uniforme, a luminosidade separada da
cromaticidade e muitas vezes apresentada como a representao dos contrastes cromticos naturais do ser humano. A letra L na sigla corresponte luminosidade (lightness) e
a e b correspondem aos componentes de cor, baseados no modelo no linear de coordenadas CIE XYZ, sendo que a vai de verde a vermelho e b vai de azul at amarelo onde
as duas dimenses so combinadas originando novas cores. As regras de classificao de
um pxel como fogo com base na cor conforme apresentadas por CELIK (2010) so dadas
pela Eq. 10:

L > Lm

a > a
m
P (x, y) =
(10)

b > bm

b > a
onde Lm , am e bm representam os valores correspondentes mdia de cada canal. Um
pxel considerado como fogo somente se este satisfizer todas as regras apresentadas na
equao.

39

Um bom modelo de cor de fogo e uma boa segmentao dos pxels em


movimento so essenciais devido ao seu papel fundamental nos sistemas de deteco de incndio baseados na viso computacional. O CIE
Lab foi escolhido porque um espao de cor uniforme perceptivamente,
tornando assim possvel representar informaes de cor de fogo melhor
do que outros espaos de cor. Os pxels em movimento so detectados
atravs da aplicao de um algoritmo de background subtraction. Os
pxels que apresentam movimento so analisados em quadros consecutivos para levantar um alarme de fogo. A fim de encontrar a correlao
entre a L, a e b um conjunto de 500 imagens RGB foram coletados a partir da Internet. Em seguida, cada imagem foi manualmente segmentada
para identificar todas as regies de chamas. Regies de incndio segmentadas so convertidos para o color space Lab. Um histograma dos
pxels de fogo criado para cada um dos trs planos de cor (CELIK,
2010).

Em um processo que CELIK (2010) chama de quantificao, estes histogramas so


agrupados em nveis de probabilidade. Atravs de experimentao foi definido que uma
quantizao em 24 nveis oferecia bons resultados. A tabela de consulta criada para
cada par de 24 nveis quantificados para descrever a probabilidade de que qualquer par de
L, a e b pertena a um incndio. Por fim o pxel definido como fogo ou no definido
pela Eq. 11, onde alpha um limiar definido manualmente com base em uma curva
ROC. O dataset utilizado para validao dos resultados o mesmo utilizado em CELIK;
DEMIREL (2009).

P (x, y) =

1, if P (Lab) ,

(11)

0, else
J NGUYEN-TI; NGUYEN-PHUC; DO-HONG (2013) combinam nove regras utilizando tanto o espao de cor RGB quanto o espao de cor YCbCr com o objetivo de minimizar falsos positivos. As regras visam eliminar regies de pele humana, definir como
regies de fogo apenas as regies que so assim detectadas em ambos os espaos de cor.
Estas regies se referem pele humana e amarelo puro, ao mesmo tempo que no excluem
regies brancas que geralmente se formam no centro das chamas. Depois disso aplicado
um algoritmo de Region Growing para tolerar pxels prximos que tenham aparncia parecida mas no tenham sido classificados como fogo dentro de alguma das regras do
filtro de cor. Embora no sejam fornecidas estatsticas NGUYEN-TI; NGUYEN-PHUC;
DO-HONG (2013) afirmam que mesmo combinando as nove regras ainda provvel que
muitas regies classificadas como fogo no correspondam exatamente a fogo. Por este
motivo so combinadas tcnicas de Frame Subtraction e Region Growing e acompanham
a oscilao com base na variao horizontal e vertical das regies classificadas.

40

Alm disso, MARBACH; LOEPFE; BRUPBACHER (2006) trabalha a ideia de que o


fogo geralmente a maior fonte de luz, motivo pelo qual a luminncia dos pxels perto do
fogo tendem para o valor mximo permitido pela cmera (usualmente 255), atingindo, na
maioria dos casos, o nvel de saturao. As duas propriedades conhecidas do fogo, oscilar
entre 1 e 10 Hz e atingir a luminncia mxima, so usadas para modelar o algoritmo, que
explora a luminncia atravs do esquema de cores YUV. No YUV, o Y representa a luminncia enquanto U e V representam a crominncia. A primeira parte do processo inclui
acumular a diferena entre os frames de forma a encontrar uma regio de interesse que
defina as partes que apresentam oscilao. Depois de extrair as ROIs uma classificao
por cor utilizada sobre os valores acumulados no tempo.
A maioria dos trabalhos publicados utiliza o color space RGB. Em alguns trabalhos
utiliza-se tambm solues baseadas em HSI/HSV como o caso de CHEN; HE; WANG
(2010); CHEN; WU; CHIOU (2004) e GNAY et al. (2010). De acordo com ETIN
et al. (2013) isto se deve ao fato de a maioria das cmeras trabalharem por padro com
este sistema de cor e pelo fato de RGB apresentar uma associao espectral clara com a viso humana. Alguns autores prope abordagens diferentes, como PHILLIPS III; SHAH;
VITORIA LOBO (2002) que faz uso de histogramas e valores de cor que correspondem
a uma gaussiana da regio da chama.

3.2

Deteco de Movimento

seguro afirmar que a cor no pode, por si s, classificar uma determinada regio da
imagem como fogo ou no, pois existe uma enorme variao na cor, densidade, quantidade de luz gerada pelo fogo, condies de iluminao do ambiente ou mesmo elementos
do background que podem influenciar na cor capturada pela cmera e nos resultados da
converso de um color space para outro. Por este motivo, a maioria dos VFDs utiliza
tambm outras caractersticas como o formato da chama, textura, movimento e relaes
espaciais.
Para determinar se o movimento decorrente de uma chama ou fumaa necessria uma anlise de uma sequncia de quadros. Usualmente, considerando que trabalhase com cmeras estacionrias, utilizam-se tcnicas background subtraction. Este o
caso de GNAY et al. (2010), CHEN; HE; WANG (2010), citettoreyin2005wavelet e
JIAO; WEIR; YAN (2011). Outros trabalhos como GMEZ-RODRGUEZ et al. (2002),
GOMEZ-RODRIGUEZ; ARRUE; OLLERO (2003) e KOLESOV et al. (2010) buscam
abordar o problema do movimento utilizando fluxo ptico ou anlise temporal como em
LEE; HAN (2007).
ETIN et al. (2013) afirma que muitas das abordagens iniciais baseavam-se apenas
na deteco de cor e movimento, mas esta abordagem usualmente resulta em falsos positivos. Uma anlise mais aprofundada necessria para atingir resultados mais acurados.

41

Uma destas anlises baseada na cintilao. HAMINS; YANG; KASHIWAGI (1992)


apresenta um estudo detalhado do comportamento do fogo. De acordo com o estudo, um
incndio tem a propriedade de cintilao, aumentando e diminuindo a intensidade da luz
emitida. Do ponto de vista de uma cmera, esta oscilao faz com que ocorra o aumento e
a diminuio da luminncia das imagens no decorrer do vdeo. A frequncia de oscilao
tpica do fogo est na faixa de 1-10 Hz.
3.2.1

Anlise da Oscilao no Domnio da Frequncia

amplamente aceita a ideia de que o fogo oscila entre 1 e 10 Hertz e que isto independe do material que est queimando. Isto que permite que filtros no domnio da
frequncia sejam utilizados para distinguir fogo de objetos em movimento presentes na
cena. Os mtodos baseados nesta caracterstica utilizam o comportamento do pxel ao
longo do tempo. Esta premissa no valida para os primeiros instantes, quando o fogo
est iniciando e apresenta um comportamento completamente aleatrio. Neste estgio inicial impossvel perceber uma oscilao constante na frequncia. Para a fumaa tambm
no possvel obter resultados precisos baseados apenas na frequncia (ETIN et al.,
2013).
HAMINS; YANG; KASHIWAGI (1992) apresenta um estudo experimental realizado
com o objetivo de estudar a liberao de calor, dimetro das chamas e a frequncia de
pulsao do fogo considerando vrios combustveis gasosos e lquidos. No processo foram usados vdeos gravados a 30FPS. A frequncia de pulsao foi determinada a partir
da contagem do nmero de frames necessrios para que o vrtex completasse 50 ciclos.
Este processo foi repetido em diversas partes do vdeo para estimar a mdia e o desvio
padro da frequncia de pulsao. O experimento demonstrou ainda que a frequncia
fracamente correlacionada com a velocidade de liberao do combustvel, variando no
mximo 1,5 Hz.
A frequncia de oscilao utilizada para diferenciar chamas de outras fontes de luz
em movimento atravs da realizao de uma anlise de frequncia. No entanto, de acordo
com o teorema da amostragem de NyquistShannon, a frequncia de amostragem de um
sinal deve ser maior do que duas vezes a frequncia do sinal. Infelizmente, a taxa de
captura de vdeo , em geral, a 25 Hz (25FPS) na maioria dos sistemas de vigilncia. Esta
amostragem s pode revelar variaes de at 12,5 Hz, e no pode cumprir a exigncia de
amostragem. Alm disso, a transformao de sinais do domnio de tempo para o domnio
da frequncia custosa e afeta a eficincia do algoritmo de deteco (CHEN; HE; WANG,
2010).
TREYIN et al. (2006) utilizam a anlise no domnio da frequncia para acompanhar
o comportamento do valor no pxel dentro da regio que foi inicialmente classificada
como chama com base na cor e movimento. Neste caso, os autores fazem uma ressalva
afirmando que para funcionar adequadamente o vdeo deve ser capturado em no mnimo

42

20 FPS. Sabe-se contudo que quando ocorre undersampling existe um efeito de aliasing,
o que sugere que com um devido tratamento ainda seja possvel fazer a filtragem no
domnio da frequncia. Para a filtragem aplicou-se o filtro sobre o canal vermelho do
color scheme RGB. Um filtro de dois estgios que filtra as altas frequncias. Se o pxel
pertencer ao contorno da chama ento seu valor oscilar vrias vezes. Se for apenas um
objeto qualquer ento espera-se que apenas um pico seja gerado. O nmero de passagens
por zero durante alguns segundos (no especificado no paper) utilizado para classificar
os pxels utilizando um threshold qualquer.
natural que exista uma associao entre fogo e fumaa pois a presena do segundo
geralmente um indicativo de que o primeiro tambm est presente, mesmo que em
uma regio fora do campo de viso da cmera. TOREYIN et al. (2005) afirmam que a
oscilao/pulsao do fogo induz nas bordas da fumaa uma oscilao entre 1 e 3 Hertz.
Nos testes foram utilizados vdeos gravados 5 frames por segundo e utiliza-se um banco
de filtros de frequncia sobre os canais de cor YUV que permite pegar frequncias entre
0.625 e 2.5Hz.
A figura 3 apresenta o filtro de dois estgios utilizado. Xn [k, l] representa a variao
dos descritores de Fourier entre o frame n e n + 1. A decomposio em dois canais
constitui-se de um filtro passa-alta (-0.25, 0.5, -0.25) e um filtro passa baixa (0.25, 0.5,
0.25). Se o pxel apresenta alta frequncia de e en devem ser diferentes de zero. Pelo
contrrio, se o frame n permanece estvel com relao ao frame n + 1 ento estes sinais
devem ser prximos zero. A taxa de cruzamentos por zero de dn e en durante alguns
segundos utilizada para caracterizar as regies de fogo. Se este nmero for maior que
um threshold predeterminado (TOREYIN et al., 2005).

Figura 3: Filtro passa banda de dois estgios utilizado em ZHANG et al. (2008) e TREYIN et al. (2006). HPF e LPF representam respectivamente filtros passa-alta e passabaixa.
Na ltima etapa, a convexidade com o formato de regies de fumaa verificada.
A fumaa de um fogo no controlado se expande no tempo resultando em regies com
bordas convexas. Os limites das regies que contm "pxels candidatos"so verificados
quanto sua convexidade ao longo de linhas verticais e horizontais. Na implementao
foram utilizadas cinco linhas horizontais e cinco linhas verticais. A anlise consiste em
verificar se os pxels em cada uma das linhas pertencem regio em movimento ou no.
Pelo menos trs pxels consecutivos nas linhas que se cruzam nas regies movimento

43

devem pertencer ao background a fim de verificar se a regio em movimento viola a


condio de convexidade. Se ao longo de qualquer uma das linhas, a regra de convexidade
no for cumprida, os pxels de fumaa na regio so descartados. Essas pistas so ento
combinadas para dar uma deciso final. Se todos os critrios acima mencionados so
atendidos para um pxel, o pxel determinado como fumaa (TREYIN et al., 2006).
J ZHANG et al. (2008) apresenta um sistema de deteco de fogo e fumaa voltado
especificamente para deteco de fogo em florestas. A anlise temporal no domnio da
frequncia segue um modelo semelhante ao apresentado por TREYIN et al. (2006) e
apresentado na Fig. 3. Os valores dos pxels so extrados do canal R no espao de cor
RGB. A amostragem utilizada de 30 Hz (30 FPS) e os resultados apontam que um limiar
de 3 Hz adequado para deteco de fogo em vdeos.
3.2.2

Anlise da Oscilao Utilizando Fluxo ptico

Fluxo tico refere-se ao problema de estimar um vetor de distncia que mostre o deslocamento de um ponto em uma sequncia de imagens. Na formulao do problema de
fluxo ptico assume-se que um ponto, definido por (x1 , y1 ) de uma imagem obtida no
instante t deve ter um correspondente no instante t + 1. O deslocamento local, assumidamente pequeno, permite estimar o deslocamento do objeto observado nos frames
subsequentes (CYGANEK; SIEBERT, 2011).
As duas abordagens mais usuais para o problema do fluxo ptico so dadas por
HORN; SCHUNCK (1981) e LUCAS; KANADE et al. (1981). O algoritmo de HornSchunck o mais simples e embasa-se na ideia de que o brilho de um objeto sempre
constante (Brightness Constancy Assumption), fazendo com que seu movimento possa ser
identificado diretamente pelo valor do pxel. Assim, o gradiente de intensidade utilizado
para encontrar a melhor correspondncia entre dois pxels. J o mtodo de Lucas-Kanade
utiliza descritores Eigenvalue para encontrar a correspondncia entre caractersticas da
imagem e determinar o deslocamento.
Para deteco de fogo, KOLESOV et al. (2010) prope o uso de fluxo ptico OMT
(Optimal Mass Transport) como um descritor de baixo nvel. O processo de deteco
tratado como um problema de classificao Bayesiana onde as entradas so compostas
pelas velocidades OMT e pela cor no espao RGB. O classificador implementado como
uma rede neural de 1 camada oculta, sendo que os resultados apresentam a possibilidade
de cada pxel ser de fogo ou fumaa.
O problema de transporte de massa foi inicialmente formulado por Gaspar Monge em 1781, e focado em encontrar um caminho timo, no sentido de reduzir o custo do transporte, de transportar um volume fixo
de terra de um ponto para outro. Uma formulao moderna para este
problema foi proposta no trabalho de Kantorovich em 1947, sendo por
este motivo tambm conhecido como problema de MongeKantorovich

44

[...] A mtrica de KantorovichWasserstein define a distncia entre duas


densidades ao computar o menor custo de transporte de um domnio
para outro (KOLESOV et al., 2010).

As abordagens que partem do pressuposto de que o brilho dos objetos constante entre
os quadros no so adequadas para a deteco de fogo e fumaa. Este pressuposto vlido
para objetos rgidos com uma superfcie Lambertiana, mas falha para materiais lquidos
ou gasosos. Na viso computacional, estes materiais devem ser modelados por texturas
dinmicas. As texturas dinmicas tpicas de fumaa e fogo possuem dinmica intrnseca
e, portanto, no podem ser capturadas de forma confivel utilizando fluxo ptico na sua
forma tradicional. Deve-se levar em conta tambm que a regio de fogo/fumaa tende a
apresentar um fluxo muito mais rpido do que a rea em torno dele (KOLESOV et al.,
2010).
KOLESOV et al. (2010) buscam criar um modelo de fluxo que represente melhor o
comportamento de fogo e fumaa baseando-se nos atributos fsicos deste processo:
Um atributo simples que fogo e fumaa tendem a conservar intensidade tomada como uma massa generalizada e mover a massa de uma
forma otimizada. Assim, uma restrio matemtica apropriada no a
preservao da intensidade, mas sim da conservao de massa ou conservao brilho (KOLESOV et al., 2010).

A soma da energia total da imagem com a preservao da massa utilizada como


entrada em uma rede neural para ser classificada como fogo ou no-fogo. Sem fornecer
maiores detalhes, os autores afirmam que apenas seis frames de um vdeo, segmentados
manualmente, foram utilizados para o treinamento da rede neural. Os testes foram realizados no mesmo vdeo do qual os frames foram extrados. Embora os autores assegurem
que os resultados so promissores e apresentem imagens de classificaes corretas, no
so fornecidas quaisquer estatsticas sobre taxas de deteco, falsos positivos e falsos
negativos.
Outra proposta utilizando fluxo ptico apresentada em MUELLER et al. (2013),
que trabalham considerando dois mtodos de fluxo ptico desenhados especificamente
para deteco de chamas: OMT para extrao de textura dinmica nas regies onde o
fogo apresenta variao de intensidade e uma abordagem clssica de fluxo ptico que
busca explorar o fluxo ptico das reas saturadas que os autores tratam por NSD (NonSmothed Data). A partir disso, caractersticas relacionadas com a magnitude e direo so
extradas para discriminar entre regies de fogo e no fogo. Uma viso geral do mtodo
apresentada na Fig. 4.
Sobre a variao direcional das reas saturadas, MUELLER et al. (2013) defendem
que o mtodo proposto capaz de diferenciar o movimento das bordas da chama das
bordas de objetos rgidos presentes na cena e que apresentem movimento, ao quantificar
a varincia da direo do fluxo dos pxels em movimento. Conforme pode ser observado

45

Figura 4: Mtodo de deteco de fogo proposto por MUELLER et al. (2013). A nfase
do trabalho est na extrao de caractersticas combinando transporte timo de massa e
magnitude e variao na direo das reas saturadas, criando um vetor 4D que utilizado
como entrada em uma rede neural.
na Fig. 5 uma varincia alta sugere que movimento em vrias direes (fogo), ao passo
que uma varincia pequena induz um movimento uni-direcional (objeto rgido).
Sobre a variao direcional das reas saturadas, MUELLER et al. (2013) defendem
que o mtodo proposto capaz de diferenciar o movimento das bordas da chama das
bordas de objetos rgidos presentes na cena e que apresentem movimento, ao quantificar
a varincia da direo do fluxo dos pxels em movimento. Conforme pode ser observado
na Fig. 5, uma varincia alta sugere que existe movimento em vrias direes (fogo), ao
passo que uma varincia pequena induz um movimento uni-direcional (objeto rgido).

(a)

(b)

Figura 5: Histograma normalizado das direes do fluxo ptico utilizando NSD conforme
apresentadas em MUELLER et al. (2013). Os dados foram obtidos a partir de dois vdeos,
ambos apresentando regies onde o brilho do objeto provoca saturao da imagem. Naturalmente o componente u corresponde ao deslocamento no eixo x e o componente v
corresponde ao deslocamento do pxel no ponto y.

Os vdeos utilizados pra treinamento e testes so gravados a 30 FPS e

46

com resoluo 240x360 pxels. De cada um dos 263 cenrios (169 contendo fogo e 94 sem fogo), 10 quadros consecutivos so rotulados como
ground truth fornecendo um banco de dados de teste de 2630 frames.
Note-se que os cenrios de fogo so escolhidos de forma a serem provveis falsos positivos, ou seja, apresentam movimento e/ou objetos com
cor de fogo, como carros, pessoas, folhas vermelhas e luzes. Uma rede
neural foi treinada em quadros de 20 desses vdeos que no so utilizados nos testes. O resultado do teste mostra que fogo detectado de
forma confivel usando fluxo ptico. A taxa de falsos positivos de
3,19% e a taxa de falsos negativos de 3,55%. Visto que apenas as caractersticas do fluxo ptico so exploradas considera-se que o mtodo
vivel para aplicao em grandes bases de dados (MUELLER et al.,
2013).

Em uma anlise qualitativa, 4 cenrios geraram erros de classificao produzindo falsos negativos (MUELLER et al., 2013):
Rudo estruturado no vdeo, apresentando linhas horizontais faz com que o movimento do fogo no seja capturado de forma adequada;
Distoro da cor do fogo pela cmera faz com que a estimativa de transporte de
massa falhe.
reas de chama muito pequena no geram movimento suficiente para serem detectadas atravs do mtodo.
Ocluso parcial do fogo, onde algum dos lados do fogo est oculto faz com que a
variao das direes do movimento no possam ser estimadas, levando o mtodo
a produzir falsos negativos.
Embora apresentem algumas limitaes claras, pode-se considerar que a deteco da
oscilao do fogo utilizando fluxo ptico representa uma alternativa promissora. Esta
abordagem relativamente nova e portanto existem poucos trabalhos publicados. Alm
dos trabalhos de MUELLER et al. (2013) e KOLESOV et al. (2010), que focam especificamente em deteco de chamas, CHUNYU et al. (2010) propem o uso de fluxo ptico
conforme apresentado em LUCAS; KANADE et al. (1981) para a deteco de regies de
fumaa. Em linhas gerais, o mtodo propem encontrar as regies de movimento utilizando fluxo ptico, fazer uma classificao baseada em oscilao e cor no color space
RGB utilizando uma rede neural e disparar um alarme caso fumaa seja detectada.
3.2.3

Anlise da Oscilao Utilizando Minerao de Dados

Tambm utilizando as caractersticas de oscilao do fogo LI; WU (2011) combinam


um modelo estatstico de cor e minerao de padres sequenciais para estabelecer uma

47

classificao dos pxels como fogo ou no-fogo. A minerao de dados um processo


de inferncia de conhecimento de grande quantidade de dados e uma de suas reas a
descoberta de padres que ocorrem frequentemente em dados sequenciais. AGRAWAL;
SRIKANT (1995) definem o problema de minerao de padres sequncias da seguinte
forma:
Dado um conjunto de sequncias, em que cada sequncia constituda
por uma lista de elementos e cada elemento constitudo de um conjunto
de itens, e dado um limiar de suporte mnimo especificado pelo utilizador, o objetivo da minerao de padres sequenciais encontrar todas
as subsequncias frequentes, isto , as subsequncias cuja frequncia de
ocorrncia no conjunto de sequncias maior que o suporte mnimo.
(AGRAWAL; SRIKANT, 1995).

LI; WU (2012) e LI; WU (2011) utilizam o algoritmo de minerao de padres sequenciais PrefixSpan para identificar as sequncias mais comuns que pixeis de fogo assumem durante 8 frames. Para criar o que os autores chamam de "fire rules", os autores
coletaram diversos vdeos da internet, segmentando manualmente as regies que apresentam fogo. No sentido de reduzir as possveis regras e diminuir o espao de busca o valor
de cada pxel dividido por 8, fazendo com que os possveis valores para cada canal de
cor RGB passem de 28 para 25 , antes de ser utilizado para a minerao de sequncias
comuns reas de chamas. Mais detalhes sobre o funcionamento do algoritmo PrefixSpan
podem ser obtidos em PEI et al. (2001).
Assumindo que existem sequncias que ocorrem com frequncia um histrico de cada
pxel gerado e verifica-se se ele satisfaz as "fire rules" que foram anteriormente mineradas. Cabe salientar que uma vez minerados os padres o algoritmo PrefixSpan no mais
utilizado. Embora os dados estatsticos apresentados sejam incompletos e no apresentem por exemplo a taxa de falsos positivos e falsos negativos, LI; WU (2012) asseguram
que os resultados so melhores que os atingidos pelo detector proposto por CELIK et al.
(2007). impossvel reproduzir o experimento apresentado visto que os resultados podem variar dependendo dos dados utilizados para a minerao das sequencias, os quais
no so disponibilizados publicamente.
3.2.4

Anlise da Oscilao com Base no Formato da Chama

Aps uma validao dos pxels com colorao de chama possvel extrair regies e
determinar as caractersticas destas regies de forma a verificar se elas representam ou
no fogo. YAMAGISHI; YAMAGUCHI (2000) transformam a imagem de entrada de
RGB para HSV e verificam se a cor satisfaz as cores de chama. Os valores de H, S e V
so definidos atravs do mtodo experimental. Os dados de regies que apresentam cor
de fogo so ento projetados em um plano HS (Matiz e Saturao) e a varincia de H na
regio calculada. A regio que apresentar a maior varincia utilizada e uma elipse que

48

melhor acomoda a regio criada. Utilizando como base o maior eixo da elipse a regio
normalizada para um tamanho previamente estipulado. Argumenta-se que isso permite
detectar chamas mesmo que o tamanho da regio em chamas varie significativamente de
uma fonte para outra.
Quando uma regio apresenta colorao de fogo durante vrios quadros consecutivos
utilizada para encontrar o centro de massa das chamas e ento desenhar um crculo utilizando com o raio o maior eixo da elipse. As regies com colorao de fogo conectadas
a este crculo so ento extradas, sendo sua rea utilizada como parmetro para anlise
da oscilao. A distncia entre cada um dos pontos do contorno para o centro de massa
extrada durante vrios frames consecutivos gerando uma matriz que ento convertida para o domnio da frequencia atravs da transformada de Fourier, obtendo dados de
amplitude e fase. Desta forma, consegue-se separar fogo de outras fontes artificiais de
luz (YAMAGISHI; YAMAGUCHI, 2000).
Em caso de fogo, o componente de frequncia tende a se concentrar no
canto superior esquerdo (rea de baixa frequncia). J em caso de luz
artificial existe uma tendncia de a distribuio ser uniforme. (YAMAGISHI; YAMAGUCHI, 2000)

No entanto, devido a uma srie de condies que podem afetar diretamente o comportamento do fogo (YAMAGISHI; YAMAGUCHI, 2000) afirmam que impossvel atravs
deste mtodo fazer uma classificao precisa, optando ento por treinar e classificar as regies utilizando uma rede neural de trs camadas, que tem como entrada um vetor de
tamanho n n que correspondem a cortes de 10 x 10 na matriz bidimensional produzida
com a flutuao dos contornos. As possveis sadas do classificador so: fogo e no-fogo.
Outra proposta de deteco de fogo baseada no formato da regio classificada como
apresentando cor de fogo apresentada em ZHOU et al. (2010). O primeiro passo neste
caso a classificao de cor no color space RGB utilizando limiares estabelecidos a partir
de resultados experimentais. Para remover regies pequenas so utilizados os operadores
de eroso e dilatao. A partir disso, a classificao pode ser definida em quatro etapas:
Converter a imagem de entrada anteriormente classificada para uma em tons de
cinza e outra binria;
Executar operaes de dilatao e eroso para suavizar as imagens;
Remover regies pequenas preenchendo as com os mesmos valores da regio maior
onde esto englobados;
Classificar as regies como chama ou no chama com base nos contornos obtidos
atravs do detector de Canny utilizando os ltimos 20 frames.
A partir dos dados do contorno a regio classificada como fogo quando satisfizer a
regra 12 (ZHOU et al., 2010):

49

PS > PST

F = PC > PCT

P > P
R

(12)

RT

onde PS , PC e PR so os percentuais de frames que apresentam aumento na rea de fogo,


frames que apresentam aumento no permetro do fogo e a mdia de circularidade nos
ltimos 20 quadros processados. Neste caso PST , PCT e PRT so definidos atravs de
resultados experimentais. Faz-se a ressalva de que esta abordagem confivel apenas
para a deteco dos estgios iniciais do fogo, quando existe um crescimento da regio em
chamas, no podendo ser utilizada em fogo j estabilizado. Outra limitao da abordagem
proposta diz respeito a distncia entre a cmera e a chama, que pode afetar os resultados
devido a dependncia de parmetros estticos (ZHOU et al., 2010).

3.3

Deteco Baseada em Textura

Alm das abordagens que utilizam o movimento para melhorar a classificao dada
pela cor, trabalhos recentes como CHENEBERT; BRECKON; GASZCZAK (2011) e
BORGES; IZQUIERDO (2010) passaram a utilizar tambm informaes de textura para
conseguir uma classificao utilizando apenas um frame do vdeo, ou uma imagem esttica. Este tipo de abordagem mostra-se mais adequado para cenrios onde cmeras no
estacionrias so utilizadas.
BORGES; IZQUIERDO (2010), trabalharam em um detector para a classificao de
vdeos de telejornais e noticirios, que foram previamente manipulados. Embora estabilizados, estes vdeos criam uma srie de dificuldades que no existem em vdeos estacionrios, como o movimento da cmera, cortes de cena e trepidao. Considerando que o
nico objetivo detectar a presena ou no de fogo no vdeo como um todo, os autores
afirmam ter atingido uma taxa de 0,68% de falsos positivos e nenhum falso negativo. Para
atingir este resultado, utilizam uma soluo que extrai dados de cor, posio do fogo na
imagem, formato da chama e textura, e um algoritmo de aprendizagem de mquina:
O mtodo proposto analisa as mudanas quadro a quadro utilizando caractersticas de baixo nvel para descrever as regies de fogo. Estas caractersticas so a cor, a rea, a granularidade da superfcie, a rugosidade
do contorno e a assimetria das regies de fogo. Devido oscilao e as
caractersticas aleatrias do fogo estas caractersticas so discriminantes importantes. O comportamento de cada uma destas caractersticas
avaliado e os resultados so ento combinados de acordo com um classificador Bayesiano de forma a obter uma deteco robusta. Alm disso,
informaes previamente conhecidas do fogo so utilizadas para melhorar os resultados da classificao. (BORGES; IZQUIERDO, 2010)

50

No sentido de fugir de uma anlise temporal utilizando uma avaliao do contorno no


domnio da frequncia da forma como feita em YAMAGISHI; YAMAGUCHI (2000),
que sabidamente tem um custo computacional alto, BORGES; IZQUIERDO (2010) apresentam uma nova proposta: as caractersticas de rugosidade do contorno so computadas
como a relao entre o contorno e o fecho convexo (Convex Hull). Assim, a rugosidade
da borda definida por BORGES; IZQUIERDO (2010) atravs da Eq. 13 onde PS o
permetro da borda e PCHS o permetro do fecho convexo:
BR = PS /PCHS

(13)

Para calcular o permetro usa-se a contagem de pxels conectados horizontal e vertical


mente, mais 2 vezes o nmero de pxels na diagonal. Utiliza-se um threshold para decidir entre fogo e no fogo. Os experimentos demonstram que os resultados so parecidos
com aqueles atingidos utilizando a transformada de Fourier (BORGES; IZQUIERDO,
2010).
Na mesma linha, CHENEBERT; BRECKON; GASZCZAK (2011) buscam utilizar
informaes de textura para a classificao de regies de fogo e no fogo. O mtodo
apresentado dividido em duas etapas. A primeira etapa consiste na classificao de
cada um dos pxeis individualmente, utilizando a Eq. 6 proposta por chen2004early,
que leva em considerao limiares fixos no color space RGB. Na segunda etapa, para
a classificao das regies so extrados histogramas de 10 bins para os canais H e S
do color space HSV resultando em 20 atributos. Ainda para a classificao das texturas
os autores utilizam GLCM , proposto inicialmente por HARALICK; SHANMUGAM;
DINSTEIN (1973), extraindo energia, entropia, contraste, homogeneidade e correlao
dos valores de pxel em H e S.
Cada regio ento classificada com base nestes 30 atributos que so testados em
um classificador de rvore e em uma rede neural. Os resultados obtidos mostram que
o algoritmo CART (rvores de Classificao e Regresso), proposto inicialmente em
BREIMAN et al. (1984) o que fornece os melhores resultados. Os autores tentaram
ainda reduzir o nmeros de atributos utilizando Anlise dos Componentes Principais, de
forma a encontrar os mais discriminantes, mas os resultados mostraram que no houve
uma melhora significativa. Os resultados obtidos na classificao quadro a quadro em
um dataset de 1194 imagens igualmente distribudas entre fogo e no-fogo, utilizando
validao cruzada com os dados divididos em 8 subconjuntos, mostraram um desempenho
de 87,83% com uma taxa de falsos positivos de aproximadamente 7%.
Precisa-se no entanto considerar que todas as tcnicas apresentadas at aqui, com exceo de BORGES; IZQUIERDO (2010) e CHENEBERT; BRECKON; GASZCZAK
(2011), buscam resolver o problema de deteco utilizando imagens obtidas a partir de
cmeras perfeitamente estacionrias tipicamente utilizadas em sistemas de vigilncia. O

51

tipo de cmera utilizada e os objetivos especficos do trabalho afetam diretamente as tcnicas propostas. Pode-se ainda afirmar que a evoluo dos algoritmos de aprendizagem
de mquina permitiu que novas solues explorassem uma quantidade maior de caractersticas do fogo. Por outro lado, fica claro que a parte de gerao de descritores foi pouco
explorada ou no foi capaz de gerar bons resultados.

DATASET E MTRICAS DE AVALIAO

A existncia de um ground truth e de mtricas padronizadas fundamental para permitir a avaliao dos algoritmos e a evoluo das tcnicas de viso computacional. Apesar
de haver uma quantidade significativa de trabalhos publicados na rea, difcil comparar
e reproduzir os resultados de diferentes detectores de fogo. Neste sentido, fez-se necessria a criao de um dataset contemplando vdeos e anotaes, e tambm um esquema
de avaliao que se adaptassem aos trabalhos que so considerados o estado da arte neste
campo de pesquisa. Alm disto, acredita-se que a existncia de um dataset permita uma
evoluo natural dos algoritmos VFD representando para esta rea o mesmo que os datasets de reconhecimento de face, como os apresentados por BERG et al. (2004) e JAIN;
LEARNED-MILLER (2010), e os datasets de segmentao e reconnecimento de objetos,
como os apresentados em RUSSELL et al. (2008), XIAO et al. (2010), FEI-FEI; FERGUS; PERONA (2007), DENG et al. (2009) e SCHROFF; CRIMINISI; ZISSERMAN
(2011), representaram para as suas respectivas reas.
A utilizao de datasets proprietrios representa uma barreira avaliao independente dos algoritmos. Em um cenrio ideal na cincia, as partes interessadas precisam
ser capazes de reproduzir os resultados alegados, validando-os com o ground truth e avaliando os resultados. No entanto, durante o decorrer deste trabalho, no foi possvel
encontrar nenhum dataset pblico voltado para a avaliao de sistemas de deteco de
fogo baseados em vdeos de cmeras no-estacionrias.
Os vdeos utilizados em BORGES; IZQUIERDO (2010), pertencentes rede de emissoras de televiso alem Deutsche Welle GmbH., no so disponibilizados publicamente.
J CHENEBERT; BRECKON; GASZCZAK (2011) no fazem qualquer referncia aos
vdeos que foram utilizados para os testes. Quanto aos datasets utilizados para avaliao
de sistemas estacionrios como os apresentados em ELIK; OZKARAMANLI; DEMIREL (2007), CHEN; HE; WANG (2010), CELIK (2010), KOLESOV et al. (2010), LABATI et al. (2013) e ZHOU et al. (2010) so incompletos no sentido de no trazerem as
informaes de ground truth, caracterizando-se assim, como uma coleo de vdeos sem
qualquer informao adicional. A falta de informaes essenciais, como a contagem de
frames que representam fogo e no fogo, faz com que no seja possvel calcular mtricas

53

como a acurcia, especificidade, fall-out, taxa de falsos negativos, taxa de falsos positivos
e outras estatsticas relevantes.
De fato, a inexistncia de dados de ground truth e a falta de padronizao para avaliar
a sada dos algoritmos de deteco de chamas resulta em uma situao onde os resultados
so muito dependentes daquilo que os autores consideram como uma deteco correta.
Neste sentido, uma das contribuies deste trabalho a criao de um dataset novo, composto por 20 vdeos e suas respectivas anotaes. Os vdeos utilizados apresentam uma
variedade de dificuldades, incluindo ocluso, variao de escala, vibrao de cmera e diferentes caractersticas de brilho e contraste, de forma a se aproximar das condies que
os sistemas de deteco de fogo encontraro em situaes reais. Uma segunda contribuio neste sentido a apresentao de um esquema de avaliao completo, composto dos
seguintes artefatos:
Um algoritmo para encontrar a correspondncia entre a sada do detector de fogo e
as anotaes do ground truth.
Dois mtodos para a avaliao dos resultados atingidos pelo detector quando utilizado no dataset: um para verificar somente a classificao frame-a-frame e outro
que leva em considerao a posio da chama na imagem;
O cdigo-fonte e bibliotecas que implementam os mtodos propostos.
Alm de oferecer uma maneira de comparar diretamente as sadas de diferentes algoritmos, acredita-se que a existncia de um dataset aberto possa, em um futuro prximo,
permitir que outros pesquisadores utilizem abordagens baseadas em aprendizagem de mquina. Uma vez que o processo de avaliao automatizado e os artefatos de software
liberados simplificam a criao de dados de treinamento, os pesquisadores podem direcionar seus esforos no desenvolvimento de tcnicas e algoritmos mais avanados para
resolver o problema da deteco de fogo baseado em vdeo.

4.1

Dataset

No sentido de desenvolver os objetivos e entender as necessidades que o dataset e


as mtricas propostas deveriam satisfazer, buscou-se inicialmente entender como autores
de trabalhos anteriores na rea haviam avaliado seus resultados. O problema da deteco de fogo utilizando vdeos no-estacionrios foi apresentado pela primeira vez em
BORGES; IZQUIERDO (2010) que apresenta, conforme descrito no Cap.3, um mtodo
para classificar arquivos gravados de noticirio de televiso. O mtodo proposto apresenta dois estgios, onde o primeiro a classificao individual dos pxels utilizando a
cor e o segundo extrao de texturas e categorizao utilizando um classificador Bayesiano. Neste caso, avaliam seus resultados considerando apenas a classificao atribuda

54

ao vdeo como um todo, desconsiderando qualquer informao referente ao momento da


deteco ou a localizao do fogo na imagem.
Posteriormente, CHENEBERT; BRECKON; GASZCZAK (2011) propem tambm
uma abordagem que combina a classificao da cor atravs da equao proposta anteriormente por CHEN; WU; CHIOU (2004) com descritores de textura GLCM e algoritmos
de aprendizagem de mquina como redes neurais e rvores de regresso. Utilizando esta
abordagem, os autores afirmam que conseguiram processar 12 frames por segundo atingindo uma preciso de 87.83%. Estes resultados so dados considerando apenas se os
frames foram classificados como contendo ou no regies de fogo. Cabe reforar que os
autores no detalham os dados de teste utilizados e deixam de apresentar por exemplo o
recall e acurcia.
Considerando as possveis aplicaes que o dataset proposto possa vir a ter, optouse por disponibiliz-lo como um pacote nico, permitindo que os desenvolvedores possam utilizar os dados da forma que lhes for mais conveniente. Enquanto nas abordagens
baseadas em aprendizagem de mquina necessrio dividir os dados em conjuntos de
treinamento, testes e avaliao, as abordagens tradicionais podem utilizar todos os dados
somente na avaliao da soluo proposta. Assim, os artefatos de software que acompanham o dataset foram desenvolvidos permitindo o acesso a frames especficos de forma
simplificada, permitindo que desenvolvedores implementem sem muito esforo tcnicas
de subamostragem como validao cruzada e bootstrapping. Outro fator que influenciou na deciso de distribuir os dados um pacote nico a preexistncia de tcnicas que
utilizam uma sequncia de frames para extrair informaes de pulsao do fogo e fluxoptico.
Os vdeos utilizados na criao do ground truth so distribudos sob a licena Creative
Commons By 3.0. O CC BY 3.0, permite copiar e redistribuir o material em qualquer formato. Permite tambm a remixagem e compartilhamento livre com a meno da autoria
e a licena. Inicialmente foram gerados 20 vdeos de 30 segundos, mantendo somente as
partes que mostram a filmagem da cmera. Os vdeos utilizados como base so listados
na Tabela 1.
Ao todo, os 20 vdeos produzidos somam 24.372 frames. Destes, 11.779 (48,33%)
apresentam fogo e 12.593 (51,66%) no apresentam. Assumindo que alguns frames podem conter mais de uma regio de fogo, o dataset apresenta 12.203 anotaes (3,59%
maior que o nmero de frames contendo fogo). Para criar um conjunto de vdeos que permita avaliar os sistemas de deteco de fogo em vdeos no estacionrio, em condies
prximas s que eles precisaro atuar em campo, buscou-se utilizar vdeos que apresentam as seguintes propriedades:
Variedade de fontes: diferentes combustveis (lquidos ou slidos) produzem diferentes chamas. Embora, HAMINS; YANG; KASHIWAGI (1992) afirmem que o

55

Tabela 1: Vdeos base utilizados para a criao do dataset


Nome do vdeo

URL

Mobile Robot Roams Show Floor


Drone-Ground Footage Working Fire - Coventry, RI
STS-31 Crew Training - Firefighting, EVA Prep and Post
Blowing Up House!!!
Burning Down The House
Car catches fire after flipping near Christchurch
Dachstuhl im vollbrand, Burning house RC Fire Fighters
My car burning to the ground after doing donuts
Raw Video - Burning Car Lifted Off Trapped Man
Winnebago RV explodes into flames and hits Firetruck
Fire Hazard of Lithium-ion Batteries in Warehouse Storage
A Ride on CoolerBot
Robots Invade ICRA Show Floor
6-Wheel Rover Initial Tests
Samsung Navibot SR8845 cleaning robot
Fire on 49 street
House Fire in Clarksburg, MD on 4/28/2012
IU-MIEN hiking in Laos

http://youtu.be/v6QVTIAUsf0
http://youtu.be/IQu_C7MRPUU
http://youtu.be/8DZWKaWEB6o
http://youtu.be/XnbVBMwP9fM
http://youtu.be/aIGTyBCMFb4
http://youtu.be/3C9t4J0BWa4
http://youtu.be/RhGYj9asHhI
http://youtu.be/WY89eGi834Y
http://youtu.be/aIGTyANMFb4
http://youtu.be/6uL1Y2W0jcI
http://youtu.be/MitnyQ4d_4g
http://youtu.be/G43DTnX8o0U
http://youtu.be/q6MZV88AvXo
http://youtu.be/Ij9EYxLW1Vs
http://youtu.be/pnOIP3f7Rww
https://youtu.be/UOHFTMLJ0TY
https://youtu.be/GVP6EQ4E7a8
https://youtu.be/5MQ_gD4MwEw

combustvel e o comburente tenham uma influncia insignificante na oscilao e


pulsao do fogo, inegvel que afetem a cor e forma do fogo.
Iluminao no-controlada: os vdeos foram gravados em vrias condies de iluminao. Cabe mencionar tambm que o fogo, sendo uma fonte de luz, acaba afetando a iluminao e colorao na cena observada. O dataset apresenta trambm
uma ampla variao nas caractersticas de contrraste e brilho.
Movimento de cmera: os vdeos foram gravados utilizando cmeras portteis ou
fixadas em robs mveis, apresentando movimento em 3 eixos e rotao.
Preciso de cor: Vrias cmeras diferentes foram utilizadas, fazendo com que exista
uma variedade de parmetros intrnsecos afetando as caractersticas dos vdeos.
Rudo: existe rudo na imagem, incluindo a linhas verticais e horizontais causadas
pelo uso de sensores e encoders de baixa qualidade.
Ocluso parcial e desordem na cena: a ocluso parcial das regies de chama foi
considerado um dos maiores desafios, ainda por resolver, dos detectores de fogo
anteriormente propostos. A ocluso especialmente difcil de tratar em abordagens
que utilizam a forma da chama ou o fluxo-ptico.

56

Motion blur: o borramento da imagem um fenmeno que ocorre frequentemente


como consequncia da trepidao e do movimento da cmera enquanto o obturador
est aberto.
Escala e projeo: o fogo no tem caractersticas bem definida de tamanho, escala
ou ponto de vista. Contudo, procurou-se utilizar videos onde o fogo est entre 1 e
15 metros da cmera, utilizando uma viso que enquadre a origem das chamas.
Reflexo e outros fenmenos pticos: Visto que o fogo uma fonte de luz, podendo
afetar os objetos que o circundam, as cenas gravadas podem conter imagens podem
conter reflexo especular, subsurface scattering, inter-reflexo ou refrao, entre
outros fenmenos discutidos no Cap. 2 deste trabalho.
4.1.1

Anotaes de Ground Truth

O fogo pode, muitas vezes, assumir diferentes caractersticas de cor, transparncia e


forma. Estas propriedades impactam diretamente nas reas que os detectores so capazes
de encontrar. Em alguns casos, quando combinado com imagens de baixa resoluo,
definir onde uma regio de fogo comea ou acaba uma tarefa ambgua. Pela falta de um
critrio objetivo para incluir ou excluir uma determinada regio nas anotaes de fogo,
recorreu-se ao julgamento de um anotador humano.
Ocasionalmente a oscilao decorrente do fogo resulta em pequenas regies de chamas que ficam completamente separadas do foco principal do fogo. Dado que o fogo
pulsa entre 2 e 10 Herz praticamente impossvel anotar o contorno exato das chamas
para cada frame. Assim sendo, optou-se por por fazer as anotaes na forma de um retngulo que engloba toda a regio de fogo na imagem. Em casos onde um foco do fogo est
afastado suficientemente de outro para ser anotado sem que os retngulos apresentassem
interseco, as regies foram anotadas como regies distintas. Desta forma, manter os
dados puros para que possam ser utilizados em tcnicas baseadas em aprendizagem de
mquina. Para cada um dos frames que apresentam fogo, uma ou mais anotaes foram
feitas. Um exemplo de anotao apresentado na Fig. 6.
Estas anotaes so arquivadas em formato XML. A linguagem de marcao XML
foi escolhida por ser um padro definido pela W3C, endossado pela industria de software
e que pode ser facilmente lido e entendido por um humano. Cada vdeo liberado com
um arquivo XML contendo as anotaes correspondentes, fazendo com que seja simples
estender o dataset ou separ-lo em partes menores para treinamento, testes e avaliao.
4.1.2

Artefatos de Software

Durante a criao do dataset tambm foram construdos alguns artefatos de software


que se destinam a manipular os vdeos e arquivos XML. Uma biblioteca de manipulao

57

Figura 6: Anotaes de ground truth no dataset. A ferramenta de anotaes desenvolvidas


permite delimitar as regies de fogo utilizando retngulos e salv-las em um arquivo XML
para que possam ser utilizadas posteriormente.
de arquivos, baseada na OpenCV (BRADSKI, 2000), fornecida para que outros pesquisadores possam ter um acesso simplificado ao contedo do dataset utilizando mtodos
j implementados. Da mesma forma, so disponibilizados o software e documentao
para permitir que as mtricas de avaliao apresentadas em Sec. 4.2 sejam facilmente
calculadas, evitando retrabalho com a implementao.
Uma ferramenta de visualizao do ground truth fornecida, permitindo aos usurios
do dataset carregar um arquivo de vdeo e o XML correspondente, mostrando as anotaes
sobrepostas ao vdeo. A ferramenta permite tambm que os usurios possam obter dados
pertinentes, como estatsticas da imagem e histogramas.
Para as ocasies em que seja interessante adicionar novos vdeos ao dataset ou modificar os dados existentes. Por este motivo, um editor de ground truth fornecido, permitindo que os usurios possam faz-lo utilizando uma interface grfica. Dado que as
anotaes so liberadas no padro de XML, os arquivos podem ser editados diretamente,
utilizando um editor de texto qualquer.

4.2

Metodologia de Avaliao

Um dos principais desafios ao comparar diferentes sistemas de deteco de fogo baseados em vdeo a falta de um acordo sobre a sada esperada. Os resultados apresentados
em diferentes trabalhos so, neste sentido, muito dependentes da definio de deteco
correta que os autores consideram. Por este motivo, so propostas trs diferentes formas

58

de avaliao:
1. Frame-a-frame: onde o problema da deteco torna-se um anlogo do problema de
classificao binria, e cada frame possui uma classe que indica a existncia, ou
no, de fogo.
2. Baseada em localizao: onde so levadas em conta informaes de localizao da
chama na imagem, de forma semelhante ao que ocorre atualmente com os detectores de face e objetos.
3. Baseada em tempo: onde leva-se em considerao o tempo que o detector demora
para detectar a existncia de fogo.
Na avaliao frame-a-frame, cada frame uma instncia. Esta a abordagem utilizada com maior frequncia para avaliar os sistemas de deteco de chamas. Embora os
autores no explorem todo o potencial desta abordagem, pode-se afirmar que a mesma j
foi utilizada anteriormente em CELIK; DEMIREL (2009), ELIK; OZKARAMANLI;
DEMIREL (2007) and CHENEBERT; BRECKON; GASZCZAK (2011), onde o Recall
foi renomeado para taxa de deteco e a preciso foi renomeada para taxa de alarme falso.
Ao considerar um frame inteiro como fogo ou no-fogo, possvel calcular todas as mtricas que seriam calculadas para um classificador binrio. Estas mtricas incluem a taxa
de positivos verdadeiros T P R 1 , taxa de negativos verdadeiros SP C 2 , valor preditivo
positivo P P V 3 , valor preditivo negativo N P V 4 , taxa de falsos positivos F P R 5 , taxa
de falsa descoberta F DR 6 e a taxa de falsos negativos F N R 7 . As equaes correspondentes so apresentadas nas Eq. 14, 15, 16, 17, 18, 19 e 20, em que P e N representam
respectivamente a contagem de instncias positivas e negativas presentes no dataset, TP
e TN representam o nmero de verdadeiros positivos e verdadeiros negativos e FP e FN
representam os falsos positivos e falsos negativos.
TPR =

TP
P

(14)

SP C =

TN
N

(15)

TP
TP + FP

(16)

PPV =
1

TPR do ingls True Positive Rate, tambm conhecida como Recall, Sensibilidade ou Hit Rate.
TNR do ingls True Negative Rate, tambm conhecida como Especificidade.
3
PPV do ingls Positive Predictive Value, tambm conhecida como Preciso.
4
NPV do ingls Negative Prediction Value.
5
FPR do ingls False Positive Rate, tambm conhecida como Fall-Out.
6
FDR do ingls False Discovery Rate.
7
FNR do ingls False Negative Rate, tambm conhecida como Miss Rate.
2

59

TN
TN + FN

(17)

FP
N

(18)

F DR =

FP
FP + TP

(19)

F NR =

FN
FN + TP

(20)

NP V =

FPR =

Ao avaliar o problema da deteco de fogo como uma classificao binria framea-frame, possvel tambm calcular a acurcia ACC (Eq. 21), F1 Score (Eq. 22) e o
coeficiente de correlao de Matthews M CC (Eq. 23). Embora no tenha sido encontrado
um caso anterior onde estas mtricas tenham sido utilizadas, acredita-se que possam vir
a melhorar a avaliao da qualidade dos detectores, visto que, levam em conta tanto a
preciso quanto o recall, balanceando as taxas de falsos positivos e negativos.
ACC =

F1 =

TP + TN
P +N

2 PPV TPR
PPV + TPR

TP TN FP FN
M CC = p
(TP + FP )(TP + FN )(TN + FP )(TN + FN )

(21)

(22)

(23)

Enquanto a abordagem baseada apenas na classificao individual dos frames parece


ser adequada para a maioria dos casos, pensando especialmente em sistemas de viso
ativa e robs mveis, importante tambm verificar a localizao do fogo na imagem.
Neste sentido, levou-se em considerao as mtricas de avaliao comparativa j utilizadas em sistemas de deteco de face como JAIN; LEARNED-MILLER (2010) e BERG
et al. (2004). No entanto, dado que o fogo no tem bordas exatas e as chamas podem se
dividir em reas menores, aceita-se que possa existir mais de uma deteco associada
uma determinada anotao de ground truth. Neste caso, utiliza-se uma abordagem 1-N,
removendo a etapa de busca por combinaes timas.
As deteces so consideradas como positivos verdadeiros ou negativos verdadeiros
levando em conta sua rea de interseco com os retngulos do ground truth. A funo
de similaridade S apresentada na Eq. 24, em que di uma sada do detector e gti uma
anotao. Uma deteco considerada correta se S > 0.5, funcionando com qualquer
sada do detector, incluindo formas geomtricas ou mesmo o contorno da chama em um
vetor de pontos.

60

Si =

di gti
di

(24)

Uma vez que a abordagem baseada em localizao no permite a contagem dos valores
negativos no ground truth, somente podem ser calculadas as mtricas que independem dos
dados negativos. Utilizando apenas os dados positivos e considerando que, por definio,
a preciso a razo entre o total de instncias recuperadas corretamente em relao ou
total de instncias recuperadas, possvel calcul-la atravs da equao Eq. 25. J o
recall, que indica a quantidade de instncias relevantes que so recuperadas, pode ser
calculada, nesta abordagem, atravs da Eq. 26. D representa o nmero total de deteces,
enquanto G representa o total de anotaes presentes na parte do dataset que foi utilizada
para a avaliao. Por fim, pode-se calcular a similaridade mdia S atravs da Eq. 27
que fornece um ndice no discretizado da exatido que o detector atinge ao apontar a
localizao do fogo na imagem.
TP
D

(25)

GT FN
GT

(26)

LP P V =

LT P R =

S=

X Si

(27)
n
Outra informao fundamental para avaliar a qualidade de um sistema detector de
fogo o intervalo de tempo entre a deteco do fogo e a primeira vez que este aparece
nas anotaes do ground truth. A latncia Lt dada pela Eq. 28, em que min(di ) o
ndice do frame em que a primeira deteco ocorre e min(gtj ) o ndice do frame em
que aparece no ground truth. Usualmente, os detectores de fogo apresentam uma latncia
intrnseca devido ao uso de informaes de pulsao do fogo. Esta mtrica foi proposta
em YIN; MAKRIS; VELASTIN (2007) para avaliao de rastreadores de objetos, onde
os autores preferem o termo Critrio de Sobreposio Temporal.
Lt = min(di ) min(gtj )

(28)

Atravs do dataset e das mtricas de avaliao propostas, juntamente com os artefatos de software disponibilizados em https://github.com/steffensbola/furg-fire-dataset,
permite-se que os desenvolvedores possam avaliar de forma precisa os mtodos de deteco de fogo. Espera-se desta forma que os vdeos e anotaes de ground truth possam
representar para a deteco de fogo o que outros datasets representaram para reas como
deteco de face, deteco de objetos e segmentao, levando os seus resultados a nveis
em que possam ser aplicados na vida real.

AVALIAO ESTATSTICA

A avaliao estatstica permite criar uma descrio quantitativa dos dados observados. Atravs da tabulao dos dados, sumarizao, observao de medidas estatsticas
e grficos, busca-se entender as principais propriedades que caracterizam o fogo, bem
como, encontrar suporte para a proposio de um novo sistema de deteco de chamas.
Segundo GIL (2010), embora no se deva considerar os resultados estatsticos como uma
verdade absoluta, o mtodo estatstico se caracteriza por ter um razovel grau de preciso
e probabilidade de acerto, fazendo-se adequada para os objetivos deste trabalho.
A maioria dos sistemas VFD propostos anteriormente so estritamente voltados
para a deteco de chamas utilizando cmeras estacionrias. Muitos deles, como
GMEZ-RODRGUEZ et al. (2002), GOMEZ-RODRIGUEZ; ARRUE; OLLERO
(2003), ZHANG et al. (2008), CELIK; DEMIREL (2009), GNAY et al. (2009), TO STIPANICEV;

(2009), CHUNYU
REYIN; CETIN (2009), KRSTINIC;
JAKOVCEVI
C
et al. (2010), CELIK (2010), GNAY et al. (2010), ZHAO et al. (2011), LABATI et al.
(2013) so claramente voltados para a deteco de incndio em florestas e grandes ambientes abertos. Os trabalhos que mais se aproximam dos objetivos deste so BORGES;
IZQUIERDO (2010) e CHENEBERT; BRECKON; GASZCZAK (2011). Por este motivo, a maior parte das tcnicas que so apresentadas voltada deteco de fumaa,
deixando a deteco de chamas como uma tarefa secundria sob a alegao de que a presena de fumaa sempre antecede a presena de fogo, devido a ocluso gerada pela copa
das rvores. Tambm por serem voltadas ambientes abertos, a presena do sol, a tonalidade do cu e outros elementos naturais afetam como a cor percebida na cmera,
levando possivelmente a desvios da tonalidade real da chama.

5.1

Classificao De Cor

Considerando que grande parte da deteco do fogo passa necessariamente pela classificao do pxel com base na cor, buscou-se encontrar o melhor mtodo ao utilizar-se
tanto de referncias apresentadas no Cap. 3, quanto ao apresentar-se uma nova proposta
utilizando como estatstica descritiva e algoritmos de escolha de atributos, aplicada em

62

dados extrados do dataset apresentado na Sec. 1.2.0.1.


Visando encontrar padres que possam ser teis para diferenciar um pxel que represente fogo de pxels que no representam fogo, foram selecionados aleatoriamente vrios
frames do dataset para extrair valores de pxel de regies de fogo e no fogo. Selecionar
essas regies uma tarefa manual e trabalhosa, visto que o fogo, em alguns casos, apresenta bordas transparentes e uma variao de um quadro para outro. Para cada uma destas
anotaes os seguintes dados foram extrados os seguintes dados de cada pixel.
Valor de cada canal no color space RGB.
Valor de cada canal no color space Lab.
Valor de cada canal no color space HSV.
Valor de cada canal no color space YCbCr.
A segmentao das regies que representam chamas para extrao de dados uma
tarefa manual. Pelo fato de muitas vezes o fogo ser translcido e trazer a colorao do
background nas regies de borda, difcil definir com exatido onde o fogo inicia ou
termina. A Fig. 7 mostra como foram definidas as regies de chama para extrao dos
dados que foram utilizados na anlise estatstica, na seleo de atributos e no treinamento
dos classificadores. Todos os pxels contidos nas regies em azul so considerados como
fogo e todos os pxels marcados nas regies em amarelo so consideradas como no fogo.
As regies que no pertencem a nenhum retngulo no so utilizadas. Cabe salientar que
este mtodo foi utilizado apenas para extrao dos dados de cor. J para a extrao dos
dados contidos nas outras etapas foram utilizadas outras marcaes.
Utilizando esta abordagem, foram coletados dados de 1.264.168 pixels, dos quais
279.883 correspondem a regies consideradas como fogo e 984.285 correspondem a regies que foram consideradas como no fogo. Como o fogo no apresenta contornos fixos
e bem definidos, em alguns casos, a regio anotada como fogo inclui tambm pxels que
no so do fogo em si, mas de algum material prximo ou at mesmo do material que est
sendo queimado. Acredita-se que, o fato da anotao da regio de fogo no ser idntica
ao formato do mesmo, no impacte significativamente nas estatsticas obtidas.
Dado que cada um dos autores citados na Sec. 3 defende um color space em especfico
e no existe um consenso sobre qual deles oferece a melhor separao entre regies de
chama e no chama, a primeira etapa do estudo consistiu na avaliao dos dados obtidos.
A tabela 2 apresentam as principais medidas estatsticas com relao s regies de chama,
incluindo tambm medidas de disperso. As Figuras 8, 10, 12 e 14 trazem o histograma
de cada um dos canais de cor da amostra extrada. No lado esquerdo so apresentados os
dados das regies que representam chamas e no lado direito apresentado o histograma
que corresponde aos dados de regies que foram consideradas como no fogo.

63

Figura 7: Segmentao manual das regies de chama para minerao de dados e anlise
estatstica. Todos os pxels contidos nas regies em azul so considerados como fogo e
todos os pxels marcados nas regies em amarelo so consideradas como no fogo. As
regies que no pertencem a nenhum retngulo no so utilizadas.
Atravs das estatsticas possvel obter um resumo das caractersticas e fazer algumas
inferncias sobre os dados. Combinando as informaes apresentadas na Fig. 8 com as
tabelas 2 e 3 pode-se verificar que, em regies de chama, o canal azul B tende a assumir
valores baixos, ao passo que, o canal verde G tende a acompanhar em menor grau o
crescimento do canal vermelho R. Pode-se atribuir esta caracterstica ao associar este
comportamento diretamente com o espectro de frequncia, dado que B representa ondas
curtas, G representa ondas mdias e R representa ondas longas. A maior parte das regies
de chama apresenta vermelho com intensidade alta, sendo que os valores abaixo de 120
no so representativos. Uma baixa intensidade da cor vemelha est associada a regies
de no fogo.
Assim como ocorre com o canal R, comum tambm a saturao do canal G nas
regies que apresentam chama, conforme observado na Fig. 8.c. A saturao do canal B
vista na Fig. 8.e, embora menos comum, est relacionada com a cor branca que ocorre
no centro da chama, onde o brilho mais alto. A maior parte dos pxels apresenta valores
baixos de azul. J nas regies onde no ocorre chama, Fig. 8.e, o azul est mais bem
distribudo. A Tab. 2 mostra que as mdias para R,G e B so respectivamente 93,15,
165,69 e 237,08 enquanto as medianas so 78, 161 e 252 fazendo com que exista uma
assimetria negativa no canal R e uma assimetria prxima a zero no canal G. Observando
a Fig. 8.a e 8.c pode-se afirmar que isto se deve, em grande parte, aos valores prximos aos
nveis de saturao nestes canais, que elevam a mdia e fazem com que a cauda esquerda
seja mais longa.
Considerando que o color space RGB pode ser representado por um cubo, onde cada
um dos seus componentes representa um eixo, buscou-se encontrar a distncia entre a

64

cor que representa o fogo e a cor que no representa fogo. No canal B ocorre a menor
diferena entre as duas mdias, 19,18. J para G a diferena entre as mdias apresentada
51,76, aumentando para 127,92 no canal R. A distncia euclidiana entre regies de
chama e regies ordinrias de 139,32. Finalizando a anlise estatstica do espao de cor
RGB, o desvio-padro do canal R um pouco mais da metade do canal G. A medida do
desvio padro neste caso indica a disperso das intensidades dos pxels amostrados. A
partir destes dados, pode se concluir que o fator discriminante na classificao por cor
o vermelho.

(a)

(b)

(c)

(d)

(e)

(f)

Figura 8: Histogramas de regies de fogo para o color space RGB. A coluna da esquerda
(a,c,e) representa os valores do canal para regies que apresentam fogo. A coluna da
direita (b,d,f) representa os valores do canal para regies que no apresentam fogo.
Analisando as estatsticas obtidas com relao ao color space HSV pode-se notar
claramente que a mdia e a mediana no canal H so muito prximas, alm de apresentar
um desvio padro pequeno. Observando os histogramas apresentados na Fig. 10a e 10b
e os graficos das Fig. 11a e 11b possvel verificar que grande parte dos pxels podem
ser classificados como chama ou no-chama utilizando como limiar superior o valor 50
no canal H. Embora existam instncias que apresentem valores acima disso, pode-se

(a)

(b)

(c)

(d)

(e)

(f)

Figura 9: Boxplot de regies de fogo para o color space RGB. A coluna da esquerda
(a,c,e) representa os valores do canal para regies que apresentam fogo. A coluna da
direita (b,d,f) representa os valores do canal para regies que no apresentam fogo.

Tabela 2: Estatsticas de cor nas regies de fogo. Os cabealhos correspondem respectivamente aos color spaces RGB, HSV, Lab e YCbCr.
B
G
R
H
S
V
L
a
b
Y
Cb
Cr
Mdia
93,15 165,69 237,08 32,39 162,44 200,78 156,53 147,38 170,47 146,63 166,02 85,74
Desvio Padro
59,31 58,78 30,50 24,59 38,86 66,92 60,68 20,25 18,99 59,98
21,25 21,87
78
161
252
26
162
233
161
151
174
148
169
85
Mediana
Distoro ou obliquidade 1,25
-0,03
-2,22 3,07
0,16
-1,22
-0,33
-0,29
-0,11
-0,19
-0,37 -0,21
0,77
0,24
-1,47 0,78
0,03
-1,44
-0,22
-0,54
-0,56
-0,07
-0,42 0,10
Assimetria de Pearson
Mnimo
0
0
35
0
32
15
10
109
114
14
117
30
Mximo
255
255
255
358
255
255
250
188
212
246
213
139
Amplitude
255
255
220
358
223
240
240
79
98
232
96
109
44,09 51,22 22,08 18,77 31,14 54,87 51,36 17,81 15,94 51,24
17,91 18,24
Desvio Mdio
Amplitude Inter-quartil
56
105
21
34
54
91
95
39
31
97
33
35

Tabela 3: Estatsticas de cor nas regies consideradas como no fogo. Os cabealhos correspondem respectivamente aos color spaces RGB, HSV,
Lab e YCbCr.
B
G
R
H
S
V
L
a
b
Y
Cb
Cr
Mdia
112,33 113,92 109,16 130,18 76,20 131,05 120,48 127,87 128,73 112,56 125,54 128,18
Desvio Padro
63,59 57,39 65,11 97,62 59,31 61,98 58,14
9,12 19,91 57,96 14,91
20,20
Mediana
99
105
103
100
59
122
115
128
132
103
127
125
Distoro
0,59
0,65
0,54
0,41 1,13
0,29
0,44
0,49
-1,22
0,67
-1,18
1,50
Assimetria de Pearson
0,63
0,47
0,28
0,93 0,87
0,44
0,28
-0,04
-0,49
0,49
-0,29
0,47
Mnimo
0
0
0
0
0
6
1
98
65
2
72
53
Mximo
255
255
255
358
255
255
255
185
198
255
200
194
Amplitude
255
255
255
358
255
249
254
87
133
253
128
141
Desvio Mdio
52,81 45,54 53,57 87,52 46,38 51,79 46,28
6,38 13,37 46,10 10,08
13,15
Amplitude Inter-quartil
95
74
94
172
70
95
76
9
16
75
13
14
66

67

ver claramente que uma quantidade insignificante em comparao com o tamanho da


amostra. importante ressaltar que a escala apresentada vai de 0 at 179 e no de 0 at
360 como na especificao do color space, visto que esta uma simplificao feita na
biblioteca OpenCV.
O canal S, que indica a pureza, tambm permite a aplicao direta de um threshold
para a classificao dos pixels. Isto pode ser observado na Fig. 10.c. Quanto menor o
nvel de pureza mais cinza o pxel . Neste caso, avaliando pelas mdias apresentadas na
tabelas 3 e 2, pode-se afirmar que regies de fogo so mais puras que a mdia das regies
que no representam fogo. No que se refere ao brilho (canal V ) pode-se afirmar que as
regies que apresentam chamas so em mdia muito mais brilhantes que o restante da
imagem. O desvio padro, no entanto, alto, fazendo com que abordagens que utilizem
valores de threshold fixo, como as apresentadas em YAMAGISHI; YAMAGUCHI (2000),
CHEN; HE; WANG (2010); CHEN; WU; CHIOU (2004) e GNAY et al. (2010) venham,
provavelmente, a produzir resultados ruins quando utilizados com este dataset.

(a)

(b)

(c)

(d)

(e)

(f)

Figura 10: Histogramas de regies de fogo para o color space HSV. A coluna da esquerda
(a,c,e) representa os valores do canal para regies que apresentam fogo. A coluna da
direita (b,d,f) representa os valores do canal para regies que no apresentam fogo.

68

(a)

(b)

(c)

(d)

(e)

(f)

Figura 11: Boxplot de regies de fogo para o color space HSV. A coluna da esquerda
(a,c,e) representa os valores do canal para regies que apresentam fogo. A coluna da
direita (b,d,f) representa os valores do canal para regies que no apresentam fogo.

O color space Lab tem cores uniformemente distribudas (cromaticidade uniforme). A


sua distribuio visualmente uniforme, a luminosidade separada da cromaticidade e
muitas vezes apresentada como a representao dos contrastes cromticos naturais do ser
humano. L corresponde luminosidade enquanto a e b correspondem aos componentes
de cor, baseados no modelo no linear de coordenadas CIE XYZ, sendo que a vai de
verde a vermelho e b vai de azul at amarelo, em que as duas dimenses so combinadas
de forma a representar as outras cores (CELIK, 2010).
Considerando que as mdias entre regies de fogo e no fogo para o canal L so
prximas e que o desvio padro alto, pode-se concluir que a luminosidade no um
bom discriminante. Os histogramas apresentados nas figuras 12.a e 12.b corroboram para
esta afirmao. J os contrastes cromticos representados, neste color space, por a e b
estabelecem uma distino melhor, embora a interseco entre o valores que representam
fogo e no fogo ainda seja grande. Pode ser observado ainda que neste color space existe
um abrandamento da assimetria, fazendo com que os valores de intensidade em cada um
dos canais de cor fiquem muito prximos.
Assim como Lab, o color space YCbCr tambm parece no fornecer os melhores
discriminantes para regies de fogo e no fogo. As estatsticas mostram, por exemplo,
que o valor mdio do canal Y para os pxels que representam regies de fogo de 146,63
enquanto regies que no representam fogo apresentam um valor mdio de 112,56, o que

69

(a)

(b)

(c)

(d)

(e)

(f)

Figura 12: Histogramas de regies de fogo para o color space Lab. A coluna da esquerda
(a,c,e) representa os valores do canal para regies que apresentam fogo. A coluna da
direita (b,d,f) representa os valores do canal para regies que no apresentam fogo.
representa uma diferena de apenas 34,08. O desvio padro no entanto de 59,98, fazendo
com que dificilmente o valor de H possa ser utilizado na deciso. Nota-se tambm que
existe um abrandamento da assimetria, isso implica dizer que dificilmente poder ser til
para a extrao de texturas. J os componentes de crominncia apresentados aqui so
melhores descritores que os apresentados no color space Lab.
Existe uma diferena de 42,44 entre as mdias para pxels de fogo e no fogo. Conforme pode ser observado na Tabela 2, para Cb o desvio padro para as regies de fogo
de 21,87 fazendo deste um bom descritor, pois apresenta uma distncia significativa entre as cores. J para os valores de Cr nota-se que no histograma da Fig. 14 existe uma
grande rea de interseco, mas como os dados ficam bastante compactados e apresentam
um desvio padro baixo, existe a possibilidade desses fatores auxiliarem na classificao
dos pxels.
Concluda esta anlise baseada na estatstica descritiva e conhecimento especfico sobre o comportamento das regies de chama, utilizou-se tambm a ferramenta de mine-

70

(a)

(b)

(c)

(d)

(e)

(f)

Figura 13: Boxplot de regies de fogo para o color space Lab. A coluna da esquerda
(a,c,e) representa os valores do canal para regies que apresentam fogo. A coluna da
direita (b,d,f) representa os valores do canal para regies que no apresentam fogo.

rao de dados WEKA apresentada em (HALL et al., 2009) para fazer a escolha dos
melhores atributos dentro dos espaos de cor acima apresentados. A principal vantagem
da utilizao da ferramenta que ela permite a aplicao de classificadores, agrupadores
e tcnicas de aprendizagem de mquina sobre um dataset com um setup time mnimo.
Para a seleo dos melhores atributos, utilizou-se o algoritmo proposto por HALL
(1999), que avalia o valor de um subconjunto de atributos considerando a capacidade que
cada atributo tem de individualmente predizer a classificao correta, assim como a redundncia entre os atributos. Atributos que apresentam uma alta correlao com a classe
e uma pequena intercorrelao so os selecionados. Este algoritmo, combinado com um
mtodo guloso, conhecido como Best First, mostrou que os atributos que, individualmente, oferecem a melhor representao de chama, e por isso mais discriminantes, so o
canal b do color space Lab, H do HSV, Cb do YCrCb. Vale notar, no entanto, que existe
uma correlao alta entre os canais b e Cb conforme j visto nos histogramas. Os clculos
da correlao com base nos valores de pxel extrados, mostram que Lab e YCbCr so
muito prximos, apontando uma correlao de 0,997 entre L e Y , 0,915 entre a e Cr e 0,988 entre b e Cb. Desta forma, no existe um ganho de informao significativo quando
Lab e YCbCr so utilizados em conjunto.
Como os resultados da classificao utilizando um mtodo guloso no permitiram
atingir uma concluso sobre qual color space que permite a melhor classificao, utilizou-

71

(a)

(b)

(c)

(d)

(e)

(f)

Figura 14: Histogramas de regies de fogo para o color space YCbCr. A coluna da
esquerda (a,c,e) representa os valores do canal para regies que apresentam fogo. A
coluna da direita (b,d,f) representa os valores do canal para regies que no apresentam
fogo.

se tambm a Anlise dos Componentes Principais (PCA). Com PCA um nmero grande
de variveis independentes pode ser reduzido sistematicamente de forma a resultar em um
conjunto coerente. PCA uma tcnica estatstica que utiliza uma transformao ortogonal
para converter um conjunto de observaes de variveis possivelmente correlacionadas a
um conjunto de valores de variveis linearmente descorrelacionadas chamadas componentes principais (DUNTEMAN, 1989).
Ao contrrio do que acontece quando considera-se apenas a capacidade individual de
classificao para cada varivel, os resultados da anlise utilizando PCA apontam que as
melhores caractersticas (canais de cor) esto nos color spaces RGB e HSV. Por ordem
de classificao, os atributos selecionados foram R, G, B, H e S. Estas informaes
foram consideradas posteriormente para a criao dos classificadores com base na cor
apresentados no Cap. 6.

72

(a)

(b)

(c)

(d)

(e)

(f)

Figura 15: Boxplot de regies de fogo para o color space RGB. A coluna da esquerda
(a,c,e) representa os valores do canal para regies que apresentam fogo. A coluna da
direita (b,d,f) representa os valores do canal para regies que no apresentam fogo.
Tabela 4: Oscilao dos pxels no tempo
R
G
B
Estatstica
F
NF
F
NF
F
NF
Mdias
19,27
3,71 18,98 2,79 19,27 3,71
Mnimo
0,93
0,22 1,12 0,00
0,94 0,00
76,63 24,00 45,47 12,57 76,63 24,00
Mximo
Mediana
19,48
2,60 19,06 2,10 19,48 2,60
Desvio Padro 11,57
3,36 7,74 2,36 11,57 3,36

5.2

Classificao da Oscilao

Conforme introduzido no Cap. 3, a pulsao e oscilao da chama outra caracterstica amplamente utilizada para sistemas baseados em cmeras estticas. No sentido de
obter mais informaes sobre o comportamento da chama foram realizados experimentos
considerando a oscilao do valor no pxel nos ltimos 20 frames. Para este teste, apenas
o espao de cor RGB foi utilizado.
A Tabela 4 sumariza os dados para oscilao dos pxels em cada um dos canais RGB
para regies de fogo e no fogo. Foram utilizados para esta estatstica dados de 295 pxels
que representam regies onde ocorre chama e dados de 806 pxels de regies sem chamas.
Nas regies sem chamas foram includas, alm de reas praticamente estticas, reas onde

73

ocorre movimentao de pessoas, automveis e rvores balanando, que so usualmente


complicadores. O desvio padro para cada pxel foi computado e utilizado para a gerao
das estatsticas.
Fica claro que nos trs canais existe uma oscilao maior nas regies de fogo que nas
regies de no fogo. Em uma escala de 0 a 255, o desvio padro da intensidade do pxel
em todos os canais em mdia menor que 4 em regies sem chamas. J para regies de
fogo essa mdia se aproxima de 20, apresentando uma diferena pequena entre os canais.
Pode-se afirmar que, nas regies de fogo, a oscilao mdia em 20 frames nos canais R e
B praticamente idntica.
Com base nos histogramas apresentados na Fig. 16 pode-se afirmar que o canal verde
o que apresenta o menor desvio padro entre os canais. Isto se deve em partes seleo
de regies com oscilao da copa de rvores, onde existe uma tendncia de a cor variar
entre o verde escuro das folhas e o branco do cu, ambos apresentando a intensidade de
G prxima de 255. Nota-se tambm que mesmo nas regies de chama existe uma grande
quantidade de pxels cujo desvio padro est entre 0 e 10. Esta uma caracterstica apresentada devido a saturao que ocorre no processo de transformao do sinal analgico
para o digital. Por fim, possvel observar que existe uma distoro positiva nos canais R
e B, indicando que existem mais pxels com variao acima da mdia. J para o canal G
a mdia est muito prxima da mediana, levando a distoro a um valor prximo de zero.
Vale ressaltar no entanto que esta avaliao foi feita extraindo dados dos vdeos estticos ou quase estticos do dataset. Para vdeos onde existe um movimento constante
de cmera, com muita trepidao e movimento nos 3 eixos como o caso de cmeras
acopladas um rob mvel este tipo de avaliao com base na varincia sobre o valor do
pxel ou de regies pr-definidas pode facilmente induzir a falsos positivos. Abordagens
utilizando filtros temporais baseadas na varincia, frequncia ou mesmo em padres de
oscilao minerados como proposto em LI; WU (2012) e LI; WU (2011) so projetadas
apenas para cmeras estticas.

74

(a)

(b)

(c)

(d)

(e)

(f)

Figura 16: Histogramas de oscilao do valor de pxel no tempo color space RGB. A
coluna da esquerda (a,c,e) apresenta os valores de desvio padro do pxel nos canais R, G
e B para regies que apresentam fogo. A coluna da direita (b,d,f) representa os valores do
canal para regies que no apresentam fogo.

MTODO PROPOSTO

Uma viso geral do funcionamento do detector de fogo proposto apresentada na Fig.


17. A primeira etapa do processo consiste na classificao do pxel com base na cor utilizando Random Forest. A partir das regies classificadas utilizando informaes de matiz,
saturao e brilho, so extrados contornos para serem validados quanto a seu formato,
rea, mdia, mediana, varincia e assimetria no valor dos pxels da regio. Se forem encontradas regies de fogo esses dados so guardados em um buffer e o processo pode
assumir dois fluxos distintos dependendo do tipo de imagens com que est trabalhando.

Figura 17: Fluxograma do mtodo proposto: depois de passar por uma classificao dos
pxels com base na cor, os contornos so extrados e as regies so verificadas quanto
varincia e assimetria. Em seguida, uma anlise da sequencia de frames realizada,
consistindo essencialmente de filtros temporais no domnio da frequncia para vdeos de
cmeras estticas e da computao de deteces subsequentes para vdeos de cmeras
mveis.

76

Com a utilizao da Anlise dos Componentes Principais foi possvel identificar que
as variveis mais discriminantes na classificao so os canais de cor R, G, B, H e S dos
color spaces RGB e HSV. Os valores de cada um dos canais destes color spaces foram
utilizadas como entrada para a criao de um modelo de classificao utilizando Random
Forest. Random Forests so uma combinao de classificadores de rvores, tal que cada
uma das rvores dependa dos valores de um conjunto de instncias amostrados de forma
independente e com a mesma distribuio para cada uma das rvores treinadas. A taxa de
erros converge ao passo em que o nmero de rvores na floresta aumenta. A acurcia da
floresta depende de quo acurada cada uma das rvores que a compe e da correlao
entre elas. A sada do classificador obtida atravs de votao, onde a classe dada pela
moda BREIMAN (2001).
No Random Forests cada rvore da floresta treinada utilizando os mesmos parmetros, mas com subconjuntos de instncias diferentes. Estes subconjuntos so criados
utilizando a tcnica de bootstrap, onde, para cada subconjunto so selecionados cerca de
2
das instncias originais. Estas instncias so selecionadas com substituio, o que faz
3
com que algumas instncias sejam selecionadas mais de uma vez e algumas delas no
sejam utilizadas. A parte remanescente da amostra original, cerca de 13 dos dados que no
so includos no subconjunto de treinamento, utilizada posteriormente para a avaliao
do erro. A taxa de erros obtida atravs desta tcnica conhecida por OOB (out-of-bag).
Utilizando subconjuntos diferentes de instncias vrias rvores so criadas seguindo
a mesma abordagem proposta por BREIMAN et al. (1984). Cada n de deciso pode
utilizar um ou mais atributos, que podem ser selecionados seguindo duas abordagens. Na
primeira abordagem a escolha dos atributos do n completamente aleatria. Na segunda
abordagem leva-se em considerao a correlao linear entre os atributos. Cada n selecionado utilizando o ganho de informao considerando o indice Gini. Na prtica os
resultados mostram que a quantidade de atributos selecionados por n no est diretamente relacionada com os resultados obtidos. Utilizando 1 ou 2 atributos por rvore
possvel construir uma floresta com preciso alta. Ao final, a classificao atribuda
instncia testada dada por votao (BREIMAN, 2001).
No modelo de classificao dos pxels pela cor construdo para este trabalho, tem-se
como atributos os valores de cor em cada pxel. O atributo classe binrio, onde 0 e 1
indicam se a cor medida no pxel corresponde ou no a fogo. Os parmetros do algoritmo
de classificao utilizados so apresentados na Tabela 5. Para a criao do modelo foram
utilizados aproximadamente 1.870.000 instncias de treinamento, onde buscou-se fazer
uma separao 50/50 entre as classes.
Para o teste do classificador de pxels com base na cor utilizou-se um segundo conjunto de dados com aproximadamente 534.000 instncias. Do total de instncias utilizadas para teste, 86.39% foram classificadas corretamente, sendo que a taxa de falsos
positivos ficou em 12.99% e a taxa de falsos negativos ficou em 0.61%. Esses valores so

77

Tabela 5: Parmetros da Random Forest para classificao de cor


Parmetro
Valor
Nmero mximo de nveis da rvore
10
0.9
Erro OOB
Suporte mnimo
500
3
Nmero de variveis utilizadas por n
Nmero de rvores na floresta
100
Atributos selecionados conforme correlao
Sim

aceitveis dado que a classificao pela cor s a primeira etapa de um fluxo em cascata
e que a taxa de falsos negativos insignificante. A classificao com base na cor serve
como um pr-processamento para permitir a extrao de dados mais precisos, dado que as
caractersticas do fogo muitas vezes impedem a segmentao em regies de forma direta.
Aps a classificao individial dos pxels, obtem-se uma imagem binria sobre a qual
aplica-se o detector de bordas de Canny. Desta forma possvel extrair contornos (Fig.
18b) para as regies com colorao de fogo encontradas. Para cada contorno so extrados
dados sobre a rea, forma e proporo (altura/largura). Cada contorno corresponde a uma
regio sobre as quais so extrados os seguintes dados estatsticos:
Mediana por canal RGB;
Media por canal RGB;
Desvio Padro por canal RGB;
Assimetria de Pearson por canal RGB;
Aceitando a ideia de que uma regio de fogo raramente apresentar um formato de
alguma forma geomtrica, utilizou-se para a verificao da irregularidade do contorno a
mesma abordagem utilizada por BORGES; IZQUIERDO (2010), onde a relao entre
o permetro do contorno e o permetro do fecho convexo (Convex Hull) so utilizados
como medida de rugosidade. A rugosidade da borda definida atravs da equao 29
onde 2PS o permetro da borda e 2PCHS o permetro do fecho convexo. Para calcular

o permetro usa-se a contagem de pxels conectados horizontal e verticalmente, mais 2


vezes o nmero de pxels na diagonal. Quanto mais distante de 1 for o resultado desta
equao, mais convexidades o contorno apresenta.
CR = 2PS /2PCHS

(29)

Sabe-se tambm que a distribuio da intensidade da chama no uniforme. Foram


feitas tentativas de gerar valores representativos desta caracterstica utilizando bancos de

78

filtros Gabor e bancos de filtros Schmid, que foram inicialmente apresentados em SCHMID (2001). Uma avaliao experimental, no entanto, demostrou que estes descritores
eram incapazes de fornecer informaes adequadas, uma vez que uma das propriedades
da chama a falta de escala, podendo apresentar tamanhos muito diferentes na imagem.
Para representar esta caracterstica visualmente perceptvel, utilizou-se de uma abordagem que divide a rea de chama resultante da classificao dos pxels em 9 subreas,
conforme apresentado na Fig. 18c. Depois de obter um retngulo, que define a regio
de interesse englobando os pxels conectados de fogo, esta regio dividida em subreas,
numeradas de 1 a 9 a partir do canto superior esquerdo. O valor de cada sub-regio
calculado utilizando o valor em escala de cinza conforme a Eq. 30, em que R a mdia
da regio, e ri a mdia em cada uma das sub-regies. Pxeis que no apresentam cor de
fogo so desconsiderados e no influenciam o clculo da mdia.
vi = R ri

(a)

(b)

(30)

(c)

Figura 18: Distribuio das regies de chama: Imagem original (a), sada da segmentao
de cor (b), definio das regies de interesse (c) e separao das regies em sub-regies
para extrao das mdias (d).
Os dados de rea, proporo e irregularidade do contorno, combinados com as informaes estatsticas da regio, so ento processadas atravs de um segundo classificador
Random Forests completando a avaliao dos dados do frame e retornando quais das regies selecionadas realmente representam fogo. Para o treinamento desta rvore foram
extradas cerca de 22.090 instncias, das quais 6.709 descrevem regies de chama e as
13.381 restantes descrevem regies que apresentam cor de chama mas so falsos positivos
resultantes da etapa anterior (classificao pxel-a-pxel com base na cor). Os parmetros
utilizados para a gerao do modelo de classificao das regies so apresentados na Tabela 6. Para evitar sobreajuste (overfitting) utilizou-se a preciso e o nmero de nveis da
rvore como critrio de poda.
Para imagens obtidas a partir de cmeras mveis, como no possvel fazer uma
avaliao da oscilao do pxel ao longo do tempo, utilizando por exemplo frequncia e
varincia, estas informaes so suficientes para reportar a deteco. parametrizvel a

79

Tabela 6: Parmetros da Random Forest para classificao de regies utilizando dados


estatsticos
Parmetro
Valor
Nmero mximo de nveis da rvore
10
Erro OOB
0,9
50
Suporte mnimo
Nmero de variveis utilizadas por n
2
100
Nmero de rvores na floresta
Atributos selecionados conforme correlao
Sim

contagem mnima de frames sequenciais para que a deteco seja dada como definitiva.
Avalia-se tambm se a regio apresentou alguma alterao no valor do pxel, de forma a
suprimir falsos positivos causados por lmpadas, nvoa ou fumaa presentes na imagem.
J para cmeras estticas, o processo pode ser levado adiante, melhorando a preciso
atravs de um filtro temporal.
Na avaliao temporal utilizada a varincia do pxel nos ltimos 3 frames. O objetivo
aqui identificar as regies de borda do fogo dado que comum os valores de pxel
no centro da chama serem saturados no apresentando assim varincia alguma. Utilizase para isto o canal R do color space RGB, medindo a distncia em relao s medias
apresentadas na Tabela 4, 19.27 para regies de chama e 3.71 para regies de no chama.
A mdia entre estes valores 11.49. Uma imagem binria gerada atravs da Eq. 31,
onde P o desvio padro no pxel.

1, se 11.49
P
P (x, y) =
0, caso contrrio

(31)

A sada produzida pode ser utilizada dentro de uma arquitetura maior, para construir
sistemas de deteco e extino automtica de fogo. Da mesma forma, os resultados gerados podem ser armazenados para reviso futura e inspeo humana sem exigir deslocamento at o local. O mtodo proposto foi implementado no framework CvWork utilizando
a linguagem de programao C++ com as bibliotecas OpenCv e Boost. A implementao
de protocolos de comunicao industrial, leitura de sensores analgicos, integrao com
sistemas de supervisrio e controle, reconhecimento de faces e outros objetos foge ao
escopo deste trabalho, mas , conforme introduzido anteriormente parte do framework.

RESULTADOS

A primeira etapa do trabalho realizado consistiu em revisar a bibliografia e implementar parcial ou completamente os algoritmos propostos de forma a verificar os resultados
gerados e como os mesmos so impactados por uma situao de cmera no esttica.
previsvel que alguns mtodos previamente propostos falhem devido s condies para
os quais foram desenvolvidos. A validao dos classificadores feita para este trabalho
no pode, no entanto, ser generalizada de forma a diminuir os trabalhos citados, servindo
apenas como referncia na busca da soluo para um problema novo. Da mesma forma,
alguns dos trabalhos citados anteriormente no Cap. 3, pecam ao omitir detalhes, impedindo assim a implementao completa do detector para fins de comparao.
A Fig. 19 apresenta um resultado comparativo da primeira parte do processo de classificao. Ao separar os pxeis que apresentam cor de fogo dos que no apresentam cor
de fogo, nota-se que o mtodo proposto (f) visivelmente melhor que as tcnicas propostas por CHEN; WU; CHIOU (2004) (b), CELIK et al. (2007) (c), CELIK; DEMIREL
(2009) (d), CELIK (2010) (e), suprimindo a maior parte dos falsos positivos. J a Fig. 20
apresenta a utilizao dos mesmos classificadores em uma imagem que apresenta fogo.
Novamente, nota-se que a segmentao realizada apresenta resultados superiores, removendo, por exemplo, as regies com laranja constante, como a que ocorre nos coletes
utilizados pela equipe de resgate. Da mesma forma, as regies de fumaa tambm foram
suprimidas.
Os resultados da classificao pela cor so de extrema importncia dentro da proposta
apresentada, pois a partir destes que feita a extrao e processamento das outras caractersticas avaliadas. Uma segmentao ruim acaba prejudicando a extrao das estatsticas
por regio e consequentemente todo o restante do processo. O mtodo proposto como um
todo, foi testado utilizando o dataset introduzido no Cap. 4. Este dataset composto por
vdeos de cmeras no estticas, sendo que a maioria deles apresenta deslocamento nos
trs eixos. As anotaes do vdeo foram feitas quadro a quadro, na forma de retngulos
que contornam toda a rea que apresenta chama.
Para validar o mtodo proposto os resultados foram comparados com o mtodo de deteco de chamas em vdeo no estacionrio, apresentado em CHENEBERT; BRECKON;

81

(a)

(b)

(c)

(d)

(e)

(f)

Figura 19: Comparativo de segmentao de cor em imagens sem fogo obtida por CHEN;
WU; CHIOU (2004) (b), CELIK et al. (2007) (c), CELIK; DEMIREL (2009) (d), CELIK
(2010) (e) e pelo mtodo proposto (f).
GASZCZAK (2011). Este, conforme apresentado na Sec. 3.3 , tambm, um mtodo que
divide a deteco em duas etapas. Na primeira delas, utiliza uma equao com limiares
fixos nos espaos de cor RGB e HSV. Na segunda etapa, utilizando descritores de textura
como histogramas e dados de energia, entropia, contraste, homogeneidade e correlao
GLMC em 4 direes, um classificador de rvore treinado e utilizado. Desta forma,
foram utilizados os mesmos dados para o treinamento e avaliao de ambos os classificadores.

7.1

Casos de teste

Dois casos de teste foram criados para avaliar a capacidade de classificao e generalizao do sistema proposto. No primeiro caso, para cada um dos vdeos do dataset,

82

(a)

(b)

(c)

(d)

(e)

(f)

Figura 20: Comparativo de segmentao de cor em imagens com fogo obtida por CHEN;
WU; CHIOU (2004) (b), CELIK et al. (2007) (c), CELIK; DEMIREL (2009) (d), CELIK
(2010) (e) e pelo mtodo proposto (f).

os primeiros 300 frames (aproximadamente 31 do total) foram utilizados para gerar os dados de treinamento. A parte remanescente de cada um destes vdeos foi utilizada para os
testes. J para a criao do segundo caso de teste, 2 vdeos, foram completamente separados e no utilizados no processo de treinamento. Os mesmos modelos de classificao
gerados para o caso de teste I foram utilizados para classificar os vdeos do caso de teste
II.

83

Os dados de treinamento para a classificao das regies utilizando textura so gerados a partir da sada do classificador de pxeis utilizando a cor. Para o treinamento, os
dados foram gerados automaticamente levando em conta a interseco das regies detectadas com os retngulos de ground-truth. Como instncias positivas considerou-se que as
regies que representam fogo, utilizadas para o treinamento deveriam ter uma interseco
mnima de 0.8. J as regies que apresentam uma interseco menor ou igual a 0.1 foram
consideradas como instncias negativas pra o treinamento. Regies que no satisfazem
nenhuma dessas condies no foram utilizadas. O desbalanceamento entre as instncias
de fogo e no-fogo, foi tratado utilizando a tcnica de bootstrap, onde as instncias so
selecionadas aleatoriamente com substituio.
O comparativo entre os resultados atingidos utilizando os mtodos de ZHOU et al.
(2010), CELIK (2010), CHENEBERT; BRECKON; GASZCZAK (2011) e o mtodo proposto, para o caso de teste I, pode ser visto na Tab. 7, que apresenta a avaliao quadro a
quadro, e na Tab. 8, que apresenta os resultados considerando a localizao das deteces.
Estes dados levam em considerao que pode existir uma relao de 1-N entre as deteces e as anotaes do ground truth (ver Fig. 21). No total, 18691 frames, originados de
13 vdeos distintos, foram testados. Destes, 8095 frames contm anotaes sobre regies
de fogo no ground truth e 10596 no contm anotaes. Entende-se que, conforme as
mtricas de avaliao propostas, o resultado um falso positivo quando existe uma deteco, mas no existe nenhuma anotao de ground truth para o frame correspondente.
Entende-se por falso negativo a situao em que existe uma anotao feita por um humano
que aponta a regio de fogo, mas o detector no aponta tal regio.

Figura 21: Mtodo de avaliao do classificador proposto. O retngulo em vermelho


mostra o gabarito para este quadro. As regies em azul mostram as regies retornadas
pelo detector proposto. Nota-se que existem vrias deteces para uma nica anotao de
ground-truth.
Dentre os mtodos testados, ZHOU et al. (2010) e CELIK (2010) so voltados para
sistemas deteco de chamas utilizando cmeras estacionrias, demonstrando-se inadequadas para o uso em cmeras mveis. Com relao aos sistemas VFD voltados para
cmeras mveis citados na Sec. 3.3, o mtodo apresentado em BORGES; IZQUIERDO

84

(2010), no pde ser implementado para fins de comparao pois existem parmetros do
classificador Bayesiano que no foram explicitados no artigo e os dados de treinamento
no so publicamente disponveis. O mtodo de CHENEBERT; BRECKON; GASZCZAK (2011) foi utilizado na avaliao, sendo superado pelo mtodo proposto em todas as
mtricas avaliadas.
Na avaliao quadro a quadro, utilizando exatamente as mesmas amostras para ambos
os mtodos, o detector proposto resultou em 122 falsos positivos e 1.365 falsos negativos.
J o detector proposto por Chenebert resultou em 1.685 falsos positivos e 2.243 falsos
negativos. Assim, o Recall, ou sensibilidade, que a mtrica que indica a capacidade do
modelo para classificar instncias de uma determinada classe mostra que o percentual de
frames corretamente classificados como fogo 14,93 maior. J a especificidade, que
dada pela taxa de negativos reais, 17,47% maior. Da mesma forma, a preciso indica
que a probabilidade de as deteces reportadas pelo mtodo proposto serem corretas
26,54% maior que aquela atingida por CHENEBERT; BRECKON; GASZCZAK (2011),
passando de 0,776 para 0,982. Com relao ao valor preditivo negativo, que , neste caso,
o equivalente da preciso aplicado somente aos frames que no contm fogo, pode-se
afirmar que a melhora de 10,77% aumentando de 0,798 para 0,884.
Em relao ao fall-out, que calculado dividindo-se o nmero de falsos positivos pelo
total de instncias negativas no dataset, nota-se que existe uma reduo de 15,90% para
1,20%. A taxa de falsa descoberta exibe valores parecidos em decorrncia da distribuio
dos dados de teste (43% fogo/56% no fogo). J a taxa de falsos negativos apresentou
uma queda de 0,277 para 0,168, o que representa uma melhora de 21,29%.
A acurcia, que obtida ao dividir a soma dos positivos verdadeiros e negativos verdadeiros pelo total de frames testados, mostrou que o mtodo proposto classificou corretamente 92% das instncias testadas enquanto no mtodo proposto em CHENEBERT;
BRECKON; GASZCZAK (2011) 79% das instncias foram corretamente classificadas.
Isso representa uma reduo de 13% no nmero de frames classificados erroneamente. A
acurcia, embora seja amplamente utilizada na avaliao de modelos de classificao, no
pode no fornecer uma representao precisa do classificador e no leva em considerao
a matriz de confuso. Em outras palavras, isto significa que impossvel, utilizando
apenas a acurcia, avaliar a qualidade de um detector de fogo. Por este motivo, foram
calculadas tambm as mtricas F1 Score e coeficiente de correlao de Matthews.
A F-measure foi proposta em CHINCHOR (1992), como uma mtrica para combinar
preciso e recall em uma nica medida atravs da mdia harmnica. Quando utiliza-se a
preciso e o recall com o mesmo peso, esta medida recebe o nome de F1 Score. Considerando esta mtrica, o mtodo proposto melhora os resultados em 20,16% passando de
0,749 para 0,900. J o coeficiente de correlao de Matthews, apresentado inicialmente
em MATTHEWS (1975), tambm uma mtrica balanceada de avaliao das predies
dadas por um classificador binrio, preparado para lidar com o desbalanceamento das ins-

85

Tabela 7: Resultados do mtodo proposto na avaliao frame a frame. A coluna A apresenta os resultados de CELIK (2010), a coluna B apresenta os resultados de ZHOU et al.
(2010) e a coluna C apresenta os resultados de CHENEBERT; BRECKON; GASZCZAK
(2011). Todos os mtodos foram avaliados utilizando os mesmos dados de teste.
Mtrica
A
B
C Proposto
Recall (TPR)
0,434 0,843 0,723
0,831
0,241 0,187 0,841
0,988
Especificidade (SPC)
Preciso (PPV)
0,434 0,442 0,776
0,982
0,571 0,610 0,798
0,884
Valor preditivo negativo (NPV)
0,758 0,812 0,159
0,012
Fall-out (FPR)
Taxa de falsa descoberta (FDR)
0,565 0,557 0,224
0,018
0,236 0,156 0,277
0,168
Miss Rate (FNR)
Acurcia (ACC)
0,467 0,471 0,790
0,920
F1 Score
0,553 0,580 0,749
0,900
Coeficiente de correlao de Matthews (MCC) 0,005 0,041 0,569
0,843

tncias. A escala do M CC varia de -1 a 1, onde -1 indica que a sada do classificador


binrio tem correlao inversa com o resultado esperado, 0 indica que o classificador
aleatrio e 1 indica que as classes retornadas pelo classificador so exatamente iguais ao
ground truth. Utilizando esta mtrica, o classificador proposto tambm mostra uma melhora significativa em relao ao estado da arte. Os classificadores de ZHOU et al. (2010)
e CELIK (2010) mostraram resultados apenas um pouco melhores que uma predio aleatria.
A relao entre preciso e recall um dilema recorrente. Enquanto sistemas com
recall alto e preciso baixa so aceitveis para aplicaes que dependem da interveno
humana para acionamento, quando se trata de sistemas totalmente automatizados necessitam de uma preciso alta para evitar o acionamento indevido do sistema. Por este motivo,
dado que o sistema proposto no foi projetado para uma aplicao especfica, o uso de
mtricas balanceadas como F1 Score e o coeficiente de correlao de Matthews mostra-se
como mais adequado para mensurar a qualidade dos sistemas de deteco de fogo avaliados.
Complementando a avaliao da qualidade do classificador, prope-se tambm a comparao de mtricas que avaliam a localizao da chama no frame. Conforme detalhado
na Sec. 4.2 a avaliao da localizao considera a interseco da regio detectada com as
anotaes de ground truth. Aceita-se a ideia de que uma anotao de ground truth possa
estar atrelada vrias deteces. As mtricas de localizao so especialmente interessantes quando se considera as possveis aplicaes do detector em um sistema de viso
ativa.
Entende-se por erro de localizao os casos em que a rea detectada est localizada
em sua maior parte fora da regio anotada como fogo no ground truth. Esse tipo de erro
geralmente causado por regies de baixo contraste entre a chama e o background, fa-

86

Tabela 8: Resultados do mtodo proposto considerando localizao. A coluna A apresenta


os resultados de CELIK (2010), a coluna B apresenta os resultados de ZHOU et al. (2010)
e a coluna C apresenta os resultados de CHENEBERT; BRECKON; GASZCZAK (2011).
Todos os mtodos foram avaliados utilizando os mesmos dados de teste.
Mtrica
A
B
C Proposto
Total de regies detectadas
92356 102862 16397
12864
Total de regies no ground truth 8425
8425 8425
8425
0,105
0,124 0,648
0,971
Preciso (LP P V )
Recall (LT P R )
0,523
0,334 0,650
0,805
0,894
0,875 0,351
0,028
Taxa de falsa descoberta (FDR)
Taxa de falsos negativos (FNR)
0,477
0,665 0,349
0,194
0,184
0,211 0,709
0,928
F1 Score
Similaridade Mdia
0,105
0,130 0,602
0,937
zendo com que a rea da regio detectada no corresponda com a rea do ground thruth.
Conforme pode-se observar na Tab. 8 os resultados mostram tambm uma melhora significativa do sistema de deteco proposto em relao ao estado da arte, melhorando as
caractersticas de similaridade entre as deteces e o ground truth. Os valores de preciso e recall mostram que 97,1% das deteces foram corretas, no entanto, o sistema
deixou de encontrar 19,5% das regies anotadas. Alm disso, o nmero de regies detectadas, mostra que o contorno das regies extrado de forma mais precisa, reduzindo a
fragmentao.
J no caso de teste II, foram comparados apenas os detectores propostos em CHENEBERT; BRECKON; GASZCZAK (2011) e o detector proposto. Como ambos os detectores dependem de classificadores treinados, buscou-se, neste caso de teste, identificar
o potencial destes classificadores quando aplicados a vdeos diferentes daqueles de onde
foram extrados os dados de treinamento. Desta forma, busca-se verificar se no ouve um
sobreajuste na etapa de treinamento. Os resultados para este caso de teste so dados na
Tab. 9 e Tab. 10 que apresentam respectivamente o desempenho na classificao framea-frame e as mtricas por localizao. para este caso de teste foram utilizados 3 vdeos,
totalizando 1719 frames que contm chamas (2054 regies de chama anotadas no ground
truth) e 1032 frames que no contm chamas.
Nota-se neste segundo caso de teste, que os resultados do detector proposto so
bastante prximos aos resultados do detector proposto em CHENEBERT; BRECKON;
GASZCZAK (2011). Nas mtricas recall e miss rate por exemplo, o detector de CHENEBERT; BRECKON; GASZCZAK (2011) mostra resultados melhores. No entanto,
quando so consideradas as mtricas balanceadas, este superado pelo detector proposto
que apresenta uma acurcia, F1 Score e coeficiente de correlao de Matthews maior. Isto
se deve, em grande parte, diferena 0,053 na preciso, que varia de 0,857 para 0,910,
indicando uma reduo no nmero de falsos positivos.
Ainda para o segundo caso de teste, quando so consideradas as mtricas por locali-

87

Tabela 9: Resultados do mtodo proposto na avaliao frame a frame para o caso de teste
II. A coluna A apresenta os resultados CHENEBERT; BRECKON; GASZCZAK (2011).
Os mtodos foram avaliados utilizando os mesmos dados.
Mtrica
A Proposto
Recall (TPR)
0,990
0,966
0,724
0,842
Especificidade (SPC)
Preciso (PPV)
0,857
0,910
0,979
0,937
Valor preditivo negativo (NPV)
Fall-out (FPR)
0,275
0,157
Taxa de falsa descoberta (FDR)
0,142
0,089
Miss Rate (FNR)
0,009
0,033
0,890
0,919
Acurcia (ACC)
F1 Score
0,919
0,937
Coeficiente de correlao de Matthews (MCC) 0,773
0,827

Tabela 10: Resultados do mtodo proposto considerando localizao para o caso de


teste II. A coluna A apresenta os resultados de CHENEBERT; BRECKON; GASZCZAK
(2011). Os mtodos foram avaliados utilizando os mesmos dados.
Mtrica
A Proposto
Total de regies detectadas
3461
3620
Total de regies no ground truth 2054
2054
Preciso (LP P V )
0,832
0,800
Recall (LT P R )
0,979
0,969
Taxa de falsa descoberta (FDR) 0,167
0,199
Taxa de falsos negativos (FNR) 0,020
0,030
F1 Score
0,902
0,880
Similaridade Mdia
0,801
0,794

88

zao, pode-se observar na Tab. 10 que os resultados do detector proposto so um pouco


inferiores ao detector proposto em CHENEBERT; BRECKON; GASZCZAK (2011).
Quando o modelo gerado utilizando um subconjunto dos vdeos do dataset e aplicado
em outro subconjunto, tentando desta forma emular os resultados da aplicao deste detector em uma situao real (em que no existe um treinamento especfico) a preciso do
detector proposto de 0,8, com uma taxa de recall de 0,969. A similaridade mdia entre
as regies detectadas de 0,794.
Durante os testes algumas deficincias do detector puderam ser observadas. A primeira particularidade diz respeito ao reflexo que ocorre na gua e no vidro. Este fenmeno, por ser facilmente ignorado em uma anlise humana no includo no ground truth
gerando falsos positivos na anlise quantitativa. Esta uma caracterstica do detector, decorrente da abordagem proposta, para a qual ainda no foi vislumbrada uma soluo.
Outra situao que implica na gerao de falsos positivos a presena de coletes reflexivos, como os utilizados por bombeiros e socorristas, na cena. Este tipo de vestimenta,
quando em condies de iluminao adequadas, capturado pela cmera com uma cor e
textura muito prxima da que apresentada pelo fogo verdadeiro, satisfazendo inclusive
as regras que buscam pela obliquidade e formato da regio.
Um terceiro gerador de falsos positivos a presena de rudo estruturado no vdeo,
normalmente uma consequncia do uso de cmeras e encoders baratos. Quando existe
rudo estruturado a definio das bordas prejudicada. Dado que o sistema baseado
primariamente na classificao por cor e nos dados estatsticos da regio, a quantidade de
falsos positivos e falsos negativos aumenta quando existe movimento da cmera.
Em decorrncia da anlise do formato, notou-se que o detector falha sistematicamente
quando existe ocluso parcial da regio de fogo. No dataset utilizado, estes casos correspondem a fogo visto atravs de janelas ou dentro de tanques que impedem a visualizao
da base do fogo. Este problema similar ao que j havia sido reportado na bibliografia
revisada. Por fim, notou-se tambm a ocorrncia de falsos negativos quando a chama
muito translcida.

TRABALHOS FUTUROS

O trabalho apresentado representa uma contribuio significativa para o estado da arte


em relao deteco de chamas utilizando cmeras mveis. Visto que no foi possvel
encontrar na bibliografia consultada nenhuma referncia que trabalhasse com objetivos
prximos que so a deteco em tempo de execuo, permitindo a tomada de deciso pelo
rob e o acionamento de uma cadeia de eventos associados, no foi possvel estabelecer
um comparativo entre os resultados alcanados. A ttulo de referncia, cabe citar que
BORGES; IZQUIERDO (2010) busca apenas classificar o arquivo de vdeo obtido de
uma biblioteca de mdias como contendo fogo ou no.
J no que se refere deteco de fogo a partir de cmeras estacionrias pode-se afirmar
que no existiu um grande avano, dado que a srie de mtodos baseados na oscilao que
foram apresentados no Cap. 3 j havia praticamente esgotado o assunto. Quando utilizase cmeras fixas e com pouca trepidao, o processo de deteco significativamente
mais simples.
Com relao s melhorias especficas do detector, sabe-se que o custo computacional
da classificao com base na cor utilizando Random Forests para a classificao de cada
pixel individualmente pode ser um impeditivo para a aplicao da soluo em imagens
de alta resoluo. Por este motivo interessante procurar uma abordagem que possa
produzir resultados semelhantes, mas que no exija tantas operaes sobre cada pixel.
Uma das alternativas viveis neste caso seria explorar massivamente o processamento
paralelo utilizando a plataforma CUDA. Alm disto, considerando os valores de recall
discutidos no Cap. 7 pode-se focar na busca por detectores que minimizem a taxa de
falsos negativos, melhorando a qualidade geral do detector.
Apesar dos resultados alcanados, existem diversas linhas de trabalho que no foram completamente exploradas at aqui. Entre elas pode-se destacar a integrao completa com o framework CvWorks, adequando-o perfeitamente arquitetura proposta pelo
mesmo e adequando a documentao de forma a permitir o reaproveitamento do cdigo
no futuro. Neste processo incluem-se tambm a colaborao para o desenvolvimento dos
mdulos em compatibilidade com ROS (Robot Operating System) e com as arquiteturas
e protocolos industriais utilizados. Da mesma forma, o suporte mltiplas cmeras

90

desejvel.
Devido a falta de critrios objetivos para definir a rea da regio de fogo, uma das
propostas futuras que o dataset seja anotado por uma segunda pessoa, utilizando ento
as estatsticas de concordncia para melhorar a consistncia das anotaes de groundtruth. J no campo de pesquisa da aprendizagem de mquina, o problema de deteco de
fogo pode ser tambm abordado utilizando tcnicas de deep learning, como redes neurais
profundas ou redes neurais profundas convolucionais.

CONCLUSO

Desde a dcada de 60, quando iniciaram-se os primeiros estudos no campo da viso


computacional, houve uma grande evoluo. A popularizao de cmeras digitais e outros
eletrnicos capazes de gravar e reproduzir vdeos fez com que tarefas que envolvessem
a extrao de dados a partir de imagens e vdeos se tornassem relevantes e permitissem
a automao de diversas tarefas. Atualmente existe uma tendncia de se usar o processamento de imagens nas mais diversas aplicaes, desde o reconhecimento de caracteres
at a deteco de fogo, passando por sistemas de autenticao e reconhecimento biomtrico, sistemas de vigilncia e monitoramento ou at mesmo processamento de imagens
mdicas.
Ao contrrio do que acontece por exemplo com a deteco de face, para deteco e
localizao de incndio, fogo ou fumaa no existem datasets pblicos completos, com
anotaes que permitam uma validao automtica dos resultados. Da mesma forma,
tambm no existe uma conveno sobre as mtricas. Por este motivo, precisou-se criar
um dataset prprio composto por vdeos de cmeras no estacionrias para verificar as
sadas produzidas. Considera-se que o trabalho foi satisfatrio e permitiu atingir um maior
conhecimento sobre a rea de pesquisa como um todo, referenciando a maior parte dos
algoritmos atualmente utilizados e elucidando suas principais vantagens e pontos fracos.
Com relao ao objetivo principal do trabalho, pode-se afirmar que o desenvolvimento
de um detector de chamas que produz bons resultados em vdeos obtidos a partir de cmeras mveis foi atingido. Por outro lado, no possvel afirmar que o sistema permite
a deteco em tempo real. Os detectores propostos na literatura foram estudados e seus
principais pontos positivos e negativos foram elucidados. A comparao quantitativa do
detector proposto com os trabalhos anteriores, utilizando um dataset desafiador, mostrou
que as tcnicas baseadas na textura da imagem fornecem melhores resultados. A avaliao qualitativa permitiu identificar quais os pontos em o detector proposto pode ser
incrementado em trabalhos futuros.
Ao minimizar a dependncia da avaliao temporal, a soluo proposta mostra-se funcional tanto para vdeos obtidos a partir de cmeras mveis quanto para vdeos obtidos
a partir de cmeras estticas. A tcnica proposta supera as principais desvantagens apre-

92

sentadas pelos outros mtodos estudados. Os prximos passos, apresentados com maiores
detalhes no Cap. 8, esto primariamente relacionados com a otimizao em nvel de cdigo e a integrao completa com o framework CvWorks.

93

REFERNCIAS

AGRAWAL, R.; SRIKANT, R. Mining sequential patterns. In: DATA ENGINEERING,


1995. PROCEEDINGS OF THE ELEVENTH INTERNATIONAL CONFERENCE ON,
1995. Anais. . . [S.l.: s.n.], 1995. p.314.
BERG, T. L.; BERG, A. C.; EDWARDS, J.; MAIRE, M.; WHITE, R.; TEH, Y.-W.;
LEARNED-MILLER, E.; FORSYTH, D. A. Names and faces in the news. In: COMPUTER VISION AND PATTERN RECOGNITION, 2004. CVPR 2004. PROCEEDINGS
OF THE 2004 IEEE COMPUTER SOCIETY CONFERENCE ON, 2004. Anais. . .
[S.l.: s.n.], 2004. v.2, p.II848.
BOOST C++ Libraries. [S.l.: s.n.], 2014. http://www.boost.org.
BORGES, P. V. K.; IZQUIERDO, E. A probabilistic approach for vision-based fire detection in videos. Circuits and Systems for Video Technology, IEEE Transactions on,
[S.l.], v.20, n.5, p.721731, 2010.
BOUWMANS, T.; EL BAF, F.; VACHON, B. Background modeling using mixture of
gaussians for foreground detection-a survey. Recent Patents on Computer Science,
[S.l.], v.1, n.3, p.219237, 2008.
BRADSKI, G. The OpenCV Library. Dr. Dobbs Journal of Software Tools, [S.l.], 2000.
BREIMAN, L. Random Forests. Machine Learning, [S.l.], v.45, n.1, p.532, 2001.
BREIMAN, L.; FRIEDMAN, J.; STONE, C. J.; OLSHEN, R. A. Classification and
regression trees. [S.l.]: CRC press, 1984.
BRICE, C. R.; FENNEMA, C. L. Scene analysis using regions. Artificial intelligence,
[S.l.], v.1, n.3, p.205226, 1970.
CANNY, J. A computational approach to edge detection. Pattern Analysis and Machine
Intelligence, IEEE Transactions on, [S.l.], n.6, p.679698, 1986.
CELIK, T. Fast and Efficient Method for Fire Detection Using Image Processing. ETRI
journal, [S.l.], v.32, n.6, 2010.

94

CELIK, T.; DEMIREL, H. Fire detection in video sequences using a generic color model.
Fire Safety Journal, [S.l.], v.44, n.2, p.147158, 2009.
CELIK, T.; DEMIREL, H.; OZKARAMANLI, H.; UYGUROGLU, M. Fire detection
using statistical color model in video sequences. Journal of Visual Communication and
Image Representation, [S.l.], v.18, n.2, p.176185, 2007.
ELIK, T.; OZKARAMANLI, H.; DEMIREL, H. Fire and smoke detection without sensors: image processing-based approach. In: EUROPEAN SIGNAL PROCESSING CONFERENCE, EUSIPCO, 15., 2007. Anais. . . [S.l.: s.n.], 2007. p.147158.
ETIN, A. E.; DIMITROPOULOS, K.; GOUVERNEUR, B.; GRAMMALIDIS, N.; GNAY, O.; HABIBOGLU, Y. H.; TREYIN, B. U.; VERSTOCKT, S. Video fire detection
Review. Digital Signal Processing, [S.l.], v.23, n.6, p.18271843, 2013.
CHEN, J.; HE, Y.; WANG, J. Multi-feature fusion based fast video flame detection. Building and Environment, [S.l.], v.45, n.5, p.11131122, 2010.
CHEN, T.-H.; WU, P.-H.; CHIOU, Y.-C. An early fire-detection method based on image
processing. In: IMAGE PROCESSING, 2004. ICIP04. 2004 INTERNATIONAL CONFERENCE ON, 2004. Anais. . . [S.l.: s.n.], 2004. v.3, p.17071710.
CHENEBERT, A.; BRECKON, T. P.; GASZCZAK, A. A non-temporal texture driven
approach to real-time fire detection. In: IMAGE PROCESSING (ICIP), 2011 18TH IEEE
INTERNATIONAL CONFERENCE ON, 2011. Anais. . . [S.l.: s.n.], 2011. p.17411744.
CHINCHOR, N. MUC-4 Evaluation Metrics. In: CONFERENCE ON MESSAGE UNDERSTANDING, 4., 1992, Stroudsburg, PA, USA. Proceedings. . . Association for Computational Linguistics, 1992. p.2229. (MUC4 92).
CHUNYU, Y.; JUN, F.; JINJUN, W.; YONGMING, Z. Video fire smoke detection using
motion and color features. Fire technology, [S.l.], v.46, n.3, p.651663, 2010.
COLLINS, R. T.; LIPTON, A.; KANADE, T.; FUJIYOSHI, H.; DUGGINS, D.; TSIN, Y.;
TOLLIVER, D.; ENOMOTO, N.; HASEGAWA, O.; BURT, P. et al. A system for video
surveillance and monitoring. [S.l.]: Carnegie Mellon University, the Robotics Institute
Pittsburg, 2000. v.2.
CUMANI, A. Edge detection in multispectral images. CVGIP: Graphical models and
image processing, [S.l.], v.53, n.1, p.4051, 1991.
CYGANEK, B.; SIEBERT, J. P. An introduction to 3D computer vision techniques
and algorithms. [S.l.]: John Wiley & Sons, 2011.

95

DENG, J.; DONG, W.; SOCHER, R.; LI, L.-J.; LI, K.; FEI-FEI, L. Imagenet: a largescale hierarchical image database. In: COMPUTER VISION AND PATTERN RECOGNITION, 2009. CVPR 2009. IEEE CONFERENCE ON, 2009. Anais. . . [S.l.: s.n.], 2009.
p.248255.
DUNTEMAN, G. H. Principal Components Analysis. [S.l.]: SAGE Publications, 1989.
n.No 69. (A Sage Publications).
FEI-FEI, L.; FERGUS, R.; PERONA, P. Learning generative visual models from few
training examples: an incremental bayesian approach tested on 101 object categories.
Computer Vision and Image Understanding, [S.l.], v.106, n.1, p.5970, 2007.
FORSYTH, D. A.; PONCE, J. Computer Vision: a modern approach. [S.l.]: Prentice
Hall Professional Technical Reference, 2002.
GIL, A. C. Mtodos e tcnicas de pesquisa social. In: Mtodos e tcnicas de pesquisa
social. [S.l.]: Atlas, 2010.
GOMEZ-RODRIGUEZ, F.; ARRUE, B.; OLLERO, A. Smoke monitoring and measurement using image processing: application to forest fires. In: AEROSENSE 2003, 2003.
Anais. . . [S.l.: s.n.], 2003. p.404411.
GMEZ-RODRGUEZ, F.; PASCUAL-PEA, S.; ARRUE, B.; OLLERO, A.; VIEGAS, D. et al. Smoke detection using image processing. In: FOREST FIRE RESEARCH AND WILDLAND FIRE SAFETY: PROCEEDINGS OF IV INTERNATIONAL
CONFERENCE ON FOREST FIRE RESEARCH 2002 WILDLAND FIRE SAFETY
SUMMIT, LUSO, COIMBRA, PORTUGAL, 18-23 NOVEMBER 2002., 2002. Anais. . .
[S.l.: s.n.], 2002.
GNAY, O.; TASDEMIR,

K.; TREYIN, B. U.; ETIN, A. E. Fire detection in video


using LMS based active learning. Fire technology, [S.l.], v.46, n.3, p.551577, 2010.

GNAY, O.; TASDEMIR,

K.; UGUR
TREYIN, B.; ENIS ETIN, A. Video based
wildfire detection at night. Fire Safety Journal, [S.l.], v.44, n.6, p.860868, 2009.
HALL, M. A. Correlation-based feature selection for machine learning. 1999. Tese
(Doutorado em Cincia da Computao) The University of Waikato.
HALL, M.; FRANK, E.; HOLMES, G.; PFAHRINGER, B.; REUTEMANN, P.; WITTEN, I. H. The WEKA data mining software: an update. ACM SIGKDD Explorations
Newsletter, [S.l.], v.11, n.1, p.1018, 2009.
HAMINS, A.; YANG, J.; KASHIWAGI, T. An experimental investigation of the pulsation
frequency of flames. In: SYMPOSIUM (INTERNATIONAL) ON COMBUSTION, 1992.
Anais. . . [S.l.: s.n.], 1992. v.24, n.1, p.16951702.

96

HARALICK, R. M.; SHANMUGAM, K.; DINSTEIN, I. H. Textural features for image


classification. Systems, Man and Cybernetics, IEEE Transactions on, [S.l.], n.6,
p.610621, 1973.
HORN, B. K.; SCHUNCK, B. G. Determining optical flow. In: TECHNICAL SYMPOSIUM EAST, 1981., 1981. Anais. . . [S.l.: s.n.], 1981. p.319331.
HORNG, W.-B.; PENG, J.-W.; CHEN, C.-Y. A new image-based real-time flame detection method using color analysis. In: NETWORKING, SENSING AND CONTROL,
2005. PROCEEDINGS. 2005 IEEE, 2005. Anais. . . [S.l.: s.n.], 2005. p.100105.
HOROWITZ, S. L.; PAVLIDIS, T. Picture segmentation by a tree traversal algorithm.
Journal of the ACM (JACM), [S.l.], v.23, n.2, p.368388, 1976.
JAIN, V.; LEARNED-MILLER, E. FDDB: a benchmark for face detection in unconstrained settings. [S.l.]: University of Massachusetts, Amherst, 2010. (UM-CS-2010-009).
JIAO, Y.; WEIR, J.; YAN, W. Flame Detection in Surveillance. Journal of Multimedia,
[S.l.], v.6, n.1, 2011.
KAMEDA, Y.; MINOH, M. A human motion estimation method using 3-successive video frames. In: INTERNATIONAL CONFERENCE ON VIRTUAL SYSTEMS AND
MULTIMEDIA, 1996. Anais. . . [S.l.: s.n.], 1996. p.135140.
KIRSCH, R. A. Computer determination of the constituent structure of biological images.
Computers and biomedical research, [S.l.], v.4, n.3, p.315328, 1971.
KO, B. C.; HAM, S. J.; NAM, J. Y. Modeling and formalization of fuzzy finite automata
for detection of irregular fire flames. Circuits and Systems for Video Technology, IEEE
Transactions on, [S.l.], v.21, n.12, p.19031912, 2011.
KOLESOV, I.; KARASEV, P.; TANNENBAUM, A.; HABER, E. Fire and smoke detection in video with optimal mass transport based optical flow and neural networks. In:
IMAGE PROCESSING (ICIP), 2010 17TH IEEE INTERNATIONAL CONFERENCE
ON, 2010. Anais. . . [S.l.: s.n.], 2010. p.761764.
KOSCHAN, A.; ABIDI, M. Detection and classification of edges in color images. Signal
Processing Magazine, IEEE, [S.l.], v.22, n.1, p.6473, 2005.
D.; STIPANICEV,

T. Histogram-based smoke segmenKRSTINIC,


D.; JAKOVCEVI
C,
tation in forest fire detection system. Information Technology and Control, [S.l.], v.38,
n.3, p.237244, 2009.

97

LABATI, D.; GENOVESE, A.; PIURI, V.; SCOTTI, F. Wildfire smoke detection using
computational intelligence techniques enhanced with synthetic smoke plume generation.
IEEE Transactions on Systems, Man, and Cybernetics: Systems, [S.l.], v.43, n.4,
p.10031012, 2013.
LEE, B.; HAN, D. Real-time fire detection using camera sequence image in tunnel environment. In: Advanced Intelligent Computing Theories and Applications. With Aspects of Theoretical and Methodological Issues. [S.l.]: Springer, 2007. p.12091220.
LI, Y.-C.; WU, W.-C. Visual Fire Detection Based on Data Mining Technique. International Conference on Robot, Vision and Signal Processing, Los Alamitos, CA, USA,
v.0, p.328331, 2011.
LI, Y.-C.; WU, W.-C. Sequential Pattern Technology for Visual Fire Detection. Environments, [S.l.], v.9, p.13, 2012.
LUCAS, B. D.; KANADE, T. et al. An iterative image registration technique with an
application to stereo vision. In: IJCAI, 1981. Anais. . . [S.l.: s.n.], 1981. v.81, p.674679.
MARBACH, G.; LOEPFE, M.; BRUPBACHER, T. An image processing technique for
fire detection in video images. Fire safety journal, [S.l.], v.41, n.4, p.285289, 2006.
MARR, D.; HILDRETH, E. Theory of edge detection. Proceedings of the Royal Society
of London. Series B. Biological Sciences, [S.l.], v.207, n.1167, p.187217, 1980.
MATTHEWS, B. W. Comparison of the predicted and observed secondary structure of
T4 phage lysozyme. Biochimica et Biophysica Acta (BBA)-Protein Structure, [S.l.],
v.405, n.2, p.442451, 1975.
MCFARLANE, N. J.; SCHOFIELD, C. P. Segmentation and tracking of piglets in images. Machine Vision and Applications, [S.l.], v.8, n.3, p.187193, 1995.
MIGLIORE, D. A.; MATTEUCCI, M.; NACCARI, M. A revaluation of frame difference in fast and robust motion detection. In: ACM INTERNATIONAL WORKSHOP
ON VIDEO SURVEILLANCE AND SENSOR NETWORKS, 4., 2006. Proceedings. . .
[S.l.: s.n.], 2006. p.215218.
MUBARAK, S. Fundamentals of Computer Vision. University of Central Florida. Orlando, Florida, USA, [S.l.], 1997.
MUELLER, M.; KARASEV, P.; KOLESOV, I.; TANNENBAUM, A. Optical Flow Estimation for Flame Detection in Videos. Image Processing, IEEE Transactions on, [S.l.],
v.22, n.7, p.27862797, 2013.

98

NGUYEN-TI, T.; NGUYEN-PHUC, T.; DO-HONG, T. Fire detection based on video


processing method. In: ADVANCED TECHNOLOGIES FOR COMMUNICATIONS
(ATC), 2013 INTERNATIONAL CONFERENCE ON, 2013. Anais. . . [S.l.: s.n.], 2013.
p.106110.
OSKOEI, M. A.; HU, H. A survey on edge detection methods. [S.l.]: Technical Report
CES, 2010.
PAL, N. R.; PAL, S. K. A review on image segmentation techniques. Pattern recognition,
[S.l.], v.26, n.9, p.12771294, 1993.
PARK, J.; KO, B.; NAM, J.-Y.; KWAK, S. Wildfire smoke detection using spatiotemporal bag-of-features of smoke. In: APPLICATIONS OF COMPUTER VISION (WACV),
2013 IEEE WORKSHOP ON, 2013. Anais. . . [S.l.: s.n.], 2013. p.200205.
PARKER, J. Algorithms for Image Processing and Computer Vision. [S.l.]: Wiley,
2010. (IT Pro).
PEI, J.; PINTO, H.; CHEN, Q.; HAN, J.; MORTAZAVI-ASL, B.; DAYAL, U.; HSU,
M.-C. Prefixspan: mining sequential patterns efficiently by prefix-projected pattern
growth. In: IEEE 29TH INTERNATIONAL CONFERENCE ON DATA ENGINEERING
(ICDE), 2013., 2001. Anais. . . [S.l.: s.n.], 2001. p.02150215.
PHILLIPS III, W.; SHAH, M.; VITORIA LOBO, N. da. Flame recognition in video.
Pattern recognition letters, [S.l.], v.23, n.1, p.319327, 2002.
PREWITT, J. M. Object enhancement and extraction. [S.l.]: Academic Press, New
York, 1970. v.75.
ROSENFELD, A.; THURSTON, M. Edge and curve detection for visual scene analysis.
Computers, IEEE Transactions on, [S.l.], v.100, n.5, p.562569, 1971.
RUSSELL, B. C.; TORRALBA, A.; MURPHY, K. P.; FREEMAN, W. T. LabelMe: a
database and web-based tool for image annotation. International journal of computer
vision, [S.l.], v.77, n.1-3, p.157173, 2008.
SCHMID, C. Constructing models for content-based image retrieval. In: COMPUTER VISION AND PATTERN RECOGNITION, 2001. CVPR 2001. PROCEEDINGS
OF THE 2001 IEEE COMPUTER SOCIETY CONFERENCE ON, 2001. Anais. . .
[S.l.: s.n.], 2001. v.2, p.II39.
SCHROFF, F.; CRIMINISI, A.; ZISSERMAN, A. Harvesting image databases from the
web. Pattern Analysis and Machine Intelligence, IEEE Transactions on, [S.l.], v.33,
n.4, p.754766, 2011.

99

SHIDIK, G. F.; ADNAN, F. N.; SUPRIYANTO, C.; PRAMUNENDAR, R. A.; ANDONO, P. N. Multi Color Feature, Background Subtraction and Time Frame Selection
for Fire Detection. Jurnal Informatika, [S.l.], 2014.
SOBEL, I.; FELDMAN, G. A 3x3 isotropic gradient operator for image processing. a
talk at the Stanford Artificial Project in, [S.l.], p.271272, 1968.
STAUFFER, C.; GRIMSON, W. E. L. Adaptive background mixture models for realtime tracking. In: COMPUTER VISION AND PATTERN RECOGNITION, 1999. IEEE
COMPUTER SOCIETY CONFERENCE ON., 1999. Anais. . . [S.l.: s.n.], 1999. v.2.
TOREYIN, B. U.; CETIN, A. E. Wildfire detection using LMS based active learning.
In: ACOUSTICS, SPEECH AND SIGNAL PROCESSING, 2009. ICASSP 2009. IEEE
INTERNATIONAL CONFERENCE ON, 2009. Anais. . . [S.l.: s.n.], 2009. p.14611464.
TOREYIN, B. U.; DEDEOGLU, Y.; CETIN, A. E. Contour based smoke detection in
video using wavelets. In: EUROPEAN SIGNAL PROCESSING CONFERENCE, 2006.
Anais. . . [S.l.: s.n.], 2006. p.123128.
TOREYIN, B. U.; DEDEOGLU, Y.; CETIN, A. E. et al. Wavelet based real-time smoke
detection in video. In: EUROPEAN SIGNAL PROCESSING CONFERENCE, 2005.
Anais. . . [S.l.: s.n.], 2005. p.48.

TREYIN, B. U.; DEDEOGLU,


Y.; GDKBAY, U.; CETIN, A. E. Computer vision
based method for real-time fire and flame detection. Pattern Recognition Letters, [S.l.],
v.27, n.1, p.4958, 2006.
TRIGO, T. Equipamento Fotografico. Teoria E Pratica. [S.l.]: SENAC, 1998.
WREN, C. R.; AZARBAYEJANI, A.; DARRELL, T.; PENTLAND, A. P. Pfinder: realtime tracking of the human body. Pattern Analysis and Machine Intelligence, IEEE
Transactions on, [S.l.], v.19, n.7, p.780785, 1997.
XIAO, J.; HAYS, J.; EHINGER, K. A.; OLIVA, A.; TORRALBA, A. Sun database: largescale scene recognition from abbey to zoo. In: COMPUTER VISION AND PATTERN
RECOGNITION (CVPR), 2010 IEEE CONFERENCE ON, 2010. Anais. . . [S.l.: s.n.],
2010. p.34853492.
YAMAGISHI, H.; YAMAGUCHI, J. A contour fluctuation data processing method for
fire flame detection using a color camera. In: INDUSTRIAL ELECTRONICS SOCIETY,
2000. IECON 2000. 26TH ANNUAL CONFERENCE OF THE IEEE, 2000. Anais. . .
[S.l.: s.n.], 2000. v.2, p.824829.

100

YIN, F.; MAKRIS, D.; VELASTIN, S. A. Performance evaluation of object tracking


algorithms. In: IEEE INTERNATIONAL WORKSHOP ON PERFORMANCE EVALUATION OF TRACKING AND SURVEILLANCE, RIO DE JANEIRO, BRAZIL, 2007.
Anais. . . [S.l.: s.n.], 2007.
ZHANG, Y. J. A survey on evaluation methods for image segmentation. Pattern recognition, [S.l.], v.29, n.8, p.13351346, 1996.
ZHANG, Z.; ZHAO, J.; ZHANG, D.; QU, C.; KE, Y.; CAI, B. Contour based forest fire
detection using FFT and wavelet. In: COMPUTER SCIENCE AND SOFTWARE ENGINEERING, 2008 INTERNATIONAL CONFERENCE ON, 2008. Anais. . . [S.l.: s.n.],
2008. v.1, p.760763.
ZHAO, J.; ZHANG, Z.; HAN, S.; QU, C.; YUAN, Z.; ZHANG, D. SVM based forest
fire detection using static and dynamic features. Computer Science and Information
Systems, [S.l.], v.8, n.3, p.821841, 2011.
ZHOU, X.-L.; YU, F.-X.; WEN, Y.-C.; LU, Z.-M.; SONG, G.-H. Early fire detection based on flame contours in video. Information Technology Journal, [S.l.], v.9, n.5, p.899
908, 2010.
ZIOU, D.; TABBONE, S. et al. Edge detection techniques-an overview. PATTERN RECOGNITION AND IMAGE ANALYSIS C/C OF RASPOZNAVANIYE OBRAZOV
I ANALIZ IZOBRAZHENII, [S.l.], v.8, p.537559, 1998.