You are on page 1of 6

Abstract Automatic bank check processing is a very hard task

as it requires efficiency and precision. Banks have been adding


different background patterns in the checks to increase its security.
For automatic recognition of the contents of the check, the systems
need to remove this background as it does not contain any valid
information of the check. This can be done by thresholding
algorithms which can work in document images removing all the
background and letting just the ink colors to remain. In this paper,
we present a new algorithm to threshold images of the courtesy
amount of Brazilian bank checks. This new algorithm uses the
concept of entropy as defined by Tsallis to find the best cut-off
value. Experiments have shown that our algorithm is better than
several well-known thresholding algorithms.

Keywords Entropy, Image Processing, Document Image
Processing.
I. INTRODUO
OM os avanos na tecnologia da informao, os bancos
vm investindo cada vez mais na automao de seus
processos. O processamento automtico de cheques envolve,
principalmente, o reconhecimento das informaes contidas
no cheque como dados do cliente, do banco e valor do cheque.
Essa uma tarefa bastante complexa j que deve ser segura e
precisa. A falsificao deve ser dificultada ao mximo. Para
isso, os bancos usam diferentes padres no fundo do cheque
com variaes de formas e de cores. No entanto, isso dificulta
tambm o uso de tcnicas de reconhecimento automtico das
informaes do cheque j que, muitas vezes, os tons dos
padres se confundem com os tons da tinta do texto. No
Brasil, existem 159 bancos; cada um tendo diferentes tipos de
cheque para cada tipo de conta corrente.
Um cheque bancrio brasileiro pode ser dividido em quatro
grandes reas: a rea 1 com informaes do banco e da conta
do cliente; a rea 2 (chamada de Courtesy Amount CA) com
o valor numrico do cheque; a rea 3 (contendo a logomarca
do banco, data, assinatura do cliente e o valor por extenso do
cheque o Legal Amount ou LA) e a rea 4 com o CMC7
(Character Magnetic Code) que um cdigo de identificao.
Por regulamentao do Banco Central do Brasil, todos os
bancos devem ter seus cheques assim divididos e em

Este trabalho foi apoiado pelo Departamento de Sistemas e Computao
da Escola Politcnica de Pernambuco, Universidade de Pernambuco e pela
AiLeader Pattern Recognition.
R.F.P.Neves, C.A.B.Mello e M.S.Silva fazem parte do Departamento de
Sistemas e Computao, Universidade de Pernambuco, Recife, PE, Brasil,
rfpn, carlos, mss@dsc.upe.br.
B.L.D.Bezerra est com a AiLeader Pattern Recognition, Recife, PE,
Brasil, bldb@aileader.com.br.
localizaes especficas no cheque. As dimenses das reas,
no entanto, podem sofrer pequenas variaes. A Fig. 1 mostra
um exemplo de cheque brasileiro e a distribuio dessas
quatro reas principais.



Figura 1. Diagramao de um cheque brasileiro.

Para automatizar o processamento de cheques, necessrio
reconhecer o texto e validar alguns campos. Reconhecimento
de texto feito usando tcnicas de OCR (Optical Character
Recognition Reconhecimento ptico de Caracteres) [1]. Um
algoritmo de OCR tem, basicamente, os seguintes passos: pr-
processamento, limiarizao, extrao de caractersticas e o
reconhecimento em si. Este artigo explora a fase de
limiarizao que responsvel pela separao dos objetos (o
texto) do fundo (o papel). Definimos um novo mtodo para
binarizao da regio do courtesy amount de cheques
brasileiros para fins de reconhecimento do valor do cheque. O
reconhecimento desse valor mais simples que do valor por
extenso j que o conjunto de smbolos (dgitos) menor.
Existem diversas pesquisas importantes associadas ao
processamento de imagens de cheques. Aps a binarizao
(tratada em mais detalhes na prxima Seo), a segmentao
de caracteres um dos passos mais importantes nesse
processamento automtico visando a um reconhecimento do
texto escrito em cheques. Esse assunto abordado em [2]
onde os autores propem um processo de segmentao em
dois estgios (um global e outro local) para o reconhecimento
do valor do cheque.
Estudos em informao manuscrita so feitos em [3]. Em
[4], os autores propem um novo mtodo para limiarizao de
imagens de cheques bancrios chineses baseado em casamento
de sinais que traz resultados satisfatrios para o campo data
daqueles cheques. No entanto, para usar essa tcnica
necessrio um sinal base com a estrutura do campo o qual o
algoritmo atuar.
Segmentao da data estudada em [5] com a proposta de
um sistema para reconhecimento da data, onde o primeiro
passo separar o campo de data em trs sub-imagens,
correspondendo ao dia, ms e ano. Em [6], descrito um
R. F. P. Neves, Member IEEE, C. A. B. Mello, Member IEEE, M. S. Silva e B. L. D. Bezerra
Thresholding the Courtesy Amount of Brazilian
Bank Checks Based on Tsallis Entropy
C
mtodo para segmentar e reconhecer automaticamente vrios
campos do cheque atravs de conectividade, entropia, energia,
e outras medidas.
A prxima Seo revisa alguns conhecidos algoritmos de
limiarizao e apresenta seus resultados quando aplicados ao
nosso objeto de estudo (o courtesy amount de cheques
brasileiros). Na Seo 3, detalhamos nossa proposta de
algoritmo. Os resultados so apresentados e analisados na
Seo 4 e a Seo 5 conclui o artigo.
II. ALGORITMOS DE LIMIARIZAO
Limiarizao ou binarizao o processo que busca por um
ponto de corte que separe objetos relevantes (no nosso caso, a
tinta) do restante da imagem (no nosso caso, o papel) [1].
Encontrar o correto ponto de corte para imagens de cheques
bastante difcil dado a complexidade dos padres no fundo do
cheque. Assim, comum o tratamento de cada rea do cheque
em separado. Limiarizao um dos primeiros passos em
sistemas de segmentao de imagens [7][8].
Cavalcanti et al. [9] criaram uma proposta de limiarizao
do CA baseado no fato que no existe apenas um valor que
separa exatamente o texto do fundo, mas, sim, um espao de
valores. A idia principal encontrar dois pontos de corte T
1
e
T
2
para restringir esse espao. T
1
o valor de corte que
elimina a maior parte do fundo, enquanto T
2
o ponto de corte
que define a tinta. Todos os valores acima de T
1
so
convertidos para branco e todos os valores abaixo T
2
so
convertidos para preto. Os valores entre T
1
e T
2
so analisados
de acordo com seus vizinhos. Se qualquer vizinho ao redor de
um pixel tem valor acima de T
2
ento esse pixel tem sua cor
convertida para preto; do contrrio, ela vira branco. Esse
mtodo usado na ferramenta iBinarize da AiLeader
Pattern Recognition para processamento de imagens de
cheques.
De uma maneira geral, existem diversos algoritmos
clssicos para limiarizao de uma forma geral. O algoritmo
de Otsu [10] quebra o histograma em duas classes C
0
e C
1

relacionadas ao papel e tinta. O nvel t, o qual define esse
ponto de quebra, obtido pela minimizao das equaes:
=
b
2
/
w
2
(1)
=
b
2
/
t
2
(2)
=
t
2
/
w
2
(3)
onde
w
2
a varincia dentro da classe;
b
2
a varincia entre
classes e
t
2
a varincia total.
Em [11], Pun props um algoritmo de limiarizao baseado
em entropia. A entropia calculada para toda a imagem e
dividida em: entropia do background (H
w
) e entropia do
foreground (H
b
). O valor de corte o valor que maximiza:
H = H
b
+ H
w
. (4)
Mello criou um novo algoritmo de limiarizao para atuar
em imagens de documentos histricos o qual foi definido em
[13] e aprimorado em [12]. Embora tenha sido desenvolvido
para documentos histricos, esse mtodo tambm gera bons
resultados em imagens de cheques j que os dois tipos de
imagens tm em comum o background complexo. O algoritmo
baseado na entropia de Tsallis [14] que pode ser definida
como:
1
) ( 1
) (

i
i p
S H
(5)
onde p(i) a probabilidade de a cor i estar na imagem e
um nmero real o qual assume valores diferentes dependendo
da aplicao.
Baseado na idia de Pun, o algoritmo de Mello usa a cor
mais freqente, t, para separar a entropia de Tsallis [14] como:
) ( ) ( ) ( B H A H S H
w b
+ =
(6)
onde

=
t
i
b
b
i p
X
A H
0
) (
1
1
1
) (


(7)
e

+ =

=
255
1
) (
1
1
1
) (
t i
w
w
i p
X
B H


(8)
com X
b
e X
w
variveis tal sua soma seja igual a 1. O valor de
corte final, th, :
w b
H mw H mb th * * + =
(9)
onde m
b
e m
w
so constantes definidas heuristicamente,
usando a entropia de Shannon (detalhes em [13]).
Esses e outros algoritmos (listados na Seo IV) foram testados
para imagens de courtesy amount. Nossa base de imagens tem mais
de 1.300 cheques digitalizados a 200 dpi de resoluo e 256 nveis de
cinza. Com dito anteriormente, nosso objetivo limiarizar o courtesy
amount dessas imagens de cheques. A imagem ideal que desejamos
encontrar aquela que preserva a maior parte do contedo registrado
pela tinta e elimina todo o resto. Essa uma tarefa bastante difcil,
pois, s vezes, o texto preservado, mas parte do fundo tambm; ou
todo o fundo e removido assim como parte do texto.
Esses experimentos mostraram que a melhor binarizao foi
conseguida pelo algoritmo de Mello para a maior parte das
imagens de CA. Em alguns casos, porm, os resultados no
foram to bons como o exemplo mostrado na Fig. 3. Foi
observado que algumas caractersticas do mtodo de Mello
no estavam trazendo bons resultados para as imagens de
cheque. Notadamente, a classificao das imagens usando a
entropia de Shannon e, posteriormente, a definio do valor
das constantes para gerar o ponto de corte pode no chegar a
um valor ideal. Mais detalhes sobre esses resultados so
apresentados na Tabela II e discutidos na Seo IV.
A seguir, apresentamos uma variao proposta nesse
mtodo para alcanar nossos propsitos.
III. NOVO ALGORITMO PARA LIMIARIZAO DO COURTESY
AMOUNT
Baseado no algoritmo de Mello, a nova proposta trabalha
com a mesma idia inicial: quebrar a entropia de Tsallis,
usando a cor mais freqente, e classificar as imagens em
grupos para definir as constantes usadas em (7), (8) e (9).
A classificao da imagem feita agora usando a
quantidade de texto existente na imagem ao invs da entropia
de Shannon como feito no algoritmo original de Mello.
Primeiro, a imagem binarizada com um valor de corte fixo th
definido experimentalmente. O valor do stroke-run ento
calculado nessa imagem em duas cores: o stroke-run um
vetor com a quantidade de carreiras com um determinado
comprimento nos objetos da imagem. Por carreira entendemos
seqncias adjacentes de pixels com uma mesma cor. No caso,
estamos interessados apenas em seqncias de preto j que
essas correspondem tinta. Por exemplo, a primeira posio
do vetor guarda o nmero de carreiras com comprimento igual
a 1; a segunda posio guarda o nmero de objetos com
comprimento de carreira igual a 2 e assim por diante. Por
causa das caractersticas da tinta de um documento, vamos
considerar apenas carreiras com comprimento entre 1 e 6.
A quantidade de texto preservado obtida pela soma do
vetor sstroke-run. As imagens so ento divididas em cinco
grupos de acordo com a quantidade de texto preservado (TP):
Grupo 1: TP < 700 objetos;
Grupo 2: 700 objetos TP < 1.500 objetos;
Grupo 3: 1.500 objetos TP < 2.200 objetos;
Grupo 4: 2.200 objetos < TP < 3.000 objetos;
Grupo 5: TP > 3.000 objetos.
Os valores usados para separar cada grupo foram
encontrados empiricamente.
Os primeiros dois grupos contm imagens claras: imagens
com a cor mais freqente (t) e histogramas agrupados perto de
255 em uma imagem com 256 tons de cinza. Esse grupo
contm tambm imagens com histograma achatado. Essas
caractersticas so entendidas como distores de um
histograma ideal e podem ser facilmente identificadas
analisando o histograma da imagem como pode ser visto na
Fig. 2. A Fig. 2a apresenta uma imagem comum de um
courtesy amount e seu histograma em comparao com outras
imagens (Figs. 2b e 2c) que tambm fazem parte do grupo um,
mas apresentam distoro em seus histogramas.
possvel usar as medidas de assimetria e curtose para
identificar essas distores. Assimetria analisa a concentrao
do histograma ao redor do seu valor mdio. Uma distribuio
gaussiana tem uma assimetria com valor 0. Se a assimetria for
negativa, isso indica que a maior parte do histograma est
concentrada no lado esquerdo da distribuio; caso contrrio,
ela est agrupada no lado direito. A curtose mede o
achatamento de uma distribuio em relao a uma
distribuio Normal. Quando seu valor 0, o histograma to
achatado quanto uma distribuio gaussiana. Se seu valor
menor que 0, a distribuio mais achatada.
Aps identificar as imagens que so claras e com distores
no histograma, o mtodo proposto aplica uma especificao de
histograma [15] nelas para corrigir suas distribuies. Essa
tcnica muda o histograma inicial tal que ele se aproxime ao
de outra distribuio dada chamada de distribuio de
referncia (veja a Fig. 3).






a)

b)

c)


Figura 2. Anlise do histograma: a) um courtesy amount normal com seu
histograma similar a uma funo gaussiana; b) uma imagem com o histograma
mais concentrado no seu lado direito (tons claros); e c) uma imagem com o
histograma mais achatado que o normal.

Para escolher a melhor distribuio a ser usada como
referncia para a especificao, um ndice de fidelidade foi
usado [16]. Tal ndice avalia o grau de semelhana entre duas
imagens ou duas distribuies. No caso, o ndice usado foi
desenvolvido para imagens, mas adaptado para comparar
histogramas. Ele apresenta um valor entre -1 e 1, onde 1
representa duas imagens (ou histogramas) iguais. Esse ndice
foi calculado nos histogramas das imagens de nossa base.
Cada histograma comparado com todos os outros usando
o ndice de fidelidade. O histograma que alcanar, em mdia,
o maior valor de similaridade (e menor desvio padro) o
escolhido para ser o histograma de referncia da
especificao. A Fig. 3a mostra esse histograma de referncia.
As Figs. 3b e 3c apresentam uma imagem com distoro no
histograma e o resultado aps a especificao,
respectivamente.

a)

b)


c)


Figura 3. Exemplo de especificao de histograma: a) histograma de
referncia; b) imagem clara com distores de histograma; e c) Fig. 3b
imagem resultante aps aplicao da especificao de histograma.

Com a anlise do histograma feita, o Grupo 1 agora
dividido em trs sub-grupos, e o Grupo 2 dividido em dois
sub-grupos (novamente, seja t a cor mais freqente da
imagem):
Grupo 1:
Imagens com t > 250;
Imagens com t > 200, curtose > 2 e assimetria > 1 (i.e.,
imagens claras com seus histogramas concentrados nos
tons claros);
As outras imagens desse grupo.
Grupo 2:
Imagens com curtose > 20;
Imagens com curtose 20.
As imagens classificadas no Grupo 1 com t > 250 ou com t
> 200, curtose > 2 e assimetria > 1 e imagens classificadas
no Grupo 2 com curtose > 20 so as que precisam de
especificao de histograma para alcanar um melhor
resultado na binarizao pelo mtodo proposto.
Para cada grupo, as constantes , m
b
e m
w
so definidas de
acordo com a Tabela I. O ponto de corte ento obtido
conforme (9).

TABELA I
CONSTANTES DEFINIDAS BASEADO NA QUANTIDADE DE TEXTO PRESERVADO
(TP) PARA CADA GRUPO DE IMAGENS.

Grupo Nmero de Objetos Constantes
1 TP < 700
se (t > 250)
m
b
= m
w
= 1; = 0,19;
se (t > 200, curtose > 2 e
assimetria > 1)
m
b
= m
w
= 1; = 0,20;
caso contrrio
m
b
=0,5; m
w
=3; = 0,18;
2 700 TP < 1.500
se (curtose > 20)
m
b
=1,5; m
w
=0,5;=0,27;
caso contrrio
m
b
=1; m
w
=2,5; =0,25;
3 1.500 PP < 2.200 m
b
=1; m
w
=2; = 0,32;
4 2.200 PP < 3.000 m
b
= m
w
= 1; = 0,35;
5 TP 3.000 m
b
= m
w
= 1; = 0,4;

Assim como em [12], a escolha dos parmetros feita de
forma emprica, considerando os resultados por inspeo
visual. Pode-se observar como mudanas no parmetro
afetam o resultado da binarizao no exemplo a seguir.
Considere a imagem da Fig. 4a que apresenta um exemplo de
uma imagem de CA. Considerando apenas a entropia de
Tsallis conforme definido em (5) como ponto de corte,
variaes no parmetro levam a diferentes valores de corte,
como pode ser visto na Fig. 4. Isso mostra tambm que
valores de que podem gerar imagens de boa qualidade no
esto em um espao muito grande. Nesse exemplo, os valores
de 0,1 e 0,5 j geraram imagens com muito rudo ou com o
texto quase todo apagado.
As partes mais custosas (em termos computacionais) do
algoritmo so relativas ao clculo do vetor stroke-run (feito
sob a matriz da imagem) e especificao do histograma
(feito usando o histograma da imagem e posterior correo das
suas cores). A definio de constantes e atravs delas do ponto
de corte feita atravs de regras definidas tomando como base
o valor da quantidade de texto preservada, calculada usando o
vetor stroke-run. A criao desse vetor feita atravs de duas
leituras da matriz imagem (uma na horizontal e outra na
vertical), sendo assim de complexidade 2.n.m, onde n o
nmero de linhas e m o nmero de colunas da imagem. O
histograma pode ser calculado junto com a criao do vetor
stroke-run, no aumentando a complexidade do algoritmo.
Apenas a especificao da imagem, quando necessria, exige
uma nova leitura da matriz, acrescentando uma nova funo
de complexidade n.m. Assim, no pior caso, quando a
especificao necessria, pode-se considerar que o algoritmo
tem complexidade O(n
2
).


a)

b)

c)

d)

e)

f)

g)

h)

Figura 4. Conseqncias no ponto de corte (th) para limiarizao com
variaes do parmetro : a) imagem original em tons de cinza e imagens
limiarizadas com b) = 0,1, th = 178; c) = 0,2, th = 127; d) = 0,27, th =
102; e) = 0,3, th = 94; f) = 0,4, th = 71; g) = 0,5, th = 56; e h) = 0,6,
th = 47.
IV. RESULTADOS
O padro ouro de cada imagem usado para analisar os
resultados. Para isso, imagens ideais foram geradas
manualmente, onde cada melhor ponto de corte foi definido
por inspeo visual para binarizar as imagens. Cada imagem
produzida por algoritmos de limiarizao comparada com
essa imagem ideal usando quatro mtricas: preciso, acurcia,
sensibilidade e especificidade [17].
Preciso avalia o erro na classificao do papel. Se seu
valor tende para 1, ento houve poucos erros na classificao
do papel. Sensibilidade o erro na classificao da tinta;
quando seu valor tende para 1, ento houve poucos erros na
classificao da tinta. Acurcia indica a quantidade de erros na
classificao (tinta e papel). Seu valor tendendo para 1 indica
poucos erros na classificao em geral. Por ultimo,
especificidade avalia a correta classificao do papel e, se seu
valor for igual a 1, ento todo o papel foi corretamente
classificado. Essas medidas so definidas como:
Preciso = TP/P (10)
Sensibilidade = TP/(TP + FN) (11)
Acurcia = (TP + TN)/(P + N) (12)
Especificidade = TN/(FP + TN) (13)
onde:
P = TP + FP e N = TN + FN;
TP (True Positive Verdadeiros Positivos): o nmero de
pixels corretamente classificados como papel;
FP (False Positive Falsos Positivos): o nmero de
pixels erroneamente classificados como papel;
TN (True Negative Verdadeiros Negativos): o nmero
de pixels corretamente classificados como tinta;
FN (False Negative Falsos Negativos): o nmero de
pixels erroneamente classificados como tinta.

Para testar nosso algoritmo, usamos uma base com mais de
1.300 imagens de cheques brasileiros, digitalizados com 200
dpi de resoluo e em tons de cinza. O CA de cada cheque foi
separado do restante do cheque. A Tabela II mostra a
comparao entre diversos algoritmos de limiarizao e nossa
proposta em relao imagem ideal. O melhor algoritmo deve
ter todas as quatro medidas prximas de 1 ao mesmo tempo.
Para tanto, 23 algoritmos foram escolhidos para teste. Isso
inclui o algoritmo original de Mello [12] e o de Cavalcanti [9]
voltado a binarizao de cheques. Alm desses, apresentamos
os resultados gerados tambm pelos algoritmos de: como: dois
picos [1], Li-Lee [18], C-Means [19], Brink [20], Huang [21],
Kapur [22], Otsu [10], Johannsen [1], White [23],
porcentagem de preto [1], Yager [23], Kapur [23], seleo
iterativa [1], Yen [23], Fisher [23], tom mdio dos nveis de
cinza [1], Renyi [23], Bernsen [23], Niblack [23], Kittler [23],
Sauvola [23], Pun [1]. Esses algoritmos foram escolhidos por
serem referncia em artigos sobre binarizao ou por serem
baseados em entropia, como a nossa proposta. Maiores
detalhes sobre eles podem ser encontrados em [23]. Podemos
observar pela Tabela II que nosso algoritmo foi o nico que
apresentou todas as quatro medidas com valores acima de 0,9,
mostrando um bom desempenho na classificao tanto do
papel quanto da tinta.

TABELA II
COMPARAO ENTRE ALGORITMOS DE LIMIARIZAO: MDIA (E DESVIO
PADRO) PARA PRECISO (P), SENSIBILIDADE (S), ACURCIA (A) E
ESPECIFICIDADE (E).

Algoritmo P S A E
Novo
Algoritmo
0,90 (0,17) 0,92 (0,13) 0,98(0,02) 0,99(0,02)
Johannsen 0,86 (0,27) 0,99 (0,02) 0,93(0,12) 0,98(0,03)
White 0,78 (0,18) 0,98 (0,02) 0,94(0,09) 0,97(0,02)
Mello 0,81 (0,23) 0,98 (0,02) 0,91(0,17) 0,97(0,03)
Li-Lee 0,97 (0,05) 0,99 (0,01) 0,76(0,29) 0,93(0,14)
Cavalcanti 0,88 (0,21) 0,77 (0,11) 0,97(0,02) 0,99(0,02)
Porc de Preto 0,96 (0,09) 0,99 (0,01) 0,68(0,26) 0,96(0,02)
Otsu 0,99 (0,03) 0,99 (0,01) 0,61(0,20) 0,95(0,03)
Yager 0,99 (0,04) 0,99 (0,01) 0,63(0,23) 0,91(0,14)
Kapur 0,99 (0,04) 0,99 (0,01) 0,60(0,18) 0,92(0,11)
Sel. Iterativa 0,99 (0,04) 0,99 (0,01) 0,56(0,27) 0,89(0,12)
Yen 0,99 (0,04) 0,99 (0,01) 0,54(0,22) 0,87(0,17)
Fisher 0,99 (0,03) 0,99 (0,01) 0,55(0,31) 0,84(0,21)
Tom Mdio 0,98 (0,09) 0,99 (0,01) 0,53(0,28) 0,86(0,15)
Brink 0,99 (0,03) 0,99 (0,08) 0,54(0,31) 0,83(0,22)
Renyi 0,99 (0,03) 0,99 (0,01) 0,41(0,22) 0,81(0,18)
Bernsen 0,99 (0,03) 0,99 (0,01) 0,27(0,16) 0,74(0,13)
Huang 0,98 (0,06) 0,99 (0,01) 0,36(0,34) 0,65(0,28)
C-Means 0,99 (0,03) 0,99 (0,01) 0,28(0,23) 0,70(0,18)
Niblack 0,96 (0,04) 0,99 (0,01) 0,22(0,11) 0,75(0,05)
Kittler 0,09 (0,07) 0,93 (0,03) 0,93(0,24) 0,93(0,03)
Dois picos 0,98 (0,07) 0,97 (0,14) 0,27(0,32) 0,56(0,24)
Sauvola 0,97 (0,05) 0,99 (0,01) 0,16(0,08) 0,62(0,06)
Pun 1,00 (0,00) 1,00 (0,00) 0,15(0,08) 0,59(0,05)

Outra comparao feita foi atravs do uso de mtricas de
distncias para avaliar a dissimilaridade entre as imagens
binrias. Para tanto, foram calculadas as distncias entre os
CAs binarizados e as imagens ideais foram calculadas. As
distncias avaliadas foram: Euclidiana, City Block,
Minkowski, Canberra e Angular [24]. No caso das imagens e
preto-e-branco, as distncias de Canberra e City Block
apresentaram os mesmos resultados. Os melhores algoritmos
devem ter as menores distncias a no ser a angular que
quanto maior melhor.
A Tabela III apresenta os valores mdios dessas distncias
calculadas para os mesmos algoritmos presentes na Tabela II.
Novamente, nosso novo algoritmo alcanou os melhores
resultados.
Por ltimo, avaliamos o erro mdio quadrtico (MSE
Mean Square Error) e sua forma em escala logartmica a
Razo Sinal-Rudo de Pico (PSNR Peak Signal-to-Noise
Ratio). Esses valores so obtidos atravs das seguintes
equaes:

=
=
m
i
i l i k
m
MSE
1
2
) ( ) (
1
(14)
) ( log 10
2
10
MSE
C
PSNR =
(15)
onde: k a imagem ideal; l a imagem resultante dos
algoritmos; m o tamanho da imagem e C a cor mxima que um
pixel pode assumir. Em uma imagem binria C = 1, em uma
imagem em tons de cinza C = 255. O melhor algoritmo deve
ter alto PSNR e baixo MSE. O desempenho de nossa proposta
em comparao com outros algoritmos de limiarizao pode
ser visto na Tabela III, onde apresentamos os resultados
mdios. Como pode ser visto, o algoritmo proposto alcanou o
menor MSE e um dos mais altos valores PSNR, em mdia.

TABELA III
COMPARAO ENTRE ALGORITMOS DE LIMIARIZAO: VALORES MDIOS DE
DISTNCIAS (E = EUCLIDIANA, CB = CITY BLOCK, M = MINKOWSKI, A =
ANGULAR), MSE E PSNR.

Algoritmo E CB M A MSE PSNR
Novo
Algoritmo
17,57 412,8 6,51 0,0128 0,01 21,40
Johannsen 17,78 499 6,41 0,0128 0,02 22,10
White 23,07 628 7,96 0,0128 0,02 18,24
Mello 23,50 739 7,90 0,0128 0,02 18,92
Li-Lee 31,20 2076 8,99 0,0126 0,07 18,58
Cavalcanti 27,76 852,0 9,07 0,0128 0,03 16,38
Porc de Preto 31,64 1150 9,80 0,0127 0,04 15,68
Otsu 35,08 1390 10,55 0,0127 0,05 14,59
Yager 40,85 2642 11,25 0,0125 0,09 14,6
Kapur 40,70 2268 11,45 0,0126 0,07 13,86
Sel. Iterativa 47,43 3255 12,46 0,0125 0,11 13,42
Yen 50,29 3711 13,04 0,0123 0,12 12,43
Fisher 54,42 4844 13,37 0,0121 0,16 13,13
Tom Mdio 53,41 4131 13,47 0,0123 0,14 12,42
Brink 55,89 5073 13,63 0,012 0,17 12,82
Renyi 65,37 5573 15,69 0,0119 0,18 9,879
Bernsen 83,74 7628 18,94 0,0097 0,25 6,798
Huang 89,08 10538 19,01 0,0105 0,35 8,128
C-Means 87,64 8842 19,33 0,0113 0,29 6,893
Niblack 86,28 7544 19,49 0,015 0,25 6,165
Kittler 43,72 2025 12,32 0,0124 0,07 12,28
Dois picos 105,82 13279 21,59 0,0099 0,44 6,511
Sauvola 105,60 11247 22,32 0,0166 0,37 4,387
Pun 110,53 12271 23,02 0,0108 0,40 3,975
V. CONCLUSES
Este artigo apresenta um novo algoritmo para binarizao
do courtesy amount de imagens de cheques bancrios
brasileiros. A rea do courtesy amount contm o valor
numrico do cheque. Essa uma rea pequena do cheque (em
relao a seu tamanho total) e contm elementos da tinta usada
para preencher o cheque j que, em geral, as pessoas usam
uma caneta apenas para preencher o cheque ou um sistema de
preenchimento automtico cuja tinta no varia tanto em um
mesmo cheque. Assim, possvel colher informao
importante sobre o cheque analisando essa rea. Em um
sistema de reconhecimento bancrio automtico, essa a rea
mais fcil para uma identificao automtica do valor do
cheque. Para limiarizao, aplicamos diversos algoritmos
bastante mencionados na literatura, buscando a melhor
resposta. Concluiu-se que o algoritmo de limiarizao de
documentos histricos de Mello alcanou os melhores
resultados; contudo, algumas imagens ainda apresentavam
resultados insatisfatrios. Isso motivou o desenvolvimento de
um novo algoritmo, tomando o de Mello como base, mas
implantando algumas modificaes.
Para anlise dos resultados, avaliamos as medidas de
preciso, sensibilidade, acurcia e especificidade, comparando
as imagens geradas com imagens ideais. O melhor algoritmo
deve ter essas quatro medidas perto de 1. Na Tabela II, pode-
se observar que a maior parte dos algoritmos apresenta baixos
valores de sensibilidade. Por exemplo, Li-lee e Otsu tm bons
resultados nas outras trs medidas, mas o valor de
sensibilidade muito baixo, indicando que esses mtodos
falharam na classificao da tinta. Os experimentos mostraram
que nossa nova proposta obteve os melhores resultados.
Como trabalho futuro, pretendemos usar a informao
colhida no CA sobre a tinta para binarizar o restante do
cheque. J que, em geral, como mencionamos, o cliente usa
uma mesma caneta para preencher todo o cheque, bastante
provvel que os tons de tinta definidos no CA sejam os
mesmos para todo o restante do cheque.
AGRADECIMENTOS
Os autores gostariam de agradecer ao apoio do
Departamento de Sistemas e Computao, FACEPE, Escola
Politcnica de Pernambuco (PIBIC/POLI) e AiLeader Pattern
Recognition. Agradecemos tambm s valiosas contribuies
dos revisores.
REFERNCIAS

[1] J. R. Parker, Algorithms for Image Processing and Computer Vision,
New York: John Wiley and Sons, 1997, p. 420.
[2] L.Q.Zhang, C.Y.Suen, Recognition of Courtesy Amounts on Bank
Checks based on a Segmentation Approach, International Workshop on
Frontiers in Handwriting Recognition, Canad, pp. 298-302, 2002.
[3] J.Zhou et al., A Feedback-based Approach for Segmenting Handwritten
Legal Amounts on Bank Cheques, International Confeence on
Document Analysis and Recognition, EUA, pp. 887-891, 2001.
[4] Z. Honggang, C. Guang, L. Gang, G. Jun, Bank Check Image
Binarization Based on Signal matching, Proceedings of IEEE
International Conference on Information, Communications and Signal
Processing, Tailndia, pp. 1430-1433, 2005.
[5] Q.Xu et al., A Knowledge-based Segmentation System for Handwritten
Dates on Bank Cheques, International Conference on Document
Analysis and Recognition, EUA, pp. 384-388, 2001.
[6] V.K.Madasu, B.C.Lovell, Automatic Segmentation and Recognition of
Bank Cheque Fields, Digital Imaging Computing: Techniques and
Applications, Austrlia, pp. 223-228, 2005.
[7] A.Conci, E.O.Nunes, Texture Segmentation and Edge Location of
Regions in Multiband Images, IEEE Latin America Transactions, Vol.
5, No. 3, pp. 185-192, 2007.
[8] M.A.Gonzalez, V.L.Ballarin, Image segmentation using Watershed
Transform: Marker definition based on fuzzy logic, IEEE Latin
America Transactions, Vol. 6, No. 2, pp. 223-228, 2008.
[9] G. D. C. Cavalcanti, et al. A Heuristic Binarization Algorithm for
Documents with Complex Background., Proceedings of IEEE
International Conference on Image Processing, Atlanta, pp. 389-392,
2006.
[10] N. Otsu, A threshold selection method from gray-level histograms,
IEEE Transactions on Systems, Man, and Cybernetics, vol. 9, pp. 62-66,
1979.
[11] T. Pun, Entropic Thresholding, the new Approach, Computer
Graphics and Image Processing, vol. 16, pp. 210-239, 1981.
[12] C. A. B. Mello, L.A. Schuler, Thresholding Images of Historical
Documents Using a Tsallis-Entropy Based Algorithm, Journal of
Software, vol. 3, no. 6, pp. 29-36, 2008.
[13] C. A. B. Mello, A. Sanchez, A. L. I. Oliveira, A.N.G. Lopes Filho, An
Efficient Gray-Level Thresholding Algorithm for Historic Document
Images, Journal of Cultural Heritage, vol. 9, pp. 109-116, 2008.
[14] C. TSallis, Possible Generalization of Boltzmann-Gibbs statistics,
Journal of Statistical Physics, vol. 52, pp. 479-487, 1988.
[15] R. C. Gonzalez, R.E.Woods, Digital Image Processing, New York:
Addison-Wesley, 2007, p. 976.
[16] Z. Wang, A. C. Bovik, A Universal Image Quality Index, Signal
Processing Letters, vol. 9, pp.81-84, March 2002.
[17] N. A. McMillan, C.D. Creelman, Detection Theory, New Jersey: LEA
Publishing, 2005, p. 512.
[18] C. H. Li, C. K. Lee, Minimum Cross Entropy Thresholding, Pattern
Recognition, vol. 26, pp. 617-625. 1993.
[19] C. V. Jawahar, P. K. Biswas, A. K. Ray, Investigations on Fuzzy
Thresholding Based on Fuzzy Clustering, Pattern Recognition, vol. 30,
pp. 1605-1613, 1997.
[20] S. W. Katz, A. D. Brink, Segmentation of Chromosome Images,
Proceedings of Communications and Signal Processing, frica do Sul,
pp.85-90, 1993.
[21] L. K. Huang, M. J. Wang, Image Thresholding by Minimizing the
Measures of Fuzziness, IEEE Transactions on Pattern Recognition,
vol. 28, pp. 41-51, 1995.
[22] J. N. Kapur, P. K. Sahoo, A. K. C. Wong, A New Method for Gray-
Level Picture Thresholding using the Entropy of the Histogram
Computer Vision, Graphics and Image Processing, vol. 29, pp. 273-285,
1985.
[23] M. Sezgin, B. Sankur, Survey over image thresholding techniques and
quantitative performance evaluation, Journal of Electronic Imaging,
vol. 1, pp. 146-165, 2004.
[24] A.Webb, Statistical Pattern Recognition, New York: John Wiley
Professional, 2002, p. 514.
Renata Freire de Paiva Neves possui graduao em Cincia da Computao
pela Universidade Catlica de Pernambuco (2006), mestrado em Engenharia
da Computao (2008) pela Universidade de Pernambuco. Atualmente,
trabalha no Centro de Estudos Avanados do Recife (CESAR). Tem
experincia na rea de Cincia da Computao, com nfase em processamento
de imagens.
Carlos Alexandre Barros de Mello (M2008) possui graduao em
Engenharia Eltrica/Eletrnica (1994), mestrado (1996) e doutorado (2002)
em Cincia da Computao pela Universidade Federal de Pernambuco.
Atualmente, professor adjunto do Departamento de Sistemas e Computao,
da Universidade de Pernambuco. Tem experincia na rea de Cincia da
Computao, com nfase em processamento de imagens. Atua principalmente
nos seguintes temas: processamento de imagens de documentos,
processamento de imagens mdicas e anlise de texturas.
Mara Sabia da Silva faz graduao em Engenharia da Computao pela
Universidade de Pernambuco, sendo estudante de iniciao cientfica com
bolsa da FACEPE.
Byron L.D. Bezerra possui graduao em Cincia da Computao pela
Universidade Federal de Pernambuco (2001), mestrado (2004) e doutorado
(2008) em Cincia da Computao pela Universidade Federal de Pernambuco.
Atualmente, Diretor de Tecnologia da AiLeader Pattern Recognition. Atua
principalmente nos seguintes temas: processamento de documentos,
reconhecimento de padres, filtragem de informao e personalizao.

You might also like