You are on page 1of 31

Multimídia

Richiely Batista de Moura Paiva.


Vinícius Bulhões.
Vinícius Nunes
Sistema de Reconhecimento
OCR
Reconhecendo e extraindo
características em placas de carros
Sumário
1.

1. Proposta
2. Revisão Bibliográfica
3. Métodos utilizados
4. Exemplo e demonstração da proposta
Proposta
Sistema de Reconhecimento OCR

Reconhecimento de caracteres de uma origem, seja uma


imagem, foto ou uma placa de carro.
Ferramentas:
● OpenCV e Tesseract
Proposta
Desafios

● Entendimento da API Tesseract


● Tratamento de imagens
○ Métodos necessários para o desenvolvimento.

■ Localizar o texto na
imagem;
■ Isolar o texto do
‘background’;
Artigos relacionados
BASSIL, Y., ALWANI, M. OCR Post-Processing Error Correction algorithm
using Google’s Online Spelling Suggestion. LACSC – Lebanese
Association for Computational Sciences january 2012.

ALVES, W. A. L. et al. Uma abordagem para localização e reconhecimento


de placas de licenciamento veicular por meio de operadores
morfológicos e busca por template. Exacta, São Paulo, v. 9, n. 3, p. 355-
362, 2011.

CONCI, A., HISS MONTEIRO, L. Reconhecimento de Placas de Veículos


por Imagem.

FARUK, A., MANJUMDER, N., BASU, S., NASIPURI, M. Design of an Optical


Character Recognition System for Camerabased Handheld Devices. IJCSI
International Journal of Computer Science Issues, july 2011
OCR Post-Processing Error Correction
algorithm using Google’s Online Spelling
Suggestion

• Demonstração do OCR sobre um


documento qualquer;
• Digitalização;
• Reconhecimento das características
• Extração do texto;
• Correção de erros com o mecanismo de
sugestão do Google.
OCR Post-Processing Error Correction
algorithm using Google’s Online Spelling
Suggestion

• Alguns erros de reconhecimento


• OCR pode confundir uma letra ‘S’ com o
número ‘5’ ou o ‘B’ com o número ‘8’.
• Correção baseada no contexto e dicionário
(abrange todas as palavras do vocabulário
específico).
OCR Post-Processing Error Correction
algorithm using Google’s Online Spelling
Suggestion
Uma Abordagem para Localização e Reconhecimento
de Placas de Licenciamento Veicular por meio de
Operadores Morfológicos e Busca por Template

• Localização e reconhecimento da placa


na imagem.
• Encontrar a posição da placa;
 Operações com a largura e altura dos
caracteres.
 Geometria da fonte - distância dos caracteres.
• Template matching;
 Comparação com placas previamente
catalogadas.
• Característica extraída.
Reconhecimento de Placas de Veículos por
Imagem

• Abordagem de técnicas de tratamento e


transformações da imagem.
• Binarização - treshold;
• Dilatação;
• Erosão;
• Segmentação;
Design of an Optical Character Recognition
System for Camerabased Handheld Devices

• Motivação principal: digitalização de


imagens, principalmente documentos;

• Segmentação feita a partir da linha do


texto;
• Como reconhecer os caracteres?
Design of an Optical Character Recognition
System for Camerabased Handheld Devices
Entendimento dos métodos
Métodos necessários para a
resolução do problema

● Binarização
● Segmentação
● Template matching
● Reconhecimento de caracteres
Binarização
● A intensidade da imagem passa a ter apenas dois
níveis distintos, para que possamos separar o objeto do
fundo da imagem. Esse método pode ser descrito
através da aplicação da função s = T(r).
● A função T(r) compara o sinal de entrada com um valor
de threshold (T), escolhido como referência para a
separação dos níveis de cinza. O sinal de saída,
apresentado é obtido pela relação:
s = {1 para r > T ou 0 para r < T}.
Segmentação

● A segmentação é o processo de dividir uma imagem


em regiões, ou objetos. Em outras palavras, a
segmentação simples consistem em localizar objetos e
formas em imagens.
● O uso desta técnica em nossa proposta será para
podermos reconhecer na imagem aonde estão os
caracteres.
Template matching
● Através de um padrão, conseguir indentificá-lo, caso
ele apareca, em alguma imagem qualquer.
● Será usado para dizer qual caractere foi encontrado,
comparando o caractere segmentado da imagem
analisada com algum banco de padrões, para que o
mesmo possa ser reconhecido.
○ Cuidado na hora de reconhecer caracteres e
números. A letra ‘S’ pode ser confundida com o
número ‘5’ ou a letra ‘O’ pode ser confundida com o
número ‘0’.
Reconhecimento de caractere
● O reconhecimento de caracteres é a técnica do OCR.
Permite converter imagens com texto em documentos
de texto usando algoritmos de computação
automatizados. As imagens podem ser processadas
individualmente (arquivos .jpg, .png e .gif) ou em
documentos PDF com várias páginas (.pdf).
Tratamento da imagem
Tratamento da imagem

● Texto encontrado na imagem


● Separação com o background
● Segmentação e binarização
Processos Realizados
• Isolamento da região que contem a placa

• Extração do texto contido na placa


Processos Realizados
• Isolamento da região que contem a placa
Original:

TopHat:
Processos Realizados
• Isolamento da região que contem a placa
Binarização :

Fechamento EE horizontal linear:


Processos Realizados
• Isolamento da região que contem a placa
Abertura altura máxima e minima :

Abertura Largura máxima e minima:


Processos Realizados
• Isolamento da região que contem a placa
Dilatação e remoção de possíveis ruídos :

Seleção placa:
Processos Realizados
• Isolamento da região que contem a placa
Recorte da placa:
Processos Realizados
• Extração do texto contido na placa
Binarização

Erosão
Processos Realizados
• Extração do texto contido na placa
Dilatação

Smooth
Demonstração
Sistema de Reconhecimento de placas com
OCR

Alunos:
Richiely Batista
Vinícius Bulhões
Vinícius Nunes