You are on page 1of 5

Proceedings of XI Workshop de Visão Computacional ‐ October 05th‐07th, 2015

Comparative study on Otsu, EICAMM and level set


techniques to automatic segmentation of breast
lesions in digital mammography

Karem D. Marcomini Homero Schiabel


Departamento de Engenharia Elétrica Departamento de Engenharia Elétrica
Universidade de São Paulo Universidade de São Paulo
São Carlos, Brasil São Carlos, Brasil
karem.dm@gmail.com homero@sc.usp.br

Abstract—Mammography is the primary screening technique Com a finalidade de minimizar esses erros e ajudar na
for early detection of breast malignant neoplastic disease. detecção precoce do câncer de mama, sistemas computacionais
Computational procedures have been developed to increase the vêm sendo desenvolvidos como uma ferramenta de auxílio ao
reliability of diagnosis. Segmentation is the step that can result in diagnóstico [4]. Um sistema de diagnóstico auxiliado por
the success or failure in these systems. In order to study computador (CAD – do inglês: Computer-aided Diagnosis)
automatic techniques with the highest accurate results, we consiste de um conjunto de ferramentas automáticas ou semi-
propose the use of Otsu, level set and Enhanced Independent automáticas desenvolvidas para auxiliar radiologistas na
Component Analysis Mixture Model (EICAMM) segmentation detecção e/ou classificação de anormalidades na mamografia
techniques. The evaluation of these techniques occurred through
[1].
comparative analysis of the image delineated manually by the
specialist with those that were automatically obtained by Intensivos estudos têm sido realizados na área de
segmentation techniques. The method that proved to be more segmentação de imagens mamográficas, principalmente na
effective for this database was the level set with the highest identificação de lesões em mamas densas. A segmentação é o
overlap rates in relation the image delimited by the specialist, low estágio mais crítico do processamento dos dados, pois erros ou
rates of under-segmentation and over-segmentation. distorções na representação da lesão podem ocasionar um
Furthermore, the level set was practically invariant using pre- diagnóstico incorreto. Dessa forma, a precisão do nódulo tende
processing and post-processing. a determinar o sucesso ou fracasso durante a análise –
Keywords—Breast cancer, mammography, image segmentation,
classificação dos dados [5].
Computer Aided-Detection. Baseado nessas características, propomos nesse trabalho
investigar a eficiência de alguns métodos de segmentação
I. INTRODUÇÃO propostos na literatura. Para tal finalidade, utilizamos Otsu [6]
por ser uma técnica clássica e que é aplicada em diversas
A mamografia é a técnica mais comum usada por
finalidades há um longo tempo; EICAMM (Enhanced
radiologistas na análise e diagnóstico de câncer de mama [1].
Independent Component Analysis Mixture Model) que foi
Devido à alta taxa de incidência dessa anomalia entre as
recentemente proposta por [7] e teve sua aplicação em
mulheres em todo o mundo e na tentativa de se obter a
mamografias estudada por [5]; e, por fim, utilizamos o level set
detecção precoce, a mamografia é recomendada até mesmo
[8], o qual vem sendo amplamente utilizado em alguns estudos
para mulheres assintomáticas, pois é capaz de detectar a doença
atuais na área de segmentação.
de 3 a 4 anos antes da manifestação dos sintomas, tornando-se
o instrumento mais efetivo no diagnóstico precoce.
II. BASE DE IMAGENS
No entanto, nem todos os cânceres são detectados pela
mamografia e alguns são detectados clinicamente após um A base de imagens INbreast foi adquirida no Centro de
escaneamento mamográfico negativo. A detecção nesse Mama pertencente ao Centro Hospitalar de São João (CHSJ)
“intervalo” tem sido associada com diversos fatores incluindo em Porto, Portugal, com permissão do Comitê de Ética do
idade mais jovem, status pré-menopausa, alta densidade Hospital e Comitê Nacional de Proteção de Dados. Para a
mamográfica e terapia hormonal [2]. Além disso, distorções na aquisição das imagens, foi utilizado o equipamento
interpretação de lesões suspeitas pelos especialistas resultam MammoNovation Siemens FFDM (full-field digital
em um elevado número de biópsias desnecessárias. Em outras mammography), com tamanho de pixel de 70μm e 14 bits de
palavras, 65-85% de biópsias na mama são realizadas em resolução de contraste. As imagens foram armazenadas em
massas benignas [3]. arquivo DICOM. Todas as informações médicas confidenciais
foram removidas do arquivo correspondente [9].

283
Proceedings of XI Workshop de Visão Computacional ‐ October 05th‐07th, 2015

Essa base possui um total de 115 casos de imagens de imagem. Além disso, um limiar adequado é selecionado de
triagem, diagnóstico e acompanhamento. Porém, foram forma automática e estável por meio de um processo simples e
selecionados apenas imagens que continham algum tipo de de baixo custo computacional [6].
lesão e que já tivessem seu contorno delimitado manualmente
pelo especialista, cujos dados são fornecidos pela própria 2) EICAMM: Esse modelo foi desenvolvido por [11] e
INbreast. Assim, foram separadas 51 mamografias, sendo 26
aplicado em mamografias por [5]. Essa técnica surgiu com o
em projeção CC e 25 em MLO. Um especialista definiu as
regiões de interesse (ROIs), e como alguns casos continham objetivo de superar algumas limitações do método
mais de uma lesão por imagem, obteve-se um total de 58 ROIs Independent Component Analysis Mixture Model (ICAMM).
para os testes. Trata-se de um algoritmo de agrupamento em que os pontos a
serem agrupados são gerados por um processo matemático
III. PROCESSAMENTO DE IMAGENS descrito como uma mistura de classes de densidades de
probabilidade k. Desse modo, o objetivo do agrupamento é
Os algoritmos descritos a seguir foram desenvolvidos
encontrar os parâmetros de distribuição de cada classe e
utilizando o software MATLAB (Matrix Laboratory) versão
8.2 (R2014b). Os testes computacionais foram executados em atribuir a amostra de acordo com a mais alta probabilidade.
um computador com processador Intel Core I7-3770, 3.40GHz, Nos experimentos com a EICAMM, k = 2 e o número máximo
16GB. de iterações foi de 400 com limite de erro igual a 0,0001 [5].
3) Level set: foi introduzido para rastrear interfaces e
A. Pré-Processamento formas. A ideia central é representar o contorno implícito
Um pré-processamento foi desenvolvido para expandir o como o nível zero da função e, assim, minimizar a energia
contraste, principalmente quando os níveis de cinza estão dessa função (Eq. 2).
limitados a uma pequena faixa de valores, como é o caso de
mamas radiograficamente densas. De acordo com [5], 8 bits
F (c1, c2, C)  ..Lenght (C)   . Area (inside(C))
são suficientes para representar cada pixel. Além disso, ao
2 2
reduzir essa faixa de valores, o processamento das etapas     0 ( x, y)  c1 dxdy     0 ( x, y)  c2 dxdy (2)
seguintes torna-se mais ágil e não interfere na qualidade final
da segmentação. Assim, a resolução de contraste foi reduzida
de 14 bits para apenas 8 bits. Em seguida, foi realizado um em que, o primeiro termo representa a energia dentro de C e o
alargamento de contraste de forma que toda a faixa de níveis de segundo termo a energia fora de C. Também, µ≥0, v≥0, λ1,
cinza fosse abrangida, ou seja, compreender os valores de zero λ2≥0 são parâmetros fixos, preferencialmente com os seguintes
a 255 – conforme a Eq. 1. valores v=0, λ1=λ2=1, objetivando a suavidade das bordas.
O level set aplicado nessa pesquisa baseou-se no algoritmo
proposto por [12] com a redefinição de alguns parâmetros
 Im  255(Im_ E  min) /(max  min)  iniciais, que são: contorno inicial e a quantidade de iterações. O
contorno inicial foi definido como sendo um retângulo
posicionado na região central da imagem e com dimensão de
em que, Im_E, min, max e Im representam a imagem de 60% da quantidade de pixels correspondentes à altura e largura
entrada, o valor mínimo e máximo da intensidade de cinza e a – razão de aspecto. A convergência dos dados varia de acordo
imagem final, respectivamente. com a dimensão da ROI, sendo assim, a quantidade de
E por fim, a equalização da imagem [10] foi aplicada para iterações foi estabelecida a partir do valor médio obtido com a
atenuar ainda mais as diferentes intensidades de níveis de soma da quantidade de pixels referentes a altura e largura da
cinza. ROI com um fator de ponderação de 0,75 (como exposto na
Eq. 3).
B. Segmentação
O principal objetivo do processo de segmentação é Iteracoes 0.75(l  a) / 2 (3)
particionar uma imagem em regiões que são homogêneas com
relação a uma ou mais características. É uma importante
ferramenta no processamento de imagens médicas e tem sido em que, l refere-se a largura da ROI e a à sua altura.
útil em muitas aplicações, tornando-se um importante passo
O valor de ponderação foi definido de forma arbitrária, de
para a extração de características e determinação de medidas da
modo que possibilitasse a convergência mais rápida do mapa
imagem [11].
de bordas da imagem e revelasse resultado mais preciso no
1) Otsu: é um tipo de limiarização global que depende conjunto de imagem em uso.
apenas do valor do nível de cinza da imagem. Esse método é
amplamente utilizado por ser simples e efetivo em diversos C. Pós-Processamento
casos de segmentação. Esse método possui a peculiaridade de O pós-processamento para a remoção de artefatos e ruídos
se basear inteiramente em cáculos realizados sobre o após a segmentação foi realizado em duas etapas. A primeira
histograma da imagem e não em propriedades locais de cada (Fase 1 do PP – pós-processamento) delas decorreu do uso de
operadores morfológicos de abertura e fechamento [13]. A

284
Proceedings of XI Workshop de Visão Computacional ‐ October 05th‐07th, 2015

segunda etapa (Fase 2 do PP – pós-processamento) visou a (AOM - area overlap measure), de falta na segmentação
uniformização do objeto segmentado, proveniente da remoção (AUM – undersegmentation measure), segmentação excessiva
dos pixels desconexos ao objeto de interesse (região com maior (AVM – oversegmentation measure) e medida combinada (CM
área segmentada) e união dos vales internos a região – combination measure) [15].
segmentada [14].
IV. RESULTADOS E DISCUSSÕES
D. Extração de Medidas
O objetivo desse experimento é avaliar as técnicas de
A fim de fornecer dados quantitativos referente à cada segmentação apresentadas na seção III, assim como verificar se
técnica de segmentação utilizada, cada uma delas foi técnicas de pré-processamento e pós-processamento
comparada com área resultante da segmentação manual forneceriam dados mais precisos quando comparada a imagem
proporcionada por um radiologista, cujos dados de borda estão segmentada automaticamente com a delimitada pelo
disponibilizados na base de imagens utilizada. Para isso, foram radiologista. Na Fig. 1 são exibidos alguns exemplos de ROIs
extraídas as seguintes medidas: medida da área sobreposta segmentadas pelas técnicas abordadas.

(a) (b) (c) (d) (e) (f) (g) (h)

Fig. 1. Imagens segmentadas automaticamente pela técnica EICAMM. (a) segmentação; (b) segmentação e Fase 2 do PP; (c) segmentação e Fase 1 do PP; (d)
segmentação, Fase 1 do PP e Fase 2 do PP; (e) pré-processamento e segmentação; (f) pré-processamento, segmentação e Fase 2 do PP; (g) pré-processamento,
segmentação e Fase 1 do PP; (h) pré-processamento, segmentação, Fase 2 do PP e Fase 1 do PP.

(a) (b) (c) (d) (e) (f) (g) (h)

Fig. 2. Imagens segmentadas automaticamente pela técnica level set. (a) segmentação; (b) segmentação e Fase 2 do PP; (c) segmentação e Fase 1 do PP; (d)
segmentação, Fase 1 do PP e Fase 2 do PP; (e) pré-processamento e segmentação; (f) pré-processamento, segmentação e Fase 2 do PP; (g) pré-processamento,
segmentação e Fase 1 do PP; (h) pré-processamento, segmentação, Fase 2 do PP e Fase 1 do PP.

285
Proceedings of XI Workshop de Visão Computacional ‐ October 05th‐07th, 2015

(a) (b) (c) (d) (e) (f) (g) (h)

Fig. 3. Imagens segmentadas automaticamente pela técnica de Otsu. (a) segmentação; (b) segmentação e Fase 2 do PP; (c) segmentação e Fase 1 do PP; (d)
segmentação, Fase 1 do PP e Fase 2 do PP; (e) pré-processamento e segmentação; (f) pré-processamento, segmentação e Fase 2 do PP; (g) pré-processamento,
segmentação e Fase 1 do PP; (h) pré-processamento, segmentação, Fase 2 do PP e Fase 1 do PP.

Quanto ao uso do pré-processamento, podemos notar que é Já quando a segmentação é aplicada sobre a imagem e não
imprescindível sua aplicação antecedente a segmentação pela há o uso do pós-processamento da informação, pode ocasionar
técnica EICAMM, principalmente se tratando de mamas casos mais ruidosos. Isso ocorre tanto no uso da técnica de
radiograficamente densas. Quando o mesmo não é adotado, o Otsu quanto na EICAMM (Fig. 1 e Fig. 3 casos (a) e (e)).
objeto segmentado é apresentado por pontos e não como um
objeto que possui contorno contínuo e uniforme. No momento Na segmentação por level set, podemos destacar a produção
em que as informações adicionais são removidas durante a de único e uniforme em todos os casos (Fig. 2).
etapa de pós-processamento a região segmentada desaparece e Para avaliar precisamente as técnicas de segmentação,
se mantém na imagem apenas alguns poucos pontos. Esse fato dados quantitativos foram levantados e os valores médios
é destacado na Fig. 1 (a-d). percentuais obtidos estão apresentados na Tabela 1.

TABLE I. MEDIDAS PARA A AVALIAÇÃO DAS TÉCNICAS AUTOMÁTICAS DE SEGMENTAÇÃO

Sem pré-processamento Com pré-processamento


Processamento
AOM AUM AVM CM AOM AUM AVM CM

Segmentação 64,14 15,43 26,51 74,06 63,74 14,4 27,12 74,07

Segmentação + Fase 2 do PP 68,17 13,29 23,32 77,19 68,24 12,38 22,61 77,75
EICAMM
Segmentação + Fase 1 do PP 60,79 24,97 24,76 70,35 65,3 16,07 24,02 75,07

Segmentada + Fase 1 do PP + Fase 2 do PP 63,41 24,84 21,38 72,40 69,5 14,35 19,33 78,61

Segmentação 74,99 6,70 19,96 82,78 74,52 11,76 15,8 82,32

Segmentação + Fase 2 do PP 75,11 6,65 19,86 82,87 74,74 11,68 15,65 82,47
Level Set
Segmentação + Fase 1 do PP 75,10 6,74 19,79 82,86 74,68 11,87 15,52 82,43

Segmentada + Fase 1 do PP + Fase 2 do PP 75,21 6,71 19,69 82,94 74,85 11,9 15,38 82,55

Segmentação 67,18 13,41 23,44 76,78 63,12 13,97 27,39 73,92

Segmentação + Fase 2 do PP 70,21 12,71 19,85 79,22 67,41 12,73 23,26 77,14
Otsu
Segmentação + Fase 1 do PP 67,45 18,26 18,09 77,04 65,74 18,81 19,98 75,65

Segmentada + Fase 1 do PP + Fase 2 do PP 69,02 18,10 15,67 78,42 68,95 18,57 15,64 78,24

Valor Ideal 100 100 0 0 100 100 0 0

286
Proceedings of XI Workshop de Visão Computacional ‐ October 05th‐07th, 2015

A técnica EICAMM produziu praticamente os mesmos [4] A. T. Stavros, “New advances in breast ultrasound: computer-aided
resultados para a imagem segmentada e limpa com e sem pré- detection”, Ultrasound Clinics, v. 4, n. 3, p. 285-290, 2009.
processamento. Porém, quando o pré-processamento, a [5] P. B. Ribeiro, R. A. F. Romero, P. R. Oliveira, H. Schiabel, L. B.
Verços, “Automatic segmentation of breast masses using enhanced ICA
segmentação e o pós-processamento, o valor de precisão mixture model”. Neurocomputing, v. 120, p. 61-71, 2013.
aumentou em torno de 5%, revelando seu melhor resultado [6] N. Otsu, “A threshold selection method from gray-level histograms”,
após a realização da limpeza do fundo, removendo artefatos e a IEEE Tansaction on System, Man, and Cybernetics, v. 9, n. 1, p. 62-66,
junção de vales internos – CM igual a 78,61% e menor índice jan. 1979.
de segmentação excessiva 19,33% (AVM). [7] P. R. Oliveira, R. A. F. Romero, “Improvements on ICA Mixture
Models for Image Pre-processing and Segmentation”. Neurocomputing,
Já a segmentação utilizando o método de Otsu foi v. 71, p. 2180-2193, 2008.
minimamente superior (valores inferiores a 1%) na ausência de [8] S. Osher, J. A. Sethian, “Fronts propagating with curvature dependent
pré-processamento. speed: algorithms based on Hamilton-Jacobi formulations”, Journal of
Computational Physics, v. 79, p. 12-49, 1988.
E por fim, o level set garantiu maior precisão em relação [9] I. C. Moreira, I. Amaral, I. Domingues, A. Cardoso, M. J. Cardoso, J. S.
aos outros dois segmentadores. As medidas permanecem Cardoso, “INbreast: Toward a full-field digital mammographic
praticamente inalteradas quando utilizamos ou não pré- database”, Academic Radiology, v. 19, n. 2, p. 236-248, 2012.
processamento e pós-processamento. A única diferença é que [10] E. D. Pisano, S. Zong, B. M. Hemminger, M. Deluca, R. E. Johnston, K.
ao utilizar pré-processamento, o valor percentual de AUM é Muller, M. P. Braeuning, S. M. Pizer, “Contrast limited adaptive
mais elevado do que quando o mesmo está ausente. Porém, a histogram equalization image processing to improve the detection of
simulated spiculations in dense mammograms”. Journal of Digital
medida AVM se eleva com a ausência de processamento. Imaging, v. 11, n. 4, p. 193-200, nov. 1998.
Dessa forma, as medidas finais passam a ser equivalentes –
[11] I. N. Bankman (Ed.), “Handbook of medical image: processing and
CM praticamente constante. analysis”, 2 ed. Londres: Academic Press, 2009.
[12] S. Lankton, A. Tannenbaum, “Localizing region-based active contours”,
V. CONCLUSÕES IEEE Transactions on Image Processing, v. 17, n. 11, p. 2029-2039, nov.
2008.
Dentre os segmentadores apresentados, a técnica EICAMM [13] A. F. C. Infantosi, L. M. S. Luz, W. C. A. Pereira, A. V. Alvarenga,
produziu resultados próximos ao método de Otsu. No entanto, “Breast Ultrasound Segmentation Using Morphologic Operators and a
o custo computacional da primeira é muito superior, levando Gaussian Function Constraint”. Proc. IFMBE, v. 20, p. 520-523, 2008.
em média 4 minutos para processar cada ROI. Esse valor [14] K. D. Marcomini, H. Schiabel, “Nodules segmentation in breast
aumenta expressivamente em ROIs de dimensões maiores, ultrasound using the artificial neural network Self-Organizing Map”.
podendo atingir um tempo superior a 10 minutos. Esse fator, World Congress on Engineering, London, v. 2, p. 1152-1155, 2012.
inviabiliza o uso do método em sistemas computacionais que [15] C. Pei, C. Wang, S. Xu, “Segmentation of the breast region in
mammograms using marker-controlled watershed transform”, 2nd
requerem respostas rápidas. International Conference on Information Science and Engineering,
O algoritmo level set proporcionou maior custo Hangzhou, China, Proc. ICISE’2010, p. 2371-2374, dez. 2010.
computacional que o de Otsu – o primeiro leva menos de 1
minuto, em média, para processar cada ROI, porém seu valor
foi bem inferior a EICAMM. Além disso, foi o método que
proporcionou maior precisão na determinação do contorno da
lesão, sendo indiferente o uso de pré ou pós-processamento por
produzir contornos únicos e suaves. Dessa forma, não há
distorção nos limites da lesão. Sendo, portanto, considerado o
método mais eficaz na segmentação imagens mamográficas.

AGRADECIMENTOS
À FAPESP (Fundação de Amparo à Pesquisa do Estado de
São Paulo) pelo apoio financeiro.

REFERÊNCIAS
[1] A. Oliver, J. Freixenet, J. Martí, E. Pérez, E. Pont, E. R. E. Denton, R.
Zwiggelaar, “A review of automatic mass detection and segmentation in
mammographic images”, Medical Image Analysis, v. 14, p. 87–110,
2010.
[2] N. F. Boyd, E. Huszti, O. Melnichouk, L. J. Martin, G. Hislop, A.
Chiarelli, M. J. Yaffe, S. Minkin, “Mammographic features associated
with interval breast cancers in screening programs”, Breast Cancer
Research, v. 16, p. 1-9, 2014.
[3] J. L. Jesneck, J. Y. Lo, J. A. Baker, “Breast mass lesions: computer-
aided diagnosis models with mammographic and sonographic
descriptors”, Radiology, v. 244, n. 2, p. 390-398, 2007.

287

You might also like