Professional Documents
Culture Documents
ABSTRACT
Nowadays, ophthalmological organizations detect cataracts with traditional methods. As are the complete ophthalmological check-
up, and the ocular echography. However, people do not undergo these surgeries, because of high costs. Another big reason is that
affected individuals do not perform these processes in time. Therefore, when they perform these eye exams, the disease is already
advanced and their only alternative is surgery.
The objective of the study is to automate the process of detecting ocular cataracts. In order that many more people have access to
this examination at a low cost and in a simple way. It is solved through a series of deep learning algorithms for the automation of
ocular cataract detection. The process is divided into: first, data augmentation: this is done because of the scarcity of data. This
allows me to significantly increase the diversity of available data. Then the fundamental factor is the processing of images using
convolutional neural networks. Thanks to that you are very effective in analyzing images, because they are able to detect
characteristics - patterns. It should be noted that convolutional neural networks are very effective in the classification process, with
adjusted parameters.
The results of the project "Location and diagnostic framework for pediatric cataracts based on slit lamp images using deep features
of a convolutional neural network" by Xiyang Liu , Jiewei Jiang , Kai Zhang, Erping Long, Jiangtao Cui, Mingmin Zhu, Yingying An, Jia
Zhang, Zhenzhen Liu, Zhuoling Lin, Xiaoyan Li, Jingjing Chen, Qianzhong Cao, Jing Li, Xiaohang Wu, Dongni Wang, Haotian Lin, threw
a classification of (97.07%, 97.28%, y 96.83%)
The experimental results show that our proposed method offers an accuracy of 85%. In conclusion, the classifier proves to be very
effective. Another point to address is that this type of computer diagnosis reduces erroneous tests, high costs, and gives greater
accessibility to the public.
Keywords: ocular cataracts, deep learning, data augmentation, processing of images, convolutional neural networks, automate
RESUMEN
Actualmente las organizaciones oftalmológicas detectan las cataratas con métodos tradicionales. Como lo son el chequeo
oftalmológico completo, y la ecografía ocular. Sin embargo, las personas no se someten a estos procesos quirúrgicos, por altos
costos. Otra gran razón es que los individuos afectados, no realizan estos procesos a tiempo. Por consiguiente, cuando efectúan
estos exámenes oculares ya la enfermedad está avanzada y su única alternativa es la cirugía.
El objetivo del estudio es automatizar el proceso de detección de las cataratas oculares. Con el fin de que muchas más personas
tengan acceso a este examen a un bajo costo y de manera sencilla. Se resuelve mediante una serie de algoritmos de aprendizaje
profundo, para la automatización de la detección de las cataratas oculares. El proceso se divide en: primero, aumento de datos: se
realiza por la escasez de datos. Este me permite aumentar de manera significativa la diversidad de datos disponibles. Luego el factor
fundamental que es el procesamiento de las imágenes mediante redes neuronales convolucionales. Gracias a que estás son muy
efectivas en el análisis de imágenes, debido a que son capaces de detectar características - patrones. Cabe destacar que las redes
neuronales convolucionales son muy efectivas en el proceso de clasificación, con parámetros ajustados
Los resultados del proyecto de " Marco de localización y diagnóstico para cataratas pediátricas basado en imágenes de lámpara de
hendidura usando características profundas de una red neural convolucional " por Xiyang Liu , Jiewei Jiang , Kai Zhang, Erping Long,
Jiangtao Cui, Mingmin Zhu, Yingying An, Jia Zhang, Zhenzhen Liu, Zhuoling Lin, Xiaoyan Li, Jingjing Chen, Qianzhong Cao, Jing Li,
Xiaohang Wu, Dongni Wang, Haotian Lin, arrojaron una classification de (97.07%, 97.28%, y 96.83%)
Los resultados experimentales demuestran que nuestro método propuesto ofrece una precisión 85%. Concluyendo, el clasificador
demuestra ser muy eficaz. Otro punto por abordar es que este tipo de diagnósticos por computadora, reducen pruebas erróneas,
altos costos, y dan mayor accesibilidad al público
Palabras claves: cataratas oculares, aprendizaje profundo, aumento de datos, procesamiento de imágenes, redes neuronales
convolucionales, automatizado
DETECTION OF OCULAR CATARACTS WITH CONVOLUTIONAL NEURAL NETWORKS
__________________________________________________________________________________________________________________
Figura 1.
como rubeola o la toxoplasmosis. Por otra parte, entrada, es decir, una imagen que ingresa el usuario.
tenemos la catarata que se producen tras un La cual es objeto de comparación con el gran la
traumatismo ocular y es llamada catarata traumática. diversidad de datos, aglomerada en el software.
Finalmente, la catarata toxica se asocia al uso crónico o
al abuso de algunos fármacos o tóxicos, siendo los
corticoides el elemento casual más frecuente.
METODOLOGÍA
Tratamiento de las imágenes
Pero nos podemos hacer una pregunta ¿existe otros
tipos de cataratas a parte de las ya mencionadas? Y la El procesamiento de imágenes, “tiene como objetivo
respuesta es que si, aunque la mayoría de las cataratas mejorar el aspecto de las imágenes y hacer más
están relacionadas con el envejecimiento. Estos tipos de evidentes en ellas ciertos detalles que se desean hacer
catarata son: notar.” VI. PROCESAMIENTO DE IMÁGENES.
(n.d.). En este punto nuestro recurso principal son los
La catarata secundaria se puede formar después de una
datos, es decir, las imágenes. Por lo tanto, debemos
cirugía para otros problemas de los ojos, tal como el
asegurarnos, de tener un conjunto de datos formidable,
glaucoma. Las cataratas también se pueden desarrollar
limpio y coherente.
en personas que tienen otros problemas de salud, como
la diabetes. A veces las cataratas están relacionadas al Aumento de datos
uso de esteroides y la catarata por radiación que como
su nombre lo indica se puede desarrollar después de Por la escasa diversidad de datos, se usa data
estar expuesto a ciertos tipos de radiación. augmentation que, como lo indica su nombre nos
permite aumentar nuestra variedad de datos. El aumento
PROBLEMÁTICA de datos es una forma de crear nuevos "datos" con
diferentes orientaciones. Los beneficios de estos son
Para empezar uno de los problemas que tienen las dos: la primera es la capacidad de generar "más datos" a
personas de Colombia para realizar los exámenes partir de datos limitados y, en segundo lugar, evita el
correspondientes acerca de las cataratas oculares, es ajuste excesivo. Data Augmentation Experimentation
que muchas veces no tienen los recursos necesarios - Towards Data Science. (n.d.).
para efectuar este diagnóstico. Igualmente, otros
individuos no lo hacen, porque es un proceso que toma En nuestro proyecto usamos dos técnicas las cuales
tiempo. Habitualmente para ejecutar una prueba para son:
la detección de esta enfermedad ocular, en primer Dar la vuelta y rotación
lugar, tienes que pedir cita. Muchas veces el proceso
citación puede tardar un poco, motivo por el cual, las Flip – Dar la vuelta: Puedes voltear las imágenes
personas desisten de realizarlo. En segundo lugar, el horizontal y verticalmente. Algunos marcos no
proceso del examen y la entrega de los resultados, proporcionan una función para voltear verticalmente.
generalmente tienen otro gran lapso para su Pero, un giro vertical es equivalente a rotar una imagen
otorgarlos. Sin embargo, a pesar de estas pequeñas 180 grados y luego realizar un giro horizontal.
circunstancias que son menores, una de las principales
es que las poblaciones afectadas no conocen cuando
deberían hacer el chequeo por parte de un
oftalmólogo. Esto se debe porque no hay campañas
para concientizar e informar a las personas de este tipo
de enfermedades, para así mismo poder controlarlas a
tiempo.
PROPUESTA
Matemáticamente expresamos:
Figura 4
Figura 3.
Fuente: Propia
Fuente: Propia
h=Senθ∗Hipotenusa Dataset;
Fuente: Propia
Figura 5:
Fuente: Propia
Figura 8
Como podemos apreciar en la imagen, el ruido de esta
imagen puede lograr confundir a la red neuronal y Luego aplicaremos un filtro a la imagen como una
hacer que ese destello de luz, provocado por el flash, o máscara de convolución, que aplicada destacan los
una iluminación externa, y que finalmente altere los pixeles candidatos e inhiben el resto. El filtro gaussiano
resultados. simula una distribución gaussiana bivariante donde el
resultado será un conjunto de valores entre 0 y 1. Para
Cada una de las imágenes de ojos con y sin cataratas se transformar la matriz en una matriz de números enteros
presentarán como una matriz H la cual se divide toda la matriz por el menor de los valores
obtenidos.
H=M ∈ R m× n.
Antes de realizar cualquier proceso, de filtración
debemos transferir la imagen original a una escala de
grises. Cuando se convierte una imagen con los tres
canales originales (R, G, B) se elimina la información
de matiz y saturación mientras conserva la luminancia.
Para trabajar los filtros de supresión de ruidos
Fuente: Propia
h ( i , j )=e 2 ×s
2
(1)
Figura 6, imagen original g(i , j )
H ( i, j )= (2)
Fuente: Propia mini , j (h (i, j ))
Figure 6, representación de la matriz de una imagen 1 filtros de pase alto: Su objetivo es resaltar las zonas
de mayor variabilidad eliminando lo que sería la
Debido que debemos pasar a escala de grises, lo que
componente media, precisamente la que detectan los
haremos es igual cada uno de los canales: R, G, B a 1
filtros de paso bajo. Por otra parte, la respuesta de
cada pixel está contaminada por la de los pixeles
DETECTION OF OCULAR CATARACTS WITH CONVOLUTIONAL NEURAL NETWORKS
vecinos ya que, considerando la superficie terrestre Figura 10, Introduction to Deep Learning: What Are
como lambertiana, la radiación reflejada por un pixel Convolutional Neural Networks? Video - MATLAB.
se reparte hacia los pixeles vecinos. Los filtros de paso (n.d.).
alto consiguen también eliminar en parte esta
contaminación. Técnicas de filtrado. (n.d.). La capa de convolución:
1
f (x)=
1−e−x
Esto dio origen a los famosos bloques de ResNet (red La función Softmax transforma las salidas a una
residual): representación en forma de probabilidades, de tal
manera que el sumatorio de todas las probabilidades
de las salidas de 1.
ez j
f (z) j= k
∑ ez k
k=1
DETECTION OF OCULAR CATARACTS WITH CONVOLUTIONAL NEURAL NETWORKS
Implementación:
Modelo Matemático:
Figure 14 CNN
H j ,k =max {x i+ k−1 , j+l−1 ∀ 1≤ k ≤ m y 1≤ 1 m}
Fuente: Propia
Pooling max = max
Capa de convolución
m ancho y alto del núcleo
La operación de convolución genera un valor alto para
una posición dada si la característica de convolución h salida de la convolución
está presente en esa ubicación; de lo contrario, genera
x entrada
un valor bajo. Más concretamente, en una posición dada
del núcleo de convolución, tomamos la multiplicación w núcleo de convolución
por elementos de cada valor de celda del núcleo y el
valor de píxel de la imagen correspondiente que se Arquitectura RESNET
superpone a la celda del núcleo, y luego tomamos la
suma de eso. Los desarrolladores de ResNet, propusieron un
remedio: en lugar de tratar de aprender a partir de
m m mapeos subyacentes de x y H (x), es posible aprender la
H i , j=∑ ∑ wk , l X i +k −1, j+l−1 diferencia entre los dos, que es el “residuo” y,
k=1 l=1 posteriormente, ajustar el último a la entrada.
f (z) j= k
utilidad para sectores como la salud.
∑ ez k
Es importante el estudio de estos grandes temas para
k=1 resolver grandes problemas que tenemos en la
actualidad, logrando automatizar muchos servicios, y
generar más alcance en los proyectos.
Dataset
Conclusiones: Con la ayuda de técnicas de
procesamiento de imágenes, visión artificial, el proceso
de diagnóstico de enfermedad ocular es mucho más
simple y efectivo
Referencias: