Detection of Ocular Cataracts With Convolutional Neural Networks

DETECTION OF OCULAR CATARACTS WITH CONVOLUTIONAL NEURAL NETWORKS
Detection of ocular cataracts with convolutional neural networks

Detección de la catarata ocular con redes neuronales convolucionales
Andrés Felipe Parra, Diego Alejandro Perdomo, Ferley Medina
Received: July _th 2019
Accepted: July_th 2019
ABSTRACT
Nowadays, ophthalmological organizations detect cataracts with traditional methods. As are the complete ophthalmological check-
up, and the ocular echography. However, people do not undergo these surgeries, because of high costs. Another big reason is that
affected individuals do not perform these processes in time. Therefore, when they perform these eye exams, the disease is already
advanced and their only alternative is surgery.
The objective of the study is to automate the process of detecting ocular cataracts. In order that many more people have access to
this examination at a low cost and in a simple way. It is solved through a series of deep learning algorithms for the automation of
ocular cataract detection. The process is divided into: first, data augmentation: this is done because of the scarcity of data. This
allows me to significantly increase the diversity of available data. Then the fundamental factor is the processing of images using
convolutional neural networks. Thanks to that you are very effective in analyzing images, because they are able to detect
characteristics - patterns. It should be noted that convolutional neural networks are very effective in the classification process, with
adjusted parameters.
The results of the project "Location and diagnostic framework for pediatric cataracts based on slit lamp images using deep features
of a convolutional neural network" by Xiyang Liu , Jiewei Jiang , Kai Zhang, Erping Long, Jiangtao Cui, Mingmin Zhu, Yingying An, Jia
Zhang, Zhenzhen Liu, Zhuoling Lin, Xiaoyan Li, Jingjing Chen, Qianzhong Cao, Jing Li, Xiaohang Wu, Dongni Wang, Haotian Lin, threw
a classification of (97.07%, 97.28%, y 96.83%)
The experimental results show that our proposed method offers an accuracy of 85%. In conclusion, the classifier proves to be very
effective. Another point to address is that this type of computer diagnosis reduces erroneous tests, high costs, and gives greater
accessibility to the public.
Keywords: ocular cataracts, deep learning, data augmentation, processing of images, convolutional neural networks, automate
RESUMEN
Actualmente las organizaciones oftalmológicas detectan las cataratas con métodos tradicionales. Como lo son el chequeo
oftalmológico completo, y la ecografía ocular. Sin embargo, las personas no se someten a estos procesos quirúrgicos, por altos
costos. Otra gran razón es que los individuos afectados, no realizan estos procesos a tiempo. Por consiguiente, cuando efectúan
estos exámenes oculares ya la enfermedad está avanzada y su única alternativa es la cirugía.
El objetivo del estudio es automatizar el proceso de detección de las cataratas oculares. Con el fin de que muchas más personas
tengan acceso a este examen a un bajo costo y de manera sencilla. Se resuelve mediante una serie de algoritmos de aprendizaje
profundo, para la automatización de la detección de las cataratas oculares. El proceso se divide en: primero, aumento de datos: se
realiza por la escasez de datos. Este me permite aumentar de manera significativa la diversidad de datos disponibles. Luego el factor
fundamental que es el procesamiento de las imágenes mediante redes neuronales convolucionales. Gracias a que estás son muy
efectivas en el análisis de imágenes, debido a que son capaces de detectar características - patrones. Cabe destacar que las redes
neuronales convolucionales son muy efectivas en el proceso de clasificación, con parámetros ajustados
Los resultados del proyecto de " Marco de localización y diagnóstico para cataratas pediátricas basado en imágenes de lámpara de
hendidura usando características profundas de una red neural convolucional " por Xiyang Liu , Jiewei Jiang , Kai Zhang, Erping Long,
Jiangtao Cui, Mingmin Zhu, Yingying An, Jia Zhang, Zhenzhen Liu, Zhuoling Lin, Xiaoyan Li, Jingjing Chen, Qianzhong Cao, Jing Li,
Xiaohang Wu, Dongni Wang, Haotian Lin, arrojaron una classification de (97.07%, 97.28%, y 96.83%)
Los resultados experimentales demuestran que nuestro método propuesto ofrece una precisión 85%. Concluyendo, el clasificador
demuestra ser muy eficaz. Otro punto por abordar es que este tipo de diagnósticos por computadora, reducen pruebas erróneas,
altos costos, y dan mayor accesibilidad al público
Palabras claves: cataratas oculares, aprendizaje profundo, aumento de datos, procesamiento de imágenes, redes neuronales
convolucionales, automatizado
__________________________________________________________________________________________________________________
1. Tnlgo Desarrollo de Software, Universidad Surcolombiana, Neiva – Huila, u20182171975@usco.edu.co

2. Tnlgo Desarrollo de Software, Universidad Surcolombiana, Neiva – Huila, u20182171975@usco.edu.co
INTRODUCCIÓN enfermedad deje consecuencias. Unidad de

Investigación Científica (2014). Catarata, una causa
Las cataratas son manchas o zonas nubladas en la lente prevenible de ceguera, y las líneas prioritarias de
interior del ojo. Se pueden formar en un ojo o en los investigación en oftalmología en Honduras. Recuperado
dos. A menudo, un ojo puede estar más perjudicado que de (Rojas, Barahona, Alvarado, & Alger, 2014) donde
el otro. se menciona que “la catarata, opacificación total o
parcial del cristalino, es la principal causa de ceguera y
Según la organización mundial de la salud la cataratas
deficiencia visual grave siendo una causa tratable”. El
esta entre las principales causas de la visión deficiente
diagnóstico se realiza por observación directa de la
en el mundo en conjunto con la glaucoma, opacidad de
opacidad, en una clínica oftalmológica o en el hogar
la córnea, errores de refracción, tracoma, entre otras
con una linterna de mano.
(“Evolución de las cataratas: tipos, diagnóstico y
tratamiento - Meditip,” n.d.). TIPOS DE CATARATA
Puede presentarse en el cristalino tres tipos de catarata

Normalmente, la lente es transparente. Deja atravesar la
según la ubicación donde aparece, inicialmente tenemos
luz hasta el fondo del ojo, permitiendo la visión nítida
la catarata nuclear la cual aparece en el núcleo del
de imágenes. Si algunas partes de la lente están
cristalino y es el tipo de catarata más frecuente y se
nubladas (opacas), la luz no puede atravesar las
asocia normalmente al envejecimiento y puede producir
manchas nubladas.
un fenómeno llamado segunda visión. Posteriormente
tenemos la catarata subcapsular cuyo tipo de catarata
afecta en la parte posterior del cristalino, es la catarata
más común en diabéticos o en personas que utilizan
cortico esteroides o trauma ocular. Finalmente tenemos
la catarata cortical, esta afecta los bordes del cristalino,
está relacionada con la edad avanzada tal como la
catarata nuclear como también a la exposición al sol y a
la diabetes.
Figura 1.
(“¿Qué son las cataratas y por qué se originan? - Hospital Intermutual

de Levante. (n.d.). Retrieved July 22, 2019”)
Con el paso del tiempo, estas manchas normalmente se

agrandan y se forman otras. A medida que pasa menos Figura 2.
luz a través de la lente, la visión se vuelve borrosa o
nublada. Cuanto más se nubla la lente, más perjudica a (“Evolución de las cataratas: tipos, diagnóstico y tratamiento -
la vista. Normalmente esta enfermedad se empieza a Meditip,” n.d.)
desarrollar y se empieza a notar algo de opacidad del
cristalino a los 50 años de edad, suele ser bilateral y por Según la causa por la cual aparece, tenemos la catarata
lo general es peor en uno de los ojos (Marcello Furtado senil cuyo tipo de catarata son las más frecuentes y
Van Lansingh Fernando Yaacov Peña Mariano Yee están vinculadas por la edad.
Melgar Fernando Barría, n.d.). Las cataratas metabólicas son aquellas que aparecen
asociadas a enfermedades metabólicas, la más frecuente
La detección de enfermedades crónicas en el cuerpo de las cuales es la Diabetes Mellitus. Adicionalmente
humano se ha convertido en un camino largo y tenemos la catarata congénita, es aquella que están
complejo, para las personas que la sufren los cuales se presentes al nacer o que se desarrollan durante los
someten a costosos procesos quirúrgicos que muchas primeros meses de vida. Su aparición puede asociarse
personas de bajos recursos desisten en intentar en llevar con condiciones genéticos o bien con alguna
a cabo dichos procesos y solo esperan el día que la enfermedad sufrida por la madre durante el embarazo,
como rubeola o la toxoplasmosis. Por otra parte, entrada, es decir, una imagen que ingresa el usuario.
tenemos la catarata que se producen tras un La cual es objeto de comparación con el gran la
traumatismo ocular y es llamada catarata traumática. diversidad de datos, aglomerada en el software.
Finalmente, la catarata toxica se asocia al uso crónico o
al abuso de algunos fármacos o tóxicos, siendo los
corticoides el elemento casual más frecuente.
METODOLOGÍA
Tratamiento de las imágenes
Pero nos podemos hacer una pregunta ¿existe otros
tipos de cataratas a parte de las ya mencionadas? Y la El procesamiento de imágenes, “tiene como objetivo
respuesta es que si, aunque la mayoría de las cataratas mejorar el aspecto de las imágenes y hacer más
están relacionadas con el envejecimiento. Estos tipos de evidentes en ellas ciertos detalles que se desean hacer
catarata son: notar.” VI. PROCESAMIENTO DE IMÁGENES.
(n.d.). En este punto nuestro recurso principal son los
La catarata secundaria se puede formar después de una
datos, es decir, las imágenes. Por lo tanto, debemos
cirugía para otros problemas de los ojos, tal como el
asegurarnos, de tener un conjunto de datos formidable,
glaucoma. Las cataratas también se pueden desarrollar
limpio y coherente.
en personas que tienen otros problemas de salud, como
la diabetes. A veces las cataratas están relacionadas al Aumento de datos
uso de esteroides y la catarata por radiación que como
su nombre lo indica se puede desarrollar después de Por la escasa diversidad de datos, se usa data
estar expuesto a ciertos tipos de radiación. augmentation que, como lo indica su nombre nos
permite aumentar nuestra variedad de datos. El aumento
PROBLEMÁTICA de datos es una forma de crear nuevos "datos" con
diferentes orientaciones. Los beneficios de estos son
Para empezar uno de los problemas que tienen las dos: la primera es la capacidad de generar "más datos" a
personas de Colombia para realizar los exámenes partir de datos limitados y, en segundo lugar, evita el
correspondientes acerca de las cataratas oculares, es ajuste excesivo. Data Augmentation Experimentation
que muchas veces no tienen los recursos necesarios - Towards Data Science. (n.d.).
para efectuar este diagnóstico. Igualmente, otros
individuos no lo hacen, porque es un proceso que toma En nuestro proyecto usamos dos técnicas las cuales
tiempo. Habitualmente para ejecutar una prueba para son:
la detección de esta enfermedad ocular, en primer Dar la vuelta y rotación
lugar, tienes que pedir cita. Muchas veces el proceso
citación puede tardar un poco, motivo por el cual, las Flip – Dar la vuelta: Puedes voltear las imágenes
personas desisten de realizarlo. En segundo lugar, el horizontal y verticalmente. Algunos marcos no
proceso del examen y la entrega de los resultados, proporcionan una función para voltear verticalmente.
generalmente tienen otro gran lapso para su Pero, un giro vertical es equivalente a rotar una imagen
otorgarlos. Sin embargo, a pesar de estas pequeñas 180 grados y luego realizar un giro horizontal.
circunstancias que son menores, una de las principales
es que las poblaciones afectadas no conocen cuando
deberían hacer el chequeo por parte de un
oftalmólogo. Esto se debe porque no hay campañas
para concientizar e informar a las personas de este tipo
de enfermedades, para así mismo poder controlarlas a
tiempo.
PROPUESTA
Con la ayuda de la visión artificial, que es “una

disciplina científica que incluye métodos para adquirir,
procesar y analizar imágenes del mundo real con el fin
de producir información que pueda ser tratada por una
máquina.” CONTAVAL. (n.d.). Retrieved July 22, 2019.
Se planteó un software que a través de grandes
conjuntos de datos o es otras palabras datasets,
predice si el ojo de un individuo posee catarata ocular
o no. Sin embargo, esto va en conjunto con una
rotación, pasando de estar de 0° a 15°.

Matemáticamente deducimos o relacionamos con una
nueva distancia que se origina, y para hallar una nueva
distancia que no conocemos, nos apoyamos gracias a
las identidades trigonométricas. Como lo son seno θ ,
cosenoθ , tangente θ .
Matemáticamente expresamos:
Figura 4
Figura 3.
Fuente: Propia
Fuente: Propia
En la figura 3 observamos lo que sucede al realizar la

técnica de dar la vuelta o “flip”, en este caso hacia la
derecha, con 15 grados. La imagen original cambia su
h=¿? Matemáticamente rotar, dar vuelta tiene relación

debido a que desplazan la imagen con el mismo
θ=15° objetivo. Generar más información
h=Senθ∗Hipotenusa Dataset;
El conjunto de datos es el recurso más importante de

h
Senθ= un proyecto puesto que este es la base, y el soporte
hipotenusa fundamental del trabajo.
h Se obtuvieron, aproximadamente 2000 imágenes,

Sen(15 °)=
hipotenusa como principal fuente internet, de algunos sitios como
kaggle, y en las imágenes de Google.
Así hallaríamos la incógnita “h” y podríamos dar la
vuelta a las imágenes El conjunto de datos para entrenar a la red neuronal
estará divido en dos carpetas, en la primera carpeta
Rotation - Rotación: Una cosa clave para tener en encontraremos las imágenes de ojos sin cataratas y en
cuenta sobre esta operación es que las dimensiones de la segunda carpeta encontraremos, imágenes de ojos
la imagen pueden no conservarse después de la con cataratas, debido a la insuficiencia de datos para
rotación. Si su imagen es un cuadrado, girarlo en clasificarlos por tipos. Nos limitamos a decir si posee o
ángulo recto conservará el tamaño de la imagen. Si es no la enfermedad ocular.
un rectángulo, girarlo 180 grados mantendría el
tamaño. La rotación de la imagen en ángulos más finos Limpieza de la imagen
también cambiará el tamaño final de la imagen. En algunas ocasiones el tratamiento de las imágenes es
complicado debido a las diferentes distorsiones y
variables que podemos encontrar en los datos. Si
jugamos con los datos, junto con estas variables,
nuestros resultados podrían variar y confundir a la red

neuronal. Lo que conllevaría a que prediga mal
Por eso, es muy importante realizar el proceso de

limpieza en las fotos, para reducir el ruido en la
imagen, es decir, los factores que no necesitamos que
evalué nuestro algoritmo.
Figura 7, imagen a escala de grises como una matriz
Fuente: Propia
Figura 5:
Ojo con catarata ocular
Fuente: Propia
Figura 8
Como podemos apreciar en la imagen, el ruido de esta
imagen puede lograr confundir a la red neuronal y Luego aplicaremos un filtro a la imagen como una
hacer que ese destello de luz, provocado por el flash, o máscara de convolución, que aplicada destacan los
una iluminación externa, y que finalmente altere los pixeles candidatos e inhiben el resto. El filtro gaussiano
resultados. simula una distribución gaussiana bivariante donde el
resultado será un conjunto de valores entre 0 y 1. Para
Cada una de las imágenes de ojos con y sin cataratas se transformar la matriz en una matriz de números enteros
presentarán como una matriz H la cual se divide toda la matriz por el menor de los valores
obtenidos.
H=M ∈ R m× n.
Antes de realizar cualquier proceso, de filtración
debemos transferir la imagen original a una escala de
grises. Cuando se convierte una imagen con los tres
canales originales (R, G, B) se elimina la información
de matiz y saturación mientras conserva la luminancia.
Para trabajar los filtros de supresión de ruidos
Figura 9, imagen con filtro gaussiano
Fuente: Propia
Matemáticamente el filtro gaussiano, se representa de

la siguiente manera:
2 2
−i + j
h ( i , j )=e 2 ×s
2
(1)
Figura 6, imagen original g(i , j )
H ( i, j )= (2)
Fuente: Propia mini , j (h (i, j ))
Figure 6, representación de la matriz de una imagen 1 filtros de pase alto: Su objetivo es resaltar las zonas
de mayor variabilidad eliminando lo que sería la
Debido que debemos pasar a escala de grises, lo que
componente media, precisamente la que detectan los
haremos es igual cada uno de los canales: R, G, B a 1
filtros de paso bajo. Por otra parte, la respuesta de
cada pixel está contaminada por la de los pixeles
vecinos ya que, considerando la superficie terrestre Figura 10, Introduction to Deep Learning: What Are
como lambertiana, la radiación reflejada por un pixel Convolutional Neural Networks? Video - MATLAB.
se reparte hacia los pixeles vecinos. Los filtros de paso (n.d.).
alto consiguen también eliminar en parte esta
contaminación. Técnicas de filtrado. (n.d.). La capa de convolución:
2 Filtros direccionales: Se utilizan para detectar La capa de convolución es el bloque de construcción

estructuras que siguen una determinada dirección en central de la CNN. Lleva la porción principal de la carga
el espacio resaltando el contraste entre los píxeles computacional de la red.
situados a ambos lados de la estructura. Técnicas de Esta capa realiza un producto de puntos entre dos
filtrado. (n.d.). matrices, donde una matriz es el conjunto de
Entrenamiento de los datos parámetros que se pueden aprender, también
conocido como núcleo, y la otra matriz es la parte
Para el entrenamiento de los datos, entramos en el restringida del campo receptivo. El núcleo es
concepto de las redes neuronales convolucionales, es espacialmente más pequeño que una imagen, pero es
un tipo de red neuronal artificial donde las neuronas más profundo. Esto significa que, si la imagen está
corresponden a campos receptivos de una manera muy compuesta por tres canales (RGB), la altura y el ancho
similar a las neuronas en la corteza visual primaria (V1) del núcleo serán espacialmente pequeños, pero la
de un cerebro biológico. Sin embargo, son similares a profundidad se extenderá hasta los tres canales.
las redes neuronales multicanal, su principal ventaja es
que cada parte de la red se le entrena para realizar una Matemáticamente
tarea, esto reduce significativamente el número de En su forma más general, una convolución es una
capas ocultas, por lo que el entrenamiento es más operación aplicada a dos funciones con números reales
rápido. como argumentos. Se define la operación de
Las redes neuronales convolucionales son muy convolución mediante la siguiente expresión
potentes para todo lo que tiene que ver con el análisis matemática:
de imágenes, debido a que son capaces de detectar
características simples como por ejemplo detención de s ( t ) =∫ x ( a ) w (t−a ) da
bordes, líneas, etc. y componer en características más
complejas hasta detectar lo que se busca. Red Comúnmente la operación de convolución se simboliza
Neuronal Convolucional CNN - Diego Calvo. (n.d.). con un asterisco:
Estructura de la red neuronal convolucional s ( t ) =( x∗w )( t )

Las redes neuronales convolucionales están El primer término la “x”, se denomina frecuentemente
constituidas por 3 diferentes tipos de capas: entrada, mientras que el segundo “w”, se llama kernel.
A la salida o resultado de la operación o convolución se
1. Una capa convolucional, que es la que le da suele llamar feature map
el nombre a la red neuronal
2. Una capa de reducción o en otros términos La capa de reducción – o pooling:
de pooling, la cual va a reducir la cantidad de
parámetros y quedarse con las características La capa de reducción o pooling se coloca generalmente
más comúnes. después de la capa convolucional. Su utilidad principal
3. Una capa clasificadora conectada, la cual nos radica en la reducción de las dimensiones espaciales
va a dar el resultado final de la red (ancho x alto) del volumen de entrada para la siguiente
capa convolucional. No afecta a la dimensión de
profundidad del volumen. La operación realizada por
esta capa también se llama reducción de muestreo, ya
que la reducción de tamaño conduce también a la
pérdida de información.
La operación que se suele utilizar en esta capa es max-

pooling, que divide a la imagen de entrada en un
conjunto de rectángulos y, respecto de cada subregión,
se va quedando con el máximo valor.
Figura 13, arquitectura resnet
Cada “bloque” ResNet consta de una serie de capas y

un mapeo de identidad que agrega una entrada de
bloque a la salida. Esta operación de “adición” se
realiza elemento por elemento. Y si la entrada y la
salida son de diferentes tamaños, se pueden utilizar
técnicas de relleno cero o de proyección (a través de
convoluciones de 1×1) para crear las dimensiones
correspondientes.
Figura 11, Redes neuronales convolucionales con Funciones de activación:

TensorFlow. (n.d.). La función de activación se encarga de devolver una
La capa clasificadora: salida a partir de un valor de entrada, normalmente el
conjunto de valores de salida en un rango determinado
Al final de las capas convolucional y de pooling, las como (0,1) o (-1,1).
redes utilizan generalmente capas completamente
conectados en la que cada pixel se considera como una Se buscan funciones que las derivadas sean simples,
neurona separada al igual que en una red neuronal para minimizar con ello el coste computacional.
regular. Esta última capa clasificadora tendrá tantas Tipos:
neuronas como el número de clases que se debe
predecir. Sigmoid – Sigmoide
La función sigmoide transforma los valores

introducidos a una escala (0,1), donde los valores altos
tienen de manera asintótica a 1 y los valores muy bajos
tienden de manera asintótica a 0.
1
f (x)=
1−e−x
Figura 12, representación de la capa de salida

ReLU – Rectified Lineal Unit
Arquitectura de la red neuronal convolucional:
La función ReLU transforma los valores introducidos
ResNet: Los desarrolladores de ResNet, propusieron un
anulando los valores negativos y dejando los positivos
remedio: en lugar de tratar de aprender a partir de
tal y como entran.
mapeos subyacentes de x y H (x), es posible aprender
la diferencia entre los dos, que es el “residuo” y,
f ( x )=max ( 0 , x )= 0 for x <0
posteriormente, ajustar el último a la entrada. {
x for x ≥ 0
Supongamos que el residuo es F (x) = H (x) -x. Ahora
nuestra red intenta aprender de F (x) + x. Softmax – Rectified Lineal Unit
Esto dio origen a los famosos bloques de ResNet (red La función Softmax transforma las salidas a una
residual): representación en forma de probabilidades, de tal
manera que el sumatorio de todas las probabilidades
de las salidas de 1.
ez j
f (z) j= k
∑ ez k
k=1
Está es la composición de la red neuronal

convolucional trabajada en el proyecto de detección de
las cataratas oculares
Implementación:
Modelo Matemático:
Red Neuronal Convolucional
G [ m, n ] =( f∗h ) [ m , n ] =∑ ∑ h [ i , j ] f [ m−i , n− j ] Figura 15, Convolución

i j
Capa de reducción
Donde la entrada de la imagen esta denotada por f y
nuestro kernel por h. Los índices de la filas y columnas La capa de agrupación (o a veces llamada submuestreo)
de la matriz son marcadas con m y n respectivamente hace que la CNN sea un poco invariante en términos de
salida de convolución. Hay dos mecanismos de
agrupación diferentes utilizados en la práctica
(agrupación máxima y agrupación promedio). Nos
referiremos a la agrupación máxima como agrupación,
ya que la agrupación máxima se usa ampliamente en
comparación con la agrupación promedio. Más
precisamente, la operación de agrupación, en una
posición dada, genera el valor máximo de la entrada,
que cae dentro del núcleo.
Figure 14 CNN
H j ,k =max ⁡{x i+ k−1 , j+l−1 ∀ 1≤ k ≤ m y 1≤ 1 m}
Fuente: Propia
Pooling max = max
Capa de convolución
m ancho y alto del núcleo
La operación de convolución genera un valor alto para
una posición dada si la característica de convolución h salida de la convolución
está presente en esa ubicación; de lo contrario, genera
x entrada
un valor bajo. Más concretamente, en una posición dada
del núcleo de convolución, tomamos la multiplicación w núcleo de convolución
por elementos de cada valor de celda del núcleo y el
valor de píxel de la imagen correspondiente que se Arquitectura RESNET
superpone a la celda del núcleo, y luego tomamos la
suma de eso. Los desarrolladores de ResNet, propusieron un
remedio: en lugar de tratar de aprender a partir de
m m mapeos subyacentes de x y H (x), es posible aprender la
H i , j=∑ ∑ wk , l X i +k −1, j+l−1 diferencia entre los dos, que es el “residuo” y,
k=1 l=1 posteriormente, ajustar el último a la entrada.
Donde: Supongamos que el residuo es F (x) = H (x) -x. Ahora

nuestra red intenta aprender de F (x) + x.
m ancho y alto del núcleo
Funciones de activación
h salida de la convolución
Sigmoide
x entrada
1
f (x)=
w núcleo de convolución 1−e−x
RELU
f ( x )=max ( 0 , x )= 0 for x <0

realizó varios entrenamientos para corrección de
{
x for x ≥ 0 errores.
Conocimientos: Las redes neuronales artificiales son

Softmax
capaces de crear patrones, reconocer información o
resolver enigmas complejos, pudiendo ser de gran
ez j
f (z) j= k
utilidad para sectores como la salud.
∑ ez k
Es importante el estudio de estos grandes temas para
k=1 resolver grandes problemas que tenemos en la
actualidad, logrando automatizar muchos servicios, y
generar más alcance en los proyectos.
Dataset
Conclusiones: Con la ayuda de técnicas de
procesamiento de imágenes, visión artificial, el proceso
de diagnóstico de enfermedad ocular es mucho más
simple y efectivo
Futuro: Realizaremos las correcciones debidas al

proyecto con el fin de sacar el software 99% funcional,
Resultados
añadiendo otros factores que nos hacen falta, como
más datos, más conocimiento en el área de aprendiza
profundo y mayor práctica.
Referencias:
[1] Evolución de las cataratas: tipos, diagnóstico y

tratamiento - Meditip. (n.d.). Available:
https://www.meditip.lat/salud-de-la-a-
z/oftalmologia/cataratas/
[2] Marcello Furtado Van Lansingh Fernando Yaacov

Peña Mariano Yee Melgar Fernando Barría, J. C. (n.d.).
Guía práctica de Catarata Senil para Latinoamérica.
Available: http://vistalatinnetwork.com/wp-
content/uploads/2017/08/Guia_practica_catarata_seni
l_2012.pdf
[3] Rojas, N. H., Barahona, M., Alvarado, D., & Alger, J.

(2014). REVISIóN BIBLIOGRÁFICA CATARATA, UNA
CAUSA PREVENIBLE DE CEGUERA, y LAS LÍNEAS
PRIORITARIAS DE INVESTIGACIÓN EN OFTALMOLOGÍA
EN HONDURAS. In REV MED HONDUR (Vol. 82).
Available https://scholar.google.es/
[4] Tipos de cataratas - Clínica Barraquer. (n.d.).

Available: https://www.barraquer.com/noticias/tipos-
de-cataratas/
Figura 16. Predicción
[5] Ponce-Rivera, E., Villalobos-Castaldi, F., Miroslaba,
Fuente: Propia D.-R., Camero-Berrones, P. Y., & Gabriela, R. (2017).
Procesamiento y análisis de imágenes digitales de
Los resultados de validación mostraron un 85% de fondo de ojo para facilitar el tele-diagnóstico oportuno.
precisión, aunque todavía falta por corregir la red In Artículo Revista de Cómputo Aplicado Septiembre
neuronal convolucional. Debido a la ausencia de datos. (Vol. 1). Available: www.ecorfan.org/spain
Se entrenó la red neuronal con 10 épocas, y se usaron
funciones de activación como RELU, sigmoide. Tardó [6] Liu, X., Jiang, J., Zhang, K., Long, E., Cui, J., Zhu, M.,
aproximadamente 65 minutos en entrenarse. Se … Lin, H. (2017). Localization and diagnosis framework
for pediatric cataracts based on slit-lamp images using
deep features of a convolutional neural network. PloS

One, 12(3), e0168606. Available:
https://doi.org/10.1371/journal.pone.0168606
[7] Función de activación en redes neuronales. (2018).

Diego Calvo. Available:
http://www.diegocalvo.es/funcion-de-activacion-
redes-neuronales/
[8] Localization and diagnosis framework for pediatric

cataracts base don slit-lamp images using deep
features of a convolutional neural network. (2017).
Available: https://journals.plos.org/plosone/article?
id=10.1371/journal.pone.0168606
[9] Automatic diagnosis of imbalanced ophthalmic

images using a cost-sensitive deep convolutional neural
network. (2017). Available: https://biomedical-
engineering-
online.biomedcentral.com/articles/10.1186/s12938-
017-0420-1
[10] Red Neuronal Convolucional (2017), Diego Calvo.

Available: http://www.diegocalvo.es/red-neuronal-
convolucional/
[11] ¿Cómo funcionan las Convolutional Neural

Networks? Visión por computador. (2018). Available:
https://www.aprendemachinelearning.com/como-
funcionan-las-convolutional-neural-networks-vision-
por-ordenador/
[12] Redes Residuales. (2015) Available:

https://en.wikipedia.org/wiki/Residual_neural_networ
k
[13] West, S. K., Rosenthal, F., Newland, H. S., & Taylor,

H. R. (1988). Use of photographic techniques to grade
nuclear cataracts. Investigative Ophthalmology &
Visual Science, 29(1), 73–77. Available:
http://www.ncbi.nlm.nih.gov/pubmed/3335435

Detection of Ocular Cataracts With Convolutional Neural Networks

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Detection of Ocular Cataracts With Convolutional Neural Networks

Uploaded by

Copyright:

Available Formats

DETECTION OF OCULAR CATARACTS WITH CONVOLUTIONAL NEURAL NETWORKS

Detection of ocular cataracts with convolutional neural networks

Accepted: July_th 2019

1. Tnlgo Desarrollo de Software, Universidad Surcolombiana, Neiva – Huila, u20182171975@usco.edu.co

INTRODUCCIÓN enfermedad deje consecuencias. Unidad de

Puede presentarse en el cristalino tres tipos de catarata

(“¿Qué son las cataratas y por qué se originan? - Hospital Intermutual

Con el paso del tiempo, estas manchas normalmente se

Con la ayuda de la visión artificial, que es “una

rotación, pasando de estar de 0° a 15°.

En la figura 3 observamos lo que sucede al realizar la

h=¿? Matemáticamente rotar, dar vuelta tiene relación

El conjunto de datos es el recurso más importante de

h Se obtuvieron, aproximadamente 2000 imágenes,

nuestros resultados podrían variar y confundir a la red

Por eso, es muy importante realizar el proceso de

Figura 7, imagen a escala de grises como una matriz

Ojo con catarata ocular

Figura 9, imagen con filtro gaussiano

Matemáticamente el filtro gaussiano, se representa de

2 Filtros direccionales: Se utilizan para detectar La capa de convolución es el bloque de construcción

Estructura de la red neuronal convolucional s ( t ) =( x∗w )( t )

La operación que se suele utilizar en esta capa es max-

Figura 13, arquitectura resnet

Cada “bloque” ResNet consta de una serie de capas y

Figura 11, Redes neuronales convolucionales con Funciones de activación:

La función sigmoide transforma los valores

Figura 12, representación de la capa de salida

Está es la composición de la red neuronal

Red Neuronal Convolucional

G [ m, n ] =( f∗h ) [ m , n ] =∑ ∑ h [ i , j ] f [ m−i , n− j ] Figura 15, Convolución

Donde: Supongamos que el residuo es F (x) = H (x) -x. Ahora

f ( x )=max ( 0 , x )= 0 for x <0

Conocimientos: Las redes neuronales artificiales son

Futuro: Realizaremos las correcciones debidas al

[1] Evolución de las cataratas: tipos, diagnóstico y

[2] Marcello Furtado Van Lansingh Fernando Yaacov

[3] Rojas, N. H., Barahona, M., Alvarado, D., & Alger, J.

[4] Tipos de cataratas - Clínica Barraquer. (n.d.).

deep features of a convolutional neural network. PloS

[7] Función de activación en redes neuronales. (2018).

[8] Localization and diagnosis framework for pediatric

[9] Automatic diagnosis of imbalanced ophthalmic

[10] Red Neuronal Convolucional (2017), Diego Calvo.

[11] ¿Cómo funcionan las Convolutional Neural

[12] Redes Residuales. (2015) Available:

[13] West, S. K., Rosenthal, F., Newland, H. S., & Taylor,

You might also like