You are on page 1of 5

Desempenho de Redes Neurais Artificiais na Análise

e Projeto de Acopladores a Fibra


MLP (Multilayer Perceptron) e RBF (Radial Basis Function)

Rafael Rodrigues dos Santos Andrade e Igor Maia A. Dourado-Sisnando e V. F. Rodriguez-Esquerre


Teles Ruffini Departamento de Engenharia Elétrica
Curso de Controle e Automação de Processos, Universidade Federal da Bahia.
Departamento de Engenharia Química – Universidade Salvador, Bahia.
Federal da Bahia, Salvador, Bahia. anderson.sisnando@ufba.br, vitaly.esquerre@ufba.br
rafael.rodrigues07@hotmail.com, iniffur@gmail.com

Resumo —Neste artigo foram analisados e projetados


II. ACOPLADORES DIRECIONAIS
acopladores direcionais baseados em fibras ópticas utilizando
redes neurais artificiais (RNA) do tipo Multilayer Perceptron
Acoplador direcional é um dispositivo fotônico, que possui
(MLP) e Radial Basis Function (RBF). Os acopladores
em sua disposição estruturas de guiamento paralelas muito
consistem de duas fibras ópticas com núcleos de sílica dopada
próximas com o objetivo de controlar as trocas de energias. É
com germânio e casca de sílica pura.
um dispositivo fundamental em circuitos ópticos e no projeto
Keywords—Redes Neurais; Radial Basis Function; Multilayer
de dispositivos fotônicos [1],[2].
Perceptron; Feedforward; Acoplador Direcional; Fibra Óptica; A potência de entrada aparecerá nas saídas do acoplador e
a fração de potência em cada porta dependerá dos parâmetros
ópticos (índices de refração do núcleo e da casca, entre outros)
I. INTRODUÇÃO e dos parâmetros geométricos (largura e afastamento entre as
guias, distância entre os núcleos, entre outros) de cada
Os acopladores direcionais são fundamentais para acoplador [1].
circuitos ópticos seja para divisão de potência, multiplexação e Estes dispositivos podem ser construídos a partir de guias
demultimexação de sinais ou na aquisição de amostras [1], [2]. de ondas. Qualquer que seja a faixa de operação, os modelos
Para realizar a análise, modelagem e simulação desses destas estruturas são obtidos a partir das equações de Maxwell
dispositivos podem ser utilizados métodos numéricos ou e da geometria e composição do material das estruturas de
analíticos [2], entretanto, para utilizar esses métodos é guiamento envolvidas [2].Outras características desses
necessário ter conhecimento avançado na área de dispositivos são: o fator de acoplamento, o isolamento e a
eletromagnetismo, grandes recursos computacionais e longo diretividade.
tempo de processamento. Por isso, o uso de RNA se torna uma
ótima opção para realizar esses procedimentos: não necessitam A. Acoplador Direcional a Fibra Óptica
de grandes recursos computacionais e tem um grande poder de Neste trabalho considera-se um acoplador formado
aproximação e de generalização, simplificando o processo de por guias de ondas constituídos de uma mistura de dióxido de
análise [3], [4]. silício com dióxido de germânio numa proporção de 86,5% e
Neste artigo implementaram-se redes neurais RBF e 13,5% respectivamente. Para determinar os índices de refração
MLP e o desempenho das mesmas foi avaliado de forma foram utilizadas as equações de Sellmeier [3].
detalhada. Foi verificado que as duas podem ser aplicadas na
análise e síntese de acopladores direcionais baseados em fibras Saída
ópticas.
O artigo está organizado da seguinte forma: o
acoplador direcional e seu funcionamento são apresentados na
seção II. Em seguida, é apresentada a expressão aproximada
para calcular a distância de acoplamento, distância onde
ocorre a transferência de energia entre os guias.
Posteriormente, são apresentadas as definições e conceitos das
RNA e suas aplicações. Por fim, são mostrados os resultados
numéricos obtidos pelas redes neurais MLP e RBF juntamente
com as principais conclusões. Entrada

Figura 1 Acoplador Direcional Baseado em Fibra Óptica [4]


A troca de energia em um acoplador direcional à fibra concluído e apresentado). Um exemplo de arquitetura de uma
óptica ocorre quando os núcleos das fibras são aproximados, o rede neural pode ser visualizada na Figura 2.
suficiente para que o campo evanescente dos modos de uma Pesos
das fibras excite modos de propagação na outra fibra, Neurônios
permitindo a transferência de energia entre elas [2]. de Saída
Essa transferência total de energia entre as duas fibras
ópticas ocorre após uma distância de propagação denominada
distância de acoplamento (Lc). O Lc depende das Entradas Saídas
características ópticas e geométricas do acoplador e existem
vários dispositivos baseados em fibra óptica para
processamento de dados [5]. Em alguns casos existem
expressões analíticas aproximadas para a previsão da distância
de acoplamento e este pode ser obtido utilizando-se [6], Neurônios
Intermediários
𝜋. 𝑎2 . 𝑛1 . 𝑉 2 . 𝐾1 . (𝑊) Figura 2. Arquitetura de uma Rede Neural Artificial
𝐿𝐶 = 𝑑 (1)
2. 𝜆. 𝑈 2 . 𝐾0 . (𝑊. )
𝑎 A. Modelo Matemático de um Neurônio Artificial
2 2 1/2 2 1/2
onde, 𝑊 = 𝑎𝑘0 (𝑛𝑒𝑓𝑓 − 𝑛1 ) e 𝑈 = 𝑎𝑘0 (𝑛22 − 𝑛𝑒𝑓𝑓 ) , O neurônio artificial é uma estrutura logico
sendo a o raio e d o afastamento entre as fibras, 𝑘0 o número matemática inspirada no neurônio biológico. O k-ésimo
de onda dado por 2𝜋⁄𝜆, 𝜆 o comprimento de onda e 𝑛1 e 𝑛2 neurônio artificial pode ser modelado com os seguintes
os índices de refração dos núcleos e da casca, respectivamente. elementos: entradas (𝑥𝑗 representa a saída do neurônio j), que
K1 e K0 são funções de Bessel. substituem os dendritos; sinapse (ligação saída entrada-entrada
Este tipo de dispositivo é muito utilizado em entre o neurônio j e o neurônio k, caracterizada pelo peso
divisores de potência, polarizadores, multiplexadores e outros sináptico 𝑤𝑘,𝑗 , o qual pode ser excitatório ou inibitório,o que
dispositivos óticos para compartilhar energia [7].
se representa através de valores positivos ou negativos,
respectivamente); somador (soma ponderada, 𝑢𝑘 , das entradas
III. REDES NEURAIS ARTIFICIAIS do neurônio k pelos respectivos pesos sinápticos); função de
ativação (F), que substitui o limiar de disparo no neurônio
As redes neurais artificiais (RNA) são sistemas biológico, bias (𝑏𝑘 , constante adicionada à soma ponderada,
paralelos distribuídos compostos por unidades de
𝑢𝑘 ) e a saída (𝑦𝑘 ), representando o axônio [1], [9].
processamento simples (nós) que calculam determinadas
funções matemáticas (geralmente não-lineares) [8]. Esses A Figura 3 mostra um neurônio artificial e as
sistemas são formados por uma ou mais camadas interligadas Equações (2) e (3) representam o somador e a saída,
por conexões que na maioria dos modelos possuem pesos. respectivamente.
A inspiração para esse sistema computacional é a
estrutura neural de organismos inteligentes. Na arquitetura das
RNA podemos citar a existência de Pesos, que armazenam o
conhecimento representado no modelo e servem para ponderar
a entrada recebida por cada neurônio da rede. O
comportamento inteligente dessa ferramenta deriva das
interações entre as unidades de processamento da rede.
Um conjunto de procedimentos bem-definidos para
adaptar os parâmetros de uma RNA para que a mesma possa
aprender uma determinada função é chamado de algoritmo de
aprendizado [8].
Pela sua capacidade de aprender e se adaptar ao
ambiente em que está operando e a capacidade de generalizar
situações, esse recurso computacional torna-se muito aplicável
nas áreas de processamento de sinais, reconhecimento de Figura 3. Modelo de um Neurônio Artificial [1]
padrões e controle de plantas industriais, entre outras
aplicações.
A arquitetura dessas redes normalmente é classificada (3)
em: camada de entrada (onde os padrões são apresentados à
rede), camada(s) intermediária(s) ou oculta(s)(onde é feita a (4)
maior parte do processamento, através das conexões
ponderadas) e camada de saída (onde o resultado final é
B. Multilayer Perceptron função de base radial. Realizando-se o somatório da saída de
Multilayer Perceptron é um modelo de rede neural cada neurônio da camada oculta (multiplicado por seu
que possui uma ou mais camadas ocultas. Essas camadas respectivo peso) e da bias (quando existente), obtém-se a saída
ocultas são responsáveis por capturar a não-linearidade dos da rede [13]. Matematicamente, a saída da camada oculta de
dados. As redes MLP possuem uma capacidade de aprender uma rede RBF pode ser dada pela Equação (4) - onde Ok é a
por exemplos, baseado na experiência (por correção de erro), saída, ck é o centro e σk é o raio do k-ésimo neurônio da
com base nos erros obtidos são realizados ajustes nos pesos camada oculta e k = 1,2,...,N, sendo N o número de neurônios
sinápticos com o intuito de diminuir o erro nas próximas ocultos e a da camada de saída (de função de transferência
iterações [7]. linear) pela Equação (5) – na qual Yj é a saída e ωj o vetor peso
Geralmente os algoritmos de treinamento são do tipo para o j-ésimo neurônio, Oj o vetor de saída do j-ésimo
supervisionado, para o qual são fornecidas as entradas e as neurônio oculto e j = 1,2,...M, sendo M o número de neurônios
saídas por um supervisor externo. Os algoritmos mais de saída [14].
utilizados são: Levenberg – Maquardt e o Backpropagation
Error.
Backpropagation é um algoritmo que possui diversas
variações e fornece um método computacional eficiente para o
treinamento de MLP, utiliza a retropropagação do erro que
consiste em duas etapas:
 Forward - ativa a rede a partir das entradas e
propaga para as saídas.
 FeedBack - utiliza a saída desejada calculada
pela rede para atualizar os pesos.
Levenberg – Maquardt é um algoritmo que utiliza um
treinamento em lote e consiste em um aperfeiçoamento do
método Gauss – Newton, esse método usa a informação da Figura 4. Arquitetura de uma Rede Neural Radial Basis Function [14]
derivada parcial de segunda ordem do índice de desempenho 𝑇
utilizado para corrigir os pesos. Este algoritmo é mais (
−[𝑋−𝐶𝑘 ] [𝑋−𝐶𝑘 ]
)
(4)
2𝜎2
eficiente do que retropropagação padrão e suas variações. 𝑂𝑘 = 𝑒 𝑘

C. Redes Feedforward Yj =ωjOj (5)


De acordo com [10] e [11] uma função contínua pode
ser arbitrariamente bem aproximada, com qualquer precisão Nesse tipo de rede, a camada de entrada conecta a
desejada não nula, por uma rede feedforward com somente rede ao seu ambiente, a camada intermediária (oculta) realiza
uma simples camada interna, onde cada unidade neural na uma transformação não linear do espaço de entrada para o
camada interna tem uma não-linearidade continua sigmoidal espaço oculto, normalmente de alta dimensionalidade,
[12]. transformando um conjunto de entradas não linearmente
Os seus neurônios estão dispostos de modo separáveis em um conjunto de saídas linearmente separáveis,
sequencial, seguindo um fluxo de informação da camada de os quais são classificados pela camada de saída [6].
entrada para a camada de saída. Não existe conexão entre
neurônios de uma mesma camada e cada neurônio é conectado E. Comparação de Redes Neurais Multilayer Perceptron e
com todos os neurônios da camada seguinte. Radial Basis Function
Realizando uma comparação entre as redes MLP e
D. Redes Radial Basis Function RBF percebe-se que ambas são aproximadoras universais de
Uma rede neural do tipo Radial Basis Function funções. Entretanto, existem várias diferenças entre elas. A
(RBF) é uma rede feedforward de apenas três camadas primeira consiste em sua arquitetura: enquanto a MLP pode
(entrada, oculta e saída) cuja função de ativação de cada possuir uma ou mais camadas ocultas, a RBF geralmente
neurônio da camada intermediária depende da distância de possui apenas uma camada intermediária.Geralmente, as redes
cada entrada xj a um ou mais ponto(s)central(is) c ou ck da RBF utilizam mais neurônios do que as do tipo MLP, sendo,
camada oculta (dependendo do número de neurônios na porém, criadas em menor tempo. Na MLP, a entrada da função
mesma) [4], sendo muito utilizada em controle, classificação de ativação é o produto interno dos vetores de entrada e seus
de problemas e aproximação de função, entre outros [6].A respectivos pesos, enquanto que na RBF o valor de ativação é
função de ativação mais comumente usada em redes do tipo dado em função da distância euclidiana entre os vetores de
RBF (Figura 4) é a gaussiana. Normalmente, o centro c (ou entrada e de pesos. A rede RBF separa os padrões de entrada
centros ck) e a largura σ são os parâmetros da função radial com hiperelipsóide, podendo desta forma construir
utilizada, e sua norma é tida como a distância euclidiana. aproximadores locais, o que a torna melhor em problemas
Na entrada de cada neurônio, a distância entre o bem-definidos. A MLP, porém, separa seus padrões de entrada
centro c do neurônio e o vetor de entrada é calculada, sendo a por hiperplanos, podendo assim construir aproximadores
saída desse neurônio calculada aplicando-se essa distância à
globais ,o que aumenta o seu poder de generalização, tornando casca de sílica pura, 𝑛1 e 𝑛2 . Esses índices são obtidos através
a MLP melhor em problemas mais complexos[8]. das equações de Sellmeier [1].
Os dados de treinamento ficaram contidos nos
intervalos: V < 2,405, λ [1,3µm, 1,6µm]; a[1,5µm, 2,0µm]; 𝑛2
IV. ANÁLISE E SÍNTESE DE ACOPLADORES DIRECIONAIS
[1,46498, 1,46817]; 𝑛1 [1,44379, 1,44726]; d[3,15µm,
UTILIZANDO REDES NEURAIS
9,2µm]; e a distância de acoplamento no intervalo 𝐿𝐶
[13,0067µm, 9248,79µm], mantendo os guias de onda obtidos
Neste trabalho foi realizada a análise e síntese de
em operação monomodo [1].
acopladores direcionais baseados em fibra óptica utilizando
Para encontrar a distância de acoplamento do
redes neurais, pela simplicidade, pouco tempo e recurso
acoplador baseado em fibras óptica utilizou-se um conjunto de
computacional – ao contrário de alguns métodos numéricos
399 amostras, das quais 329 foram usadas no treinamento e 70
como o método dos elementos finitos, que exigem grande
amostras, contidas no intervalo das amostras de treinamento,
conhecimento da teoria eletromagnética avançada, grande
separadas para testar a rede.
recurso e esforço computacional.
A rede MLP foi configurada para executar 4500
Para se realizar a análise e síntese desses dispositivos
iterações, a sua arquitetura foi constituída com duas camadas,
utilizando RNA é necessário fornecer entradas (parâmetros
possuindo a oculta 14 e a de saída 1 neurônio, a função de
ópticos e geométricos) para obter a saída desejada.
ativação usada foi a sigmoide e o algoritmo de treinamento foi
Para a análise do acoplador baseado em fibras ópticas
o Levenberg – Maquardt. A rede RBF, por sua vez foi
considerou-se a distância de acoplamento como variável de
configurada com 124 neurônios de função de ativação
saída, as variáveis ópticas (índices de refração da casca e do
Gaussiana em sua camada oculta, sendo treinada durante 22
núcleo e o comprimento de onda em operação) e geométricas
iterações. Os erros quadráticos médios apresentados pelas
(distância entre os núcleos e o raio da fibra) foram
consideradas as entradas, como mostra a Figura 5. redes MLP e RBF foram, respectivamente, 7,975x10-12 e
Para realizar a síntese do acoplador direcional à fibra 5,726x10-8.
Para determinar a distância entre os núcleos da fibra
óptica, foram considerados dois casos. O primeiro a variável
do acoplador à fibra óptica, primeiro problema de síntese,
de saída foi a distância entre os núcleos da fibra e todos os
utilizou-se um conjunto de 178 amostras, das quais 142 foram
outros parâmetros foram considerados as variáveis de entrada,
como mostrado na Figura 5.b. No segundo caso a saída foi o separadas para treinar a rede e 36 foram separadas para testar a
rede. A rede MLP foi configurada para executar 3500
raio da fibra e todos os outros parâmetros foram considerados
iterações, a sua arquitetura foi constituída com duas camadas,
como variáveis de entrada, como mostrado na figura 5.c.
possuindo a oculta 12 e a saída 1 neurônio, a função de
ENTRADAS SAÍDA
ativação usada foi a sigmoide e o algoritmo de treinamento foi
o Levenberg – Maquardt. A rede RBF, por sua vez foi
Índice de Refração do Núcleo (n1) configurada com 35 neurônios de função de ativação
Índice de Refração do Revestimento (n2) Rede Distância de
Comprimento de Onda (  ) Neural Acoplamento Gaussiana em sua camada oculta, sendo treinada durante 28
Raio do Núcleo (a) Artificial (Lc) iterações. Os erros quadráticos médios apresentados pelas
Separação entre as Fibras ( d ) redes MLP e RBF foram, respectivamente, 4,510x10-13 e
8,530x10-13.
(a)
Para determinar o raio das fibras, segundo problema
ENTRADAS SAÍDA
de síntese, utilizou-se um conjunto de 182 amostras separadas
Índice de Refração do Núcleo (n1) da seguinte maneira, 146 foram separadas para o treinamento
Índice de Refração do Revestimento (n2) Rede Separação
Comprimento de Onda (  ) Neural entre as
e 36 para o teste. A rede MLP foi configurada para executar
Distância de Acoplamento ( Lc) Artificial Fibras (d ) 3000 iterações, a sua arquitetura foi constituída por duas
Raio do Núcleo ( a ) camadas, possuindo a oculta 6, e a saída 1 neurônio, a função
de ativação usada foi a sigmoide e o algoritmo de treinamento
(b) foi o Levenberg – Maquardt. A rede RBF, por sua vez foi
ENTRADAS SAÍDA configurada com 25 neurônios de função de ativação
Gaussiana em sua camada oculta, sendo treinada durante 30
Índice de Refração do Núcleo (n1) iterações. Os erros quadráticos médios apresentados pelas
Índice de Refração do Revestimento (n2) Rede Raio do
Comprimento de Onda (  ) Neural Núcleo (a ) redes MLP e RBF foram, respectivamente, 1,313x10-13 e
Distância de Acoplamento ( Lc) Artificial 9,620x10-13.
Separação entre as Fibras ( d )
A comparação entre os resultados obtidos pelas redes
(c)
neurais e os resultados analíticos são apresentados na Figura 6.
Figura 5. Variáveis de Entradas e Saídas da Rede Neural para (a) predição da Todas as simulações foram realizadas utilizando-se
distância do acoplamento (b) síntese da separação entre as fibras e (c) síntese um computador com processador core i5 2310, 2,90 GHz de
do raio das fibras. [4] clock e 6 GB de RAM DDR3, 1.333 MHz, sistema
operacional Windows 7 Home Basic. As redes foram
Os acopladores baseados em fibras ópticas consistem implementadas no Mathematica® [13].
em duas fibras com núcleos de sílica dopada com germânico e
1,0 análise e síntese de acopladores direcionais baseados em fibra
óptica, para determinar a distância de acoplamento, o raio e a
0,8 RBF distância entre as fibras. Resultados satisfatórios foram
Distância de Acoplamento

MLP obtidos com um menor esforço computacional e muito mais


(Rede Neural) [cm]

y=x simples do que os métodos analíticos e numéricos


0,6
comunmente utilizados, como o dos elementos finitos,
mostrando conformidade com os resultados alcançados com
0,4
outros métodos.
Pode-se concluir que para a análise do acoplador
0,2 direcional baseado em fibra óptica ambas as redes, MLP e
RBF podem ser aplicadas. Os resultados obtidos pela rede
0,0 MLP foram ligeiramente melhores do que os obtidos pela rede
0,0 0,2 0,4 0,6 0,8 1,0
RBF.
Distância de Acoplamento (Analitico) [cm]
(a)
REFERÊNCIAS
9
[1] Anderson Dourado Sisnando, “Análise e síntese de dispositivos
8 RBF fotônicos utilizando redes neurais artificiais”, Dissertação de mestrado,
Distância entre as Fibras

MLP Universidade Federal da Bahia, Escola Politecnica, Departamento de


(Rede Neural) [m]

7 y=x Engenharia Elétrica, Salvador 2011.


[2] Carlos Fernando Rondina Mateus, André César da Silva, José Edimar
6 Barbosa Oliveira, “Construção de Acopladores Direcionais a Fibra
Óptica Birrefringente”, Divisão de engenharia Eletrônica Instituto
Tecnológico de Aeronáutica – ITA, São José dos Campos, Revista
5 Científica Periódica – Telecomunicações – Vol. 02 – Número 02 –
Setembro de 1999, Pag. 22-27.
4 [3] V. F. Rodríguez-Esquerre, A. Dourado-Sisnando, Fabricio G. S. Silva,
“Análise e Projeto de Acopladores Direcionais através de Redes Neurais
3 Artificiais”, In: MOMAG 2010, 2010,Vila Velha - ES. Anáis do
3 4 5 6 7 8 9 MOMAG 2010.
[4] A. Dourado-Sisnando, T. Abreu-Cerqueira, F. Simões Silva and V. F.
Distância entre as Fibras (Analitico) [m] Rodriguez-Esquerre, “An Efficient Tool Based on Artificial Neural
Netwrks for the Analysis and Design of Optical Fiber Directional
(b) Couplers”,Department of Electrical Engineering, Federal University of
1,9 Bahia, Salvador, Brazil, COMTEL 2012.
[5] Aida Araújo Ferreira, "Comparação de arquiteturas de redes neurais para
sistemas de reconhecimento de padrões em narizes artificiais",
RBF Dissertação de Mestrado, Universidade Federal de Pernambuco, Centro
1,8 MLP de Informática, Recife 2004.
(Rede Neural) [m]

y=x [6] Tuba Kurban and Erkan Besdok, “A Comparison of RBF Neural
Raio das Fibras

Network Training Algorithms for Inertial Sensor Based Terrain


1,7 Classification”, Geomatics Engineering, Engeneering Faculty, Erciyes
University, Turkey, Sensors 2009,9.
[7] K. Okamoto, Fundamentals of Optical Waveguides, Academic Pres, 2nd
Ed., 2005.
1,6
[8] Ludemir Braga e Carvalho, Redes Neurais Artificiais: Teoria e
Aplicações, LTC, 2000.
[9] Zsolt László Kovács, Redes Neurais Artificiais Fundamentos e
1,5 Aplicações, 4° Edição, Editora Livraria da Física, 2006.
1,5 1,6 1,7 1,8 1,9 [10] Hunt, K. J.; Sbarbaro, D.; Zbikowski, R.; Gawthrop, P. J. Neural
networks for control systems – A survey. Automatica, v. 28, n. 6, p.
Raio das Fibras (Analitico) [m]
1083-1112, Nov. 1992.
(c) [11] Hornik, K.; Stinchcombe, M.; White, H. Multilayer feedforward
networks are universal approximators. Neural Networks, v. 2, n. 5, p.
Figura 6. Comparação entre os resultados obtidos pelas redes neurais e os 359-366, 1989.
valores analíticos (a) predição da distância do acoplamento (b) síntese da [12] Paulo Marcelo Tasinaffo, “Estruturas de Integração Neural Feedforward
separação entre as fibras e (c) síntese do raio das fibras. Testadas em Problemas de Controle Preditivo”, Tese de Doutorado,
Instituto Nacional de Pesquisas Espaciais, São José dos Campos 2004.
[13] Mathematica Neural Networks Train And Analyze Networks To Fit
CONCLUSÃO YourData.pdf, September 2005.
[14] M. F. O. Hameed, S. S. A. Obayya, K. Al-Begain, A. M. Nasr, M. I.
Abo el Maaty, “Accurate radial basis function based neural network
Neste trabalho foram implementadas redes MLP e approach for analysis of photonic crystal fibers”, Opt Quant Electron, v.
RBF para modelar um acoplador direcional. Realizou-se uma 40, pp. 891-905, 2009.
comparação do desempenho das redes neurais MLP e RBF na

You might also like