Professional Documents
Culture Documents
Evrişim Çekirdeği Türleri - Basitleştirilmiş - Yazan Prakhar Ganesh - Veri Bilimine Doğru
Evrişim Çekirdeği Türleri - Basitleştirilmiş - Yazan Prakhar Ganesh - Veri Bilimine Doğru
Arama Aracı
Bu, bu ay üyelere özel son ücretsiz hikayeniz. Sınırsız erişim için yükseltin.
Kaydetmek
848 4
Özellik çıkarımı için elle yapılmış çekirdekler kullanmak yerine, Derin CNN'ler
aracılığıyla gizli özellikleri çıkarabilen bu çekirdek değerlerini öğrenebiliriz.
Geleneksel CNN'lerin çalışmasını daha fazla okumak için bu blogu öneririm.
Çekirdek ve Filtre
Bu konuya girmeden önce, 'çekirdek' ve 'filtre' terimleri arasındaki ayrımı netleştirmek
istiyorum çünkü birçok insanın bunları birbirinin yerine kullandığını gördüm. Bir
çekirdek, daha önce açıklandığı gibi, ilgili özellikleri çıkarmak için girdi ile çarpılan
bir ağırlıklar matrisidir. Çekirdek matrisinin boyutları, evrişimin adını nasıl aldığıdır .
Örneğin, 2B konvolüsyonlarda, çekirdek matrisi bir 2B matristir.
Bununla birlikte, bir filtre, her bir çekirdek belirli bir giriş kanalına atanan birden çok
çekirdeğin bir birleşimidir. Filtreler her zaman çekirdeklerden bir boyut daha fazladır.
Örneğin, 2B konvolüsyonlarda, filtreler 3B matrislerdir (bu, esas olarak 2B matrislerin,
yani çekirdeklerin bir birleşimidir).Çekirdek boyutları h*w ve giriş kanalları k olan bir
CNN katmanı için filtre boyutları k*h*w'dir.
Ortak bir evrişim katmanı aslında birden fazla bu tür filtreden oluşur. Aşağıdaki
tartışmada basitlik adına, aynı davranış tüm filtrelerde tekrarlandığından, belirtilmediği
sürece yalnızca bir filtrenin var olduğunu varsayalım.
1D, 2D ve 3D Evrişimler
1B konvolüsyonlar genellikle zaman serisi veri analizi için kullanılır (çünkü bu tür
durumlarda girdi 1B'dir). Daha önce bahsedildiği gibi, 1D veri girişi birden fazla kanala
sahip olabilir. Filtre yalnızca bir yönde hareket edebilir ve dolayısıyla çıktı 1D'dir.
Aşağıdaki tek kanallı 1B evrişim örneğine bakın.
Yazının başında zaten tek kanallı 2B evrişim örneğini görmüştük, bu yüzden çok
kanallı bir 2B evrişimi görselleştirelim ve kafa yormaya çalışalım. Aşağıdaki şemada,
çekirdek boyutları 3*3'tür ve filtrede (sarı ile işaretlenmiş) birden çok bu tür çekirdek
vardır. Bunun nedeni, girişte (mavi işaretli) birden fazla kanal bulunması ve girişteki
her kanala karşılık gelen bir çekirdeğin bulunmasıdır. Açıkçası, burada filtre 2 yönde
hareket edebilir ve bu nedenle nihai çıktı 2B'dir. 2D evrişimler en yaygın evrişimlerdir
ve Bilgisayarla Görüşte yoğun olarak kullanılırlar.
Evrişimleri kullanarak bunu başarmak için, devrik evrişim veya ters evrişim olarak
bilinen bir değişiklik kullanırız (gerçi bu, bir evrişim işlemini gerçekten "tersine
çevirmiyor", dolayısıyla pek çok insan bu terimi kullanmayı tercih etmiyor). Aşağıdaki
GIF'teki noktalı bloklar dolguyu temsil eder.
Bence bu animasyonlar, dolgu modeline bağlı olarak aynı girdiden farklı yukarı-
örneklenmiş çıktıların nasıl oluşturulabileceğine dair iyi bir sezgi veriyor. Bu tür
evrişimler, özellikle görüntü boyutlarını artırma yeteneklerinden dolayı, modern CNN
ağlarında çok yaygın olarak kullanılmaktadır.
Ayrılabilir Evrişim
Ayrılabilir Evrişim, evrişim çekirdeğini daha düşük boyutlu çekirdeklere ayırmayı
ifade eder. Ayrılabilir konvolüsyonlar 2 ana tiptedir. Birincisi, uzamsal olarak
ayrılabilir evrişimlerdir, örneğin aşağıya bakınız.
Ancak, uzamsal olarak ayrılabilir evrişimler, Derin Öğrenmede o kadar yaygın değildir.
Öte yandan, Derinlemesine ayrılabilir evrişimler, hafif CNN modellerinde yaygın
olarak kullanılır ve gerçekten iyi performans sağlar. Örneğin aşağıya bakın.
Önce her bir kanalı ayrı ayrı işleyen ve ardından kanallar arası kıvrımları uygulayan derinlemesine ayrılabilir 2D
evrişim
Bir Deforme Evrişimin uygulanması aslında çok basittir. Her çekirdek aslında iki farklı
matrisle temsil edilir. İlk dal orijinden 'uzaklığı' tahmin etmeyi öğrenir. Bu ofset, orijin
etrafındaki hangi girdilerin işleneceğinin bir göstergesidir. Her ofset bağımsız olarak
tahmin edildiğinden, kendi aralarında herhangi bir katı şekil oluşturmaları gerekmez,
böylece deforme olabilir yapıya izin verilir. İkinci dal, girdisi artık bu ofsetlerdeki
değerler olan evrişim dalıdır.
Sıradaki ne?
Referanslar
[1] Krizhevsky, Alex, Ilya Sutskever ve Geoffrey E. Hinton. "Derin evrişimli sinir ağları ile
Imagenet sınıflandırması." Sinirsel bilgi işleme sistemlerindeki gelişmeler. 2012.
[2] Dumoulin, Vincent ve Francesco Visin. "Derin öğrenme için evrişim aritmetiği kılavuzu."
Her Perşembe, Değişken Veri Bilimine Doğru'nun en iyilerini sunar: uygulamalı eğitimler ve en son araştırmalardan
kaçırmak istemediğiniz orijinal özelliklere kadar. Bir göz at.
Bu bülteni al