You are on page 1of 10

Harita Dergisi Temmuz 2010 Say 144

Destek Vektr Makineleri le Uydu Grntlerinin Snflandrlmasnda Kernel Fonksiyonlarnn Etkilerinin ncelenmesi

Destek Vektr Makineleri ile Uydu Grntlerinin Snflandrlmasnda Kernel Fonksiyonlarnn Etkilerinin ncelenmesi
(Investigation of the Effects of Kernel Functions in Satellite Image Classification Using Support Vector Machines)

Takn KAVZOLU, smail LKESEN Gebze Yksek Teknoloji Enstits, Jeodezi ve Fotogrametri Mhendislii Blm, Gebze, Kocaeli kavzoglu@gyte.edu.tr ZET
Uzaktan alglanm grntler ve bu grntlerin snflandrlmasyla retilen tematik haritalar, dnya yzeyindeki objelerin yaps ve zellikleri hakknda ok nemli bilgiler sunarlar. Tematik haritalarn elde edilmesinde kullanlan snflandrclarn etkinlii zellikle zor ve karmak snflandrma problemleri iin byk nem tamaktadr. Destek vektr makineleri (DVM) son yllarda ortaya atlm ve birok alanda baaryla uygulanm bir makine renme algoritmasdr. Uzaktan alglama alanndaki uygulamalar ise gncel saylabilecek niteliktedir. DVMlerin dier snflandrclardan zellikle istatistiksel tabanl snflandrclardan daha gl ve etkili olduu ispatlanmtr. Bu almada, DVMlerin snflandrma performansnn kernel fonksiyonu ve parametre deerlerine bal deiimi detayl ekilde analiz edilmitir. Analizler srasnda literatrde en yaygn kullanlan drt kernel fonksiyonun snflandrma doruluu zerindeki etkileri incelenmitir. Kullanlan veri seti iin radyal tabanl fonksiyon ve Pearson VII fonksiyon kernellerinin en yksek performans (>%94 genel doruluk) gsterdikleri belirlenmitir. Normalletirilmi polinom kerneli ise en dk snflandrma doruluunu (%91,78) reten DVM modeli olmutur. Dier taraftan, en ok benzerlik yntemiyle performans karlatrmas yapldnda, tm DVM modellerinin daha yksek doruluklu sonular rettii saptanmtr. Anahtar Kelimeler: Destek vektr makineleri, kernel fonksiyonlar, arazi rts ve arazi kullanm, grnt snflandrma.

In this study, a detailed performance analysis was carried out for SVMs with regard to kernel function and chosen parameter values. In the analyses four particular kernel functions that have been most widely used in the literature were investigated with their effects on classification accuracy. It is found that radial basis function and Pearson VII function kernels produced the highest performance (>94%) for the data set considered in this study. Also, normalized polynomial kernel showed a poor performance with the lowest classification accuracy (91,78%) among all SVM models. On the other hand, it is found that all SVM models produced more accurate results compared to maximum likelihood classification. Key Words: Support vector machines, functions, land cover and land use, classification. kernel image

1. GR Yeryz zerindeki evresel deiimlerin izlenmesi ve ynetimi gerek srdrlebilir evre gerekse doal kaynaklarn etkin kullanm asndan byk nem tamaktadr. Kresel ve yerel lekteki bu deiimlerin tespitinde uzaktan alglanm grntler saladklar esiz avantajlar nedeniyle en ok bavurulan kaynak durumundadrlar. Yersel bazl almalarla karlatrldnda, uzaktan alglama uygulamalar maliyet, zaman, alma sahas bykl noktalarnda nemli faydalar salamaktadr. Geni ve eriilmesi mmkn olmayan alanlar iin ksa sre iinde nemli aratrmalarn yaplabilmesi uzaktan alglama teknolojisi sayesinde mmkn olmaktadr. Bu kapsamda gerekletirilecek almalarda uzaktan alglanm grntlerin snflandrlmas sklkla bavurulan bir yntemdir. Literatrde birok snflandrma metot ve yaklam mevcuttur (Tso vd., 2001; Lu vd., 2007). Ayrca, bu metotlarn performanslarnn analizine ynelik birok alma yaplmtr (Huang vd., 2002; Pal vd., 2005; Kavzoglu vd., 2008). Makine renmesi alanndaki uygulamalar sonrasnda, destek baarl vektr

ABSTRACT
Remotely sensed images and the thematic maps derived from these images provide invaluable information about the nature of the Earth surface materials and objects. The robustness of classification techniques used to produce these thematic maps can be crucial especially for complex classification problems. Support vector machines (SVMs) are machine learning algorithms that have been recently introduced and successfully used in many fields. Their use in remote sensing is relatively new. It is proved that these algorithms are more robust and effective than other classifiers, particularly the ones on statistical basis.

73

Harita Dergisi Temmuz 2010 Say 144

T.Kavzaolu vd.

makineleri uzaktan alglama alannda son yllarda baaryla kullanlan bir snflandrma yntemidir. Bu snflandrma yntemi, veriyi daha yksek bir boyuta dntrerek oluturaca bir hiperdzlem ile iki snf birbirinden ayrma prensibini esas alr. Yksek boyuta dnm aamasnda deiik zelliklere sahip fonksiyonlar kullanlr. Bu fonksiyonlar kernel fonksiyonlar olarak adlandrlr. Kernel fonksiyonlarnn kullanm iin bu fonksiyonlarn matematiksel ifadesinde bulunan baz parametrelerin kullanc tarafndan belirlenmesi gerekir. Bu almada, destek vektr makineleri iin literatrde en ok kullanlan kernel fonksiyonlarnn performanslar, belirlenen optimum parametre deerleriyle bir Landsat ETM+ uydu grnts kullanlarak deerlendirilmitir. Bu analizler srasnda, grnt snflandrmada temel lt ya da dayanak olarak kabul edilen en ok benzerlik snflandrcs da uygulanm ve destek vektr makineleriyle performans asndan karlatrlmtr.

ekilde temsil eden alt snf (su, geni yaprakl aa, ine yaprakl aa, bozkr, yerleim ve toprak-ta) belirlenmi ve bu alt snf iin eitim ve test verileri oluturulmutur.

3. GRNT SINIFLANDIRMA YNTEMLER Uydu grntlerinden yeryzne ait bilgilerin elde edilmesinde kullanlan en yaygn yntem grntlerin snflandrlmas ilemidir. Grnt snflandrma, grnty oluturan her bir pikselin tm bantlardaki deerlerinin dier pikseller ile karlatrlarak benzer piksellerin kullancnn belirledii snflara ayrlmas ilemidir (Campbell, 1996). Dier bir deyile; snflandrma, yeryz objelerinin farkl spektral yansma deerlerinin tespiti yaplarak grnt zerindeki her pikseli ait olduu zellik grubuna yani snfa atama ilemidir. Snflandrma sonucu elde edilen grntler tematik harita olarak adlandrlr. Snflandrma ileminde genel olarak kontroll ve kontrolsz snflandrma olarak adlandrlan iki yaklam vardr. Uydu grntlerinin snflandrlmasnda kontroll snflandrma yntemi yani eitim alanlaryla snflandrma metodolojisi sonularn doruluu ve gvenilirlii asndan en ok tercih edilen yntem olmutur. Kontroll snflandrma ilemi iin literatrde birok metot sunulmasna karn, en yaygn kullanlan yntem en ok benzerlik (EB) metodudur. Bu yntem referans veya temel lt olarak ele alnm ve yeni metotlarn performanslarnn analizinde literatrde sklkla kullanlmtr. EB yntemini de kapsayan istatistiksel tabanl yntemlerde, her bir snfa ait rnek piksellerin normal dalmda olduu kabulnn yaplmas ve deiik veri yaplarnn snflandrmasna olanak vermemesi gibi nemli zayflklar olduu literatrde vurgulanmtr (Bruzzone vd., 1997; Shrestha vd., 2001; Kavzoglu vd., 2003). Ayrca, genel olarak yksek doruluk veren bu metotlar, spektral ayrmn zor olduu durumlarda (kark pikseller, nem ve topografya gibi deiken faktrlerin etkisi, ok sayda snf ayrmak iin tek zamanl ve az sayda spektral bant kullanm vb.) tutarsz sonular retebilmektedir. Bu zayflklar ortadan kaldrmak amacyla son dnemde gelimi snflandrma yaklamlar ile uydu grntlerinin analizi konusunda almalar youn ekilde yrtlmektedir. Bu yaklamlardan balcalar olarak yapay sinir alar, karar aalar, destek vektr makineleri ve bulank mantk verilebilir. Bunlarn uzaktan alglanm grntlerin

2. ALIMA ALANI VE KULLANILAN VER alma alan olarak seilen Kocaeli, Marmara denizinin dousunda ve yaklak 3.505kmlik yzlme sahiptir. Merkez ilesi zmit olan Kocaelinin dier ileleri ise Baiskele, ayrova, Darca, Dilovas, Gebze, Glck, Karamrsel, Kandra, Kartepe, Krfez ve Derincedir. Bir sanayi ve endstri kenti olan Kocaeli Trkiyenin en byk sanayi kurulularna ev sahiplii yapmaktadr. Kocaeli gayri safi milli hasladan fert bana den payda Trkiyede birinci srada yer almaktadr. stanbul ilinin snrnda bulunmas, evre yolu ve dier balant yollar zerinde olmas, ulam kolayl nedeniyle 1980ler sonrasnda ehri bir sanayi kenti haline dntrmtr. Kocaeli ilinin 1970 ylnda 385.408 olan nfusu 2009 yl sonu itibariyle 1.522.408 ulamtr (www.tuik.gov.tr). Hzl nfus art ve sanayileme kontrolsz yaplama ve arazi bozulmasn (degradasyonunu) beraberinde getirmitir. Bu almada ortaya konan amalar yerine getirmek iin tm snflandrma ilemlerinde 30.09.2009 tarihli Landsat ETM+ grnts kullanlmtr. Bu grnt zerinde geometrik rektifikasyon ilemi gerekletirilerek UTM projeksiyon sisteminde yeniden rneklemesi yaplmtr. Mevcut hlihazr ve mecere haritalarnn yannda araziden toplanan veriler ile snflandrclar iin eitim ve test alanlar tespit edilmitir. alma alan olan Kocaeli ilini en iyi

74

Harita Dergisi Temmuz 2010 Say 144

Destek Vektr Makineleri le Uydu Grntlerinin Snflandrlmasnda Kernel Fonksiyonlarnn Etkilerinin ncelenmesi

snflandrmasndaki etkinlii birok almada ortaya konmutur (Pal vd., 2003; Erbek vd., 2003; Pal vd., 2005; Kavzoglu vd., 2009). Bu metotlarn kstl eitim verisi olduu durumlarda iyi sonular retilebildii de aratrmalarla ortaya konmutur (Paola, 1994; Foody, 1995). a. En ok Benzerlik Snflandrma Yntemi En ok benzerlik (EB) yntemi literatrde yaygn olarak kullanlan istatistiksel tabanl bir snflandrma yntemidir. Bu yntemde ortalama deer, varyans ve kovaryans deerlerinin tm dikkate alnr. Eitim alanlarn oluturan snflar iin olaslk fonksiyonlar hesaplanr ve buna gre her bir pikselin hangi snfa daha yakn olduu belirlenir. Bir pikselin hangi snfa ait olduu her bir snfa ait olma olaslklarnn hesabndan sonra en yksek olaslkl gruba atama eklinde yaplr. Bu noktada kullanc tarafndan tespit edilecek bir eik deer snflandrlacak pikselin belirlenen snflardan veya bu snflarn dnda bir snftan olduunun tespitinde kullanlr. Piksellerin snflandrlmasnda tm snflar iin hesaplanan olaslk deerinin nceden belirlenen eik deerinin altnda kalmas durumunda ilgili pikseller belirsiz olarak deerlendirilir. EB ynteminde, snf kontrol verilerini oluturan noktalar kmesindeki dalmn normal (Gauss) dalmnda olduu kabul yaplr. Snflarn ilk olaslklar hakknda bilgi mevcut deilse, hepsi eit olaslkl olarak kabul edilir. Yntem, sadece piksel deerlerine gre deil, her snf iin oluturacak varyans-kovaryans matris deerini de dikkate alarak snf tayini yapar. Bylece metot, rnek piksellerin zellik uzayndaki dalmlarn da dikkate alm olur (Mather, 1999). Pikselin p saydaki bant deerlerini ieren x vektrnn bir k snfnda olma olasl aadaki ekilde hesaplanr.
P ( x ) = 2 -0.5 p S i -0.5 e xp -0.5 y S i-1 y

olduu matematiksel algoritmalar balangta iki snfl dorusal verilerin snflandrlmas problemi iin tasarlanm, daha sonra ok snfl ve dorusal olmayan verilerin snflandrlmas iin genelletirilmitir. DVMnin alma prensibi iki snf birbirinden ayrabilen en uygun karar fonksiyonun tahmin edilmesi, baka bir ifadeyle iki snf birbirinden en uygun ekilde ayrabilen hiper-dzlemin tanmlanmas esasna dayanmaktadr (Vapnik, 1995; Vapnik, 2000). Bir ok alanda baaryla kullanlan DVMlerin uzaktan alglama alannda kullanm konusunda son yllarda youn almalar yrtlmektedir (Foody vd., 2004; Melgani vd., 2004; Pal vd., 2005; Kavzoglu vd., 2009). (1) Dorusal Ayrlabilen Veriler iin DVM Destek vektr makineleri ile snflandrmada genellikle {-1,+1} eklinde snf etiketleri ile gsterilen iki snfa ait rneklerin, eitim verisi ile elde edilen bir karar fonksiyonu yardmyla birbirinden ayrlmas amalanr. Sz konusu karar fonksiyonu kullanlarak eitim verisini en uygun ekilde ayrabilecek hiper-dzlem bulunur. ekil 1(a)da gsterildii zere iki snfl verileri birbirinden ayrabilen birok hiper-dzlem izilebilir. Ancak DVMnin amac kendisine en yakn noktalar arasndaki uzakl maksimuma karan hiper-dzlemi bulabilmektir. ekil 1(b)de grld zere snr maksimuma kararak en uygun ayrm yapan hiper-dzleme optimum hiper-dzlem ve snr geniliini snrlandran noktalar ise destek vektrleri olarak adlandrlr. Dorusal olarak ayrlabilen iki snfl bir snflandrma probleminde DVMnin eitimi iin k sayda rnekten oluan eitim verisinin { xi ,y i }, i = 1,.....,k olduu kabul edilirse, optimum hiperdzleme ait eitsizlikler aadaki ekilde olur:

(1)

w x i + b +1 w x i + b +1

her her
N

y = +1 iin y = 1 iin

(2) (3)

Bu eitlikte; P( x ) olaslk deerini, Si i. snf iin varyans-kovaryans matrisini, matrisin determinantn, y = x xi

) ve

xi ise i. snf iin

ortalama deeri ifade eder. b. DVM le Snflandrma Destek Vektr Makineleri (DVM) istatistiksel renme teorisine dayal bir kontroll snflandrma algoritmasdr. DVMnin sahip

Burada x R olup N-boyutlu bir uzay, y {-1, +1} ise snf etiketlerini, w arlk vektrn (hiper-dzlemin normali) ve b eilim deerini gstermektedir (Osuna vd., 1997).Optimum hiper-dzlemin belirlenebilmesi iin bu dzleme paralel ve snrlarn oluturacak iki hiper-dzlemin belirlenmesi gerekir (ekil 2). Bu hiper-dzlemleri oluturan noktalar destek vektrleri olarak adlandrlr ve bu dzlemler w xi + b = 1 eklinde ifade edilirler.

75

Harita Dergisi Temmuz 2010 Say 144

T.Kavzaolu vd.

Destek Vektrleri

Optimum Hiper-Dzlem

(a)

(b)

ekil 1. (a) ki snfl bir problem iin hiper-dzlemler, (b) Optimum hiper-dzlem ve destek vektrleri.
Destek Vektrleri Snr

w x + b = 1

w
Optimum Hiper-Dzlem

eitlii elde edilir. Sonu olarak, dorusal olarak ayrlabilen iki snfl bir problem iin karar fonksiyonu aadaki ekilde yazlabilir (Osuna vd., 1997). k (7) f ( x ) = sign i y i ( x xi ) + b i =1

(2) Dorusal Ayrlamayan Veriler iin DVM

w x + b = 0

ekil 2. Dorusal olarak ayrlabilen veri setleri iin hiper-dzlemin belirlenmesi. Optimum hiper-dzlemin snrnn maksimuma karlmas iin w ifadesinin minimum hale getirilmesi gerekir. Bu durumda en uygun hiperdzlemin belirlenmesi aadaki snrl optimizasyon probleminin zmn gerektirir.
2 1 min w 2

(4)

Uydu grntlerinin snflandrlmasnda olduu gibi birok problemde verilerin dorusal olarak ayrlmas mmkn deildir [ekil 3(a)]. Bu durumda eitim verilerinin bir ksmnn optimum hiper-dzlemin dier tarafnda kalmasndan kaynaklanan problem pozitif bir yapay deikenin ( i ) tanmlanmas ile zlr [ekil 3(b)]. Snrn maksimum hale getirilmesi ve yanl snflandrma hatalarnn minimum hale getirilmesi arasndaki denge pozitif deerler alan ve C ile gsterilen bir dzenleme parametresi (0 < C < ) tanmlanmasyla kontrol edilebilir (Cortes vd., 1995). Dzenleme parametresi ve yapay deiken kullanlarak dorusal olarak ayrm yaplamayan veriler iin optimizasyon problemi:

Buna bal snrlamalar ise;

y i (w xi + b ) 1 0 ve y i { 1, 1}

(5)

eklinde ifade edilir (Vapnik, 1995). Bu optimizasyon problemi Lagrange denklemleri kullanlarak zlebilir. Bu ilem sonrasnda;

w 2 +C min 2
eklini alr.

i i =1
r

(8)

1 L(w ,b, ) = w 2

y (w x
i i i =1

+ b) +

i =1

(6)

Buna bal snrlamalar ise; y i (w ( xi ) + b ) 1 1 i

(9)

i 0 ve i = 1,...,N
eklinde ifade edilir.

76

Harita Dergisi Temmuz 2010 Say 144

Destek Vektr Makineleri le Uydu Grntlerinin Snflandrlmasnda Kernel Fonksiyonlarnn Etkilerinin ncelenmesi

Destek Vektrleri

Snr X

w x + b = 1

Optimum Hiper-Dzlem

w x + b = 0

(a) (b) ekil 3.(a) Dorusal olarak ayrlamayan veri seti, (b) Dorusal ayrlamayan veri setleri iin hiper-dzlemin belirlenmesi. Eitlik 8 ve 9da ifade edilen optimizasyon probleminin zm iin ekil 4te grlecei zere girdi uzaynda dorusal olarak ayrlamayan veri, zellik uzay olarak tanmlanan yksek boyutlu bir uzayda grntlenir. Bylece verilerin dorusal olarak ayrm yaplabilmekte ve snflar arasndaki hiper-dzlem belirlenebilmektedir. Literatrde kernel fonksiyonu olarak en sk kullanlan polinom, radyal tabanl fonksiyon, Pearson VII (PUK) fonksiyonu ve normalletirilmi polinom kernelleri Tablo 1de formlleri ve parametreleriyle birlikte sunulmutur. Tablodan grlecei zere her kernel fonksiyonu iin baz parametrelerin kullanc tarafndan belirlenmesi gerekir. PUK kerneli iin belirlenmesi gereken parametre says iki iken, dier fonksiyonlar iin snflandrmaya esas olacak model oluumunda bir parametrenin belirlenmesini gerektirmektedir. Kernel fonksiyonlar karlatrldnda polinom ve radyal tabanl kernellerin daha sade ve anlalabilir olduu ifade edilebilir. Matematiksel olarak basit grnse de, polinomun derecesindeki art algoritmann karmak bir hal almasna neden olmaktadr. Bu da hem ilem sresini nemli lde artrmakta hem de bir noktadan sonra snflandrma doruluunu drmektedir. Buna karn radyal tabanl fonksiyonun kernel boyutu ( ) olarak ifade edilen parametresindeki deiimlerin snflandrma performansna etkisinin daha az olduu grlmtr (Hsu vd., 2010). Normalletirilmi polinom fonksiyonu ise veri setinin normalletirilmesi yerine polinom kernele ait matematiksel ifadenin normalletirilmesi amacyla Arnulf vd. (2001) tarafndan nerilmitir. Normalletirilmi polinom kernelinin polinom kernelinin genelletirilmi bir hali olduu sylenebilir. Dier taraftan, PUK kerneli Pearson genilii olarak bilinen ( , ) iki parametresi ile dier kernel fonksiyonlarna gre daha karmak bir matematiksel yapya sahiptir. Bu iki parametre snflandrma doruluuna etki etmekte ve hangi parametre iftinin en iyi sonu verecei nceden bilinmemektedir. Bu nedenle PUK kernelinin kullanmnda en uygun parametre iftinin belirlenmesi nemli bir aamadr.

Hiper-Dzlem

Girdi Uzay

zellik Uzay

ekil 4. Kernel fonksiyonu ile verinin daha yksek bir boyuta dntrlmesi. Destek vektr makineleri matematiksel olarak K( xi ,x j ) = ( x ) ( x j ) eklinde ifade edilen bir kernel fonksiyonu yardmyla dorusal olmayan dnmler yaplabilmekte ve bu ekilde verilerin yksek boyutta dorusal olarak ayrmna imkan salamaktadr. Sonu olarak, kernel fonksiyonu kullanarak dorusal olarak ayrlamayan iki snfl bir problemin zm ile ilgili karar kural aadaki ekilde yazlabilir (Osuna vd., 1997): f ( x ) = sign i y i ( x ) ( xi ) + b (10) i

Destek vektr makineleri (DVM) ile gerekletirilecek bir snflandrma ilemi iin kullanlacak kernel fonksiyonu ve bu fonksiyona ait optimum parametrelerin belirlenmesi esastr.

77

Harita Dergisi Temmuz 2010 Say 144

T.Kavzaolu vd.

Tablo 1. Destek vektr makinelerinde kullanlan temel kernel fonksiyonlar ve parametreleri. Kernel Fonksiyonu Polinom Kerneli Normalletirilmi Polinom Kerneli Radyal Tabanl Fonksiyon Kerneli Matematiksel fadesi Parametre Polinom derecesi (d) Polinom derecesi (d) Kernel boyutu ( )
2

K( x,y ) = (( x y ) + 1)d
K( x,y ) = (( x y ) + 1)d (( x x ) + 1)d (( y y ) + 1)d
( x x i )
2

K( x,y ) = e

1
Pearson VII (PUK) Kerneli

2 1 +

x- y

(1/ )

-1

Pearson genilii parametreleri ( , )

Kernel fonksiyonuna zg parametrelerin yannda tm destek vektr makineleri iin dzenleme parametresi Cnin kullanc tarafndan belirlenmesi gerekir. Bu parametre iin olmas gerekenden ok kk veya ok byk deerler seilmesi durumunda optimum hiper-dzlem doru belirlenemeyeceinden snflandrma doruluunda ciddi d beklenir. Dier taraftan C = olmas durumunda DVM modeli sadece dorusal olarak ayrlabilen veri setleri iin uygun hale gelir. Buradan da grlecei zere parametreler iin uygun deerlerin seimi DVM snflandrcsnn performansn direkt olarak etkileyen bir faktr durumundadr. Genellikle deneme ve hata stratejisi kullanlmasna karn, apraz dorulama yaklam baarl sonulara ulalmasna olanak salamaktadr. apraz dorulama yaklamnda ama oluturulan snflandrma modelinin performansnn belirlenmesidir. Bu amala veri seti iki ksma ayrlr. Birinci ksm snflandrmaya esas olan model oluumunda eitim verisi olarak kullanlrken ikinci ksm modelin performansnn belirlenmesi amacyla test verisi olarak ileme konur. Eitim seti ile oluturulan modelin test veri setine uygulanmas sonucunda doru snflandrlan rneklerin says snflandrcnn performansn gsterir. Dolaysyla apraz geerlilik yntemi kullanlarak en iyi snflandrma performansnn elde edildii kernel parametrelerinin belirlenmesi ve snflandrmaya esas olacak modelin oluturulmutur.

seilmi piksel ve test veri seti iin her snfa karlk 1.000 adet rastgele piksel seimi yaplmtr. Bu almadaki tm snflandrma problemlerinde ayn eitim verisi kullanlmtr. Her snf iin eit miktarda rnek piksel seilerek snflandrma sonucunda elde edilecek sonularn objektif ve karlatrlabilir olmas amalanmtr. almann ana hedefi olan destek vektr makinelerinin (DVM) farkl kernel fonksiyonlaryla gsterecei etkinin aratrlmasnda bir temel lt ya da dayanak olarak kullanlan en ok benzerlik (EB) snflandrcs kullanlmtr. EB ve DVM uygulamalarnn tamam MATLAB ortamnda yazlm programlarla gerekletirilmitir. alma alan iin tespit edilen snflar Tablo 2de sunulan snf etiket numaralar ile kodlanarak snflandrma ilemleri gerekletirilmitir. Snflandrclarn performanslarnn deerlendirmesinde snflandrma sonucu elde edilen hata matrisleri yardmyla genel snflandrma doruluklar ve Kappa deerleri hesaplanr. Hata matrisinde snflandrma sonular satrlar ve stunlar eklinde gsterilir. Matrisin diyagonal elemanlar doru snflandrlan pikselleri gsterirken, satrdaki dier elemanlar ise farkl snfa atanm dier bir ifadeyle hatal snflandrlm test piksellerini gsterir. Genel snflandrma doruluu, doru snflandrlm piksel saysnn (diyagonal matris elemanlarn toplam) toplam piksel saysna blnmesiyle elde edilir. Kappa deeri ise hata matrisinin satr ve stun toplamlar ile kegeni zerindeki elemanlar kullanlarak hesaplanr (Congalton vd., 2009).

4. UYGULAMA alma alann kapsayan Landsat ETM+ uydu grntsn snflandrmak iin ncelikle eitim ve test verisi hazrlanmtr. Eitim veri seti iin her snfa karlk 2.000 adet rastgele

78

Harita Dergisi Temmuz 2010 Say 144

Destek Vektr Makineleri le Uydu Grntlerinin Snflandrlmasnda Kernel Fonksiyonlarnn Etkilerinin ncelenmesi

Tablo 2. Snf etiket numaralarnn aklamas. Snf Aklama 1 2 3 4 5 6 Su (gl, glet, akarsu, vb.) Geni yaprakl aa ne yaprakl aa Bozkr ve mera alanlar Toprak, ta ve kayalk alanlar Yerleim (bina, yol vb.)

EB yntemi kullanlarak gerekletirilen snflandrma ilemi iin hesaplanan hata matrisi Tablo 3de verilmitir. Tablodan da grlecei zere snflandrmann genel doruluu %91,30 olmutur. Snflara gre EBnin performans analiz edildiinde en dk snflandrma doruluunun toprak-ta olarak nitelendirilen snf iin gerekletii grlmektedir. Bu snfn rnek piksellerinin arlkl olarak yerleim etiketi ile snflandrld grlmektedir. Bir ksm toprak alann ise bozkr nitelii yani ot vb. bitkilerle rtl olduu grlmektedir. Tablo 3. En ok benzerlik snflandrcs iin hata matrisi. Snf 1 2 3 4 5 6 1 2 3 4 5 6 993 0 0 0 0 0 2 975 18 0 0 0 0 25 918 43 7 1 0 0 34 926 84 6 5 0 29 29 746 73 0 0 1 2 163 920

radyal tabanl fonksiyon kerneli iin 500 ve PUK kerneli iin 300 olarak belirlenmitir. Polinom kerneli iin yaplan almalar sonucunda 2. dereceden bir polinom fonksiyonun en yksek doruluk deerlerini retecei tespit edilmitir. Normalletirilmi polinom kernelinde ise optimum polinom derecesi 3. derece olarak hesaplanmtr. Her iki polinom kerneli iin polinom derecesi artrldnda, DVM modelinin kompleks hale gelmesi neticesinde snflandrma ileminin nemli derecede uzad ve snflandrma doruluunun negatif ynde etkilendii gzlenmitir. Radyal tabanl fonksiyon kerneli iin en uygun deerinin 2 olduu hesaplanmtr. Dier taraftan, PUK kernelinin iki parametresi ( , ) ile yaplan testler sonucunda en uygun deerlerin iin 0,5, iin 1,0 olduu grlmtr. Tespit edilen dzenleme parametre deerleriyle kernel parametreleri kullanlarak DVMnin eitimleri tamamlanarak test veri seti zerinde snflandrma doruluk analizi hata matrisleri zerinden yaplmtr (Tablo 4). Seilen kernel fonksiyonlar ile DVM snflandrma sonular genel doruluk esas alnarak deerlendirildiinde en dk doruluun normalletirilmi polinom kerneli ile (%91,78), en yksek doruluun ise PUK kerneli kullanlarak (%94,83) elde edildii grlmektedir. Radyal tabanl fonksiyon kerneli ile elde edilen snflandrma doruluunun (%94,38) PUK kerneli sonularna yakn olduu ve bu metotlarn benzer sonular rettii sylenebilir. Tm DVM tabanl snflandrma ilemleri gz nne alndnda, genel doruluk asndan literatrde temel lt kabul edilen EB sonularndan daha iyi sonular rettikleri grlmtr. Bu da DVM metodunun temel ald kuramlarn geerliliini ortaya koymaktadr. Hata matrislerinin detayl analizi yapldnda, EB dahil tm snflandrma yaklamlarnn toprak-ta rnek piksellerini yerleim ve bozkr pikselleriyle kartrd grlmektedir. Spektral zellikleri benzer toprak-ta ve yerleim piksellerinin ayrmnda snflandrma yaklamlarnn etkinlii sonulara direkt olarak yansm durumdadr. Bu almada ele alnan 30 metre konumsal znrlkl grnt dnldnde, alma alanndaki birok ta-toprak ve yerleim pikselinin kark pikseller olduu ifade edilebilir. Ta-toprak snf iin geni eitim alanlarnn belirlenmesinde glk yaand bu noktada belirtilmesi gereken nemli bir husustur.

Genel Doruluk : %91,30

Kappa : 0,89

Blm 3de ifade edildii zere destek vektr makineleri ile yaplacak snflandrma ilemlerinde kullanc tarafndan eitim aamas ncesinde tespit edilmesi gereken parametreler mevcuttur. Bu parametreler kullanlacak kernel fonksiyonuna gre deiiklik gstermektedir. Tablo 1de sunulan kernel parametrelerinin seimi sonularn doruluu zerinde nemli bir etkiye sahiptir. Ayrca, tm DVM uygulamalar iin dzenleme parametresinin (C) belirlenmesi esastr. Bu noktadan hareketle, tm kernel fonksiyonlar iin en uygun parametre deerinin tespiti apraz dorulama yaklam yardmyla yaplmtr. apraz dorulamalar sonunda, test veri seti iin en yksek doruluu verecek dzenleme parametresi (C) polinom kerneli iin 400, normalletirilmi polinom kerneli iin 1.000,

79

Harita Dergisi Temmuz 2010 Say 144

T.Kavzaolu vd.

Tablo 4. Kernel fonksiyonuna bal olarak DVM snflandrma sonular Snf 1 2 3 4 5 6 1 999 1 0 0 3 0 2 0 978 10 0 0 0 3 1 21 963 17 20 3 4 0 0 25 960 52 4 5 0 0 2 16 711 56 6 0 0 0 7 214 937 Snf 1 2 3 4 5 6 1 999 0 0 0 0 0 2 0 975 14 0 0 0 3 0 25 948 23 14 0 4 0 0 28 936 59 3 5 1 0 9 38 730 78 6 0 0 1 3 197 919

Genel Doruluk : %92,47

Kappa : 0,91

Genel Doruluk : %91,78

Kappa : 0,90

(a) Polinom kerneli.

(b) Normalletirilmi polinom kerneli.

Snf 1 2 3 4 5 6

1 1000 0 0 0 0 0

2 0 983 5 0 0 0

3 0 17 973 4 5 1

4 0 0 20 975 49 3

5 0 0 2 15 809 73

6 0 0 0 6 137 923

Snf 1 2 3 4 5 6

1 1000 0 0 0 0 0

2 0 989 8 0 0 0

3 0 10 971 4 6 0

4 0 1 17 979 44 5

5 0 0 4 14 830 74

6 0 0 0 3 120 921

Genel Doruluk : %94,38

Kappa : 0,93

Genel Doruluk :%94,83

Kappa : 0,94

(c) Radyal tabanl fonksiyon kerneli. Dolaysyla sz konusu edilen durum, veri ve arazi zellikleri gzetildiinde normal olarak karlanmaldr. alma alanna ait grnt tm snflandrma yntemleriyle snflandrlarak tematik haritalar retilmitir. Bu haritalara rnek olarak en yksek doruluu veren PUK kernelli DVM snflandrmas sonucu ekil 5de sunulmutur. Tematik haritadan da grlecei zere Kocaeli ilinde yaplama genellikle deniz kenar ve ana yol arterleri evresinde olumutur. E-5 karayolu boyunca olan yaplamann zamanla TEM otoyolu evresine doru kayd gzlemlenmitir. Geni yaprakl ormanlk alanlarn arlkl olarak ehrin gney ksmnda ve ine yaprakl am tr ormanlarn ise daha ok ehrin kuzey ksmlarnda (zellikle Karadeniz kysnda) olduu grlmtr.

(d) Pearson VII (PUK) kerneli. kabiliyetiyle birlikte kullanlacak snflandrma ynteminin gc sonular zerinde olduka byk etkiye sahiptir. Literatrde birok yntem bulunmasna karn, aratrmaclarn yeni yntem ve yaklamlar aray devam etmektedir. Birok aratrmac tarafndan temel metot olarak kabul edilen en ok benzerlik (EB) yntemi, rnek verilerin normal dalmda olduu kabuln yapmas nedeniyle standart bir metot olarak grlmemektedir. Bu araylar neticesinde son dnemde yapay sinir alar, karar aalar, bulank mantk gibi metotlar ne srlmtr. Destek vektr makineleri (DVM) de baarl bir snflandrma metodu olarak son dnemde ne srlen bir makine renme algoritmasdr.

5. SONU Uydu grntlerinin snflandrlmasyla elde edilen tematik haritalarn doruluu birok bilimsel aratrma iin son derece nemlidir. Bu nedenle, kullanlacak veri setinin kalitesi ve temsil

80

Harita Dergisi Temmuz 2010 Say 144

Destek Vektr Makineleri le Uydu Grntlerinin Snflandrlmasnda Kernel Fonksiyonlarnn Etkilerinin ncelenmesi

ekil 5. Pearson VII (PUK) kernel fonksiyonlu destek vektr makineleri kullanlarak retilen alma alannn tematik haritas. Bu almada DVMlerin kullanmnda kritik neme sahip kernel fonksiyonlarnn snflandrma sonularna yani performansna olan etkileri detayl ekilde analiz edilmitir. Bu analiz srasnda drt farkl kernel fonksiyonu optimum parametre seimi yaplarak alma sahas olarak belirlenen Kocaeli iline ait Landsat ETM+ grntsnn snflandrlmasnda kullanlmtr. DVMlerin performans EB metodu sonularyla karlatrldnda daha etkin ve baarl bulunmutur. Genel doruluk asndan performans fark %3,5a kadar deikenlik gstermektedir. alma sahas dnldnde %3,5 genel doruluk fark yaklak 131.000 pikselin daha doru snflandrld anlamna gelmektedir. Bu da yaklak olarak 117 kmlik bir alan ifade etmektedir. Snflandrma doruluundaki artn alansal karl, metotlarn performanslarnn sonular zerindeki etkisini net bir ekilde ortaya koymaktadr. Burada kullanlan kernel fonksiyonlar deerlendirildiinde DVM ile en yksek doruluun PUK kerneli kullanlmas sonucunda retildii grlmtr. Radyal tabanl fonksiyon kerneli de PUK kerneline yakn sonular retmitir. ki kernel benzer sonular retmesine karn PUK kerneli iin daha fazla parametrenin (C, , ) belirlenmesi ihtiyac sz konusudur. Ayrca PUK kerneli kullanlan DVMlerin daha uzun bir ilem sreci gerektirdii grlmtr. Kullanlan kernel fonksiyonlar iinde en dk doruluu (%91,78) normalletirilmi polinom kernelinin verdii belirlenmitir. Her iki polinom tabanl kernelin uygulanmasnda polinom derecesinin artrlmasnda bir noktadan sonra snflandrma performans ciddi anlamda azald gzlemlenmitir. Bu duruma DVM modelinin ar kompleks hale gelmesinin neden olduu dnlmektedir. Sonu olarak; yaplan bu alma, DVM snflandrcsnn optimum kernel fonksiyonlar ve parametre deerlerinin seimiyle uydu grntlerinin snflandrlmasnda etkin bir yntem olduunu gstermektedir.

81

Harita Dergisi Temmuz 2010 Say 144

T.Kavzaolu vd.

KAYNAKLAR Arnulf B. A. Graf, S. Borer, 2001, Normalization in Support Vector Machines, Lecture Notes in Computer Science, 2191: 277-282. Bruzzone, L., Conese, C., Maselli, F., Roli, F., 1997, Multisource Classification of Complex Rural Areas by Statistical and Neural Network Approaches, Photogrammetric Engineering and Remote Sensing, 63(5): 523-533. Campbell, J.B., 1996, Introduction to Remote Sensing, Guilford Press, New York. Congalton R.G., Green, K., 2009, Assessing the Accuracy of Remotely Sensed Data, 2. Bask, CRC Press, New York. Cortes, C., Vapnik, V., 1995, Support-Vector Network, Machine Learning, 20(3): 273297. Erbek, F.S., zkan, C., Taberner, M., 2003, Comparison of Maximum Likelihood Classification Method with Supervised Artificial Neural Network Algorithms for Land Use Activities, International Journal of Remote Sensing, 25(9): 1733-1748. Foody, G.M., 1995, Using Prior Knowledge in Artificial Neural Network Classification with a Minimal Training Set. International Journal of Remote Sensing, 16(2): 301-312. Foody, G.M., Mathur, A., 2004, A Relative Evaluation of Multiclass Image Classification by Support Vector Machines, IEEE Transactions on Geoscience and Remote Sensing, 42(6): 13351343. Huang, C., Davis, L.S., Townshed, J.R.G., 2002, An Assessment of Support Vector Machines for Land Cover Classification, International Journal of Remote Sensing, 23(4), 725749. Hsu, C.W., Chang, C.C., Lin, C.J., 2010, A Practical Guide to Support Vector Classification,http://www.csie.ntu.edu.tw/~cjli n/papers/guide/guide.pdf. Kavzoglu, T., Colkesen, I., 2009, A Kernel Functions Analysis for Support Vector Machines for Land Cover Classification, International Journal of Applied Earth Observation and Geoinformation, 11(5): 352359. Kavzoglu, T., Mather, P.M., 2003, The Use of Backpropagating Artificial Neural Networks in Land Cover Classification, International Journal of Remote Sensing, 24(23): 4907-4938.

Kavzoglu, T., Reis, S., 2008, Performance Analysis of Maximum Likelihood and Artificial Neural Network Classifiers for Training Sets with Mixed Pixels, GIScience and Remote Sensing, 45(3): 330342. Lu, D., Weng, Q., 2007, A Survey of Image Classification Methods and Techniques for Improving Classification Performance. International Journal of Remote Sensing 28(5): 823-870. Mather, P.M., 1999, Computer Processing of Remote-Sensed Images, 2. Bask, John Wiley and Sons, New York. Melgani, F., Bruzzone, L., 2004, Classification of Hyperspectral Remote Sensing Images with Support Vector Machines, IEEE Transactions on Geoscience and Remote Sensing, 42(8), 17781790. Osuna, E.E., Freund, R., Girosi, F., 1997, Support Vector Machines: Training and Applications, A.I. Memo No. 1602, C.B.C.L. Paper No. 144, Massachusetts Institute of Technology and Artificial Intelligence Laboratory, Massachusetts. Pal, M., Mather, P.M., 2003, An Assessment of the Effectiveness of Decision Tree Methods for Land Cover Classification. Remote Sensing of Environment, 86(4): 554565. Pal, M., Mather, P.M., 2005, Support Vector Machines for Classification in Remote Sensing, International Journal of Remote Sensing, 26(5): 1007-1011. Paola, J.D., 1994, Neural Network Classification of Multispectral Imagery. Master Tezi, The University of Arizona, USA. Shrestha, D.P., Zinck, J.A., 2001, Land Use Classification in Mountainous Areas: Integration of Image Processing, Digital Elevation Data and Field Knowledge (Application to Nepal). International Journal of Applied Earth Observation and Geoinformation, 3(1): 78-85. Tso, B., Mather, P.M., 2001, Classification Methods for Remotely Sensed Data, Taylor & Francis, London. Vapnik, V.N., 1995, The Nature of Statistical Learning Theory, Springer-Verlag, New York. Vapnik, V.N., 2000, The Nature of Statistical Learning Theory, 2. Bask, Springer-Verlag, New York.

82

You might also like