Professional Documents
Culture Documents
PCA Nedir, Ne Işe Yarar
PCA Nedir, Ne Işe Yarar
Byk boyutlu veri kmesinden anlaml verileri elde edebilen analiz yntemine PCA denir. PCA byk boyutlardaki veri kmesinde benzerlik ve farkl l klar ortaya koyabilmektedir. Byk boyutlu veri kmesinde analiz i lemi zor olmakta ve hata oran da yksek olmaktad r. Bu a dan PCA birok sistemlerde byk nem ta maktad r. 3 amac vard r: Verilerin boyutunu azaltmak Tahminleme yapmak Ver i setini, baz analizler iin grntlemek 3 zelli i var: Korelasyonsuzlard r. (bir cisme ait e itli zellikler aras nda ba lant kurma) Birinci temel bile en toplam de i kenli i en ok a klayan de i kendir. Bir sonraki temel bile en kalan de i kenli i en ok a klayan de i kendir. PCA, bilgisayarl grme ve rnt tan ma sistemlerinde s ka kullan lan istatiksel bir yntemdir. PCA mant grnt uzay nda yz grntlerinin ya da nesnelerin vb. da l m n en iyi ekilde veren vektr bulmakt r. Bu vektrler orijinal grntlere ya da nesnelere kar l k gelen kovaryans matrislerinin z vektrleridir. PCA vektr tabanl bir yakla md r ve ama byk boyutlu ve birbiriyle vektrleri kk boyutlu birbiriyle ili kisiz ifade eden bir boyut indirgemesi gerekle tirmektir. Temel bile en analizinde kullan lan baz formller;
1-Mean: ortalama
3-Variance:Varyans
ya da
4-Covariance:Kovaryans
lem ad mlar :
Data alma. Ortalamay hesaplama. Kovaryans matrisi hesaplama. zde er ve zvektr hesaplama. zde erlere gre zvektrleri s ralay p zellik vektr olu turma. En ba taki datalar zellik vektr ile arp p zellik uzay na transfer etme. Final Data=zellik Vektr * lk data
zde er ve zvektr hesaplama: zde er ve zvektr hesaplama yntemi olarak QR yntemi kullan labilir. Kare matrisi Q ve R matrislerine ay r p o ekilde yazma mant na dayan r . Q ortogonal matris, R st gen matristir.
R matrisi :
eklinde bulunur.
A matrisi 5 elemanl olsa P4*P3*P2*P1 hesaplan r. Bu P ler her seferinde k egen alt ndaki de erleri 0 a eker. P1 1. Sutun alt ndakileri 0 lar, P2 2. sutun alt ndakileri 0 lar
olur. Ak matrisi st gen olana kadar hesaplama ger ekle ir. st gen olunca hesaplanan matrisin k egen de erleri z de erleri, o zamana kadar elde edilen Qlar n arp m z vektr olur.
K sa projenin a klamas :
Projenin konusu veri taban olarak dosyalarda tutulan verilerin silik ve grltl durumlar nda da bilgisayar n bu verileri tan yabilmesidir. Bunun iin ilk nce e itim matrisi olu turulmal d r. E itim matrisi veri taban olarak tuttu umuz 20 dosyadan okudu umuz verilerin sat rlar n n her bir eleman n n ortalamas ndan kar lmas yla olu turulur. Dolay s yla boyutlar 20*(N*N) olur. E itim matrisini transpozesi ile arp p N*N e blnce kovaryans matris elde edilir. Bu kovaryans matris hem simetrik, hem de kare matristir. Kovaryans matris zde er ve zvektr hesaplamas iin kullan l r. zde erler ve zvektrler zellik matrisi olu turulmas n sa lar. zde er ve zvektrleri bulmak iin QR yntemi kullan l r. Bu yntemde kovaryans matris Q ve R arp mlar na ayr l r. Q ve R yi kovaryans matrisin Pklar bulunmas yla elde ederiz. Bu Pklar n arp m bize Q matrisinin transposunu verir. P2*P1*A=R A=Q*R
Pkler her seferinde k egen alt ndaki de erleri 0 a eker. Bylelikle R matrisi st gen matris olur. Q ve R bulunduktan sonra R*Q nun st gen olup olmad kontrol edelir. E er st gen de ilse, R*Q yeni A kabul edilir ve bu de erinde R ve Q arp mlar hesaplan r. Bu i lem st gen bulana kadar devam eder. E er st gense bu st gen matrisin k egen de erleri bize zde erleri verir. Bu zamana kadar bulunan Q arp mlar ise zvektrler kmesini olu turur. Programdabu i lem bir while dngs iinde gerekle ir. zde erler ve zvektrler bulunduktan sonra s ra zellik matrisini olu turmaktad r. Bunun iin zde erler bykten k e do ru s ralan r. Buna ba l olarak da zvektrler s ralanm zde erlere gre bir s ra halini almal d r. S ralanan zvektrler kmesi normalize edilmelidir. Normalize edilmi bu matrisle e itim matrisinin arp m zellik matrisini olu turur. zellik matrisi ile dosyadaki veriler arp ld nda bu dosyalardaki de erler iin uzayda bir yer bulunmu tur. E er silik bir z harfinin gerekten z harfi oldu unu grebilmek isteniyorsa bu silik z harfine ait veriler zellik matrisi ile arp ld ktan sonra olu turulan de erlerin normal harfler iin bulunan konumlara uzakl bulunur. Bu uzakl klardan en k bu harfin kime yak n oldu unu daha do rusu hangi harf oldu unu verir.