You are on page 1of 41

Prof.Dr.

Durmu ZDEMR YTE Fen Fakltesi Kimya Blm zmir

KEMOMETR DERS NOTLARI BLM I DENEYSEL TASARIM VE OPTMZASYON


KONULAR 1. Deneysel Tasarmn nemi 2. Tarama Tasarmlar (Screening Designs) 2.1.Ful Faktriyel Tasarm 2.2. Fraksiyonel faktriyel tasarm 2.3. Plackett-Burman tasarm 3. Optimizasyon 3.1. Merkezi Kompozit Tasarm 1. DENEYSEL TASARIMIN NEM Deneysel tasarmn nemi drt maddede aklanabilir. Tarama (Screening): Bu tasarmlar deneysel almalarda sonucu etkileyen nemli faktrleri belirlemek iin kullanlr. Bir kimyasal reaksiyonun verimini etkileyen faktrler, kullanlan reaktif konsantrasyonu, katalizr konsantrasyonu, scaklk, pH, reaksiyon sresi, kartrma hz, vb. 10 faktr etkiledii dikkate alndnda bu faktrlerden hangileri nemlidir, hangileri elimine edilebilir ve hangileri ayrntl incelenmelidir? Bu sorularn cevaplar faktriyel ve Plackett-Burman tasarmlar ile verilebilir. Optimizasyon: Tarama tasarmlar ile bulunan nemli faktrlerin optimum deerleri optimize edilerek reaksiyonun verimi ve kromatografik ayrma iyiletirilebilir. En yaygn

kullanlan optimizasyon yntemleri simplex optimizasyonu ve merkezi kompozit tasarm dr. Zaman tasarrufu: Deneysel almalarda faktrlerin ektisi klasik yntemle bir faktrn deerini deitirme dierlerini ise sabit tutma yntemi ile de belirlenebilir. Ancak ok sayda faktr incelendiinde bu yntem zaman alc ve maliyetli olmaktadr. Modelleme: Tarama tasarm ve optimizasyon sonucu her bir faktrn etkisi matematiksel modelle ifade edilebilir. Bylece deneysel olarak bulunan sonucun yannda hesapla tahmini sonu da bulunmu olur. Beklenen sonucun deneysel olarak gerekletirilip gerekletirilemedii kontrol edilir. statisitksel deneysel tasarm ve optimizasyon yakalmnn sunaca avantajlar kavrayabilmek iin basit bir rnek verebiliriz. Bir almada klasik deneysel tasarm (btn faktrleri sabit tutup sadece birinin deerinin deitirilmesi) yaklam kullanldnda bir reaksiyonun verimine etki eden iki faktrden pH ve katalizr konsantrasyonu incelenmi, katalizr konsantrasyonu 2.0 mMda sabit tutulurken pH deitirilmi ve reaksiyon verimi hesaplanmtr. ekil 1den grld gibi optimum pH 3.4 tr.

ekil 1. Katalizr konsantrasyonu 2.0 mM da sabit tutularak bulunan optimum pH. pH=3.4 optimum olarak bulunduktan sonra pH bu deerde sabit tutularak konsantrasyon deitirilmitir. Elde edilen konsantrasyon ekil 2te gsterilmitir. Klasik yntemle optimum konsantrasyon 1.4 mM olarak bulunmutur.

ekil 2. pH 3.4te sabit tutularak bulunan optimum konsantrasyon. Daha sonra any deneysel alma istatistiksel deneysel tasarm ynetemi ile gereekletirilmi ve elde edilen sonular ekil 3te verilmitir.

ekil 3. pH ve katalizr konsantrasyonuna bal olarak reaksiyon ver imindeki deiimi. statistiksel deneysel tasarm metodu kullanlarak elde edilen optimum artlar pH 4.4 ve konsantrasyon 1.0 mM olarak bulunmutur. Bu noktada klasik yaklamla bulunan optimum artlar ile istatistiksel deneysel tasarm metodu ile bulunan sonulardan olduka farkl olduu grlmektedir. Bu farkn nedeni pH ve konsantarsyon arasndaki etkilemedir. Bu nedenle istatistiksel deneysel tasarm kullanlarak bu etkileimler gz nnde bulundurulmal ve

deneysel tasarm yntemine gre optimum deerler bulunmaldr. leriki blmde benzer bir rnek uygulamal ekilde ayrntl olarak tekarar incelenecektir. 2. TARAMA TASARIMLARI 2.1 Tam Faktriyel Tasarm Tam faktriyel tasarm sonu zerine etki eden faktrlerin hangileri ve ne kadar etkili olduunu anlamada kullanlan iki seviyeli bir tarama tasarmdr. rnein, bir kimyasal reaksiyon pH ve scakla bal olarak deiiyorsa, iki seviyeli iki faktrl bir deney tasarlanabilir. Deney says 2k forml ile hesaplanr. Burada 2, seviye says ( -1 ve +1 olarak kodlanr), k ise faktr saysdr (burada 2 faktr var). Faktriyel tasarmda, 2 faktr iin deney says 4 (22), 3 faktr iin deney says 8dir (23). Tam faktriyel tasarm tablosu hazrlamak iin, her bir faktr iin yksek ve dk seviyeler belirlenir. rnein scaklk 30 oC ve 60oC, pH 4 ve 6. Yksek (+1) ve dk (-1) seviyelere gre tasarm tablosu oluturulur (izelge 1). izelge 1. ki seviyeli iki faktrl tam faktriyel tasarm Deney 1 2 3 4 x1 -1 +1 -1 +1 x2 -1 -1 +1 +1

izelge 2 ve 3te srasyla 3 ve 4 faktrl iki seviyeli tam faktriyel tasarmlarn tablolar verilmitir izelge 2. ki seviyeli faktrl tam faktriyel tasarm Deney 1 2 3 4 5 6 7 8 x1 -1 +1 -1 +1 -1 +1 -1 +1 x2 -1 -1 +1 +1 -1 -1 +1 +1 x3 -1 -1 -1 -1 +1 +1 +1 +1

izelge 3. ki seviyeli drt faktrl tam faktriyel tasarm

Deney 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

x1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1

x2 -1 -1 +1 +1 -1 -1 +1 +1 -1 -1 +1 +1 -1 -1 +1 +1

x3 -1 -1 -1 -1 +1 +1 +1 +1 -1 -1 -1 -1 +1 +1 +1 +1

x4 -1 -1 -1 -1 -1 -1 -1 -1 +1 +1 +1 +1 +1 +1 +1 +1

Deneysel tasarm tablosu hazrlandktan sonra kodlanm deerler yerine faktrlerin gerek deerleri yerletirilerek deneysel alma gerekletirilir. rnein, faktrl iki seviyeli bir sistemde faktrlerin minimum ve maksimum seviyeleri izelge 4te verilmitir. izelge 4. faktr iki seviyeli bir sistemde faktrlerin minimum ve maksimum aralklar
Faktrler Katalizr konsantrasyonu (%) Reaksiyon scakl (0C) Reaksiyon sresi (dk) (-1) seviye 0.1 60 20 (+1) seviye 0.3 80 40

izelge 5, iki seviye zerinden gerekleitirilen ve katalizr konsantrasyonu (x1), reaksiyon scakl (x2) ve reaksiyon sresi (x3) faktrlerinden oluan 8 deneye ait her bir faktrn gerek skalasndaki deerleri ve bu sistemde elde edilen sonular ( y deerleri) gstermektedir. izelge 5. Deneysel sonular da ieren faktrl tasarm Deney 1 2 3 4 5 6 x1 0.1 0.3 0.1 0.3 0.1 0.3 x2 60 60 80 80 60 60 x3 20 20 20 20 40 40 y 73 71 79 82 78 89

7 8

0.1 0.3

80 80

40 40

83 93

Faktrler arasndaki etkileimler de dikkate alnarak (izelge 6) tasarm matrisi hazrlanr ve analiz edilir. Tasarm matrisi kullanlarak her bir faktr iin Microsoft Excel, MINITAB veya Design Expert gibi hazr programlar kullanlarak katsaylar hesaplanabilir. izelge 6. faktrl iki seviyeli bir sistemde dorusal model iin tasarm matrisinin deneysel sonularla bir arada verilmi hali.
Deney 1 2 3 4 5 6 7 8 x0 +1 +1 +1 +1 +1 +1 +1 +1 x1 -1 +1 -1 +1 -1 +1 -1 +1 x2 -1 -1 +1 +1 -1 -1 +1 +1 x3 -1 -1 -1 -1 +1 +1 +1 +1 x1x2 +1 -1 -1 +1 +1 -1 -1 +1 x1x3 +1 -1 +1 -1 -1 +1 -1 +1 x2x3 +1 +1 -1 -1 -1 -1 +1 +1 x1x2x3 -1 +1 +1 -1 +1 -1 -1 +1 y 73 71 79 82 78 89 83 93

izelge 6da verilen bir sistem iin, faktrler ile deneysel sonular arasndaki ilikiyi veren dorusal model denklemi eitlik 1de verilmitir.

y b0 b1 x1 b2 x2 b3 x3 b12 x1 x2 b13x1 x3 b23 x2 x3 b123x1 x2 x3 e

(1)

Eitlik 1den grld gibi denklemin 8 parametresi vardr ve toplamda 8 adet deney yapld iin szkonusu modelin tanmlanmas isetenen sisteme uygun olup olmadnn test edilebilmesi iin yeterli serbestlik derecesi kalmamtr. te yandan, szkonusu deneyler tarama ammal gerekletirildii dnldnde, faktrlerin l etkileimleri darda ihmal edilerek denklemdeki parametre says bir azaltlarak denklem katsaylar iin istatistiksel deerlendirme yapmak mmkn olacaktr. Eitlik 2, bu 8 deneyden oluan bu sistemin regresyon anlizinden elde edilen model denkleminin gstermektedir. Eitlik 2de verilen denklemin elde edilmesindeki basamaklar aada verilen 2 kaktrl 3 seviyeli bie baka uygulamal rnekte ayrntl olarak verilmitir.

y 81 2.8 x1 3.2 x2 4.9 x3 0.5 x1 x2 2.5 x1 x3 1.0 x2 x3 0.8 x1 x2 x3


2.2 Fraksiyonel faktriyel tasarm

(2)

Full faktriyel tasarmda her bir faktrn ve etkileimlerinin deney sonucuna etkileri incelenir. 2k formlne gre 7 faktr iin 128 deney, 10 faktr iin 1024 deney yaplmas

gerekir. Buradan grld gibi faktr says arttka deney says da ok fazla artt iin bu yntem pratik olmamaktadr. Birok durumda faktrler arasndaki ikili, l ve daha yksek etkileimler ok nemli olmayabilir. Bu durumda rnein 7 faktr iin 128den daha az deney yaparak faktrlerin etkileri incelenebilir. Bu ise fraksiyonel faktriyel tasarm ile gerekletirilir. Bu deney ynteminde deney says 2k-p formlnden hesaplanr. rnek: Enzim aktivasyonu ile ilgili bir almada ZnSO 4 deriimi, pH, disodyumparanitrofenilslfat, MgSO4, 2-amino-2-metil-1-propanol faktrlerinden hangisinin daha etkili olduu incelenmek istenmektedir. Bunun iin deney says 2 5-1=16 olacaktr. 16 deney iin kodlanm deerler izelge 7de verilmitir. izelge 7. 25-1fraksiyonel faktriyel tasarm
Deney 1 2 3 4 5 6 7 8 9 10 11 12 12 14 15 16 x1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 x2 -1 -1 +1 +1 -1 -1 +1 +1 -1 -1 +1 +1 -1 -1 +1 +1 x3 -1 -1 -1 -1 +1 +1 +1 +1 -1 -1 -1 -1 +1 +1 +1 +1 x4 -1 -1 -1 -1 -1 -1 -1 -1 +1 +1 +1 +1 +1 +1 +1 +1 x5 (x1x2x3x4) +1 -1 -1 +1 -1 +1 +1 -1 -1 +1 +1 -1 +1 -1 -1 +1 y 106 113 103 115 103 117 105 123 119 128 95 143 99 145 110 132

Fraksiyonel faktriyel tasarmda deney says azaltlrken baz faktrler aras etkileimler incelenemez. Belirlenen amaca gre full faktriyel veya fraksiyonel faktriyel tasarm kullanlmaldr. Fraksiyonel faktriyel tasarmn bir ok avantajlar olmakla beraber baz eksiklikleri de vardr. Deneysel tasarm incelenememektedir. sadece iki seviyeli olduu iin parabolik terimler

Tekarar edilen deneyler olmad iin hata hesab yaplamamaktadr. Deneysel tasarm sadece ikinin katlar eklindedir. rnek 1. Deneysel tasarmn nemini anlamak iin reaksiyon verimini etkileyen pH ve katalizr konsantrayonu optimize etmek isteyelim. Byle bir deneyi her bir faktr farkl seviyede denediimizde tam faktriyel bir deneysel tasarm iin en az dokuz (3 2 = 9) deney yapmamz gerekir. izelge 8, bu deneylerde optimize edilen iki faktrn minimum, orta ve maksimum seviyelerini gstermektedir.

izelge 8. ki faktrl seviyeli deneysel tasarmda faktrlerin minimum, orta ve maksimum seviyeleri. Faktr Kodlanm pH Katalizr Konsantrasyonu, M Minimum -1 3 1 Orta 0 6 2 Maksimum +1 9 3

izelge 8de verilen faktrlerin seviyeleri deneysel tasarm matrisinin oluturulmasnda genellikle kodlanm olarak verilir. Bunun nedeni her bir faktrn genellikle olduka farkl skalalara sahip olmasdr ve tasarmnn istatistiksel analizinin bu skala farkndan etkilenmesi tercih edilmez. izelge 9de gerekletirilen deney elde edilen verimlerle birlikte verilmitir. izelge 9. ki faktrl 3 seviyeli tam faktriyel deneysel tasarm ve elde edilen verimler. No 1 2 3 4 5 6 7 8 9 pH, x1 3 3 3 6 6 6 9 9 9 Katalizr Konsantrasyonu, M, x2 1 2 3 1 2 3 1 2 3 Verimi, y 41 59 60 61 76 71 61 69 59

izelge 9de gerekletirilen 9 deneyin verimleri incelendiinde en yksek verimin pH 6 ve 2 M katalizr konsantrasyonunda olduu grlmektedir. Ancak szkonusu reaksiyonda en uygun artlarn ne olaca ve ve reaksiyon verimine etki ettii dnlen bu iki faktrn istatistiksel olarak nasl bir katk yaptn grebilmek iin deneysel verim deerleri ile bu faktrler aras ilikiyi veren bir denklem kurarak inceleyebiliriz. Bu noktada, her iki faktr 3 farkl seviyede alld iin bu faktrlerin dorusal etkilerinin yannda ikinci dereceden etkileri ile birbirleri ile olan etkileimlerininde incelenmesinde fayda vardr. Eitlik 3te iki faktrl bir sistemde ikincidereceden model denklemi verilmitir.

y = b0 + b1x1 + b2x2 + b11x1^2 + b22x2^2 + b12x1x2 + e

(3)

Eitlik 3 de b0, her bir faktr kodlanm olarak orta seviyede (sfr alndnda) tutulduunda denklemin alaca sabit deeri gsterirken, b1 ve b2 katsaylar her bir faktrn dorusal katksn gsterir. te yandan b11 ve b22 deerleri ikinci dereceden (dorusal olmayan) katklar gsterirken, b12 degeride her iki faktrn etkileimlerini temsil etmektedir. Son olarak, e terimide modellenemyen artklar gstermektedir. izelge 10, eitlik 3de verilen model denklemine gre hazrlanm deneysel tasarm matrisini oluturmaktadr. izelge 10. ki faktrl seviyeli tam faktriyel bir sistemde kullanlan deneysel tasarm matrisi. No 1 2 3 4 5 6 7 8 9 b0 1 1 1 1 1 1 1 1 1 x1 -1 -1 -1 0 0 0 1 1 1 x2 -1 0 1 -1 0 1 -1 0 1 x1^2 1 1 1 0 0 0 1 1 1 x2^2 1 0 1 1 0 1 1 0 1 x1x2 1 0 -1 0 0 0 -1 0 1 y 41 59 60 61 76 71 61 69 59

izelge 10da verilen tasarm matrisinin ilk stunu deneylerin srasn gsterirken son stn ise elde edilen deneysel verimleri gstermektedir. Arada kalan 6 adet stn ise asl tasarm matrisini oluturmaktadr. Bylece matris notasyonunda eitlik 3 yeniden dzenlenirse, eitlik 4te verilen model denklemi elde edilir.

y=Dxb+e

(4)

Eitlik 4den de grlecei gibi koyu renk kk harf vektr temsil ederken koyu renkli byk harf matrisi temsil etmektedir. Bu denklemde y ve D bilinmekte olup bilinmeyen katsaylar vektrnn hesab enkk kareler metoduna gre matris notasyonunda eitlik 5te verildii gibi hesaplanr.

=(DxD) 1xDxy
(5)

Eitlik 5 kullanlarak elde edilen

katsaylar eitlik 4de yerine konarak tahmin edilen deerieri arasndaki

deerleri ve daha sonrada deneysel y deerleri ile hesaplanan farklardan artklar (eitlik 6) hesaplanabilir.

e=y-

(6)

Bu noktaya kadar verilen bu reaksiyon verimine ilikin rnein regresyon, ANOVA ve t -testi analizleri aada verilen MS Excel sayfalarnda adm adm verilmitir. ncelikle Data sekmesinden Data Analysis seenei seilerek Regression seilmelidir (Resi m 1).

Resim 1. Regresyon analizi iin verilerin regresyon analizi basama. Aada verilen (Resim 2) resimde grld gibi ilgili alanlar seildikten sonra regresyon analizi gereekletirilir.

Resim 2. Regresyon analizinin gereekletirilmesi. Regresyon analizinin sonular aagda (izelge 11, 12, 13, 14 ve 15) verilmitir. ncelikle izelge 11de seilen ikinci dereceden model denklemi kullanlarak elde edilen modelin deneysel sonular ne kadar iyi tahmin ettiini gsteren R2 deerinini grmekteyiz. Burada elde edilen R2 deeri 0.998 gibi olduka iyi bir sonu olduundan seilen model denkleminin olduka baarl olduunu grmekteyiz. izelge 11. Regresyon analizinin zeti.
zet kts Regresyon statisitii oklu R 2 R ayarlanm R2 Standart hata Gzlem says

0.999034 0.998068 0.994849 0.713624 9

izelge 12de regresyon analizinin ANOVA sonularn grmekteyiz. Burada elde edilen F deerinin 310 gibi byk bir rakam olams faktr seviyelerinin deitirilmesi ile elde edilen deneysel verim sonularnn %95 gven snrnda istatistiksel olarak anlaml olduunu syleyebiliriz. izelge 12. Regresyon analizinin ANOVA sonular
ANOVA df Regresyon Artklar SS MS F 5 789.3611 157.8722 310.0036 3 1.527778 0.509259 P-deeri 0.000287767

Toplam

8 790.8889

izelge 13, ngrlen ikinci dereceden model denklemi (eitlik 3) katsaylar ve bu katsaylarn standart hatalar, t -deerleri, P-deerleri ve %95 alt ve st gven aral (GA) verilmektedir. izelge 13. ngrlen ikinci dereceden model denklemi katsaylar ve bu katsaylarn standart istatistiksel analiz sonular.
Katsaylar Standart Hata 75.4444 0.5319 4.8333 0.2913 4.5000 0.2913 -11.1667 0.5046 -9.1667 0.5046 -5.2500 0.3568 t-deeri P-deeri 141.8385 0.0000 16.5902 0.0005 15.4461 0.0006 -22.1294 0.0002 -18.1659 0.0004 -14.7136 0.0007 %95 alt GA 73.7517 3.9062 3.5728 -12.7726 -10.7726 -6.3855 %95 st GA 77.1372 5.7605 5.4272 -9.5608 -7.5608 -4.1145

b0 b1 b2 b11 b22 b12

izelge 13den grld gibi her iki faktrn dorusal (b1 ve b2) etkilerinin P-deerleri 0.05 (=0.05) ten kk olduu iin szkonusu terimler %95 gnen snrnda istatistiksel olarak anlaml terimleridir ve model sdenkleminde bulumas gerekir. Ayrca szkonusu iki faktrn ikinci dereceden etkileri (b11 ve b22) ile bu faktrlerin birbirleri ile olan etkileimi (b12) %95 gven snrnda istatisitiksel olarak nemlidir. Bylelikle reaksiyon veriminin model denklemi Eitlik 7te verildii gibidir.

y = 75.44 + 4.83x1 + 4.50x2 11.17x1^2 9.17b22x2^2 5.25x1x2 + e

(7)

izelge 14de, eitlik 7de verilen model denklemi kullanlarak hesaplanan tahmini verim deerleri ve artk deerleri standardize edilmi artk deerleri ile birlikte verilmitir. izelge 15de normal olaslk ktlar verilmitir. ekil 4de deneysel verim deerlerinin normal olaslk grafii verilmitir. izelge 14. Tahmin edilen verimler ve artklar
Artklar sra 1 2 3 4 5 6 7 8 9

tahmin y Artklar Standart artklar 40.5278 0.4722 1.0806 59.4444 -0.4444 -1.0170 60.0278 -0.0278 -0.0636 61.7778 -0.7778 -1.7798 75.4444 0.5556 1.2713 70.7778 0.2222 0.5085 60.6944 0.3056 0.6992 69.1111 -0.1111 -0.2543 59.1944 -0.1944 -0.4449

izelge 15. Normal olaslk kts


Olaslk kts Yzde 5.555555556 16.66666667 27.77777778 38.88888889 50 61.11111111 72.22222222 83.33333333 94.44444444

y 41 59 59 60 61 61 69 71 76

ekil 4. Normal olaslk grafii ekil 5de deneysel verim deerleri ile model denklemi kullanlarak hesaplanan verim deerlerinin korelasyon grafii verilmitir. ekilden de grlecei gibi olduka baarl tahmin deerleri elde edilmitir. ekil 6, artklarn grafiini gstermektedir.

ekil 5. Deneysel verim deerlerine kar hesaplanan verim deerleri.

ekil 6. Deneysel verim deerlerine kar elde edilen artklarn grafii. Artklarn dalm incelendiinde normal bir dalm gsterdikleri grnmektedir. Bu noktada elde edilen model denklemi kullnlarak optimum artlarn belirlenmesi uygun olacaktr. Bu amala MS Excel de solver kullanlarak (Resim 3) en yksek verimi elde edebilmek iin en uygun pH ve katalizr konsantrasyonunun belirlenebilir.

Resim 3.a. Optimumartlar iin solver uygulamas ilk pencere.

Resim 3.b. Optimumartlar iin solver uygulamas ikinci pencere Resim 3.bde grld gibi en yksek verimin elde edildii koullar pH (x1) iin kodlanm deer olarak 0.2304 ve katalizr konsantrasyonu (x2) iin 0.3126 olarak bulunmutur. Burada optimum koullarn faktrlerin gerek skalas iin kar gelen deerler Eitlik 8 ile hesaplanr.
x orta (orta alt ) veya (st orta )

kod

(8)

Eitlik 8 kulanlarak pH ve katalizr konsantrasyonu (K.K.) iin optimum deerler:


pH 6 (6 3)

0.2304

pH 6.6912

0.3126

K .K . 2 ( 3 2)

K .K . 2.3126

Bylece pH 6.6912 ve katalizr konsantrasyonu 2.3126 M olduunda reaksiyon veriminin %76.86 olacan gryoruz. Bu noktada bulduumuz optimum arlarn dnda baka lokal optimum blgelerin olup olamdn anlamak iin faktrlere (x1 ve x2) karlk reaksiyon veriminin nasl deitiini grebileceimiz boyutlu yant yzey grafiinin (ekil 7) oluturulmas faydal olacaktr.

75

80

70

70

65

Verim (y)

60 50

60

55

40 10 8 6 4 pH 2 1 1.5 2.5 2 3

50

45

Katalizr Konsantrasyonu (M)

ekil 7. Katalizr konsantrasyonu ve pHa karlk reaksiyon veriminin deiimini gsteren yant yzey grafii. ekil 6dan grld gibi pHn 6 ve katalizr konsantrasyonunun yaklak 2 olduu blgede bir plato olumakta ve verim en yksek deerine ulamaktadr.

2.3 Plackett-Burman tasarm ok sayda faktrn etkisi incelenmek istendiinde full faktriyel ve fraksiyonel faktriyel tasarm yntemlerin pratik olarak uygulanmas zorlamaktadr. Sadece faktrlerin kendi etkileri incelendii, yani faktrler arasndaki etkileimlerin nemli olmad durumlarda Plackett-Burman tasarm pratik olarak uygulanabilir. Bu tasarmda geerli olan deney says, faktr says ve retici izelge 16da gsterilmitir. izelge 16. Plackett-Burman tasarm iin reticiler
Deney says 8 12 16 20 24 Faktrler 7 11 15 19 23 retici +++-+-++-+++---+++++-+-++--+--++-++++-+-+----+++++++-+-++--++--+-+----

11 faktr ve 12 deneyi ieren Plackett Burman tasarm izelge 17de gsterilmektedir. izelge 17. 11 faktr iin Plackett Burman tasarm

Bu tasarmn baz zellikleri vardr. Birinci satr ayn seviyeye sahiptir (-1 veya +1). kinci satr retici satrdr. Tablo 3teki reticilerden birisi kullanlr. Faktr says her zaman tek say ve deney says faktr saysndan bir fazladr. nc satr ikinci satrn bir yana kaydrlmas ile elde edilir (izelge 17).

Btn faktrler iin yksek ve dk seviye says eittir. Bu da kolonlarn birbiri ile ortagonal (kolonlar birbirinden bamsz) olduunu gsterir. Placktett-Burman tasarmda faktr says deney saysndan bir dktr. 11 faktr iin 12 deney yapmak gerekir. Ancak gerekte 10 faktr var ise 11. faktr sonu zerinde herhangi bir etkisi olmayan rastgele bir faktr seilir. Bu faktre dummy faktr denilir. Tasarm tablosuna kesim noktas (b0) ilave edildiinde kare matris elde edilir. 3. OPTMZASYON 3.1 Merkezi kompozit tasarm ki seviyeli faktriyel tasarmlar her bir faktrn etkilerini genel olarak inceleyen yntemlerdir. nemli faktrler belirlendikten sonra detayl inceleme yani optimum deerlerin bulunmas gerekebilir. Her bir faktrn optimum koullarnn bulunmas merkezi kompozit tasarm yntemi ile yaplr. ki nedenle optimizasyona ihtiya vardr. Birincisi, deneysel sonucu etkileyen faktrlerin optimum deerlerini bulmak. rnein, organik sentezde maksimum verimi etkileyen faktrlerin veya kromatografik ayrmada ayrma gcn etkileyen faktrlerin optimizasyonu gibi. kinci neden, her bir faktrn sonuca etkisini gsteren matematiksel modelin oluturulmas. rnein, bir rnn FTIR spektrumu ile rnn zellii ve retim prosesi arasndaki iliki kurulmasna ihtiya duyulabilir. Faktriyel tasarmlar tekrarlanan deney says ve parabolik etkileri incelemez. Plackett-Burman ve fraksiyonel faktriyel tasarmn baz faktrlerinde, faktrler arasndaki etkileimleri incelemek mmkn deildir. nemli faktrler belirlendikten sonra parabolik etkiler ve faktrler arasndaki etkileimler hesaplanr. Merkezi kompozit tasarmda deney says aadaki formle gre belirlenir. Tasarm says 2 k 2 k 1 (k: faktr says) Formldeki 2k full faktoriyel veya fraksiyonlu faktoriyel tasarmdaki deney saylarn, 2k star tasarm deney saysn ve 1 ise orta seviyedeki deney saysn gsterir. 2 kdaki seviyeler (-1) ve (+1), 2kdakiler , 1deki ise (0) dr. deeri dairesel ve ortagonal tasarma gre farkl seviyeler alr. Dairesel tasarmda aadaki formle gre hesaplanr.

4 2k
Ortagonal tasarmda ise aadaki formle gre hesaplanr.

k
rnek: 3 faktr (k=3) iin dairesel tasarmda = 1.682, ortagonal tasarmda = 1.732 bulunur. rnek 2: Petrol rafinasyonunda kkrt (S) uzaklatrlmas ileminde etkin olduu belirlenen scaklk (T, oC), ak kz (V, g/sn) ve basn (P, bar) faktrlerinin optimizasyonu hedeflenmektedir. izelge 18de faktrlerin 5 ayr seviyede ald deerler kodlanm ve ham hallerinde verilmitir. Bu almann amac rafine edilecek olan rnde en dk kkrt

miktarn elde etmek iin optimum scaklk, ak hz ve basncn belirlenmesidir. Denemelerden elde edilen sonular ppm S cinsinden hesaplanmtr. izelge 18. faktrl merkezi kompozit tasarmda faktrlerin ald deerler. Faktrler Kodlanm x1, T (oC) x2, V (g/sn) x3, P (bar) - -1.682 334.18 99.54 46.64 -1 -1 341 120 48 Orta 0 351 150 50 +1 +1 361 180 52 + +1.682 367.82 200.46 53.36

izelge 18de verilen 1.682 kodlanm seviyesindeki faktrlerin gerek deerleri aada verildii gibi hesaplanabilir. rnein, x2 faktr iin:
x2 150 (150 120) veya (180 150)
x1 99.54 x1 200.46

x2 150 30 x 150 1.682 2 30 1.682

Bu deerlere gre tasarm tablosu kodlanm ve kodlanmam halde aadaki ekilde (izelge 19) dzenlenir.

izelge 19. Merkezi Kompozit Tasarm Tablosu

deney 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

T (oC) V (g/sn) P (bar) x1 x2 x3 y, (ppm S) 341 120 48 -1 -1 -1 68 341 120 52 -1 -1 1 81 341 180 48 -1 1 -1 170 341 180 52 -1 1 1 200 361 120 48 1 -1 -1 38 361 120 52 1 -1 1 55 361 180 48 1 1 -1 67 361 180 52 1 1 1 62 334.18 150 50 -1.6818 0 0 180 367.82 150 50 1.6818 0 0 39 351 99.54 50 0 -1.6818 0 17 351 200.46 50 0 1.6818 0 130 351 150 46.64 0 0 -1.6818 44 351 150 53.36 0 0 1.6818 55 351 150 50 0 0 0 42 351 150 50 0 0 0 41 351 150 50 0 0 0 43 351 150 50 0 0 0 45 351 150 50 0 0 0 44 351 150 50 0 0 0 43

izelge 19daki tasarmda; k 8 deney (23=8) iki seviyeli full faktriyel tasaqrma edeer deney saysn, Takip eden 7 deney (2*3+1= 7) ydz noktalarn ve bir adet orta noktadaki deneyleri, Son 5 deney orta seviyenin tekrar edilen deney says olmak zere toplam 20 deney yaplmaktadr. Bu faktrl tasarmda ikini dereceden matematiksel model aadaki (Eitlik 9) gibi gsterilebilir.
= b0 + b1x1 + b2x2 + b3x3 + b11x12 + b22x22 + b33x32 + b12x1x2 + b13x1x3 + b23x2x3 +b123x1x2x3 y

(9) Bu modelde; 1 kesim noktas (b0), 3 (=k) lineer etkileimler (b1, b2, b3), 3 (=k) parabolik terimler (b112, b222, b332), 3 ikili etkileimler (b12, b13, b23) terimleri bulunmaktadr. izelge 20de yukarda verilen eitlikteki model denklemine kar gelen deneysel tasarm izelgesi vailmitir.

izelge 20. kinci dereceden 3 faktrl merkezi kompozit tasarm tablosu.


deney x1 x2 x3 x1^2 x2^2 x3^2 x1x2 x1x3 x2x3 x1x2x3 y, (ppm S) 1 -1 -1 -1 1 1 1 1 1 1 -1 68 2 -1 -1 1 1 1 1 1 -1 -1 1 81 3 -1 1 -1 1 1 1 -1 1 -1 1 170 4 -1 1 1 1 1 1 -1 -1 1 -1 200 5 1 -1 -1 1 1 1 -1 -1 1 1 38 6 1 -1 1 1 1 1 -1 1 -1 -1 55 7 1 1 -1 1 1 1 1 -1 -1 -1 67 8 1 1 1 1 1 1 1 1 1 1 62 9 -1.682 0 0 2.828 0 0 0 0 0 0 180 10 1.682 0 0 2.828 0 0 0 0 0 0 39 11 0 -1.682 0 0 2.828 0 0 0 0 0 17 12 0 1.682 0 0 2.828 0 0 0 0 0 130 13 0 0 -1.682 0 0 2.828 0 0 0 0 44 14 0 0 1.682 0 0 2.828 0 0 0 0 55 15 0 0 0 0 0 0 0 0 0 0 42 16 0 0 0 0 0 0 0 0 0 0 41 17 0 0 0 0 0 0 0 0 0 0 43 18 0 0 0 0 0 0 0 0 0 0 45 19 0 0 0 0 0 0 0 0 0 0 44 20 0 0 0 0 0 0 0 0 0 0 43

izelge 20 yakndan incelendiinde en dk kkrt deerine sahip deney 11inci srada verilen ve 17 ppm S deerini gsteren denemedir. Bu denemde ak scaklk iin sfr kodlanm deer, ak hz iin -1.682 ve basn iin sfr kodlanm deerler szkonusudur. Bylece, bu denemede ak hznn en dk olduu, scaklk ve basncn orta seviyede tutulmas ile en dk kkrt oranna eriildii grlmektedir. Ancak, szkonusu 20 denemenin istatistiksel analizleri yapldnda farkl optimum deerlerde ortaya kabilir. Resim 4, bu rnein MINITAB ortamndaki veri analizinin adm adm nasl yapldn gstermektedir.

Resim 4. rnek 2nin MINITAB ortamna zm. Resim 4de gsterildii gibi, MINITAB alma sayfasnn ilk stunu deneylerin srasn gstermektedir. Daha sonra 2, 3, 4nc stunlar srasyla scaklk (x1), ak hz (x2) ve basn (x3) faktrlerinin gerek skalalarnda ald deerleri gstermektedir. Takipm eden 3 stun ise bu faktrlerin kodlanm hallerini gstermektedir. Sekizinci stun ise denelerden elde edilen sonularn verildii stunu gstermektedir. izelge 21de MINITAB analizinden gelen sonular yer almaktadr. Ayrca, Resim 5, MINITAB kullanlarak elde edilen modelin grafik sonularn gstermektedir. Elde edilen bu model kullanlarak oluturulan optimum artlar Resim 6da verilmitir. Son olrak, boytutlu yant yzey grafikleri Resim 7d e verilmitir. Resim 8, kontugrafiklerini gstermektedir. izelge 21. MINITAB program kullanlarak rnek 2nin zm.
Response Surface Regression: y, (ppm S) versus T (oC), V (g/sn), P (bar)
The analysis was done using coded units. Estimated Regression Coefficients for y, (ppm S) Term Constant T (oC) V (g/sn) P (bar) T (oC)*T (oC) V (g/sn)*V (g/sn) P (bar)*P (bar) T (oC)*V (g/sn) T (oC)*P (bar) V (g/sn)*P (bar) Coef 42.575 -65.782 55.056 9.047 74.277 38.277 14.295 -65.423 -10.950 -1.766 SE Coef 3.801 4.242 4.242 4.239 6.944 6.944 6.941 9.322 9.311 9.311 T 11.201 -15.509 12.980 2.134 10.697 5.513 2.060 -7.018 -1.176 -0.190 P 0.000 0.000 0.000 0.059 0.000 0.000 0.066 0.000 0.267 0.853

S = 9.31948 PRESS = 6808.55 R-Sq = 98.36% R-Sq(pred) = 87.13% R-Sq(adj) = 96.88% Analysis of Variance for y, (ppm S) Source Regression Linear Square Interaction Residual Error Lack-of-Fit Pure Error Total Obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 StdOrder 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 DF 9 3 3 3 10 5 5 19 Seq SS 52028.7 35919.8 11707.5 4401.4 868.5 858.5 10.0 52897.2 Adj SS 52028.7 35919.8 11707.5 4401.4 868.5 858.5 10.0 Adj MS 5781.0 11973.3 3902.5 1467.1 86.9 171.7 2.0 F 66.56 137.86 44.93 16.89 85.85 P 0.000 0.000 0.000 0.000 0.000

y, (ppm S) 68.000 81.000 170.000 200.000 38.000 55.000 67.000 62.000 180.000 39.000 17.000 130.000 44.000 55.000 42.000 41.000 43.000

Fit 60.791 80.562 173.756 191.026 36.573 40.843 57.038 58.808 182.634 51.071 25.797 135.909 47.823 65.917 42.575 42.575 42.575

SE Fit 7.627 7.627 7.627 7.627 7.627 7.627 7.627 7.627 7.264 7.264 7.264 7.264 7.259 7.259 3.801 3.801 3.801

Residual 7.209 0.438 -3.756 8.974 1.427 14.157 9.962 3.192 -2.634 -12.071 -8.797 -5.909 -3.823 -10.917 -0.575 -1.575 0.425

St Resid 1.35 0.08 -0.70 1.68 0.27 2.64 R 1.86 0.60 -0.45 -2.07 R -1.51 -1.01 -0.65 -1.87 -0.07 -0.19 0.05

18 18 45.000 42.575 3.801 2.425 0.28 19 19 44.000 42.575 3.801 1.425 0.17 20 20 43.000 42.575 3.801 0.425 0.05 R denotes an observation with a large standardized residual. Estimated Regression Coefficients for y, (ppm S) using data in uncoded units Term Constant T (oC) V (g/sn) P (bar) T (oC)*T (oC) V (g/sn)*V (g/sn) P (bar)*P (bar) T (oC)*V (g/sn) T (oC)*P (bar) V (g/sn)*P (bar) Coef 29429.8 -166.968 24.1582 -54.3591 0.262546 0.0150331 1.26620 -0.0770833 -0.193750 -0.0104167

Normal Probability Plot


99 90 50 10 -10 1 -20 -10 0 Residual 10 20 50 10

Versus Fits

Residual

Percent

100 150 Fitted Value

200

Histogram
8 10

Versus Order

Frequency

4 2

Residual
-10 -5 0 5 Residual 10 15

-10 0 2 4 6 8 10 12 14 16 Observation Order 18 20

Resim 5. MINITAB kullanlarak elde edilen modelin grafik sonularn.

New High D Cur 0.00000 Low

T (oC) 367.820 [351.7966] 334.180

V (g/sn) 200.460 [116.9115] 99.540

P (bar) 53.360 [48.9596] 46.640

Composite Desirability 0.00000

y, (ppm Targ: 17.0 y = 20.3864 d = 0.00000

Resim 6. Elde edilen bu model kullanlarak oluturulan optimum artlar.

Surface Plots of y, (ppm S)

300 y, ( ppm S) 200 100 0 340 350 T ( oC ) 360 100 150 200 V ( g/sn)

150 y, ( ppm S) 100 50 0 340 350 T ( oC ) 48 360 52 50 P ( bar )

150 y, ( ppm S) 100 50 100 48 200 50 52 P ( bar )

Hold Values T (oC) 352 V (g/sn) 117 P (bar) 50

150 V ( g/sn)

Resim 7. boytutlu yant yzey grafikleri.

Contour Plots of y, (ppm S)


200 175 51.0 150 125 100 340 350 360 340 350 360 P (bar)*V (g/sn) 52.5 51.0 49.5 48.0 49.5 48.0 V (g/sn)*T (oC) 52.5 P (bar)*T (oC)

y, (ppm S) < 50 50 100 100 150 150 200 200 250 250 300 > 300
200

Hold Values T (oC) 352 V (g/sn) 117 P (bar) 50

100

125

150

175

Resim 8. kontur grafikleri.

BLM II YNLENDRMESZ SINIFLANDIRMA VE KMELEME TEKNKLER

KONULAR 1. Temel Bileen Analizi (Principal Component Analysis) 1.1. Eigen Deerler 1.2. Verilerin Analize Hazrlanmas a. Merkeziletirme b. Standartlatrma c. Normalizasyon 2. Ynlendirmesiz Kmeleme Teknikleri (Unsupervised Pattern Recognition: Cluster Analysis) 2.1. klit Uzakl (Euclidien distance) 2.2. Manhattan uzakl (Manhattan distance) 2.3. Mahalanobis uzakl (Mahalanobis distance) 1. TEMEL BLEEN ANALZ (PRINCIPAL COMPONENT ANALYSIS, PCA) ok deikenli veri analizinde temel bileen analizi en ok kullanlan tekniklerden biridir. Temel bileen analizi rnekler ve deikenler arasndaki ilikiyi incelemek iin kullanlan bir keomoetrik yntemdir. Temel bileen analizinde X ile gsterilen bir veri matrisi, T ile gsterilen bir skore matrisi, P ile gsterilen bir loadings matrisi ve E ile gsterilen bir hata matrisi bulunur. Bu deerlerle ilgili eitlik (Eitlik 1) aadaki gibi verilebilir. X = TP +E (1)

Temel bileen analizinin uygulanmasnda eitli algoritmalar kullanlmaktadr. En ok kullanlan algoritmalar NIPALS (Srekli olmayan en kk kareler) ve SVD ( Tek deer ayrma)dr. NIPALS algoritmas istenilen sayda temel bileen hesaplamak iin kullanlr. SVD algoritmas ise temel bileenlerin tamamn hesaplamaktadr. PCA iin genel eitlik temel bileenlerin toplam olarak eitlik 2de aadaki gibi de yazlabilir. X=

t
k 1

' pk E

(2)

Eitlikte k bileen saysn belirtmektedir. Veri matrisinin ayrntl yaps yledir

Burada grld gibi ilk olarak t1 skor ve p1 loadigsi ile t1 p1 arpm elde edilir. Eer t1 p1 arpmn X matrisinden karlrsa E1 hatas hesaplanm olur. Bu hata bir sonraki hatay hesaplamada kullanlr. Bununla ilgili bantlar aadadr (Eitlik 3 ve 4) E1 = X t1 p1 (3) E2 = E1 t2 p2 k sayda bileen iin hata hesabna ynelik aadaki eitlik (Eitlik 5) kullanlmaktadr. Ek = Ek-1 - tk pk (5) (4)

Yukardaki eitlikte pk simgesiyle gsterilen loadings vektr u ekilde hesaplanr (Eitlik 6). pk = tX / t t Ayn ekilde benzer bir forml ile sckor vektr tk yle hesaplanr (Eitlik 7). tk = X pk / pk pk (7) (6)

Yukardaki eitliklerde verilen loadings (ykleme) ve skor vektrleri her bir bileen iin hesaplanr ve bylece temel bileenler elde edilir. Temel bileen analizi hem analitik kimya ile ilgili almalarda hem dedier uygulamalarda ska kullanlan kemometrik yntemlerden biridir. Temel bileenlerin hesaplanmasnda kullanlan loadings ve skor deerleri normalizasyon ve ortagonallik gibi baz nemli zelliklere sahiptir. Normalizasyon her temel bileendeki loadings deerlerinin karelerinin toplamnn 1e eit olmasdr (Eitlik 8).

j 1

2 p kj 1

(8)

Eitlikte pkj knc temel bileenin jinci loadingini ifade etmektedir. Ortagonallik ise skor veya loadinglerin kolonlarnn arpmlarnn sfra eit olmasdr (Eitlik 9).

t
i 1

ik il

t 0

(9)

1.1 Eigen Deerler Temel bileen analizinde eigen deerler verideki bileen saysnn bulunmasnda kullanlr. En yksek eigen deeri en nemli temel bileen anlamna gelmektedir. Kemometri literatrnde eigen deerlerine ynelik bir ok tanm bulunmaktadr. Genel istatistiksel tanm bir temel bileenin deiimidir. Eigen deer genellikle temel bileen skorlarnn karelerinin toplamnn rnek saysnn bir eksiine blnmesiyle elde edilir. fade matemetiksel olarak yle verilmitir (Eitlik 10).
I

t
gk =
i 1

2 ik

I 1

(10)

Baz aratrmaclar ise eigen deerleri basit bir ekilde temel bileen skorlarnn karelerinin toplamn rnek saysna blerek hesaplamlardr (Eitlik 11).
I

t
gk =
i 1

2 ik

(11)

1.2. Verilerin Analize Hazrlanmas Kemometrik analizlerde ham veri byk neme sahiptir. Yaplan bir deneysel alma sonrasnda elde edilen verilerin kemometrik hesaplamalarna gemeden nce verilerin zellikleri dikkatle incelenmelidir. Elde edilen veriler arasnda birbirinden ok farkl deerler bulunuyorsa ya da deerler aras byk dengesizlik varsa, verilerin benzer birimlere evrilmeleri veya ortalama deer etrafnda toplanmas gerekebilir. Bunun gibi durumlarda verilere merkeziletirme, standartlatrma ve normalizasyon gibi verilerin analize hazrlanmasna ynelik ilemler uygulanr. a) Merkeziletirme Kemometrik analizde veri matrisinin X simgesiyle ifade edildii ve bu matrisin satrlarnn i stunlarnn ise j simgeleriyle gsterildii daha nce belirtilmiti. Buna gre Xij eklindeki bir veri matrisinin merkeziletirme ilemi Eitlik 12 ile u ekilde yaplmaktadr.

xij = xij xj

(12)

Eitlik 12de mxij merkeziletirme ilemi yaplm matrisi ifade etmektedir. xij iinci satr jinci stundaki matris elemann, xj ise her bir kolonun ortalamasn belirtmektedir. Eitlikten de grlebilecei gibi, matristeki her bir kolonun ortalamasnn kolon elemanlarndan karlmasyla matris verisinin merkeziletirme ilemi yaplm olmaktadr. Bylece matristeki her bir deer ortalama evresinde toplanm olmaktadr. b) Standartlatrma Standartlatrma ileminde ncelikle her bir kolonun ortalama ve standart sapmas hesaplanr. Daha sonra kolondaki her bir elemandan kolon ortalamas karlr ve kolon standart sapmasna blnr. Bylece matris verisi standartlatrlm olur (Eitlik 13).
S

xij

xij x j

(x
i 1

ij

x j )2
(13)

N 1

S Eitlik 13te xij simgesi standartlatrma ilemi yaplm matrisi ifade eder.

c) Normalizasyon Normalizasyon ilemi verilerin sabit bir deere getirilmesi ilemidir. Matris zerinde normalizasyon ilemi yaplrken nce satr elemanlar toplanr ve toplam deerler her satr iin ayr ayr hesaplanr. Sonra her bir satr toplam her satrn kendi elemanlarna blnr ve normalizasyon ilemi tamamlanm olur (Eitlik 14).

xij

xij

x
i 1

(14)

Eitlik 14te

xij simgesi normalize edilmi matrisi ifade etmektedir.

rnek 1. Aada tabloda farkl corafi blgede yetien ayn tr zmden yaplm 21 adet arap rneine ait 13 farkl deikenin incelendii veriler verilmitir. Bu almadaki ama, bu verileri kullanarak szkonusu 21 adet rnei PCA analizi kullanarak doru ekilde ait olduu gruplara snflandrmaktr.

No
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

X1
14.83 13.86 14.1 14.12 13.75 14.75 14.38 11.66 13.03 11.84 12.33 12.7 12 12.72 12.25 13.16 13.88 12.87 13.32 13.08 13.5

X2
1.64 1.35 2.16 1.48 1.73 1.73 1.87 1.88 0.9 2.89 0.99 3.87 0.92 1.81 3.88 3.57 5.04 4.61 3.24 3.9 3.12

X3
2.17 2.27 2.3 2.32 2.41 2.39 2.38 1.92 1.71 2.23 1.95 2.4 2 2.2 2.2 2.15 2.23 2.48 2.38 2.36 2.62

X4
14 16 18 16.8 16 11.4 12 16 16 18 14.8 23 19 18.8 18.5 21 20 21.5 21.5 21.5 24

X5
97 98 105 95 89 91 102 97 86 112 136 101 86 86 112 102 80 86 92 113 123

X6
2.8 2.98 2.95 2.2 2.6 3.1 3.3 1.61 1.95 1.72 1.9 2.83 2.42 2.2 1.38 1.5 0.98 1.7 1.93 1.41 1.4

X7
2.98 3.15 3.32 2.43 2.76 3.69 3.64 1.57 2.03 1.32 1.85 2.55 2.26 2.53 0.78 0.55 0.34 0.65 0.76 1.39 1.57

X8
0.29 0.22 0.22 0.26 0.29 0.43 0.29 0.34 0.24 0.43 0.35 0.43 0.3 0.26 0.29 0.43 0.4 0.47 0.45 0.34 0.22

X9
1.98 1.85 2.38 1.57 1.81 2.81 2.96 1.15 1.46 0.95 2.76 1.95 1.43 1.77 1.14 1.3 0.68 0.86 1.25 1.14 1.25

X10
5.2 7.22 5.75 5 5.6 5.4 7.5 3.8 4.6 2.65 3.4 2.57 2.5 3.9 8.21 4 4.9 7.65 8.42 9.4 8.6

X11
1.08 1.01 1.25 1.17 1.15 1.25 1.2 1.23 1.19 0.96 1.06 1.19 1.38 1.16 0.65 0.6 0.58 0.54 0.55 0.57 0.59

X12
2.85 3.55 3.17 2.82 2.9 2.73 3 2.14 2.48 2.52 2.31 3.13 3.12 3.14 2 1.68 1.33 1.86 1.62 1.33 1.3

X13
1045 1045 1510 1280 1320 1150 1547 428 392 500 750 463 278 714 855 830 415 625 650 550 500

Yukarda verilen tabloda rnekler satrlarda deikenler stunlarda verilmitir. Bu veri MINITAB ortamna aktarlarak aada verilen Resimdeki gibi PCA analizi gerekletirilebilir.

ncelikle ilk iki temel bileen verideki toplam deikenliin %67.77 sini akladn aada verilen izelgedeb grmekteyiz.

E.V

% Variance C. % Var

6.134532 47.44872 47.44872 2.627051 20.31943 67.76815

Bu noktadan haraketle PCA anlizinden gen ilk iki temel bileen skor vektrn birbirine kar grafie geirdiimizde aada verilen PCA skor grafiini elde etmi oluruz.
13 8

10

11 14

PC2

12 16

17 15 4 5 1 2 3 6

-1

18 20

19

-2 -4 -3

21

-2

-1

PC1

Yukarda verilen PCA skor grafiini yakndan incelediimizde ilk 7 rnein karaktesitik olarak grafiin sa alt tarafndan yer aldklarnn ve digger rneklerden net bir ekilde ayrldklarn grmekteyiz. Ayn ekilde sol alt kede kmelenen 7 rnek dier bir grubu gsterirken ste grnen 7 rnekte 8-14 numaral rnekleri gstermektedir. PCA analizinde, ayrca bu rneklerin gruplandrlmasnda kullanlan 13 deikenin ykleme grafii oluturulur. Aadaki ekil PCA analizinden gelen ilk iki ykleme vektrnn birbirine kar grafiini gstermektedir.
0.3 0.2
X12 X11

0.1
X8

0.0

X4

X5

PC2

-0.1 -0.2 -0.3 -0.4


X10 X1 X3 X2

X7 X9 X6

X13

-0.5 -0.6 -0.4 -0.3 -0.2 -0.1

0.0

0.1

0.2

0.3

0.4

PC1

Yukarda verilen ykleme grafiini incelediimizde zellikle x1 ve x13 deikenleri ilk 7 rnein snflandrmasnda byk rol alrken x3 ve x10 deikelnleri son 7 rnei daha iyi karakterize etmekte ve son olarak x8 ve x11 deikenleri 8 -14 arasndaki rnekleri daha iyi snflandrm grnmektedir.

2. YNLENDRMESZ KMELEME ANALZ (UNSUPERVISED PATTERN RECOGNITION: CLUSTER ANALYSIS) Kmeleme analizi rnekler ya da deikenler arasndaki benzerliklerin gsterilmesi ve yorumlanmasna ynelik kimyada ska kullanlan kemometrik yntemlerden birisidir. Kmeleme analizi ile benzer rnekler ayn grup altnda toplanabilmektedir. Kmeleme analizi ynlendirmesiz (unsupervised pattern recognition) ve ynlendirmeli (supervised pattern recognition) olmak zere iki ekilde yaplabilmektedir. Bu blmde ynlendirmes iz kmeleme tekniinden bahsedilecektir. Ynlendirmesiz kmeleme tekniinde birinci adm rnekler arasndaki benzerlii belirlemektir. Tablo 1de 6 ayr kan rneinde kalsiyum ve fosfat analizi sonular verilmitir. izelge 1. Kan rneklerinde kalsiyum ve fosfat deerleri
rnek 1 2 3 4 5 6 Kalsiyum (mg/100mL) 8.0 8.25 8.7 10.0 10.25 9.75 Fosfat (mg/100mL) 5.5 5.75 6.3 3.0 4.0 3.5

Kalsiyum ve fosfat ieriine gre 6 kan rnei arasnda benzerlik ilikisi kurulabilir. rnekler arasndaki benzerlik ilikisini veren ve en ok kullanlan 3 yntem aada aklanmtr. 2.1. klit Uzakl (Euclidean distance) ki rnek (k ve l) arasndaki iliki aadaki formlle verilir (Eitlik 15).

d kl

j 1

2 ( xkj xlj )

(15)

Burada j, llen deerleri gstermektedir. xij de i rneinde j lmn, yani x32 3. rnekteki 2. lm, Tablo 1deki 6.3 fosfat deerini gsterir. ki rnek arasndaki klit uzakl kk ise bu rnekler birbirine benzerdir. klit uzakl matris formatnda aadaki gibi yazlabilir (Eitlik 16).

d kl ( x k x l ).( x k x l )'

(16)

Burada izelge 1de gsterilen her bir kolon bir vektrdr. Bu forml Excel veya Matlabta kolaylkla hesaplanabilir.

2.2. Manhattan uzakl (Manhattan distance) klit uzaklndan biraz farkldr. rnekler arasndaki iliki benzer ekilde deerlendirilir. Manhattan uzaklnda matris tablosundaki deerler klit uzaklndan daha byktr. Manhattan uzakl aadaki formlle hesaplanr (Eitlik 17).
J

d kl | xkj xlj |
j 1

(17)

klit uzakl ile Manhattan uzakl arasndaki fark ekil 1de gsterilmitir.
Manhattan uzakl
klit uzakl

ekil 1. klit ve Manhattan uzakl ilikisi 2.3. Mahalanobis uzakl (Mahalanobis distance) En sk kullanlan kemometrik yntemleden birisidir ve klit uzaklna benzerdir. Birbiri ile korelasyona sahip deikenleri dikkate alan bir yntemdir. k ve l rnekleri arasndaki ilikiyi veren uzaklk aadaki matris terimi ile hesaplanabilir (Eitlik 18). dkl = (xk - xl). C-1. (xk - xl)' (18)

Burada C deikenlerin varyans-kovaryans matrisi gsterir. Deiken says rnek saysndan fazla olduunda bu metot kolaylkla uygulanamaz. nk bu durumda varyans kovaryans matrisinin tersi yoktur. Kmeler aras uzaklklar farkl yntemlerle hesaplanabilir (Eitlikler 19, 20, 21, 22, 23, 24 ve 25). a. Ortalama link (Average Likage) (Eitlik 19)
d ki d Ai d Bi 2

(19)

b. Tekli link (Single Linkage) Bu eitlikte kmeler aras en ksa mesafe aadaki gibi hesaplanr (Eitlik 20).

d ki

d Ai d Bi d Ai d Bi min( d Ai , d Bi ) 2 2

(20)

c. Toplam link (Complete Linkage) Bu metotta kme noktalar arasndaki en geni mesafe dikkate alnarak klit uzakl hesaplanmaktadr (Eitlik 21).

d ki

d Ai d Bi d Ai d Bi max( d Ai , d Bi ) 2 2

(21)

d. Arlkl ortalama link (Weighted Average Linkage) Bu metotta kmeler aras uzakln hesaplanmasnda bileen says dikkate alnr (Eitlik 22).
d ki NA N d Ai B d Bi N N N NA NB

(22)

e. Merkezi (Centroid) Bu metotta iki kmenin merkezleri arasndaki mesafe dikkate alnarak bek uzakl hesaplanmaktadr (Eitlik 23).

d ki

NA N N N d Ai B d Bi A 2 B d AB N N N

(23)

f. Medyan (Median) (Eitlik 24)

d ki

d Ai 2

d Bi d AB 2 4

(24)

g. Ward metodu (Wards Method) (Eitlik 25)


d ki N A Ni N Ni Ni d Ai B d Bi d AB N Ni N Ni N Ni

(25)

Yukarda verilen eitliklerde (k) ve (i) simgeleri (k) numaral kolonun (i) numaral elemann ifade eder. A ve B simgeleri ise rnekleri gsterir.

izelge 1deki veriler dikkate alnarak rnek klit uzakl aadaki ekilde hesaplanabilir. Kalsiyum iin 1. ve 2. rnekler arasndaki klit uzakl, d12 = [(8-8.25)2 + (5.5-5.75)2]1/2 = 0.354 dir. Matristeki her rnek iin klit uzakl ayn ekilde hesaplandnda aadaki izelge 2 elde edilir. izelge 2. klit uzakl tablosu
rnek 1 2 3 4 5 6 1 0 0.354 1.063 3.201 2.704 2.658 2 0 0.711 3.260 2.658 2.704 3 4 5 6

0 3.347 2.774 2.990

0 1.031 0.559

0 0.707

Uzaklk matrisinin indirgenmesi rneklerin toplanmasyla yaplmaktadr. Burada kural en ksa uzakla sahip rneklerin ilk olarak toplanmasdr. Aada toplama ilemi srasyla gsterilmitir. 1. ndirgenmi matris Tablo 2de grld gibi matristeki en ksa uzaklk 1. ve 2. rnekler arasndadr. Yani d12 = 0.354 olmaktadr. 1. ve 2. rnek 1* ile gsterilen yeni bir bileen olarak birletirilir ve aralarndaki uzaklk sfra eitlenir. Bylece rnekler arasndaki yeni uzaklk deerleri aadaki gibi hesaplanr.
d13 d 23 1.063 0.711 0.887 2 2 d14 d 24 3.202 3.260 3.231 2 2
d15 d 25 2.704 2.658 2.681 2 2

d1*3 d1*4
d1*5

d1*6

d16 d 26 2.658 2.704 2.681 2 2

1. ndirgenmi matris aadaki izelgede (izelge 3)gsterilmitir.

izelge 3. ndirgenmi matris


rnek 1* 3 4 5 6 1* 0 0.887 3.231 2.681 2.681 3 0 3.347 2.774 2.990 4 5 6

0 1.031 0.559

0 0.707

2. ndirgenmi matris Tablo 3te grld gibi matristeki en ksa uzaklk 4. ve 6. rnekler arasndadr. Yani d46 = 0.559 olmaktadr. 4. ve 6. rnek 4 * ile gsterilen yeni bir bileen olarak birletirilir ve aralarndaki uzaklk sfra eitlenir. Bylece rnekler arasndaki yeni uzaklk deerleri aadaki gibi hesaplanr.
d 5*4 d 54 d 56 1.031 0.707 0.869 2 2

d 4*3 d 4*1*

d 43 d 63 3.547 2.990 3.269 2 2 d 41* d 61* 3.231 2.681 2.956 2 2

2. ndirgenmi matris izelge 4te gsterilmitir. izelge 4. ndirgenmi matris


rnek 1* 3 4* 5 1* 0 0.887 2.956 2.681 3 0 3.269 2.774 4* 5

0 0.869

3. ndirgenmi matris Tablo 4te grld gibi matristeki en ksa uzaklk 5. ve 4 *. rnekler arasndadr. Yani d54* = 0.869 olmaktadr. 5. ve 4 *. rnek 5* ile gsterilen yeni bir bileen olarak birletirilir ve aralarndaki uzaklk sfra eitlenir. Bylece rnekler arasndaki yeni uzaklk deerleri aadaki gibi hesaplanr.
d1*5* d 35* d 51 d 4*1* 2.681 2.956 2.819 2 2 d 4*3 d 53 0.887 2.774 1.813 2 2

3. ndirgenmi matris izelge 5te gsterilmitir.

izelge 5. ndirgenmi matris


rnek 1* 3 5* 1* 0 0.887 2.819 3 0 1.831 5*

4. ndirgenmi matris izelge 5ten grld gibi matristeki en ksa uzaklk 1*. ve 3. rnekler arasndadr. Yani d1*3 = 0.887 olmaktadr. Bu veriler rnek 3 * ile gsterilen yeni bir bileen olarak birletirildiinde rnekler arasndaki yeni uzaklk deerleri aadaki gibi hesaplanr.
d 3*5* d 5*1* d 5*3 1.831 2.274 2.325 2 2

4. ndirgenmi matris izelge 6da gsterilmitir. izelge 6. ndirgenmi matris


rnek 3* 5* 3* 0 2.547 5* 0

Sonu olarak yukarda hesapladmz noktalar bir grafik zerinde gsterirsek aadaki dendrogram elde ederiz (ekil 2).

100

80

Benzerlik

60

40 3*

5* 20 4*

1* 0 5 6 4 rnekler 3 2 1

ekil 2. rnekler arasndaki ilikiyi veren dendrogram.

Bu hesaplamalar karmak gibi grnse de konunun anlalmas asndan yararldr. Kmeleme analizi daha kolay olarak baz hazr programlarla (Statistica gibi) da yaplabilmektedir. ekil 2de grld gibi bu rnekte iki temel kme bulunmaktadr. 1,2,3 bir kme 4,5,6 baka bir kmeyi gstermektedir. rnek 2. Aada izelgede farkl corafi blgelerden elde edilmi 20 adet zeytin ya rneinin ya asitleri profilini gstermektedir. Bu veriler kullanlarak PCA ve HCA analizleri yaplacak ve szkonusu 20 rnein ka farkl gruba ayrlaca belirlenmek istenmektedir.
samples 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 palmitic palmitoleic stearic oleic linoleic eicosanoic linolenic eicosenoic 911 49 268 7924 678 51 70 44 922 66 264 7990 618 49 56 29 1100 61 235 7728 734 39 64 35 1082 60 239 7745 709 46 83 33 1037 55 213 7944 633 26 52 30 1285 129 244 7323 819 57 65 36 1248 107 313 7299 840 46 66 33 1356 106 236 7209 866 48 75 36 1260 102 228 7354 870 49 64 28 1261 121 312 7238 877 47 65 25 1364 204 225 6929 1084 21 50 14 1410 199 216 7130 955 21 48 19 1384 178 208 7105 999 29 67 26 1412 185 217 6842 1203 34 72 32 1410 232 280 6715 1233 32 60 24 1136 72 341 7616 661 49 65 32 926 41 277 7815 784 45 65 25 1105 69 373 7714 532 51 68 37 1109 79 305 7576 763 45 64 36 1284 93 265 7235 893 43 77 46

Yukarda verilen veri ncelikle MINITAB ortamna aktarlm ve PCA ve HCA analizleri ayr ayr gerekletirilmitir. Yukarda PCA rnei verilirken MINITAB ortamnda analizin nasl balatld bir resim ile verilmiti. Bu nedenle burada sadece HCA analizi nasl balatlyor zerinde durulacak ve aada verilen resim HCA analizinin emasn gstermektedir.

Yukarda MINITAB alma sayfasnda gsterilen veriler ncelikle PCA analizine tabi tutulmu ve szkonusu 20 rnein nasl snfland aada verilen ilk iki temel bileen skor vektrnn birbirine kar grafii izilerek gsterilmitir .
3
5

11

12 17

3 19 7 6 14 8 20 16 18 4

PC2

0
15

13

9 10

-1

-2 -4 -3 -2 -1 0

PC1

PCA analizinden gelen ilk iki skor vektrnn grafiini incelediimizde rneklerin genel olarak alt gruba ayrldn syleyebiliriz. Aada verilen izelgede PCA analizinde ilk iki temel bileen vektrnn verideki toplam deikenliin %79.42sini akladn te yandan ilk drt temel bileenin ise %95 civarndaki varyans kapsadn grmekteyiz.

Eigenval % Varianc C.% Var


4.690292 1.663256 0.893089 0.295994 0.245336 0.159076 0.050536 0.002421 8 58.62865 20.7907 11.16362 3.699921 3.066701 1.98845 0.631696 0.030264 58.62865 79.41935 90.58297 94.28289 97.34959 99.33804 99.96974 100

PCA analizinden sonra yaplan HCA analizinde ncelikle ham veriler kullanlarak dendrogram oluturulmu ve elde edilen dendrogram aadaki ekilde verilmitir.
Ward Linkage, Euclidean Distance 19.67

Uzakl k

13.11

6.56

0.00

2 17 3

5 16 19 18 6

7 10 8 20 11 12 13 14 15

rnekler

Yukarda verilen dendrogram yakndan incelendiinde 11, 12, 13, 14 ve 15 numaral rneklerin bamsz bir grup olarak snflandrld grlmektedir. te yandan, geriye kalan 15 rnekten 6, 7, 8, 9, 10 ve 20 numaral rneklerin bir baka alt grubu oluturduu ve son olarak dendrogramn sol tarafndaki 10 rnein bir baka alt grubu oluturduu grlmektedir. Daha sonar HCA analizi, ham veriler yerine, PCA analizinden gelen ve veri setindeki toplam varyansn %95ini kapsayan ilk 4 temel bileen skor vektr kullanlarak oluturulmu ve elde edilen dendrogram aada verilmitir.

Ward Linkage, Euclidean Distance 20.10

Uzakl k

13.40

6.70

0.00

17

5 16 19 18

9 20

7 10 11 12 13 14 15

rnekler

Yukarda verilen dendrogram incelendiinde ham veriler ile elde edilen dendrogramn hemen hemen aynsnn PCA analizinden gelen ilk drt temel bileen vektr ile de elde edilebildii grlmektedir.