You are on page 1of 35

HEDEF PROGRAMLAMA GÖRÜŞÜNDE VZA -

DİSKRİMİNANT
ANALİZİNİN TEORİ VE METEDOLOJİSİ
(DEA-DISCRIMINANT ANALYSIS IN THE VIEW OF GOAL
PROGRAMMING)
T.Sueyoshi

Özet
Makale HP(Hedef programlama) görüşünde VZA(Veri Zarflama
Analizi) ve DA(Discriminant Analiz) arasındaki farklılıklar ve
benzerlikleri tanımlar. Bu tanımlamaya dayanarak, “VZA-
Diskriminant Analiz(VZA-DA)” denilen DA formülasyonu içinde
VZA’nın metodolojik bir gücünü kapsayan yeni bir tür DA tekniğini
önerir. Araştırma, önerilen VZA-DA metoduna hem örnek bir veri
seti hem de Japon bankalarıyla ilgili gerçek bir durum çalışması
sunar. VZA-DA ‘nın önemi diğer DA metodlarıyla karşılaştırılarak
kabul edilir.

1
1.Giriş
• Görünüşte farklı olan hem VZA tekniğine hem de DA tekniğine kamu ve özel sektörlerde birçok
karar verme durumunda sık sık başvurulur. İlk olarak Charnes ve diğerleri tarafından öne sürülen
(1978) “CCR-oran formu” olarak isimlendirilen VZA metodu çeşitli etkileri ölçmek için kullanılan bir
yönetim bilim tekniğidir.

• Önceki araştırma çalışmalarında, VZA formülasyonunun birçok farklı türü kolaylıkla bulunabilir,
dahası performans analizleri ile ilgili BCC model, bağımlı model, çarpımsal model ve diğer VZA
modelleri gibi oran formları vardır. Bu araştırma tüm metodların HP ile ilgili olduğunu söyler ve bu
yüzden VZA, DA ile bağlantısı kurulmadan önce HP ‘nin çatısında yeniden incelenmelidir.

• Aynı zamanda DA, grup elemanlarını tahmin etmek için kullanılan istatistiksel bir tekniktir. Metod ya
istatistiksel bir tekniği ya da birkaç gruptan biri üzerine gözlenmiş bir veri setini sınıflamak için
kullanılan bir HP tekniği olabilir. Makale; ilk olarak Freed ve Glover(1981) tarafından öne sürülen
diskriminant analize dayandırılan HP ‘yi ele alır, çünkü araştırma amacımız HP alanındaki DA’ yı
incelemek ve DA üzerine VZA’ nın analitik özelliklerini kapsayarak onu daha fazla genişletmektir. DA
yaklaşımında; elemanları önceden saptanmış bir grup gözlem, hatalı grup sınıflamasını minimum
yaparak tahminlerin bir setinin ölçümü için kullanılır. Böylece; DA tahminlerin bir setini verir,
dolayısıyla grup elemanını belirtmek için başlangıç değeriyle karşılaştırılan bir ölçüm değeri sağlar.

2
1.Giriş

• DA daki VZA özelliklerini kapsayan bu makalenin araştırma çalışmasının burada


anlatılması gereken metodolojik önemi vardır. Örneğin, bu çalışma orjinal oran
formunu kullanmaz. Onun yerine VZA toplamsal modelini inceler ve eş zamanlı
olarak onu HP’ nin bakış açısındaki DA ile karşılaştırır, çünkü toplamsal model oran
formundan daha çok doğrudan HP’ye bağlı olabilir. Böylece, bu çalışma kolaylıkla
DA formülasyonundaki VZA özelliklerini kapsar.

• Makalenin kalan kısmı ilerleyen bölümlerde ele alınır. Bölüm 2 ve 3 sırasıyla HP


görüşündeki DA ve VZA ‘yı tanımlar. Bu tanımlamaya dayanarak, DA daki VZA ‘nın
yapısal özelliklerini kapsar, dolayısıyla “VZA-DA” yı üretir. Araştırma bölüm 4 de
incelenir. Bölüm 5 de, önerilen VZA-DA tekniği hem örnek bir veri setinde hem de
Japon bankalarıyla ilgili gerçek bir veri setinde uygulanır. VZA-DA’ nın önemi, iki
uygulama içerisinde diğer DA metodlarıyla karşılaştırılarak doğrulanır. Son olarak,
sonuç ve geleceğe yönelik genişletmeler bölüm 6 da özetlenmiştir.

3
2. Diskriminant analizi
2.1. Önceki araştırma çalışmaları

HP’ ya dayanan DA’nın, Freed ve Glover (1986), Glover (1990), Ragsdale ve Stam
(1991), ve Retzla.-Roberts (1996a, b) gibi birçok araştırmacı tarafından önemli ölçüde
dikkat çektiği kabul edilir. Önceki araştırma çalışması şu DA kriterini kapsar:

• (a) MMaD (En büyük sapmanın minimizasyonu) - Freed ve Glover


• (b) MMiD (En küçük sapmanın maksimizasyonu) - Freed ve Glover
• (c) MSID (İç sapmalar toplamının minimizasyonu) - Freed ve Glover
• (d) MSD (Sapmalar toplamının minimizasyonu) – Freed ve Glover
• (e) MMO (Yanlış sınıflanmış gözlemlerin minimizasyonu) - Banks ve Abad
• (f) Hybrid Model (Dışsal sapmaların minimizasyonu ve içsel sapmaların
maksimizasyonu)
• (g) Ratio Model (İçsel sapmaların dışsal sapmalara oranının maksimizasyonu) -
Retzla.-Roberts

4
2. Diskriminant analizi
• Bu yedi kriter arasında MSD sıklıkla kullanılandır, çünkü pratik bir hesaplanışı vardır.
Pratik hesaplanışı, diğer yedi kriterle karşılaştırılarak açıklanabilir. Örneğin, MMaD
kriteri uygun bir çözüm olarak gözlemlerin açıkça iki grup olarak sınıflanabilen
herhangi veri setine ayırıcı bir hiperdüzlem üretir.(Keşisim olmayan durumlarda)Öte
yandan, iki grup arasında bir kesişim olduğu durumda ise MmaD sıkça mümkün
olmayan bir çözüm üretir. Bu çeşit bir problem MmiD ve MSID kriterlerinde de sıklıkla
bulunur. Aynı zamanda, MSD kriteri uygun bir çözüm üretmekten bir zorluk gibi
kaçınabilir.

• MMO (Yanlış sınıflanmış gözlemleri en küçükleme) kriteri; sapmaları minimum


yapmak için değil, yanlışlıkla sınıflanmış gözlemlerin sayısını minimum yapmak için
tasarlanmıştır. MMO kriterinin önemini kabul ederek, bu çalışma tamsayılı
programlamanın doğrusal programlamadan çok hesaplama çabası ve zamana ihtiyaç
duyduğunu anlatmalıdır. Bu yüzden, bu çalışma MSD’nin MMO‘dan daha çok
hesaplama pratikliği olduğuna inanır.

5
2. Diskriminant analizi
• Bu DA modellerine bağlı olarak karma model, Glover tarafından ortaya
konmuştur(1990).Bu model MSID (İç sapmalar toplamının minimizasyonu) ve MSD
(Sapmalar toplamının minimizasyonu) arasında oluşturulan bir karma model olarak
düşünülebilinir. Kriterin metedolojik faydasını kabul ederken, bu araştırma bir eksiklik
de bulur. Yani MSID ve MSD arasındaki ağırlıkları belirtmemiz gerekmektedir.
Genellikle bu araştırmacıların kişisel kararlarıyla belirtilir. Farklı ağırlık seçimleri
sıklıkla farklı ayırıcı hiperdüzlemler üretir. Karma modelin ötesinde DA için VZA-oran
modeli kullanımı da ortaya konmuştur. Bu yaklaşımın VZA-oran modelinin çok basit
bir formuyla formüle edildiğine inanılır. VZA-toplamsal model VZA-oran modelinden
daha çok doğrudan MSD’ye bağlıdır. Bu yüzden bu çalışma, MSD formülasyonundaki
VZA-toplamsal modelinin analitik özelliklerini nasıl kapsadığını inceler.

6
2.2.Sapmalar toplamının minimizasyonu
Kriteri MSD olan DA’yı anlatmak için; makale ilk olarak, Freed ve Glover(1981)
tarafından öne sürülen HP formülasyonunu, VZA için analitik bir tanımlama kullanarak
inceler. Makale n tane, klasik bir DA tanımlamasındaki gözlemlere uyan
KVB(j=1,.....,n) olduğunu varsayar ve her KVB’nin kendi etkisini göstermek için k tane
bağımsız faktörü(i=1,.....,k) vardır. Her KVB bilgisi Zij ile gösterilir. DA-MSD çatısında,
tüm KVB’lerinin grup 1(G1) yada grup 2 (G2) içerisine sınıflanabileceği ön bilgisi bize
verilir. İki grup sırasıyla, n1 ve n2 KVB’ya sahiptir, n1+n2=n . DA aşağıdaki model ile
formüle edilebilir

7
2.2.Sapmalar toplamının minimizasyonu
d eşik değeri ve αi(i=1,....,k) ağırlıklardır.Her ikiside bilinmemektedir bu yüzden (1)
denklemleriyle tahmin edilmelidir. Sj + ve Sj - artık değişkenleri sırasıyla (G1) ve (G2)
için sapmaları gösterir ve her artık değişken i 1 i Z ij değerinin eşik değerinden (d) ne
k

kadar değiştiğini gösterir.


Bu DA modeli ayrılan iki grup için bir hiperdüzlem tanımlayan ağırlıkların (αi *) optimal
bir setini üretir. Yeni seçilen bir KVB , i 1 i* Z ij değerinin tahmin edilen eşik değerinin
k

altında ya da üstünde olmasına bakılarak (G1) ya da (G2) içine sınıflanır. Önemsiz


sonuçlardan ( her i ve d=0 için αi=0 ) kaçınmak ve iki grup arasında daha açık bir
ayrım yapmak için makale (1) eşitliğinin aşağıdaki gibi formüle eder.

Burada, η iki grup arasında küçük bir aralık oluşturmak için kullanılan küçük bir sayıyı
gösterir. η’nin kapsamının bir sonucu olarak, DA-MSD (2) önemsiz sonuçların
meydana gelmesini engelleyebilir(Glover,1990).

8
2.2.Sapmalar toplamının minimizasyonu

Bu formüle ediliş (3), aşağıda orjinal formuyla açıklanan HP modellerinin bir tanesi
gibi kolaylıkla tanımlanabilir.(Charnes ve Cooper,1977)

9
2.2.Sapmalar toplamının minimizasyonu
İki modeli karşılaştırırken DA-MSD(3) HP(4)’nin özel bir formu olduğu düşünülebilir. İki
yaklaşım arasında aşağıda özetlenmiş olan üç önemli farklılık vardır:

•Eşik değeri(d) DA(3) içinde bilinmeyen bir karar değişkeni iken, hedefler (dj,j=1,.....,n)
HP(4) de bilinen belli değerlerdir.

•Tüm gözlemler(KVB ler) DA (3) içinde (G1) ya da (G2) ye sınıflanmalıdır, ama bu


sınıflama HP(4) için yapılmak zorunda değildir.

•En dikkat çekici farklılık; DA(3) her grup için sadece tek taraflı sapma kullanır, ama
HP(4) tüm KVB için çift taraflı sapmayı kapsar. Bu HP(4)’ün, hedeflerdeki (dj) sapmaların
toplamını minimum yapmak için tasarlandığını gösterir. Aynı zamanda, DA(3) (G1) ve
(G2) ‘nin hatalı sınıflanışını minimum yapmak için tasarlanmıştır. G1 ’in yanlış sınıflanışı,
tahmin değeri ( i 1 i Z ij ) eşik değerinin (d*) altına düştüğü zaman tanımlanabilir. G1 ’in
k *

hatalı sınıflanışını gösteren tek taraflı sapma (Sj +) ,DA(3) ‘ün amacı içinde minimum
yapmaktır. Benzer olarak, DA(3) sadece Sj - ’nin minimizasyonuyla G2 de hatalı
sınıflamayı minimum yapar.(3) denklemlerinin en önemli özelliği; DA’nın kısıtlarındaki Sj -
’yi içererek G1 için tahmin değerinin eşik değerinin üstünde olmasına izin vermesidir.
Sj + ( j  G2 ) içinde tam tersi bir tanımlama yapılabilir.

10
3. Toplamsal Model
Charnes et al (1985) tarafından öne sürülen VZA-toplamsal model, kalan diğer KVB
ler ile performansının göreceli olarak karşılaştırılmasıyla, belli bir KVB’nun etki
seviyesini ölçmek için geliştirilmiştir. VZA’ nın önemli bir özelliği; tüm KVB lerin
üretim süreçleriyle tanımlanmasıdır ve bunların birçok girdi ve çıktıyla ölçülmesidir.
Dahası, bize girdiler ve çıktılar arasındaki ilişkiyi vermek zorunda değildir.
Matematiksel olarak, VZA-toplamsal model aşağıdaki gibi formüle edilen belli KVB
leri ölçmek için kullanılır:

11
3. Toplamsal Model
• “VZA-oran model”i denilen orjinal VZA modeli, bir KVB nin etkin olup olmadığını gözden
geçirmek için hem VZA etkin değerini (θ) hemde fazlalıkları (Si+ ve Sr-) gözden
geçirmelidir. Diğer taraftan; KVB etkin olarak sonuçlanması için hem θ*=1 hemde Si +*=
Sr-*=0 olduğunu göstermeliyiz. Bu kesinlikle, θ*=1 ve Sİ +*>0 ya da Sr-*>0 in bir sonucu
olabileceğini belirtir. Charnes et al (1985) fazlalıkların iki türüne de sahip olan VZA
toplamsal modelini geliştirmiştir, ama (5) formülünde VZA etkinlik değeri dışarıda
tutulmalıdır.

• VZA toplamsal modelindeki θ’ nın hariç tutulması kolaylık sağlar, çünkü VZA performans
değerleri için sadece fazlalıklara dikkat etmeliyiz. Yine de aynı zamanda fazlalıkların
etkinsizlik yönüyle açıklanan VZA etkinliğinin seviyesi bir uygunsuzluk yaratır. Charnes et
al (1985) un araştırmasına göre etkinsizliği (μ) şu şekilde ölçülmelidir ve etkinlik değeri
(θ), θ =1- μ ile açıklanır

12
3. Toplamsal Model

VZA toplamsal model ve HP arasındaki fark aşağıdaki maddelerde özetlenmiştir:

• HP(4) girdi ve çıktılar arasında VZA(5) daki gibi ayrım yapmaz.


• HP’ nin (4) amaçları (dj ,j=1,......,n) VZA(5) daki h. KVB’nin gözlenmiş girdi ve
çıktılarıyla (xih ve yrh) belirlenir.
• İki teknik arasındaki en büyük fark; tüm gözlemlerin (KVB lar), VZA(5) da konveks bir
bölgeyle gösterilmesidir.k Aynı zamanda bu faktörler (Zij) HP(4) de ağırlıklı bir
toplamsal modeliyle ( i 1 i Z ij ) gösterilmiştir.

13
Etkinlik Sınırı

Ayırıcı Çizgisi

Şek.1:Veri zarflama analizi

Şek.2:Diskriminant Analizi

14
4. VZA-Diskriminant Analizi
• VZA-toplamsal modelin önemli bir özelliği, önceki bölümde belirtildiği gibi, VZA
kullanıcıları girdiler ve çıktılar arasında ilişki kurmak zorunda olmamasıdır, çünkü bu
gözlemler(KVB) bir dışbükey kabuk, veri alanı içerisinde dizilen çok sayıda parça
parça doğrusal hiperdüzlemler(hyperplanes) ile bağlıdır. DA(3)bir doğrusal
ağırlıklandırılmış toplamsal modelin ( i 1 i Z ij ) bir ayırıcı fonksiyonu ifade ettiğini
k

varsayar.
Bir tahmin edilmiş ayırıcı değeri (score) ( i 1 i Z ij) optimal (en iyi) eşik değeri (d*) ile
k

*

karşılaştırılır. Ağırlıklandırılmış toplamsal modelin gözlemlere ait iki grubu açıkça


ayırabildiği doğru mudur? Bir doğrusal ayırıcı hiperdüzlemin DA’ nın bütün gözlemleri
için bir olası durumu gösterdiğini dahil etmesi üzerindeki varsayım iki gruba açıkça
sınıflandırılamadığıdır.
• G1deki bazı gözlemler diğer gruba(G2‘ye)ait olabilir. Tersi bir durumda olabilir. Böyle
bir durum bir “kesişme(overlap)” gibi gösterilebilir ve bu yanlış sınıflandırmanın temel
bir sorunudur.

15
4. VZA-Diskriminant Analizi
• VZA-DA formülasyonu: Bu bölüm DA tekniğinin yeni bir çeşidini veya VZA-
Diskriminant Analizini daha açıkça tanımlar, VZA’nın yöntemsel zorluklarını DA
çerçevesine dahil eder.
• Birinci Aşama(sınıflandırma ve kesişmenin tespiti): kesişme tespit süreci veya
VZA-DAnın ilk aşaması şöyle formülize edilir:

Birinci aşama yanlış


sınıflandırılmanın iki çeşidinin
enküçüklemesini tasarlar:
G1deki KVBlerin G2 içine
sınıflandırılması ve bunun aksi
durumu.

16
4. VZA-Diskriminant Analizi

• Eşitlik(7)’nin önemli bir özelliği; tüm gözlenmiş faktörler iki parçalı doğrusal fonksiyon
k k k k
(   1 ve  Z  i   i Z ij ) ile bağlıdır.
 i 1
i  
i 1
i
1 ve
ij
i 1 i 1

• Yeni örneklenmiş m. gözleminin kesişimi, ki bu değer Zim ile gösterilir, takip eden kriter
ile tamamlanır.

• a)Eğer
k k


i 1
*
i Z im  d    i* Z im
*

i 1

veya
k k


i 1
*
i Z im  d    i* Z im
*

i 1

yeni örneklenmiş m. gözlemi (KVB) için tanımlanırsa, VZA-DA şu sonucu çıkarır;


burada bir kesişim vardır ve gözlem G1  G2 ye aittir.

17
4. VZA-Diskriminant Analizi
• b)Eğer
k k


i 1
*
i Z im  d ve   i* Z im  d *
*

i 1
k k


i 1
*
i Z im    i* Z im  d * de dahil
i 1

gözlem için tanımlanırsa, VZA-DA şu sonucu çıkarır; burada kesişim yoktur ve


gözlem G1 e aittir.

• c)Eğer
k k


i 1
*
i Z im  d ve   i* Z im  d *
*

gözlem için tanımlanırsa, VZA-DA şu sonucu


i 1
çıkarır; burada kesişim yoktur ve gözlem G2 ye aittir.

• Eşitlik(7) G1 ve G2 arasını ikiye bölen diskriminant(ayırıcı) fonksiyon üretir.


Model(7)nin bir amacı kesişimin bulunuşunu tanımlamaktır, son ayırıcı fonksiyonun
saptanması değildir. Eşitlik(7)de G1 için d=1 ve G2 için d-n=0 koymayı gerektirir.
Böylece eşik değeri (d) artık bilinmeyen bir karar değişkeni olmaz. Bu durum ile
ilişkilendirilmiş bir problem, ikisi de yapay olan bizim kişisel kararımız ile saptanmış iki
eşik değeri olmasıdır. Bu iki eşik değerinin en iyi kombinasyonunu belirlemede
sorunla karşılaşabiliriz. Bu sorunu önlemek için sunulan öneri şudur, VZA-DA karar
değişkeni olarak eşik değerini göz önünde tutar, böylece iki ayırıcı hiper düzey üretilir.
18
4. VZA-Diskriminant Analizi
• İkinci Aşama (kesişimin kullanılması): bir kesişimin ( ( nin) bulunuşu şöyle
tanımlanır; bir KVB her iki gruba aittir. Ama böyle bir durum olsa bile; VZA-DA çoğu
durumda gözlemin ya G1 ya da G2 ye ait olup olmadığına ilişkin tahmin yapmayı
gerektirir. Bu tür güçlüklerle baş etmenin en iyi yolu uzmanlardan profesyonel görüş
istemektir. Örneğin fakülte üyeleri belirli bir düzeye gelmiş öğrenci ile mülakat
yapabilir çünkü yönetici öğrencinin işe alınışı ile ilgili iyi bir karar veremeyebilir.
Mülakat genellikle yöneticiye öğrencinin gelecek potansiyelinin olup olmadığına ilişkin
profesyonel fikir sağlar.

• Diğer bir stratejik seçenek, özellikle VZA-DA uzman görüşüne ulaşılamadığında, takip
eden problemi çözmekle kesişimi matematiksel olarak ele almaktır.

19
4. VZA-Diskriminant Analizi

• Eşitlik(8)den αi* elde edildikten sonra, VZA-DA tüm gözlemleri (KVB leri) G1  G2 ye,
  ile tahmin edilen eşik değerini (d*) karşılaştırarak
k
G1 ya da G2 ye *
Z
i 1 i ij
sınıflandırabilir.

• Bunu şöyle gösteririz;

Eğer   i* Z ij  d * , j  G1  G2 ise j  G1 ya da
k
i 1

  i* Z ij  d * , j  G1  G2 ise j  G2
k
Eğer i 1 (9)

• Eşitlik(8)in önemli bir özelliği Eşitlik(7) de yazarak formüle edilmesidir. Eşitlik(9)


yalnızca kesişimdeki gözlemlerin sınıflandırılmasında kullanılır. Bu VZA-DAnın ikinci
aşamasıdır. İkinci aşamanın tamamlanması VZA-DA algoritmasının sonunu belirtir.

20
4. VZA-Diskriminant Analizi
Makale VZA-DA ya ilişkin takip eden şu üç bakış açısını sunmayı gerektirir:

• Parametre, n, Eşitlik(3)te önemsiz bir çözümden sakınıldığı (yani bütün ağırlıklar


sıfırdır) gösterildi. Bu arada Eşitlik(7) ve Eşitlik(8) de toplamları bir olan ağırlık kısıtları
verilmişti, VZA-DA böyle önemsiz çözümden kaçınabilir. Bunun için Eşitlik(7) ve
Eşitlik(8)de n=0 yazılabilir. Bu VZA-DA’ nın yöntemsel zorluğunu gösterir. Bu
araştırma, Eşitlik(9) da formüle edildiği gibi iki grubu açıkça bölen iki modeldeki n’ yi
pozitif bir sayı olarak içerir. Böyle pozitif bir n olmadan, bir gözlemi G1 ya da G2 ye
sınıflandırmada zorluk çekeriz. ( k  i* Z ij  d * de olduğu gibi)
i 1

• İki aşamalı yaklaşım (ilki; kesişimin tanımlanması, ikincisi; ayırma) bu çalışmada


Stam and Ragsdale(1992)de olduğu gibi başka araştırma çabalarında
bulunulabileceği önerilmiştir. İki aşamalı MSD; bir bakıma, ilk aşamasındaki bir
kesişimin bulunuşunu tanımlayabilen ve ikinci aşamasındaki gözlemleri ait olduğu
kesişime sınıflayan MSD’nin genişletilmiş bir formu gibi düşünülebilir.

21
4. VZA-Diskriminant Analizi
Bu makale iki DA yaklaşımı arasında üç farklılık tanımlamayı gerektirir. İlki,
önceden sözü geçen iki aşamalı MSD(Stam and Ragsdale(1992)) nin birinci ve
ikinci aşamanın ikisinde de üretilen doğrusal hiperdüzlemin tasarlanmasıdır. Bu
arada, VZA-DA ilk aşamada iki doğrusal ayırıcı fonksiyon verir ve sonra ikinci
aşamada aralarında bir başka doğrusal ayırıcı fonksiyon üretir. İkincisi, Stam
and Ragsdale(1992) yaklaşımı birinci aşamasında sırasıyla G1 için d=1 ve G2
için d=0 alırken VZA-DA d’yi (eşik değerini) bir karar değişkeni olarak dikkate
alır. Son olarak VZA-DA’ nın ikinci aşaması hataların toplamını en küçüklerken,
iki aşamalı MSD(Stam and Ragsdale(1992)) nin ikinci aşamasının hedefi gereği
yanlış sınıflandırılan gözlemlerin sayısını en küçükler.

• Ağırlık tahminleri VZA-DA da yüzdelik ifadeler ile ölçülür. Bu tür yüzdelik ifadeler
ayırıcı fonksiyonun geliştirilmesinde her bir faktörün toplamsal düzeyine ait bilgi
edinmeyi sağlar.

22
5. Sayısal Örnek
5.1. Tanımlayıcı Örnek
5.1.1. Yapay olarak üretilen bir veri seti

• Tablo 1’in sol taraf kısmı yapay verilerdir. Bu veri seti ilk sütunda listelenen 20
gözlemde ve her gözlem iki faktörle karakterize edilmiş olup sırasıyla ikinci ve üçüncü
sütunda listelenen iki faktörden oluşmaktadır.
• Bu çalışmada yapay olarak üretilen veri seti şöyle düzenlenmiştir; sırasıyla ilk 10
gözlemin ilk faktör için değer aralığı (5’den 7.5’e) ve ikinci faktör için diğer değer
aralığı (6’dan 12’ye) geri kalan 10 gözlem sırasıyla ilk faktör için değer aralığı(1.5’den
4.5’e) ve ikinci faktör için(2.5’den 5’e) tanımlanmıştır.
• Bu değer aralıklarında bir eşik değeri ile veri setinin ayırıcısının belirlenmesi kolay
olacaktır. Burada kesişim tanımlanmamıştır. Bu nedenle G1 ve G2 birinci ve ikinci
grup olarak alınır ve dördüncü sütunda listelenir.
• Bu açık ayırıcıya ek olarak bu çalışma biraz değiştirilerek iki grup arasındaki kesişimi
içeren orijinal veri seti düzenlenebilir. Bu kesişim bazı gözlemlerin(Tablo 1’de
parantezin içinde listelenenler gibi)büyüklüklerinde değişimler yaparak üretilebilir.
Örneğin,iki gözlemin büyüklüğü 5.9’dan 1.9’a değişsin. Böyle bir değişim 2.,19. ve 20.
gözlemde bulunabilir.

23
5.1.2. Yöntemsel Alternatifler
Tablo(1) deki veri setini kullanarak, bu çalışma yedi farklı DA yaklaşımının
performansını sunar. Bunlar bu makalede;

• Fisher’in İstatistiksel Yaklaşımı – Kendal ve diğerleri. (1983, sayfa 152)


• MMaD (En büyük sapmanın minimizasyonu) Freed ve Glover (1986, sayfa 70)
• MMiD (En küçük sapmanın maksimizasyonu) Freed ve Glover(1981, sayfa 156)
• MISD (İç sapmalar toplamının minimizasyonu) Freed ve Glover(1986, sayfa 153)
• MSD (Sapmalar toplamının minimizasyonu) Freed ve Glover(1986, sayfa 153)
• İki Aşamalı MSD- Stam ve Ragsdale (1992)
• VZA-DA planlamasıdır.

İlk DA yaklaşımı iyi bilinen bir istatistiksel yöntemdir ve birçok bilgisayar yazılımınca
içerilir. Bu araştırmada bilgisayar yazılımı olarak “Visual Stat”(design Technology,
1994) adı verilen program kullanılır. Diğer bir DA yöntemi doğrusal programlama
yazılımı olan “QSB+ (Quantative Systems for Business Plus)” (Pretice Hall, 1994) ile
çözümü bulmaktır.

25
5.1.3. Hesaplanmış Sonuçlar
• Hesaplanmış DA sonuçları Tablo1, Tablo2 ve Tablo3 de özetlenmiştir. Bu DA
sonuçlarını tanımlamadan önce makale MMaD, MMiD ve MSD ile ilgili yöntemsel
ihmallerden söz etmeyi gerektirir.
Bulgu1: DA yaklaşımı, (MMaD, MMiD ve MSD) toplamak, kesişimin olmadığı
durumda G1 ve G2 arasında bir ayırıcı hiper düzlem için ağırlık tahmini üretebilir.
Ama bu üç kriter, bilgisayar yapılamaz bir çözüm sonucunu çıkardıktan sonra
kesişimin olduğu durumda bu ağırlık tahminlerini veremez. Geri kalan dört DA
yöntemi kesişimin olduğu durumda bile bu ağırlık tahminlerini verir. (Buradan sonra,
bu makalede bu üç DA yaklaşımından söz edilmeyecektir.
• Tablo 1’in sağ tarafı iki DA yönteminin (Fisher’in İstatistiksel Yaklaşımı ve MSD) iki
durumunda (kesişim yok, kesişim var) uygulandığı sonuçları içermektedir. Bu sütunlar
“Fisher’in İstatistiksel Yaklaşımı” nın etkisi altında geleneksel DA sonuçlarını özetliyor.
Bu yaklaşımda, bir ayırıcı hiperdüzlem  0  1 Z1   2 Z 2 şeklinde ifade edilir ve bu ağırlık
tahminleri Tablo1in sonunda listelenmiştir. İstatistiksel yaklaşımda bir eşik değeri sıfır
(d=0) olduğunda bu çalışma ayırıcı hiper düzlemin yapısında sabit terimi ( 0 ) içerir.
Tahmin edilen diskriminant değerleri “Disc. Score”un altında, türetilen tahminlerle
birlikte listelenmiştir. Benzer şekilde MSD tahminleri (  * ,  * ve d * )de Tablo1in
1 2
sonunda listelenmiştir.

26
• Bu MSD, eşik değerini(d) bir karar değişkeni olarak içerir, böylece ayırıcı hiperdüzlemin
yapısından sabiti çıkarabilir.

• Makale iki DA yönteminin yanı sıra Stam ve Ragsdale (1992) tarafından üçüncü
metodolojik seçenek olarak önerilen iki aşamalı MSD sonuçlarını da belgeler. İki aşamalı
MSD’nin hesaplanan sonuçları Tablo 2’ de özetlenmiştir. Stam ve Ragsdale’yi takip eden
bu çalışma ilk aşamanın eşik değeri olarak sırasıyla G1 ve G2 için d=1 ve için d=0’ı ikinci
aşamanın eşik değerini ise 0.5 olarak seçer. Böylece Tablo–2 ‘nin k

ED*  d * ’si (G1 için) d=1, (G2 için) d=0 ve (ikinci aşama için) d=0.5 olan   i Z ij  d
* *

i 1

Tablo 1 ve Tablo 2’deki deneysel bulgular şu şekilde özetlenebilir:

Bulgu 2: Tablo 1 ‘in sağ tarafında verilen iki DA yöntemi (Fisher’in istatistiksel yaklaşımı ve
MSD) kesişme olmayan durumda iki gruptaki verileri başarılı bir şekilde ayırır. Aynı
zamanda, bu yaklaşımlar kesişme olması durumunda grup üyeliğini tahmin etmede zorluk
yaşarlar. Örneğin, altıncı gözlem birinci, ikinci, üçüncü ve dördüncü gözlemlerde de
bulunabilen kesişme nedeniyle MSD’de grup üyeliğini G1’den G2’ye değiştirir. Sonuç olarak
MSD’nin tahmin doğruluğu %75 (=15/20) düşer. Bu tür bir problem istatistiksel yaklaşımda
da bulunabilir ama tahmin doğruluğu (%80) MSD’ninkinden (%75) az miktarda daha iyi bir
performans gösterir.

27
Bulgu 3: Tablo 2’nin sol tarafında görüldüğü gibi kesişme olmaması durumunda iki
aşamalı MSD iki gruptaki verileri başarılı bir biçimde ayırabilir. Aynı zamanda,
kesişme olması durumunda bu yaklaşım ilk aşamasında altı gözlemdeki (3. 4. 6. 12.
13. ve 18.) varlığını ispat eder.
• İkinci aşama üçüncü, dördüncü ve altıncı gözlemlerin G1’e ait olduğunu çünkü bu
ayrıştırma değerlerinin 0,5’ten büyük olduğunu belirtir. Diğerleri (12. 13. ve 18.) G2
üyeleridir çünkü ayrıştırma değerleri 0,5’ten küçüktür. Üç gözlem (3. 4. 6.) (Tablo 1’in
son sütununda) MSD tarafından G1 üyeleri olarak tanımlanır; diğerleri (Tablo 2’nin son
sütununda) iki aşamalı MSD tarafından G2 üyeleri olarak tanımlanır.
• Aslında, bu araştırmanın iki grubun kesişmesini sağlamak için yapay olarak birinci ve
ikinci gözlemlerin büyüklüğünü değiştirdiği doğrudur bu nedenle bu çalışma iki
gözlemin G2 üyesi olarak sınıflandırıldığı sonucunu kabul edebilir. Fakat bu araştırma
üçüncü, dördüncü ve altıncı gözlemlerde hiçbir değişiklik yapmıyor bu nedenle G1
üyeleri olarak sınıflandırılmalılar.
• Bu bulgu iki aşamalı MSD’nin (tek aşamalı) MSD’den daha iyi performans
gösterdiğini belirtir. Sonuç olarak, tahmin doğruluğu %75’ten (MSD) %90’a (iki
aşamalı MSD) çıkar. Bu %15’lik ilerleme 20 gözlemden üçündeki tahmin
doğruluğundandır.
• Tablo 3 bu araştırmada önerilen VZA-DA ’nın sonuçlarını belgeler. Bu tabloda ED    d
* *
k

ve ED     d sırasıyla birinci aşamanın   i* Z ij  d * ve  i Z ij  d sunar.


k * *
* *

i 1 i 1
Tablo 3’ün sağ kısmı VZA_DA, Eşitlik(7) ve (8)’in kesişme olan durumdaki sonuçlarını
özetler. İlk aşama (7), Tablo 3’ün son sütununda özetlendiği gibi, kesişme
durumundaki(G1  G2 )tüm gözlemleri G1 ya da G2 olarak sınıflandırır.
29
Bulgu 4:VZA_DA Tablo 3’ün sol tarafında gösterildiği gibi kesişme olmaması
durumunda iki gruptaki verileri başarılı bir biçimde ayırabilir. Kesişme olduğunda bu
yaklaşım ilk aşamada yedi gözlemde (1. 2. 3. 4. 6. 19. ve 20.) varlığını ispatlar. İkinci
aşama üçüncü, dördüncü ve altıncı gözlemlerin G1’e ait olduğunu; diğerlerininse (1.
2. 19. 20.) G2 üyeleri olduğunu belirtir. Sonuç olarak tahmin doğruluğu Tablo 3’ün
(sağ) altında verildiği gibi %90’dır.

• İki aşamalı MSD (Tablo 2) ve VZA_DE (Tablo 3) arasındaki fark iki yöntemin ilk
aşamasıyla elde edilen tahmin ile bulunabilir. Örneğin birinci ve ikinci gözlemler Tablo
2’de G2 de sınıflandırılırken Tablo 3’te kesiştikleri belirtilmektedir. Böyle bir ayrıştırma
farkı 12. 13. 18. 19. ve 20. gözlemlerde de bulunabilir. Böyle farklı sonuçlardan
başlayarak iki yaklaşım ikinci aşamalarında aynı sınıflandırmayı yaparlar.

31
5.2. Japon Bankacılık Sistemi

5.2.1 Japon Banka Verileriyle İlgili Bir Veri Dizisi

• Bu araştırma VZA_DA’nın performansını diğer DA’ların performanslarıyla


karşılaştırmak için Japon bankalarıyla ilgili yapay veri dizilerinin yanı sıra gerçek veri
dizileri de kullanır. Veriler Japonya’da aylık olarak yayımlanan Financial Business’dan
elde edilmiştir. Veri kaynağı Avrupa ve Amerika Birleşik Devletleri’ndeki Economist,
Financial Times ve Business Week gibi, Japon iş adamları arasında oldukça tanınan
bir finans dergisidir.

• Tablo 4 bu yedi göstergenin yanı sıra 100 Japon finans kurumunu kapsayan böyle bir
banka veri dizisi sunar. Dergi, 1996 yılı Mart ayında bir anket uyguladı ve bu ankete
dayanarak 100 Japon bankasının sınıfını belirledi (Financial Journal, 1996, sf.48)

32
• Makale, derginin açıklamasını takiben, finansal kuruluşları şu şekilde sınıflandırır:
G1 =  j | j bankası en üst düzeydeki 50 banka arasında yer alır ve
G2 =  j | j bankası en alt düzeydeki 50 banka arasında yer alır

• Tablo 4’te gösterildiği gibi aşağıdaki yedi performans indeksi tarafından değerlendirilir:

 Toplam aktiflerdeki dönüş (=toplam kâr/ortalama toplam aktifler)


 İş verimliliği (=toplam kâr/ toplam işçi)
 Toplam aktifteki sermaye (=toplam sermaye/ortalama toplam aktif)
 Toplam net çalışma sermayesi
 Sermayenin dönüşü (=ortak/ortalama sermayeden sağlanan kazanç)
 Maliyet- kar oranı (=toplam gider/toplam kâr)
 Batık kredi oranı (=toplam batık krediler/toplam krediler)

• Dergi, en iyi performans gösterenin indeks sayısını 1000 olarak belirler ve diğer
bankaların verileri en iyi performans gösterenlerinkine göre düzenlenir. Böylece tüm
veri dizileri indeks sayılarıyla ifade edilir. Tablo 4’ü incelerken her performans
ölçütünde daha büyük indeksin daha iyi performansı ifade ettiğini unutmamalıyız. Bu
nedenle bu işaretlerdeki tüm ağırlık tahminleri negatif olmamalı.

33
5.2.2 Hesapla İlgili Sonuçlar

• Tablo 4’te gösterildiği gibi her grup elli gözleme sahip. Bu araştırma gelişim örnekleri
elde etmek için her gruptan rasgele 10, 20 ve 30 gözlem seçer. Kalan gözlemler (40,
30 ve 20) direnen örneklerdir. Böyle bir rasgele örneklem üç durumun her biri için on
kez tekrarlanır. Dört DA yaklaşımı (Fisher’in istatistiksel yaklaşımı, MSD, iki aşamalı
MSD ve VZA-DA) performans karşılaştırmamızda kullanılır. Bu araştırma 120
kombinasyonun performansını inceler . (=3 örneklem türü 10 tekrar  4 yöntem)
• 120 kombinasyonun biri Tablo 5’te verilmiştir. Tablo sonuç ağırlık tahminlerini, doğru
sınıflandırmayı ve her grup için 20 gözlemin kalan örnek, 30 gözlemin gelişim örnek
dizisi olarak kullanıldığı durumda dört DA metodunun tahmin doğruluğunu özetler.
Doğru sınıflama gelişim örneği tarafından ayrılmış her iki gruptaki doğru
sınıflandırılmış gözlemlerin sayısıyla belirlenir (bu durumda; 60=30 (gözlemler)  2 (grup) ).
• Bu tahmin doğruluğu, kalan örnek tarafından ayrılan her iki gruptaki doğru tahmin
edilen gözlemlerin sayısıyla hesaplanır (Bu durumda; 40=20 (gözlem)  2 (grup) ).
Tablo 5’teki bulgular aşağıdaki gibi özetlenebilir:
• Bulgu 5: İki aşamalı MSD ve VZA-DA doğru sınıflandırma ve tahmin doğruluğu
bakımından istatistiksel yaklaşım ve MSD’den biraz daha fazla iyi performans
gösterir. Örneğin VZA-DA 60 gözlem arasından 57 gözlemi doğru biçimde sınıflandırır
(böylece, %95 (=57/60) Tablo 5). 53 gözlem istatistiksel yaklaşım tarafından doğru
sınıflandırılmıştır (böylece %88 (=53/60), Tablo 5). Benzer hesaplamalar Tablo 5’in iki
alt sırasındaki sayılara uygulanabilir.

34
Bulgu 6:VZA-DA hariç bu DA yaklaşımlarının ağırlık tahmin işaretlerinde bir problem
bulunabilir. Yani pek çok tahmin bu işaretlerde negatif gösterilebilir. Böyle sonuçlar bu
türdeki bir DA uygulamasında kabul edilemez. Daha önce de bahsedildiği gibi veri
dizisi daha büyük indeksin daha iyi performans gösterdiği düşüncesiyle
düzenlenmiştir. Bu ağırlık tahminlerinin hiçbiri negatif olmamalıdır.(önceden
belirlenmiş bir ayrıştırma puanıyla birlikte kullanılan sabitte  0 bir istisna görülebilir.
Sıklıkla ayrıştırma puanı gibi görev yapar bu nedenle her işareti alabilir.)

• Böyle bir zorluğun üstesinden MSD ve (istatistiksel yaklaşım değil) iki aşamalı MSD
ile kolaylıkla gelinebilir. Negatif olmayan bir durum iki DA yönteminin ağırlık
tahminleriyle yan sınırlar biçiminde birleştirilebilir. Fakat böyle bir birleşim doğru
sınıflandırmayı ve tahmin doğruluğunu azaltabilir. Bu nedenle tahmin kalitesi ve kabul
edilebilir parametre tahmini arasında bir problem ortaya çıkar. İstatistiksel yaklaşımın
böyle bir ön bilgiyi birleştirmede hesapla ilgili bir zorluk çektiği doğrudur.

• Bu nedenle bu araştırma istatistiksel yaklaşımın karar verilmesi gereken gerçek


durumlarda uygulanırken zorluk yaşanılacağını savunuyor.

Bulgu 7: VZA-DA diğer yöntemlerdeki gibi ağırlık hesaplaması ifadesinde öyle bir
metodolojik problem içermez. Fakat VZA-DA’nın eksik bir yanı vardır.

35
• Tablo 5’te belirtildiği gibi bu araştırma VZA-DA ağırlık tahmininde sıfır buluyor; bu, böyle
bir sıfır ağırlığının DA sınıflaması ve tahmini için tamamen kullanılmadığını ifade eder.
• Bu problem bu ağırlık tahminlerinin daha düşük bir sınırı olarak çok küçük bir pozitif
sayıyı birleştirerek kolayca çözülebilir. Böyle bir çözüm VZA’da da bulunabilir (Örneğin
VZA çarpanlarını sınırlandırmak için çok küçük bir pozitif sayıyı kullanan Charles ve ark.
araştırma çabaları (1978)). Bu makale problemin, ağırlık tahminlerinde en iyi
sınırlandırmayı yapacak şekilde, incelenmesi gerektiğini savunur.
• 120 kombinasyonun deneysel sonuçları Tablo 6’da özetlenmiştir. Bu tablo üç durumdaki
veri yapısında dört DA yönteminin ortalama performansını özetler. Tablo 6’nın her sayısı
doğru biçimde sınıflandırılmış gözlemlerin oranını ya da doğru tahmin edilmiş
gözlemlerin oranını ifade eder. Tablo 6’daki bulgular şu şekilde özetlenebilir:

Bulgu 8: Tablo 5 ile ilişkili tüm deneysel bulgular (Bulgu 5, 6 ve 7) Tablo 6’da da
verilmiştir. Ayrıca, VZA-DA’nın diğer DA yöntemlerinden az miktarda daha iyi bir
performans gösterdiği doğrulanmıştır. Böyle küçük bir ilerleme önemlidir çünkü Tablo
4’teki gözlemlerin çoğu örtüşmüyor ve bu nedenle herhangi bir DA yöntemiyle açıkça
ayrılabilir. Her bir DA yönteminin performansı geriye kalan örtüşen gözlemlerin ne kadar
doğru bir biçimde sınıflandırıldığına bağlıdır. Tablo 4’ün veri dizisinde örtüşme boyutu
sınırlıdır. Bu nedenle bu çalışma böyle küçük bir ilerlemenin bu türdeki DA
karşılaştırması için oldukça önemli olduğunu savunmaktadır.

• Bu makale en iyi DA yaklaşımı konusunda nihai bir karar vermek için daha fazla
simülasyon çalışmasına ihtiyacımız olduğunu savunur. Bu da başka bir araştırma
görevidir.
39
6. Sonuçlar
• Bu makale HP bakış açısıyla DA ve VZA arasındaki benzerlikleri ve farklılıkları inceledi,
sonuç olarak yeni bir DA türü, VZA-DA önerdi. İki tekniğin analitik açıdan güçlü yanlarını
kapsayan yeni yaklaşım ilk aşamada iki grup arasındaki örtüşmenin varlığını tanımlamak
için tasarlandı. VZA-DA’nın ikinci aşaması ayırıcı sınıflandırma (doğrusal) görevi belirler.
Böylece yeni örneklenmiş gözlemin grup sınıflamasını tanımlayabiliriz. Bu araştırma
önerilen VZA-DA tekniğini hem örnekleyici veri dizisine hem de Japon bankalarıyla ilgili
olan gerçek veri dizisine uygulamıştır. VZA-DA’nın önemi bu iki uygulamada VZA-DA ile
diğer doğrusal DA yöntemleri karşılaştırılarak doğrulandı.
• Bu çalışma yakın zamanda incelenecek pek çok araştırma konusunu barındırıyor. Bu
konulardan bazıları bu makalede ele alındı. Diğer önemli araştırma konuları şu şekilde
özetlenebilir: birincisi, VZA-DA’nın performansı diğer doğrusal olmayan tekniklerin yanı
sıra (örn Rubin, 1994) ikinci dereceden ve polinomial DA yöntemleriyle (örn; Duarte Silva
ve Stam, 1994) karşılaştırılmalı. Bu çalışma, geniş çapta bir simülasyon çalışması
incelemek amacıyla, VZA-DA için, geniş veri dizilerini etkili bir biçimde ele alabilen özel
bir bilgisayar algoritması geliştirmelidir. İkincisi, yanlış sınıflandırmanın olup olmadığını
incelemek için istatistiksel bir test gerekir. Üçüncüsü, VZA-DA bilgisayar bilimindeki
model tanıma ve doktorlardaki karar destek sistemi gibi başka türdeki uygulamalar için
kullanılabilir. Bu araştırma konuları gelecekte ele alınacak önemli araştırma görevleri
olarak düşünülebilir.
• Son olarak, bu araştırmanın DA ve VZA konusundaki araştırma çalışmalarına küçük de
olsa bir katkı sağladığını umut ediyoruz. Bu araştırma, makalede belirtildiği gibi, VZA-DA
konusunda yeni araştırma gelişmeleri görmeyi umuyor
41
Bilgilendirme
• Bu araştırmaya Eğitim Bakanlığı ve Okawa Vakfı tarafından fon sağlanmıştır.

42

You might also like