You are on page 1of 2

Değişken seçimi, model performansını iyileştirmek amacıyla uygulanan ve veri setindeki en

uygun ve en efektif değişkenlerin belirlenmesine yardımcı olan bir süreçtir. Bu, modelin daha
doğru ve güvenilir sonuçlar vermesini sağlar.

Değişken seçimini Weka üzerinde incelmemiz gerekirse yöntemler üç ana kategoriye ayrılır:
Filtreleme yöntemleri, sarmal yöntemler ve gömülü yöntemler. Bu yöntemlerin belirgin
özellikleri aşağıdaki gibidir:

 Filtreleme yöntemleri, değişkenleri istatistiksel testler veya korelasyon katsayıları gibi


belirli kriterlere göre sıralar ve belirli bir seviyenin üzerindekileri seçer. Bu yöntemler,
makine öğrenmesi algoritması türünden bağımsızdır ve oldukça hızlı çalışır. Ancak,
seçilen değişkenlerin model performansını doğrudan dikkate almayabilirler.
AttributeSelection filtresi, Weka'da filtreleme yöntemleri için kullanılır.
1. Öncelikle veri setini seçeriz.
2. Sonra Preprocess sekmesinde Choose düğmesine basarız ve filters >
supervised > attribute > AttributeSelection yolunu izleriz.
3. Bu filtreyle çalışmak için, iki temel parametre belirlememiz gerekiyor:
Evaluator ve Search.
4. Evaluator, değişkenlerin değerlendirilmesinde kullanılan kriteri belirtir.
Örneğin, CfsSubsetEval değişkenlerin birbirleriyle ve hedef değişkenle olan
ilişkisini dikkate alır.
5. Search ise, değişken setini oluşturmak için kullanılan arama stratejisini
belirtir. Örneğin, BestFirst, en uygun değişken setini bulmak için ileri veya geri
adımlar atar.
6. Bu parametreleri belirledikten sonra, filtre uygulanır ve sonucunda, seçilen
değişkenlerin listesini ve ölçüt değerini görebiliriz. Bunun için Apply butonuna
basarız.

 Sarmal yöntemler, modelin performansını optimize etmek için belirli değişkenleri seçmek
üzere bir makine öğrenmesi algoritmasını kullanır. Bu yöntemler, filtreleme yöntemlerine
kıyasla daha hassas sonuçlar sunma potansiyeli taşısa da, daha yavaş çalışabilir ve
kullanımı biraz daha karmaşık olabilir.
Weka’da sarmal yöntemler için AttributeSelectedClassifier sınıflandırıcısını kullanırız. Bu
sınıflandırıcıyı kullanabilmek için,

1. Öncelikle veri setini seçeriz.


2. Sonra Classify sekmesinde bulunan Choose butonuna tıklarız ve meta >
AttributeSelectedClassifier seçeneğini seçeriz.
3. Bu sınıflandırıcıyı uygularken, belirlememiz gereken üç parametre bulunmaktadır:
Evaluator, Search ve Classifier. Evaluator ve Search parametreleri, filtreleme
yöntemlerinde olduğu gibi, değişken seçiminde kullanılan kriter ve arama
yöntemini belirler.
4. Classifier parametresi, değişken seçiminden sonra uygulayacağımız makine
öğrenmesi algoritmasını belirtir. Örneğin, J48 bir karar ağacı algoritmasıdır.
5. Bu parametreler belirlendikten sonra, Start butonuna basarak sınıflandırıcıyı
çalıştırabiliriz. Sonuç olarak seçilen değişkenlerin listesini, modelin performansını
ve karmaşık matrisi görüntüleyebiliriz.

 Gömülü metodlar, değişken seçme ve model kurma işlemlerini eş zamanlı olarak


gerçekleştir. Bu metodlar, değişken seçimi için makine öğrenmesi algoritmasının özgün
özelliklerini kullanır. Örneğin, ağaç bazlı algoritmalar, değişkenleri dallandırmak için bilgi
kazancı gibi metrikler kullanır. Bu metodlar, sarmal metodlara kıyasla daha hızlı; fakat
filtreleme metodlarına göre daha yavaştır.
Weka’da ise değişken seçimi yapabilen makine öğrenmesi algoritmalarını kullanabiliriz.
Örneğin RandomForest adlı ağaç tabanlı algoritma değişken seçimi yapabilir. Bu örnek
üzerinden incelememiz gerekirse;

1. Veri setini seçeriz.


2. Bundan sonra Classify sekmesindeki Choose butonuna tıklarız ve trees >
RandomForest seçeneğini seçeriz.
3. Bu algoritmayı uygularken, parametreleri isteğimize göre ayarlarız. Örneğin,
numFeatures parametresi, her ağaçta kullanılacak olan değişken sayısını belirler.
4. Bu parametreyi seçtikten sonra, Start butonuna tıklayarak algoritmayı çalıştırırız.
Sonuç olarak, model performansını ve karışıklık matrisini görürüz.

NOT:Ayrıca, More options butonuna tıklayarak, Output predictions ve Output


source code seçeneklerini işaretleyerek, tahmin değerlerini ve model kodunu da
görebiliriz.

You might also like