You are on page 1of 9

Türk Psikoloji Bülteni, Temmuz 2007, Yıl: 13, Sayı: 40, s.

17

Ölçek Geliştirme ve Uyarlama Çalışmalarında


Karşılaşılan Sorunlar
Adnan Erkuş*
Mersin Üniversitesi, Eğitim Fakültesi, Eğitimde Ölçme ve Değerlendirme ABD
adnanerkuspsi@mersin.edu.tr
Psikoloji alanındaki bilimsel çalışmaların kısa olmalıdır. Ölçek geliştirme ve uyar-
büyük çoğunluğu, özgün veya uyar- lama çalışmaları da, öncelikle, özgün bir
lama sonucu kültürümüze kazandırılan ölçek “geliştirme” mi, yoksa “uyarlama”
psikolojik ölçme araçlarıyla elde edilen mı olduğu bilgisini başlıkta yansıtmalı;
verilere dayanmaktadır. Bu çalışmalar ölçeğin ismini içermeli; önemliyse, kimler
sonucunda elde edilen bulguların için geliştirildiği yer almalı; “… Ölçeğinin
genellenebilirliği, işlevselliği ve Güvenirliği ve Geçerliği” gibi bir başlıktan
sağlamlığı da, kullanılan bu ölçme (her türlü ölçek geliştirme çalışması zaten
araçlarının güvenirliği ve geçerliğiyle ölçeğin güvenirliği ve geçerliğini içerir)
paralellik göstermektedir. Bu bakımdan, kaçınılmalıdır.
araştırma problemi istenildiği kadar yeni-
lik getirici ve önemli, araştırma düzeneği Sıklıkla karşılaşılan bir sorun ise uyar-
ve yöntemi istenildiği kadar sağlam, lama çalışmalarında gözlenmektedir.
istatistiksel analizler de istenildiği kadar “Questionnaire” sözcüğü dilimize,
doğru yapılmış olsun; kullanılan ölçme doğru bir şekilde, “sormaca (anket)”
aracı sağlam olmadığında, elde edilen olarak çevrilmiştir. Özellikle Fransa ve
bulgular da önemini yitirmektedir. Bu Kanada çıkışlı ölçek çalışmalarının veya
nedenle; araştırma sürecinin her aşaması “ilgisiz” alanlarda yapılan çalışmaların
önemli olmasına karşın, doğrudan çoğunda, “scale” yerine, “question-
gözlenemeyen değişkenleri ölçme hüneri naire” kullanılmaktadır. Uyarlama
gösteren meslektaşlarımızın kullandığı çalışması yapan araştırmacı da, ölçme
ölçme araçlarının niteliği hepsinden de aracının içeriğine ve diğer özel-
önemli olmaktadır. Son yıllarda, akade- liklerine bakmadan, birebir çeviriyle
misyenlerin üzerindeki yayın baskısının “questionnaire”i “anket (sormaca)”
da itici gücüyle, alanımızdan veya yakın- olarak çevirmektedir. Sormaca, doğası
uzak alanlardan pek çok akademisyen, ne gereği belirli bir psikolojik yapı değildir;
yazık ki bu engeli aşmada “en kolay” yol pek çok demografik ve/veya diğer
olarak ölçek geliştirme veya ölçek uyar- değişkenler hakkında genellikle “bilgi”
lama çalışmalarını görmektedir ve bu da toplamaya yarayan bir araçtır, toplam
pek çok hatayı ve eksikliği beraberinde puanı anlam taşımaz, teknik anlamda
getirmektedir. Aşağıdaki kısımlarda bu madde analizi-güvenirliği ve geçerliği
hata ve eksiklikler üzerinde durularak bir de söz konusu değildir. Bu nedenle,
farkındalık yaratılmaya çalışılacaktır. psikolojik bir yapıyı ölçmeye yönelik
olarak hazırlanmış, alt veya toplam
I. Karşılaşılan Sorunlar ölçek puanları bulunan, madde ve tepki
formatları aynı maddelerden oluşmuş bir
1. Çalışmanın Başlığı ölçme aracının “anket” olarak nitelenmesi
doğru değildir. Öte yandan, sınır yeter-
Her türlü bilimsel makalenin başlığı, lik (maksimum performans) dışındaki
çalışmanın içeriğini özetleyici, görgül değişkenleri (kişilik, ilgi, tutum vb.) ölçen
bir çalışmaysa değişkenlerini -yöntem- ölçme araçlarına “test” denmesi de doğru
ini- hatta örneklemini niteleyici, ifade değildir.
bozukluğu taşımayan, ne uzun ne de
Türk Psikoloji Bülteni, Temmuz 2007, Yıl: 13, Sayı: 40, s. 18

2. Ölçülmek İstenen Örtük Değişkenin 3. Madde Üretilmesi


Kavramsal Tanımı
Madde üretim aşaması -örtük değişkenin
Bir ölçek geliştirme çalışması, ölçü-lecek uyaranlarının üretilmesi aşaması- çok
psikolojik değişkenin, çok detaylı ve önemlidir. Madde üretimi kavramsal
kapsayıcı bir şekilde, kuramsal ve ka- yapıya uygun durum-bağlam-ortam
vramsal bir tanımlama girişimi ile başlar; belirlendikten sonra, bunlara uygun
çünkü geliştirilecek olan ölçeğin ken- davranışsal göstergeler belirlenme-
disi, bu doğrudan gözlenemeyen örtük siyle başlar, önceki kavramsal çerçeve
değişkenin işevuruk tanımının ta kendisi- ve içeriğe uygun bir madde formatının
dir. Bu kavramsal tanım, bir veya birkaç seçilmesi-belirlenmesiyle devam eder.
kurama dayalı olabileceği gibi, gözlem- Madde üretim süreci, üretilen maddelerin
ler ve diğer kavramlardan hareketle de kavramsal yapı ve onun üzerinde temel-
yapılabilir; ancak önemli olan, kavramsal lenen davranışsal göstergelerin gözetil-
tanımın, o kavramı niteleyen ortak özel- mesini gerektirir. Madde üretilmesi süre-
likleri kapsaması ve o kavrama yakın ka- cinde, madde yazarı bir yandan kafasının
vramlardan farkını da nitelemesidir. bir yanında sürekli ölçülecek değişkenin
içeriğini ve maddenin uyardığı tek şeyin
Ölçeğin kapsam geçerliği bu aşamada ilgili değişken olduğunu düşünmeli; öte
temellendiği ve sonraki her türlü yandan potansiyel yanıtlayıcılarla empati
davranışsal gösterge ve o örtük değişkeni kurarak “ben şöyle birisi olsaydım, nasıl
uyaran maddeler bu tanım üzerinde cevap verirdim” diye kendine sormalıdır.
yapılandırıldığı için, bu aşama oldukça
önemlidir. Aslında, bu aşama o örtük Örneğin, “kıskançlık” ölçeği geliştirecek-
değişkene ilişkin bir kuram (veya de- siniz ve varsayın ki, bu konuda yapılmış
nence) geliştirmeye eşdeğerdir ve ölçek hiçbir kavramsal tanım ve ölçek yok.
de onun test edilmesinden başka bir şey Kıskançlığı, “kendinde olanı başkalarıyla
değildir. Bu bakımdan, ölçek geliştirici, paylaşmama, başkasında olana imrenme”
ölçülecek değişken ile ilgili sağlam bir olarak tanımladınız; bu iki ayrı boyuta
kuramsal ve kavramsal temele sahip da, iki bileşene de karşılık gelebilir
olmalıdır; bir ölçme-değerlendirmeci veya (henüz bilmiyorsunuz). Bu tanıma uygun
psikometrist, bilmediği, hakim olmadığı davranışsal göstergeler neler olabilir? Bu
bir psikolojik değişkeni ölçme girişiminde karar, “ölçeğin kimler için geliştirileceği”
bulunmamalıdır; elbette, tersi de sorusuna karşılık gelir: Evli bireyler mi,
(ölçmeden anlamadan) olmamalıdır. bekarlar mı? Diyelim ki, “evli bireyler”
olarak belirledik; sadece erkek veya
Bu sorun, daha çok psikoloji alanı kadınlar mı, yoksa her ikisi mi olduğuna
dışındakilerin ölçek geliştirme karar vermeniz gerekir. Diyelim ki, evli
çalışmalarında sıkça gözlenmektedir: Bir kadınlar (görüldüğü gibi ölçeğin hedef
turizmci veya bir işletmeci, hiç tanımadığı- kitlesi belirginleşmeye başladı); evliliği
bilmediği bir psikolojik değişkene ilişkin devam eden veya sonlananlar mı, yoksa
ve hemen hiç bilmediği ölçek geliştirme her ikisi mi karar vermeliyiz. Görüldüğü
“temelsizliğiyle” (etik boyutunu bir gibi, bu kararlar “durumu” (situation/
yana bırakalım) ölçek geliştirme işine setting) belirlemeyi gerekli kılıyor. Diye-
soyunabilmektedir. Çalışmanın bir lim ki, evliliği devam eden ve her iki cins…
ölçek uyarlaması olması da, kavramsal O zaman, yukarıdaki kavramsal tanıma
tanımlamanın “atlanacağı” kolaycılığına uygun, evli bireyler için davranışsal
yol açmamalıdır. göstergeler bulmak durumundayız: Bir
davette dans, giyim-kuşam gibi… Bu
Türk Psikoloji Bülteni, Temmuz 2007, Yıl: 13, Sayı: 40, s. 19

göstergeler çok değişik biçimlerde (ölçek 4. Deneme Uygulaması


ve madde formatı da dikkate alınarak) Deneme uygulamasının niceliği ve niteliği
maddelere dönüştürülebilir: (Örn.; bir tüm madde analizini etkiler. Bu nedenle
Likert tipi ölçek için) “Eşimin başkalarıyla deneme uygulamasının kimler üze-
dans etmesine dayanamam”, “Benim eşim rinde yapılacağı, ölçülecek değişkene ve
de niye X gibi dans etmiyor”, “Eşimin dik- hedef grubun kimler olacağına bağlıdır.
kat çekici giyinmesi beni çılgına çevirir”, Deneme uygulaması örneklemin-
“Benim eşimin de X gibi giyinmesini deki grubun yaş aralığı, eğitim düzeyi,
isterim” gibi. Çok önemli olan bu aşama cinsiyeti gibi pek çok özelliği ölçeğin
ve süreç, ne yazık ki pek çok çalışmada kullanılacağı asıl hedef grubun özellikle-
ya yeterince önemli görülmemekte ya riyle aynı olmalıdır. Deneme uygulaması
da “atlanmaktadır”. Öte yandan bu sü- örnekleminin seçkisiz (random) seçilmesi
reçte kullanılan yöntem de önemlidir: doğru değildir; amaçlı örnekleme (non-
Araştırmacının sadece kendisi tarafından random) söz konusudur. Bu konudaki
mı, bir grup madde yazarı tarafından mı amaçlı örneklemede ise, amaç sadece il-
yazıldı? Yazılan maddeler yargıcılara gili değişken aralığının temsil edilmesi-
verilmiş ve maddelerin anlam, boyut, dir. Türbana ilişkin geliştirilen bir tutum
ifade ve benzeri açılardan yargıcılar arası ölçeğini sadece türbanlılara veya sadece
uyumuna bakılmış ve buna göre mad- türbana karşı olanlara uygularsanız;
deler atılmış veya düzeltilmiş midir? hem ölçeğin uygulanacağı hedef kitleyi
Uygulamada, sadece bir grup (2-3, o da sınırlandırmış olacağınızdan ölçeği her-
hocası-kendisi) yargıcıya maddeler veri- kese uygulayamazsınız, hem de varyans
lip, başka hiçbir istatistiksel işlem yap- daralacağından madde analizleriniz sizi
madan ölçeğin kapsam geçerliğinin yanıltır (atılmayacak madde atılır, atılacak
sağlandığı ileri sürülmektedir. Bir uyar- madde bırakılır). Deneme uygulaması
lama çalışması ise, doğrudan araştırmacı örnekleminin büyüklüğü de madde
tarafından veya bir grup (tek veya iki analiz tekniklerine bağlı olmakla birlikte,
dilli) tarafından mı çevrilmiş, çevirenler ne kadar büyük n sayısı o kadar doğru
ilgili kavramsal yapıya aşina mı, çeviri- analiz ve o kadar sağlam kararlar anlamı
den sonra ters çeviri yapılmış mı, çeviri taşır; “faktör analitik tekniklerle madde
geçerliği için neler yapılmış (iki dili bilen analizi yapılacaksa, kx10 birey” gibi
bir gruba uygulanıp Türkçe ve diğer dille ölçütlerin doğru olmadığı anlaşılmıştır
yazılmış form arasındaki korelasyona (MacCallum, Widaman, Zhang ve Hong,
bakılmış mı) gibi soruların yanıtları çok 1999). Uygulamada, asıl hedef örneklem-
önemli olmaktadır (syntax ile semantics den başka örneklemler üzerinde -yeterli
arasındaki fark). olmayan birey sayıları gibi- çalışmalar
yapıldığına tanık olunmaktadır. Uyarlama
Uygulamada bu sürece yeterince önem çalışmaları için de yukarıdaki açıklamalar
verilmediği (birileri masaya oturup, kendi geçerlidir; orijinal çalışmanın örneklemine
çalıp kendi oynuyor!) için uyarıcı madde sadık kalınmalıdır.
köklerinin ifadelerinde tutum ölçülecekse,
kişiliğin veya görüşlerin bulaştığına çokça 5. Madde Analizi
tanık olunmaktadır. Büyükçe bir örnek-
lemden ayakkabı numaraları, yaşları, Madde analizi, kabaca, maddelerin
kaç yıl okudukları, boy uzunlukları, başlangıçta öngörülen psikolojik yapıya
Türkçe final puanları gibi ilişkisiz pek uygunluğunun test edilmesini içerir.
çok değişkene ilişkin veri toplansa, on- Maddeler, ilgili özelliğe sahip olanlar ile
lara madde analizi yapılsa, hiç kuşkunuz olmayanları ayırt ediyor mu; ilgili boyut
olmasın pek çoğu bir “ölçek” oluşturur! içinde yer alıyor mu; ilgili boyut üzerin-
Türk Psikoloji Bülteni, Temmuz 2007, Yıl: 13, Sayı: 40, s. 20

deki yerleri ne gibi sorulara yanıt alınmak nuda kullanılabilir. Öte yandan klişe ve
için madde analizi yapılır. Madde ana- birilerine atfen ve özellikle başarı testleri
lizinde kullanılacak teknikler ölçülen için kullanılan .30 madde-toplam ölçek
psikolojik yapıya, madde formatına, korelasyon katsayısı ölçütüne sık sık
maddelerin puanlanma biçimine vb. sığınılmaktadır. Oysa orta düzeydeki bir
bağlı olarak değişir. İşlem sonunda da korelasyon, çok boyutlu bir yapıyla karşı
uymayanlar atılır veya tekrar gözden karşıya olunduğunun işaretini vereceği
geçirilir (işlem tekrar edilir). İster özgün gibi, başarı dışındaki değişkenler için işe
ister uyarlama çalışması olsun, madde yaramaz bir maddenin göstergesi de ola-
analizi diğer niteliklerin irdelenmesin- bilir. ‘Ne kadar yüksek madde geçerliği,
den önce gelir: Uygulamada görülen bir o kadar iyi ayırt edici madde’ demek
hata, özellikle SPSS paket programında olduğuna göre, ölçek geliştirici olarak,
“reliability” işlemi içinde madde ana- niye .30 ölçütüne sığınılır anlamak çok
lizi (ki, o da sadece madde-toplam ölçek (aslında işin kolaycılığı) zor.
korelasyonları ve maddeler arası kore-
lasyon matrisidir) verildiği için, pek çok Öte yandan, madde analizi için
araştırmacı tarafından madde analizinin başvurulan faktör analizi sonuçlarının
“güvenirlik” alt başlığı altında veril- “geçerlik” veya “yapı geçerliği” başlığı
mesidir ve bu doğru değildir. Güvenirlik altında verildiğine de tanık olunmaktadır.
ve geçerlik, madde analizinden sonra, .30 - .35 faktör yükü ölçütü de, ne yazık ki
üstelik başka örneklemler üzerinde kanıt dikkatle yaklaşılması gereken bir ölçüttür.
aranması gereken psikometrik nitelikler- .30 - .35’lik faktör yükü, o maddenin başka
dir ve bu nedenle zamansal olarak madde faktörlere de benzer yük verebileceğinin
analizinden sonra yer alırlar. Madde ve bu nedenle kompleks bir maddeyle
analizi süreci, sadece istatistik bilgisi ile karşılaşıldığının işaretini verir; böyle
gerçekleştirilemez; istatistiksel sonuçların, bir durumda ya madde çıkarılır ya da
ilgili yapıya bağlı olarak “okunmasını- çeşitli döndürme işlemlerine başvurarak
koklanmasını” da gerektirir. ölçeğin yapısı incelenir. Uygulamada
çeşit çeşit faktör analizi olmasına rağmen,
Madde geçerliği için (her bir madde hangisinin yapıldığının belirtilmemesi;
ölçeğin bir parçası, bir başka deyişle verilerin faktör analizi yapmaya uygun
ölçek onu oluşturan maddelerin bir olup olmadığının test (Kaiser-Meyer-
fonksiyonudur; dolayısıyla tek tek ölçme Olkin ve Barlett’s testleri) edilmemesi;
aracı neyi ölçmek için hazırlanmışsa, açıklanan varyans ve özdeğerlerinin rapor
onu ölçüp ölçmediği gösterilmelidir) edilmemesi; faktör sayısına doğru karar
madde-toplam ölçek korelasyonları verilememesi; gereksiz yere döndürme
kullanılacaksa, madde puanı ile ölçek yapılması veya yapıya uygun döndürme
puanının hangi düzeyde ölçmeye işleminin yapılmaması; faktör ile
(sınıflama, sıralama vb.) uygun olduğu bileşenin ayırt edilememesi gibi pek
bilinmelidir: Madde 1-0’lı puanlanıyorsa, çok eksiklik ve hataya rastlanmaktadır.
bu gerçek süreksiz mi, yapay süreksiz mi Ayrıca, “Temel Bileşenler Analizi ile ilk
olduğuna bağlı olarak nokta çift serili veya ortaya çıkan faktör yapısı başlangıçtaki
çift serili korelasyon tekniğine başvurulur kavramsal öngörüye ne kadar uymaktadır,
ve özellikle SPSS paket programında bu uymuyorsa bu ne anlama gelmektedir,
korelasyon teknikleri olmamasına rağmen kavramsal yapı mı, ölçek mi sorunludur”un
ne yazık ki Pearson Momentler Çarpımı yanıtı, alan bilgisi ile istatistik ve ölçme
Korelasyon tekniğinin kullanıldığı sıklık- bilgisinin harmanlanmasını gerektirir;
la gözlenmektedir. STATISTICA gibi bunlardan biri eksik olduğunda verilecek
başka pek çok paket program bu ko- kararlar da yanlış olur. Her ölçek, madde
Türk Psikoloji Bülteni, Temmuz 2007, Yıl: 13, Sayı: 40, s. 21

atımıyla kolaylıkla tek faktöre indirgene- Kongresi’ndeki bir oturumda birbirinden


bilir; ancak, ölçülen yapı gerçekten tek ayrı ve habersiz, biri Geleneksel Kurama,
faktörlü müdür sorusu yanıtlanmadan diğeri Modern Kurama dayalı olarak
kalmış olur. Bazen, öyle olur ki, özdeğeri yapılan iki çalışmada Beck Umutsuzluk
ve açıklama gücü düşük en son birkaç mad- Ölçeği’nin 12. maddesinin yapılan ana-
delik bir faktör, ölçeğin gerçek yapısına lizlerde sorunlu olduğu (büyük olasılıkla
ilişkin çok fikir verebilir; bu durumda çeviride kültürümüze özgü “umuyo-
belki yeni baştan yeni madde desteğiyle rum” ile “ummuyorum” yüklemlerinin
o faktörü güçlendirme yoluna gitmek ge- ayırt edilememesinden kaynaklanan), bu
rekebilir. Görüldüğü gibi, sadece istatistik madde çıkarıldığında ölçeğin psikometrik
bilgisiyle veya istatistiksel sonuçlara ba- niteliklerinin yükseldiği belirtilmişti.
karak (özellikle faktör analitik tekniklerle Ancak ne yazık ki, bu ölçeğin hala eskisi
madde seçilecekse) ölçeğin faktör yapısına gibi puanlanmaya devam edildiği görül-
ve maddelerin atılıp atılmayacağına karar mektedir.
vermek yanlışlıklara yol açabilir; ölçek
geliştiricinin o madde ve test istatistikleri- İstatistik paket programlarının yaygın-
ni “okuması-koklaması” gerekmektedir. laşması ve analiz çeşitliliğinin zengin-
leşmesinden sonra, madde anali-zinde
Özellikle uyarlama çalışmalarında faktör birden çok yöntemin kullanılması; bunun
analitik tekniklerle maddelerin ince- yanında tüm ölçek veya alt faktörler
lenmesi çok daha fazla özen gerektirir. için iç tutarlık, toplanabilirlik gibi özel-
Psikolojik değişkenlerin çoğu kültüre liklerin de karar vermede göz önünde
bağımlıdır ve bu nedenle kültürlere bulundurulması önerilebilir.
(sadece başka kültürlere değil, aynı kültür
içinde farklı hedef gruplara da uyarlama 6. Güvenirlik
çalışılması yapılır) “çeviri değil” “uyar-
lama” çalışmaları yapılır. Bu durumda, Güvenirlik belirlemede en sık yapılanın
ölçek geliştiricinin yukarıdakilere ek SPSS paket programının “reliability”sini
olarak ayrıca kültürel yapıyı dikkate tıklamak ve maddeleri (bazen, toplam
alması gerekir; o kültürde 3 faktörlü olan puanları ve hatta demografik değişkenleri
bir psikolojik yapının bizde 4 faktörlü de!) doldurduktan sonra OK’e tıklamak
veya 2 faktörlü çıkması önemli bir bilgi olduğu gözlenmektedir. Hangi güvenirlik
taşır. ‘Zorlama’ bir şekilde faktör sayısını belirleme yolunun seçileceği maddel-
‘denkleştirmeye’ çalışma ise uyarlama erin puanlanmasına, ilgili yapının tek ya
esprisini ortadan kaldırır; bu gibi durum- da çok boyutlu olup olmamasına, ilgili
larda orijinal çalışmadaki faktör (alt ölçek) değişkeni kararlılık durumuna vb bağlıdır.
yapısı değil, bizim kültürümüzdeki yapı Uygulamada, ölçek çok boyutlu olmasına
dikkate alınmalı, isimlendirme ve puan- karşın, yarıya bölme güvenirliğine
lama ona göre önerilmelidir. Piyasada bakıldığı; maddeleri ikili puanlanan
ne yazık ki, uyarlama çalışmasında farklı ölçek için Cronbach Alfa hesaplandığı;
faktör yapısı bulunmasına rağmen, oriji- sadece (hazır) iç tutarlık katsayılarından
nalindeki gibi kullanılan ve yorumlanan birine ya da en fazla ikisine bakıldığı,
pek çok ölçek mevcuttur; böyle bir du- ölçeğin test-tekrar test güvenirliğinin çok
rumda uyarlama çalışması da esprisini incelendiği; tek tek puanların yorumunda
yitirmektedir. önemli olan ölçmenin standart hatasının
hemen hiç verilmediği; SPSS çıktısı diye,
Alandaki potansiyel ölçek kullanıcılarının, madde-toplam ölçek korelasyonları ile
ölçekler ile ilgili yapılan çalışmaları da korelasyon matrisinin güvenirlik içinde
takip etmesi gerekir. XIII. Ulusal Psikoloji verildiği vb. görülmektedir. Çoğu kez
Türk Psikoloji Bülteni, Temmuz 2007, Yıl: 13, Sayı: 40, s. 22

de, deneme uygulaması örnekleminden nin ölçütü olumsuz otomatik düşünceler


elde edilen veriler üzerinde güvenirliğe (ya da tersi) olur; zekanın (belirli)
bakılıp bırakıldığı gözlenmektedir; oysa yaşa bağlı olarak arttığı biliniyorsa,
yapılması gereken, seçilmiş maddelerden geliştirilen zeka ölçeği yaş farklılıklarını
oluşan nihai ölçeğin tekrar bir örnekl- ortaya çıkarabilmelidir, gibi. Ama bir
em üzerinde uygulanarak güvenirliği bakıyorsunuz, araştırmacı hiçbir kuşku
sınamaktır. Çünkü denemelik ölçekteki veya bulgu olmamasına rağmen, “bir de
çok sayıdaki maddeye verilen tepkilerle, cinsiyetler arası farka bakalım” (bir şey
azaltılmış-seçilmiş maddelerden oluşan yapmış görünmek, sayfayı doldurmak
ölçeğe verilen tepkiler çok farklı olabilir. için olsa gerek!) diyerek bir t-testi yapıyor.
Bir bilimsel toplantıda, bir ölçmecinin Niye yaptın? Ölçülen değişkenin cinsiyete
ölçek geliştirme sunumu yapan bir bağlı olarak değiştiği bekleniyor mu ki?!
akademisyene, “tamam da, bu ölçeğin Geçerlik için gerekli pek çok değişkenle
güvenirliğine nasıl baktınız” sorusuna, ve pek çok yolla kanıt toplanmalı, ilişkisiz
sunum yapan akademisyenin, “yahu değişkenler kullanılmamalı ve işlemler
beni tanımıyor musun, bana güvenmiyor yapılmamalıdır.
musun; biz birbirimize güvenmeyeceğiz
de kime güveneceğiz” türü trajikomik 8. Puanların Yorumlanması
açıklamalar artık geride kalmalıdır.
Ölçek geliştirme çalışmasının ve
7. Geçerlik raporlarının en çok ihmal edilen kısmı
bu olmaktadır. Ölçek kullanıcısı, ölçek-
Geçerlik, güvenirlikten daha önemli ten elde edilecek bir ölçüme sahip birini
olduğu halde, ne yazık ki ‘gereken ilgiyi’ nasıl değerlendirecek? Puanların artışı
görmemektedir. Oysa ki, bir ölçek güve- değişkendeki artışa ya da azalışa mı karşılık
nilir olabilir, ama geçerli olmayabilir. geliyor? Toplam puan elde edilebilir mi,
Geçerlik, bir ölçeğin “işe yararlılığının” yoksa alt ölçek puanları ayrı ayrı mı ele
kanıtı olduğundan, üzerinde önemle alınmalı? Peki toplam puanlar hangi ölçüte
durulmalı; ölçek geliştirici kendi geçer- göre yorumlanacak? Normlar geliştirilmiş
lik çalışmalarının ötesinde, ölçeğiyle midir, geliştirilmişse nasıl? En çok
yapılan tüm görgül çalışmaları izlemeli- görülen yanılgılardan biri de, “normların
dir, çünkü hemen hemen tümü ölçeğinin mutlaka içinde bulunulan grubun
geçerliğine kanıt oluşturur. Uygulamada, ham puanlarının standartlaştırılması”
madde analizinde kullanılan Temel olduğu şeklindeki bilgidir; oysa, klinik
Bileşenler Analizi sonuçlarının “yapı psikoloji alanındaki pek çok ölçek bir
geçerliği” olarak adlandırılmasına ne kesme noktasına göre yorumlanır. Peki
yazık ki çok sık rastlanmaktadır. Oysa, normlar nasıl oluşturulacak? Normlar,
adı üstünde yapının geçerliği için yeniden mutlaka ölçek geliştirme örneklem-
veri toplanıp ve başka istatistiksel anali- lerinden çok daha büyük örneklemler
zlere (Doğrulayıcı Faktör Analizi, SEM üzerinde geliştirilmelidir; elde edilen
gibi) başvurulması gerekir. Üstelik yapı dağılım istatistiklerine göre bir yöntem
geçerliği, sadece faktör analitik teknikler- izlenmelidir. Norm değişkeni, ilgili değişken
le de yapılmaz. Ölçeğin geçerlik kanıtları ölçümlerini farklılaştıran potansiyel karıştırıcı
için başvurulacak işlem ve değişkenlerin değişkenlere göre belirlenir, gelişigüzel
ipuçları, kavramsal tanımlamanın ele değil. Ölçülen değişken kadın ve erkeğe
alındığı alan yazında büyük ölçüde yer göre değişmiyorsa, cinsiyet normları
alır. Örneğin depresyonun, olumsuz yapmanın anlamı yoktur. Bir diğeri
otomatik düşüncelerle ilişkili olduğu ise, özellikle uyarlama çalışmalarında,
biliniyorsa, geliştirilen depresyon ölçeği- sürekli değişkenin kategorileştirilerek
Türk Psikoloji Bülteni, Temmuz 2007, Yıl: 13, Sayı: 40, s. 23

norm grupları oluşturulmasında gözlen- vermiyor vb. En sık karşılaşılan kapanış


mektedir. Örneğin, yurtdışında “reaksi- cümlesi ise, “Görüldüğü gibi ölçek
yon süresi” ölçeğinin yaş normları (eşit güvenilir ve geçerlidir.” Hiçbir ölçek
aralıklı veya değil) diyelim ki, 18-25, tam olarak güvenilir ve geçerli değildir;
26-35, 36-40, 41-55, 56 ve üstü olarak hele hele yukarıdaki gibi hatalı, eksik bir
belirlenmiş ve kullanılmış. Niye bu yaş çalışmadan sonra bunun iddia edilm-
dilimleri kullanılmış, çünkü bu gruplar esi son derece tehlikeli olmaktadır. Birçok
arasında reaksiyon süresi açısından fark habersiz kişi, tez veya makalenin sonun-
çıkmış da ondan; bir başka deyişle, görgül daki bu ölçekleri (yeterli ve doğru kabul
bir çalışma yapılmış da (ANOVA gibi) edip) alıp araştırmalarında kullanıyor, bu
sonra bu gruplar norm grupları olarak ölçeğe dayanarak insanlar hakkında karar
saptanmış. Bizim “ölçekçimiz” de tutuyor veriyor…
aynı grupları (n sayısının düşüklüğünü
de bir yana bırakırsak) norm grubu olarak II. Bu Sorunların Olası Nedenleri
alıyor; ancak yaş grupları arasındaki farkı ve Çözüm Önerileri
da test ediyor veya etmeden örneğin
ortalamaları da veriyor: Bir bakıyorsunuz, Aşağıdaki kısımda (yine kişisel gözlemlere
yaş gruplarının üçünün (örneğin, 26- dayanarak), denemelik bir nedenler listesi
35, 36-40 ve 41-55) reaksiyon süreleri ve olası çözüm önerileri sıralanacaktır.
ortalamaları hemen hemen aynı ve
(yapılmışsa) ANOVA’da da bu gruplar 1. Olası Nedenler
arasında fark yok! Ancak “ölçekçimiz”
bunu göz ardı edip (ya da bilmediğinden), a) Bilgisayarda istatistiksel paket
tüm yaş grupları için yurtdışındaki gibi programların yaygınlaşması ve bu
norm tabloları hazırlamış! Bizim kültürü- programları bir şekilde kullanabilenin,
müzde bu yaş grupları arasında fark yok, kendisini istatistikçi (istatistikçinin de
niye bu normları kullanıyorsun? kendini ölçmeci) olarak algılaması ve
o programlarla ölçek geliştirebileceği
9. Çalışmanın Raporlaştırılması yanılgısına düşmesi;

Bir bilimsel çalışmanın raporlaştırılması, b) Akademisyenler üzerindeki yayın


o çalışmayı yürütüş aşamalarına göre baskısının artması ve özellikle psikoloji
yapıldığında bir bütünlük oluşturur, dışındaki alanlar için en kolay yol olarak
okuyucu daha iyi kavrar. Ancak ne yazık ölçek geliştirme veya uyarlama çalışması
ki, psikometri alanında bir dergimizin olduğu yanılgısına düşülmesi;
olmamasından da kaynaklanan bir
şekilde, ölçek geliştirme çalışmaları kendi c) Uygulama alanlarında, özellikle klinik
özgün yürütülüş aşamaları dışında, zorla- ortamlarda çalışanlar tarafından bireyi
ma bir şekilde başka kalıplarda yazılmak tanımlamada en kolay yol olarak test ve
zorunda kalınıyor. Raporlaştırma ko- ölçek geliştirmenin (veya uyarlamanın)
nusundaki bu temel sorun bir yana, görülmesi;
“ölçekçimiz” (yukarıdaki alt başlıklar
ona göre sıralandı), rapor yazımında hiç d) Ölçme, ölçek geliştirme, istatistik ve
madde analizine değinmeden güvenirlik araştırma teknikleri alanlarında ya hiç
ve geçerliğe ‘atlayıveriyor’; tablolarda, eğitim alınmaması veya çok yetersiz
sadece kendi öngördüğü faktör altındaki alınması;
faktör yüklerini vererek, bir maddenin
diğer faktörlere verdiği yükleri ‘gizliyor’; e) İlgili kavramsal alt yapıya sahip olunca
özdeğerleri ve/veya açıklanan varyansları o konuda ölçek geliştirilebileceği veya
Türk Psikoloji Bülteni, Temmuz 2007, Yıl: 13, Sayı: 40, s. 24

ölçek geliştirme bilgi ve becerisine sahip ii) Bu merkeze bağlı Test ve Ölçek
olunca hakim olunmayan bir değişkene Bankası’nın oluşturulması,
ilişkin ölçek geliştirilebileceği yanılgısı; iii) Böylelikle, geliştirilen ve
uyarlanan her ölçeğin denetlenmesi,
f) Ülkemizde her türlü ölçeğin hiçbir ölçeklerin bir tek merkezde toplanması,
denetime uğramadan geliştirilebilmesi ve ölçek kullanıcılarının eğitilmesi, iz-
rahatlıkla kullanılabilmesi; insiz ölçek kullanılmaması, her ölçek
için küçük de olsa bir bedel ödetilerek
g) Bu konuda çalışanların ve özellikle aka- ölçek geliştiricilerinin özendirilm-
demik ortamda yapılan tez vb çalışmaların esi-ölçek kullanıcılarının caydırılması vb.
danışmanlarının sanrı düzeyindeki benlik sağlanmalıdır.
algılarına sahip olması gibi.
b) Zaman geçirilmeden, bu alanda eleman
Yukarıdaki nedenlerin tümü, aslında yetiştirmek için;
ölçme ve ölçek geliştirmeyi hafife almak i) yurtiçi bütünleştirilmiş lisan-
şeklinde bir tek nedene indirgenebilir. süstü programların açılması,
Bir zamanlar, üstelik çok önemli bir ii) yüksek lisans, doktora ve dok-
psikolog hocamız, bir kongremizde, tora sonrası eğitim için yurtdışı eğitim
“YÖK’ün (o komisyondaymış) neden olanaklarının yaratılması,
Psikometriyi doçentlik alanlarından iii) ulusal hizmet içi programlarının
çıkardığı” konusundaki bir soruya, “eee yaşama geçirilmesi,
her psikoloğun kendi ölçme aracını iv) Türkçe yayın gereksinimini
zaten kendisinin geliştirme yeterliğine karşılamak için destek sağlanması
sahip olması gerektiği” şeklinde (böyle gerekmektedir.
düşünenlere, APA onayı almış birçok der-
giyi incelemelerini ve bu konudaki kitap c) Ulusal ve sonra da giderek (en azından)
ve yeni yöntem-teknikleri okumalarını bölge ülkelerini kapsayacak şekilde ulus-
öğütleyebiliriz) yanıtlamıştı! Psikometri lar arası bir “Psikoloji ve Eğitimde Ölçme
bir (ağırlıkla) temel ve uygulamalı Değerlendirme Dergisi”nin bir an önce
alandır; üstelik psikolojinin bir bilim yayına başlaması zorunludur. Bu önerinin
olması ölçmenin, dolayısıyla psikometri- önemsenmesi ve yaşama geçirilmesi
nin gelişimiyle olanaklı olmuştur; üstelik sayısız yarar sağlayabilir: Böylelikle, gi-
psikometri alanındaki üretilenler kendi derek başka alanlardakiler de olmak
dışındaki istatistik alanına bile önemli üzere ölçek geliştirme çalışmaları dis-
katkılar sağlamıştır. Psikometristlerin ipline olmaya başlayacak; başka dergile-
asli görevi ölçek geliştirmek değil, ölçek rin yazım formatından ve gevşekliğinden
geliştirmek için yeni model, yöntem ve kurtulunulacak ve asıl önemlisi, yukarıda
teknikler geliştirmektir. Öte yandan, önerilen merkezlerin doğuşu için zemin
psikometri, eleman yetişmesi en zor; hazırlanmış olacaktır.
ancak eleman eksikliği en çok hissedilen
alanlardan biridir; bunun için ulusal ve Bilimsel amaçlarla ve ciddi kararlar
uluslar arası bir tarama okuyucuya çok vermek için kullanılacak ölçekler, hafta
şey kazandırabilir. sonu magazinlerindeki gibi üç soruda
“partnerinizi ne kadar kıskanıyorsunuz
2. Olası Çözüm Önerileri test edin” türü eğlencelik zırvalardan çok
farklıdır; ölçek geliştirmek çok zor, çok
a) Yasamızın bir an önce çıkarılarak; ciddi, ama çok keyifli bir iştir. “Çok zor”
i) Test ve Ölçek Denetleme olması bir ölçüde yukarıda yazılanlardan
Merkezi’nin kurulması, çıkarsanabilir; “çok ciddi” olması, bu
Türk Psikoloji Bülteni, Temmuz 2007, Yıl: 13, Sayı: 40, s. 25

ölçme araçlarına dayanarak araştırmalar


yapılması ve bireyler hakkında ciddi
yaşamsal karar vermekte yatmaktadır;
“çok keyifli” olması ise, ölçek geliştiricinin
kimsenin doğrudan gözleyemediği bir
şeyi gözleyebilme becerisi göstermesidir.

Kaynaklar
MacCallum, R. C., Widaman, K. F., Zhang, S.
ve Hong, S. (1999). Sample size in factor analysis.
Psychological Methods, 4 (1), 84-99.

* Bu sınırlı uzam taşıyan yazıda ele alınanlar,


yazarın dergi ve diğer konulardaki hakemlik
ve danışmanlıkları ile kişisel yaşantılarına
dayanmaktadır; bu nedenle, bu yazıda
örneklere hiç atıf yapılmaması uygun
görülmüştür ve daha pek çok konu, eleştiri
ve öneri bu yazıya eklenebilir. Yazının hedefi
hiçbir kurum veya kişi değildir, sadece bu
konuda bir farkındalık yaratmak ve bu yönde
bazı girişimleri başlatabilmektir. Bu alanda bir
özel sayı çıkardıkları ve bana böyle bir fırsatı
verdikleri için Türk Psikoloji Bülteni Yayın
Kurulu’na teşekkür ederim.

You might also like