Professional Documents
Culture Documents
10 31451-Ejatd 671952-1030740
10 31451-Ejatd 671952-1030740
Bülent Özkan1
1) Mersin Üniversitesi, Eğitim Fakültesi, Türkçe Eğitimi Bölümü, Mersin,
ORCID ID: 0000-0002-4319-7582, İleti: ozkanbulent@gmail.com
Özet
Bu çalışmanın amacı, Türkçe üzerine çalışan dil/dilbilim araştırmacıları için araştırma sorularına bağlı olarak
biçimlendirilebilen, araştırmacıya özel, esnek, kolay ulaşılabilir, veri tabanı destekli ve bu çerçevede araştırma sonuçlarının
sağlıklı bir şekilde raporlanabildiği bir derlem platformu olan “Kendi Kendine Derlem Oluşturma Platformu”nun
(KKDP) Terim Bilim Modülü’nü (TBM) tanıtmaktır. Söz konusu TBM, KKDP’nin alt modüllerinden biri olarak terim
bilim çalışmalarında kullanılmak üzere geliştirilmiş bir derlem modülüdür.
Anahtar Kelimeler: Derlem Dilbilim, Kendi Kendine Derlem Oluşturma, Terim Bilim Modülü
Abstract
The aim of this paper is to introduce the Terminology Module (TM) of the Do It Yourself Corpus Platform
(DIYCP) which can be individualized in line with the research questions of the scholars, and which is exclusive to the
scholar, user friendly, and is supported by the database. Considering this perspective, this corpus is going to provide a
corpus platform in which the results of the research can be reported in a functional way. The mentioned TM is the
one of the DIYCP module which can be used in the field of terminology studies.
Bu çalışma, TÜBİTAK 1005 Ulusal Yeni Fikirler ve Ürünler Araştırma Destek Programı çerçevesinde 111E791 numaralı “Türkçe için Kendi
Kendine Derlem Platformu Oluşturma” başlıklı projeden üretilmiştir. Katkıları için TÜBİTAK’a teşekkür ederim. Bu metin ilgili projenin sonuç
raporunda üretilmiştir.
Geliş Tarihi: 8 Ocak 2020, Düzeltme Tarihi: 22 Şubat 2020, Kabul Tarihi: 1 Mart 2020 8
Avrasya Terim Dergisi, 2020, 8 (1): 8 - 17
1 Başka tanımlar için bk. Say, 2002 ve 2003. 2Türkçe üzerine yürütülen önemli derlem çalışmaları için bk.
Özkan 2010.
eurasscience.com 9
Avrasya Terim Dergisi, 2020, 8 (1): 8 - 17
yandan her araştırma kendine özgü birtakım veri işleme Dilbilimsel çalışmalar çerçevesinde web tabanlı
ve raporlama süreçlerini de araştırmanın amacına uygun yazılımlara literatürde rastlanmaktadır. Bu yazılımların
olarak kendisinde barındırmaktadır. Bu çerçevede araş- başında bir metin işleme/derlem oluşturma yazılımı olan
tırmacılara kendi araştırma sorularına bağlı olarak veri iş- ve BNCweb ile bütünleşik olarak çalışan WordSmith gel-
leme ve raporlama imkânı sunabilen KKDP'nin alt mo- mektedir. Lancester Üniversitesince ortaya koyulan bu
dülü olan Terim Bilim Modülü’nü araştırmacılara tanıt- yazılım yine standart derlem işleme aşamalarına bağlı ola-
mak bu çalışmanın ana amacıdır. rak raporlar sunabilmektedir.3
Bugün için kullanılan yazılımların bir diğer eksik- Bugün derlem çalışmalarında açık kaynak kodlu
liği ise yalnızca standart birtakım raporlama araçlarına sa- yazılımlar, metin işleme/derlem oluşturma yazılımları ve
hip olmasıdır. Oysa her araştırma, araştırma sorularına web tabanlı uygulamalar derlem oluşturma çalışmala-
bağlı olarak kendine özgü birtakım özellikler taşır ve söz rında sıklıkla kullanılmaktadır. Söz konusu yazılımlar
konusu özellikler derlem dilbilimin araştırma mantığına Php, Perl, Java, Python, C vb. programlama dilleri kulla-
göre farklı raporlamalar ve etiketlemeler/işaretlemeler nılarak oluşturulmuş yazılımlardır. Bu anlamda Steven
gerektirir. B., Ewan K., Edward L. (2009) http://www.nltk.org/
adresinden de erişilebilen Python programlama diliyle
Bir yazılım kümesi olarak KKDP, derlem dilbili- Unix tabanlı sürümünün yanında diğer işletim sistemleri
min yöntemsel yaklaşımlarına paralel olarak kullanıcıların için de üretilmiş NLTK (Natural Language Toolkit)
ihtiyaçlarını en üst seviyede karşılayabilmekte ve doğru- önemli bir yer tutmaktadır. Ancak söz konusu program
dan Türkçenin kendine özgü yapısının araştırma sorula- kullanıcı için programlama bilgisi gerektirmektedir.
rına göre biçimlendirilebileceği bir platformu araştırma-
cılara sunabilmektedir. ICEweb olarak bilinen küçük ve basit web tabanlı
derlem uygulaması ise International Corpus of English'e da-
Bu çerçevede KKDP’nin Türkçe için özelleştiril- yanmaktadır. Bahsi geçen diğer uygulamalar gibi bu yazı-
miş küçük ve orta ölçekli derlem projelerinde etkili bir lım sözcük türü etiketleme, bağımlı dizi oluşturma, sıklık
şekilde kullanılabilecek bir derlem platformu olduğu söy- belirleme gibi olanakları araştırmacılara sunabilmekte;
lenebilir. Bu anlamda çalışmanın konusu ve kapsamı kurulum dosyası üzerinden bilgisayara kurularak çalıştırı-
KKDP’nin tanıtımı ve bunun yanı sıra bir alt modül olan labilmektedir.
Terim Bilim Modülü’nün terim çalışmalarında ne şekilde
kullanılabileceğini ortaya koymaktır (Özkan, 2016). https://cqpweb.lancs.ac.uk/ adresinden de ulaşı-
labilen CQPweb ise açık kaynak kodlu yazılımların bir
3. Tartışma ve Değiştirme araya getirilmesiyle oluşturulmuş, derlem oluşturma ve
işlemede kullanılan Perl ile yazılmış bir yazılım kümesi-
3.1. KKDP’nin Özgün Değeri dir. CQPweb5 (Corpus Query Processor), var olan der-
lemler için (BNCWeb XML -British National Corpus
Batıda derlem-tabanlı çalışmalar, her ne kadar XML Sürümü- gibi) bütüncül sorgulama imkanını kulla-
daha eskiye dayansa da 1960’lı yılların başlarından bu nıcılara sunabilmektedir.
yana edebiyat, sözlükbilim, ağız (diyalekt) çalışmaları, dil
öğretimi ve dilbilgisinde bir yöntem olarak hızlı bir geli- Yine bu tip yazılımlara başka bir örnek UAM Cor-
şim göstermiştir. Günümüzde ise, derlem odaklı çalışma- pusTool’dur. Yine bir kurulum dosyasıyla bilgisayar üze-
ların özellikle sözlükbilim, dil öğretimi ve dilbilgisi alan- rinden çalışabilen özellikle batı dilleri için geliştirilmiş
larında yoğunlaştığı gözlemlenmektedir (McEnery, ve son kullanıcı için düşünülse de kullanıcı tarafından ayrıca
ark., 2006). öğrenilmesi gereken ve veri tabanı desteği sunamayan, bu
3 http://www.lancaster.ac.uk/fss/courses/ling/corpus/blue/ 5 https://cqpweb.lancs.ac.uk/
diy_top.htm
4 http://ucrel.lancs.ac.uk/claws/
eurasscience.com 10
Avrasya Terim Dergisi, 2020, 8 (1): 8 - 17
anlamda da raporlama aşamasında beklentileri karşılaya- 3.2. Kendi Kendine Derlem Oluşturma Plat-
mayan, bir derlem yazılımıdır.6 formu Terim Bilim Modülü ve Örnek Bir Uygu-
lama.
Örnekleri çoğaltmak mümkünse de tüm bu yazı-
lımlar batı dilleri, özellikle de İngilizce için geliştirilmiş "Kendi Kendine Derlem Oluşturma Platformu"
yazılımlardır. Bu yazılımları Türkçe üzerine çalışan araştırmacılara var olan standart derlem çıktılarının yanı
dil/dilbilim araştırmacıları için araştırma sorularına bağlı sıra araştırma sorularına bağlı olarak biçimlendirilebilen, araştır-
olarak biçimlendirilebilen, araştırmacıya özel, esnek, ko- macıya özel, esnek, kolay ulaşılabilir, veri tabanı destekli ve araş-
lay ulaşılabilir, veri tabanı destekli ve bu çerçevede araş- tırma sonuçlarının sağlıklı bir şekilde raporlanabildiği bir der-
tırma sonuçlarının sağlıklı bir şekilde raporlanabildiği lem altyapısı sunabilmektedir.8
derlem yazılımları olarak değerlendirmek güçtür.
Var olan metin işleme/derlem paket yazılımları
Alan uzmanları derlem araştırmalarının ya oluştu- yukarıda da sözünü ettiğimiz üzere batı dilleri için geliş-
rulmuş derlemler üzerinden yapılabildiği ya da amaca uy- tirilmiş olan derlem yazılımlarıdır ve o dillere özgü birta-
gun bir derlem oluşturularak genellikle sözcük sıklığı be- kım veri işleme ve raporlama özelliklerine sahiptir.
lirleme, bağımlı dizin oluşturma gibi basit-standart der- Türkçe için de kısmen kullanılabilen söz konusu yazılım-
lem çıktıları alınabileceği konusunda birtakım bilgiler ların en büyük eksikliği, oluşturuldukları diller de dahil
vermekte ve söz konusu çıktıların alınabileceği paket ya- olmak üzere, işlenen verilerin saklanamaması ve araş-
zımlar ya da web uygulamalarını önermektedir (Sinclair, tırma sorularına bağlı olarak sağlıklı bir şekilde söz ko-
1991; Stevens, 1995). nusu verilerin raporlanamamasıdır. Ayrıca bu yazılımları
Türkçe üzerine çalışan dil/dilbilim araştırmacıları için
KKDP’nin bu anlamda temel amacı açık kaynak araştırma sorularına bağlı olarak biçimlendirilebilen,
kodlu, internet üzerinden erişilebilen, dilbilimsel etiketle- araştırmacıya özel, esnek, kolay ulaşılabilir, veri tabanı
meler yapabilen, eşdizimlilik ve sıklık listesi çıktıları vere- destekli ve bu çerçevede araştırma sonuçlarının sağlıklı
bilen, bunun yanında istatistiksel yordamalar sunan, so- bir şekilde raporlanabildiği derlem yazılımları olarak de-
nuçları kaydedebilen bir derlem altyapısı ve arayüzü oluş- ğerlendirmek güçtür.
turmaktır.
Derlem oluşturmak bilgisayar bilimleri uzmanları-
Derlem dilbilim konusunda ulusal ve uluslararası nın desteği olmaksızın gerçekleşmesi güç bir iş olarak gö-
patent, faydalı model, tescil taramasında7 genellikle der- rülmektedir. Diğer taraftan batı dilleri için geliştirilen me-
lemlerin oluşturulması, derlemlerde sorgu sonuçlarının tin işleme/derlem oluşturma paket yazılımları Türkçeye
verimliliği, derlemlerden bir takım standart veri çıkarım- özgü olmamaları bir tarafa bırakılırsa ayrıca öğrenilmesi
ları ya da bunların iyileştirilmesi veya sözlü derlem vb. gereken ayrıntılı ve karmaşık yazılımlardır. Bir dilbilimci-
doğal dil işlemenin alt araştırma alanlarında bir takım me- nin söz konusu yazılımları kullanabilmesi için bu yazılım-
tot ve yöntemlerin geliştirilmesi üzerine patent, faydalı ların ayrıntılı ve karmaşık yapılarını çözümlemesi gerek-
model veya tescil alındığı görülür. Bu anlamda Türkçe için mektedir. Oysa dilbilimciler, bir tarayıcı (browser) üze-
Kendi Kendine Derlem Oluşturma Platformu özgün ve ala- rinden, kullanıcı dostu, açık ve anlaşılır arayüzlerle kendi
nında ulusal ve uluslararası yenilikleri barındıran bir ya- uzmanlık alanlarına ve araştırma sorularına bağlı olarak
pıya sahiptir. bir derlem oluşturabilme olanağına sahip olabilmelidirler.
Öte yandan derlem dilbilim alanında batı literatü- KKDP, araştırmacıların araştırma sorularına bağlı
ründe özellikle altı çizilen nokta, derlemlerin araştırma olarak kuracakları derlemde yer alacak tabakaları oluştu-
sorularına göre şekillenen araştırma evrenleri olmalarıdır rabileceği, metin girişleri yapabileceği ve bunların meta-
(McEnery, T. ve ark., 2006, Sinclair, J. 1991, McEnery T. datalarını belirleyebileceği, bunlara bağlı olarak birtakım
ve Wilson A. 1996, Barnbrook, G. 1996). Bu anlamda standart derlem işlemlerinin yanında yine araştırma soru-
KKDP söz konusu ihtiyacı karşılayacak niteliktedir. larına bağlı olarak kendi etiketleme sistemini esnek olarak
belirleyip oluşturacağı, derlemi bu etiket sistemine göre
etiketleyebileceği ve tüm bunları esnek bir raporlama sis-
temi üzerinden çıktı olarak alabileceği bir platformdur.
6
Bahsedilen metin işleme/derlem oluşturma yazılımlarının bir listesi 7
http://www.tpe.gov.tr, tr.espacenet.com ve http://www.epo.org/
ve söz konusu yazılımların linkleri için (http://www.uow.edu.au adreslerinden "corpus, corpora, DIY corpora, building corpus, own corpus, der-
/~dlee/software.htm) adresi önemli bir kaynaktır. lem" gibi anahtar sözcüklerle yapılan sorgu sonuçları incelendiğinde
benzer bir çalışmanın olmadığı görülür.
8 KKDP üzerinden yapılmış çalışmalar için bk. http://kkd.mer-
sin.edu.tr/
eurasscience.com 11
Avrasya Terim Dergisi, 2020, 8 (1): 8 - 17
Örneğin yazın türleri ayrı bir tabaka oluşturabile- Eşdizimlilik Hesaplama: “Sözcükbirimlerin
ceği gibi internet metinleri ya da herhangi bir ana tabakaya anlamsal ya da dilbilimsel birlikteliklerinden kaynaklanan
girmeyen çeşitli türler (bilimsel yazılar vb.) başkaca tabaka- ve kullanım sıklığına bağlı olarak sözlükbirimsel özellik
lar olarak derlemlerde yer alabilir. Ayrıca sadece araş- taşıyabilen söz birlikleri.” (Sterkenburg, 2003:119-120); ya
tırma yapılacak alanla ilgili tek bir tabaka oluşturulabilir. da “Sözdizimsel olarak anlamsal sözcük birliktelikleri”
(Malmkjaer, 2001; Hartmann ve Gregory, 1998:22, 23;
Alan Tanımlama: Oluşturulan arayüzle der- Baker, ve ark., 2006) olarak tanımlanan eşdizimliliklerin
lemde yer alan tabaka ve metin nitelikleri ile dilbilimsel çeşitli istatistiksel yöntemlerle hesaplanması (mutual infor-
etiketleri araştırma sorularına göre biçimlendirme/belir- mation, t-test, z test, chi-squared test, likelihood ratio) ve listelen-
leme. mesi.
Metadata: Üstveri olarak da adlandırılan metin 3.3.3. Esnek Etiket Oluşturmayla İlgili Ta-
adı, yazar adı, yayın yılı, ilk yayın tarihi, son basım tarihi, yaza- nımlar
rın cinsiyeti, metin cümle sayısı, farklı ve aynı cümle sayısı vb.
sistem üzerinden araştırma sorularına göre biçimlendiri- Esnek Etiket: Yazılım arayüzüyle araştırmanın
lebilen veri girişleri (Burnard, 2004). araştırma sorularına göre biçimlendirilebilen etiketler
oluşturmaya karşılık gelir. Örneğin, sözcük anlambilimi
İşaretleme (annotation): Sözcük türü, cümle ile ilgili etiketleri araştırmacı araştırma sorularına göre
ve diğer nitelikler açısından derlemi etiketleme. kendisi belirleyebilmektedir.
eurasscience.com 12
Avrasya Terim Dergisi, 2020, 8 (1): 8 - 17
Dur Listesi (stop list): Sadece seçilmiş belirli Raporlama: Derlemde etiketlenmiş-işaretlen-
sözcükbirimlerin sorgulanmasına olanak veren sorgu- miş her bir birimi çeşitli raporlama arayüzleriyle (metin,
lama arayüzü. grafik, harita, liste vb.) çıktı olarak dışa aktarma.
Bağımlı Dizin (concordance): Aranan sözcü- Yukarıda yapılan tanımları doğrultusunda oluş-
ğün bağlamlı tümceler olarak listelenmesi. turulacak olan KKDP’nin amaca uygun araştırma soru-
larına bağlı olarak aşağıdaki gibi bir derlem prosedürü
oluşturmaktadır (bk. Şekil 1).
3.3.5. Örnek Bir Uygulama Olarak Sözlük Bi- Araştırma” başlıklı çalışmada 1003 metin, 42.831 cümle,
lim Terimleri10 703.986 sözbiçim ve 1.616 tekil söz içeren bir özel alan
derlemi oluşturulmuş ve Türk sözlükbilimi terminolojisi
KKDP TBM kullanılarak gerçekleştirilen “Türk araştırma konusu yapılmıştır (http://tsd.ogu.edu.tr /in-
Sözlükbilimi Terminolojisi Üzerine Derlem Tabanlı Bir dex.php).
10 Erdoğan Boz, Ferdi Bozkurt ve Fatih Doğru, Corpus-Based Rese- Lexikos 28 (AFRILEX-reeks/series 28: 2018): 428-439 http://lexi-
arch on Terminology of Turkish Lexicography (CBRT-TURKLEX) kos.journals.ac.za; https://doi.org/10.5788/28-1-147
eurasscience.com 13
Avrasya Terim Dergisi, 2020, 8 (1): 8 - 17
Söz konusu araştırmanın ana hatları örnek bir uy- metinlerin metadataları belirlenmekte, (Ekran 1.2) Ta-
gulama olarak aşağıdaki gibidir: baka Tanılama panelinde derlemin tabakaları belirlen-
mekte, (Ekran 1.3) Metin Girişi panelinde ise metin gi-
3.3.5.1. Derlem Oluşturma Aşamaları rişleri yapılmakta ve (Ekran 1.4) İstatistik Sayfası’nda
basit istatistiksel/sayısal verilerle raporlanarak bir son-
Bu aşamada (Ekran 1.1) Metadata Tanılama pa- raki aşama olan Terim Bilim Modülü’nde terimler işlemlen-
nelinden oluşturulacak özel amaçlı derlemde yer alacak meye hazır hâle getirilmektedir.
eurasscience.com 14
Avrasya Terim Dergisi, 2020, 8 (1): 8 - 17
eurasscience.com 15
Avrasya Terim Dergisi, 2020, 8 (1): 8 - 17
Türkçe üzerine çalışan dil/dilbilim araştırmacı- McEnery T. and Wilson A., 1996. Corpus linguistics. Edin-
ları için araştırma sorularına bağlı olarak biçimlendirile- burg: Edinburg University Press.
bilen, araştırmacıya özel, esnek, kolay ulaşılabilir, veri ta-
banı destekli ve bu çerçevede araştırma sonuçlarının sağ- McEnery, T., Xioa, R., Tono, Y., 2006. Corpus-based lan-
lıklı bir şekilde raporlanabildiği bir derlem platformu guage studies -an advanced resource book-. London: Rout-
olan “Kendi Kendine Derlem Oluşturma Plat- ledge.
formu”nun (KKDP) Terim Bilim Modülü’nü (TBM)
Türkçenin terim bilim çalışmalarında hızlı güvenilir bir Özkan, B., 2016. Tübitak 1005 Ulusal Yeni Fikirler ve
veri işleme platformu olarak amaca uygun bir yapılan- Ürünler Araştırma Destek Programı 111E791 nolu
dırma sunmaktadır. “Türkçe için Kendi Kendine Derlem Platformu
Oluşturma” başlıklı proje raporu.
Kaynaklar
Özkan, B., 2013. Yöntem ve Uygulama Açısından Tür-
Baker Paul, Hardie A. and McEnery T., 2006. A glossary kiye Türkçesi Söz Varlığının Derlem Tabanlı Söz-
of corpus linguistics. Edinburg University Press. lüğü. bilig. Sayı: 66 Yaz'13.
Barnbrook, G., 1996. Language and computers: a practical int- Özkan, B., 2010. Türkçenin Öğretiminde Sıfatların Eşdi-
roduction to the computer analysis of language. Edinburgh: zim Sözlüğü: Yöntem ve Uygulama, e-International
Edinburgh University Press. Journal of Educational Research. Volume 1. No 2. Au-
tumn 2010: 51-65.
Boz, E., Bozkurt, F. ve Doğru F., 2017. "Türk sözlükbi-
limi terminolojisi üzerine derlem tabanlı bir araş- Say, B., 2003. Türkçe İçin Biçimbirimsel ve Sözdizimsel
tırma". III. Uluslararası Sözlükbilimi Sempozyumu Bil-
Olarak İşaretlenmiş Ağaç Yapılı Bir Derlem Oluş-
diri Kitabı. Eskişehir Osmangazi Üniversitesi Bası-
turma. Proje No: 199E026. Proje Raporu-Ek-b:
mevi: Eskişehir.
Türkçe Ağaç Yapılı Derlem Kılavuzu. Ankara.
Boz, E., Bozkurt, F. and Doğru. F., 2018. Corpus-based
Say, B., Umut, Ö., Oflazer, K., 2002. Bilgisayar Orta-
research on terminology of Turkish lexicography
mında derlem Geliştirme Çalışması. Akademik Bi-
(CBRT-TURKLEX) Lexikos 28 (AFRILEX-re-
eks/series 28: 2018): 428-439 http://lexikos.jour- lişim Konferansı. Konya.
nals.ac.za; https://doi.org/10.5788/28-1-147
Sinclair, J., 1991. Corpus, Concordance, Collocation. Oxford:
Burnard, L., 2004. Metadata for Corpus Work. Oxford University Press.
(http://users.ox.ac.uk/~lou/wip/metadata.html)
Sterkenburg, P., 2003. A practical Guide to Lexicography.
Hanks, P., 2003. Lexicography. Computational Linguistics. Philadelphia. PA. USA: John Benjamins Publis-
(Ed. Ruslan Mitrov). Oxford University Press. hing.
Hartmann, R. R. K. and Gregory, J., 1998. Dictionary of Stevens, V., 1995. Concordancing with Language Lear-
lexicography. London: Routledge. ners: Why? When? What?. CAELL Journal vol. 6 no,
2, 2-10.
Jackson, H., 2002. Lexicography: an introduction. Routledge.
USA. Steven, B., Ewan, K. and Edward, L., 2009. Natural Lan-
guage Processing with Python -Analyzing Text with the Na-
Jurafsky D. and Martin, J.H., 2006. Speech and language pro- tural Language Toolkit-. O'Reilly Media,
cessing: an ıntroduction to speech recognition, computational http://www.nltk.org/
linguistics and natural language processing.
(http://web.mit.edu/6.863/www/fall2012/rea- http://kkd.mersin.edu.tr/
dings/ngrampages.pdf) ET: 15.08.2019
http://tsd.ogu.edu.tr/index.php
Kennedy, G., 1998. An introduction to corpus linguistics.
Longman. http://ucrel.lancs.ac.uk/claws/
eurasscience.com 16
Avrasya Terim Dergisi, 2020, 8 (1): 8 - 17
http://www.lancaster.ac.uk/fss/courses/ling/cor-
pus/blue/diy_top.htm http://www.uow.edu.au/~dlee/software.htm
eurasscience.com 17