Professional Documents
Culture Documents
T.C. Ufuk Üniversitesi Sosyal Bilimler Enstitüsü Yönetim Bilişim Sistemleri Anabilim Dali Yönetim Bilişim Sistemleri Programi
T.C. Ufuk Üniversitesi Sosyal Bilimler Enstitüsü Yönetim Bilişim Sistemleri Anabilim Dali Yönetim Bilişim Sistemleri Programi
UFUK ÜNİVERSİTESİ
SOSYAL BİLİMLER ENSTİTÜSÜ
YÖNETİM BİLİŞİM SİSTEMLERİ ANABİLİM DALI
YÖNETİM BİLİŞİM SİSTEMLERİ PROGRAMI
HASAN DİKENGÜL
TEZ DANIŞMANI
PROF. DR. ALAATTİN PARLAKKILIÇ
ANKARA
2023
T.C.
UFUK ÜNİVERSİTESİ
SOSYAL BİLİMLER ENSTİTÜSÜ
YÖNETİM BİLİŞİM SİSTEMLERİ ANABİLİM DALI
YÖNETİM BİLİŞİM SİSTEMLERİ PROGRAMI
HASAN DİKENGÜL
TEZ DANIŞMANI
PROF. DR. ALAATTİN PARLAKKILIÇ
ANKARA
2023
BİLDİRİM
13/07/2023
Hasan DİKENGÜL
i
TEŞEKKÜR
ii
ÖZET
Hasan DİKENGÜL, Türkiye’deki son 100 yılda gerçekleşen 4.5 üstü depremlerin makine
öğrenmesiyle analizi, Yüksek Lisans Tezi, Ankara, 2023.
Türkiye, fay hattı coğrafi konumu nedeniyle çok büyük yıkıma ve can kaybına neden olan
yıkıcı depremler yaşamaktadır. Bu araştırmada depremlerin şiddeti ve derinliğinin, ölüm
ve hasar kaybına olan etkilerini detaylı olarak makine öğrenimi yöntemleri ile analizi
yapılmıştır. Analizlerde, deprem derinliği ve şiddetinin, özellikle de daha şiddetli
depremlerin, bir deprem sırasında ölüm sayısı ve hasar gören bina sayısı üzerinde belirgin
etkiler yarattığını göstermiştir. Depremin şiddetini lineer değil logaritmik olarak arttığı
bilgisi ile tahmin sonuçlarımızın daha az hatalı sonuçlar verdiğini görülmüştür. Deprem
büyüklüğü değişkenlerin logaritmik dönüşümü Log_Hasarli_Bina = log(1 +
Hasarli_Bina), özellikle büyük ölçekteki değişkenlikleri azaltarak, makine öğrenme
modellerinin performansını arttırdığı görüldü. Grafiklerle derinliğin ve büyüklüğün hasar
ve ölüm sayıları üzerinde belirgin bir etkisi olduğunu gözlemledik. Ayrıca, depremlerin
meydana geldiği bölgelerin, hasar ve ölüm sayılarına olan etkisinin önemini belirlemek
için bölgesel gruplama yapıldı. Bu, yerleşim yerlerinin ve depremlerin yoğun yaşandığı
bölgelerin sismik aktivite ile ne kadar uyumlu olduğu görüldü. Sınıflandırma ve
gruplandırma ise, belirli özelliklere sahip depremleri ayırt etmeyi sağladı. Böylece belirli
bir deprem tipinin, hasar ve ölüm oranlarını nasıl etkilediğini daha net bir şekilde
gözlemlenebildi. Sonuç olarak, grafik analizlerinin ve sınıflandırmanın kullanımı,
depremlerin özelliklerini ve etkilerini ortaya koydu. Bu çalışmada 14 adet sıfılandırma ve
grafik algoritması kullanıldı. Türkiye’de en çok deprem faaliyetlerinin Akdeniz
bölgesinde oluştuğu, kara sınırları içerisinde ise Ege bölgesi ve yine Akdeniz bölgesine
yakın yerlerde meydana geldiği görülmüştür. Ayrıca en çok ölüme sebep olan
depremlerin gece yarısı 12-4 arasında meydana geldiği bulunmuştur. Ayrıca en çok ölüme
sebep olan depremlerin gece yarısı 12-4 arasında meydana geldiği bulunmuştur. Yıkımla
ölüm arasında da doğrusal olarak bir ilişki olduğu gözlemlendi. En çok deprem
aktiviteleri genellikle 0-25 km derinliğinde gerçekleşmektedir. Çalışmada 12 tane makine
öğrenme algoritması kullanıldı ve en tutarlı sonuçları Gradyan ve Rastgele Orman
Regresyonları kullanılan veri setinde en az hata alan algoritmalar olarak görülmüştür.
Anahtar Sözcükler: Makine öğrenmesi, yapay zeka, deprem, derinlik, şiddet, ilişki,
büyüklük, ölüm, hasar, bina, yıkım
iii
ABSTRACT
Hasan DİKENGÜL, Analysis of Earthquakes Above 4.5 Magnitude in the Last 100 Years
in Turkey Using Machine Learning, Master's Thesis, Ankara, 2023.
Turkey experiences destructive earthquakes causing massive destruction and loss of life
due to its geographic location on fault lines. In this study, the effects of the intensity and
depth of earthquakes on death and damage loss were analyzed in detail using machine
learning methods. The analyses showed that earthquake depth and intensity, especially
more intense earthquakes, created significant effects on the number of deaths and
damaged buildings during an earthquake. By incorporating the knowledge that the
intensity of an earthquake increases not linearly, but logarithmically, it was seen that our
prediction results produced less erroneous results. The logarithmic transformation of
earthquake magnitude variables, Log_Damaged_Building = log(1 + Damaged_Building),
reduced large-scale variabilities, and thus, increased the performance of machine learning
models. We observed a significant effect of depth and magnitude on damage and death
tolls through graphs. Additionally, regional grouping was done to determine the impact
of the regions where earthquakes occur on the number of damages and deaths. This
revealed how compatible the settlements and areas with intense earthquake activities were
with seismic activity. The classification and clustering, in turn, allowed distinguishing
earthquakes with certain features. Thus, it could be more clearly observed how a certain
type of earthquake affected the rates of damage and death. In conclusion, the use of
graphic analyses and classification revealed the characteristics and impacts of
earthquakes. Fourteen classification and graphical algorithms were used in this study. It
was observed that the most earthquake activities in Turkey occurred in the Mediterranean
region, and within land borders, in the Aegean region and places close to the
Mediterranean region. It was also found that the earthquakes causing the most deaths
occurred between midnight and 4 am. A linear relationship was observed between
destruction and death. Most earthquake activities usually occur at depths of 0-25 km.
Twelve machine learning algorithms were used in the study, and the Gradient and
Random Forest Regressions were seen as the algorithms with the least errors in the used
dataset.
iv
İÇİNDEKİLER
Sayfa No:
BİLDİRİM ....................................................................................................................... i
TEŞEKKÜR ...................................................................................................................ii
ÖZET ..............................................................................................................................iii
ABSTRACT ................................................................................................................... iv
İÇİNDEKİLER .............................................................................................................. v
GİRİŞ .............................................................................................................................. 1
1. BÖLÜM..................................................................................................................... 14
v
2. BÖLÜM ..................................................................................................................... 31
METOT ......................................................................................................................... 31
3. BÖLÜM ..................................................................................................................... 34
BULGULAR ................................................................................................................. 34
SONUÇ .......................................................................................................................... 82
KAYNAKÇA ................................................................................................................ 90
vi
KISALTMALAR DİZİNİ
vii
ŞEKİLLER DİZİNİ
Sayfa No:
Şekil 12. Yıkım ve Ölüm Olan Depremlerin Derinlik ve Büyüklük Dağılımı ............... 52
viii
GİRİŞ
Bilgisayar bilimleri ve veri analizi tekniklerinin gelişmesi ile birlikte, büyük ölçekli
depremleri daha iyi anlamak ve öngörmek için bu tekniklerin uygulanabilirliği üzerine
araştırmalar artmıştır. Bu tez çalışması, makine öğrenmesi ve istatistiksel analiz
tekniklerini kullanarak Türkiye'deki son 100 yılda gerçekleşen 4.5 MW ve üzeri
depremleri incelemeyi amaçlamaktadır.
1
eğilimler olduğudur. Ancak, bu ve diğer tüm varsayımların doğruluğu, veri analizi ve
makine öğrenmesi yöntemlerinin uygulanması ile test edilecektir
Problemler
Depremler, en yıkıcı doğal afetlerden biridir ve çoğu zaman önemli ölçüde can ve mal
kaybına neden olur. Depremleri doğru bir şekilde analiz etmek, etkilerini tahmin etmek
ve azaltmak için çok önemlidir. Ancak, deprem analizini engelleyebilecek potansiyel
problemler vardır:
Zaman ve Kaynaklar,
Tahmin ve Doğruluk
Jeoloji Bilgisi
Veri Eksikliği ve Kalitesi: Bu tür bir çalışma için geniş çaplı ve kaliteli veri setlerine
ihtiyaç vardır. Her deprem hakkında detaylı bilgiye (derinlik, büyüklük, coğrafi konum,
tarih, saat, bina hasarı, ölüm sayısı, vb.) erişim sağlamak önemlidir. Ancak, bu bilgiler
her zaman tam, güncel veya doğru olmayabilir. Bu, analizlerin kalitesini ve sonuçların
güvenilirliğini etkileyebilir.
Zaman ve Kaynaklar: Bu tür bir araştırma, geniş kapsamlı veri analizini ve karmaşık
modellerin geliştirilmesini gerektirir. Bu, önemli miktarda zaman ve kaynak gerektirir.
Farklı Ölçüm Birimleri: Depremlerin büyüklükleri ve şiddetleri için kullanılan bir dizi
farklı ölçüm birimi vardır (örneğin, Richter ölçeği, moment magnitüd ölçeği ve Mercalli
yoğunluk ölçeği). Bu ölçekler farklı özellikleri ölçer ve farklı veri türlerini gerektirir. Bu,
veri analizi ve modelleme aşamalarında karışıklığa neden olabilir (Ertekin, 2014).
Jeoloji Bilgisi: Yer kabuğunun yapısının ve dinamiklerinin tam bir anlayışı hala
gelişmektedir. Özellikle fay hatları, yer kabuğu gerilimi ve yer hareketi hakkındaki
bilgilerimiz sınırlıdır. Depremlerin tam olarak nerede ve ne zaman meydana geleceğini
tahmin etmek için bu bilgilerin daha ayrıntılı olması gerekmektedir (Tekin, 2013).
Jeolojik Analizin Maliyeti: Fay hatları ve yer kabuğu gerilimi hakkındaki bilgiler
genellikle pahalı ve zaman alıcı jeolojik araştırmalarla toplanır. Bu, özellikle kapsamlı ve
detaylı veri gerektiren büyük ölçekli çalışmalar için bir engel oluşturabilir (Özel, 2017).
3
Teknolojik Sınırlamalar: Depremlerin ölçülmesi ve izlenmesi için kullanılan
teknolojiler zamanla gelişmiştir, ancak hala belirli sınırlamalar vardır. Örneğin, deprem
öncesi stresin belirlenmesi hala zor bir problem olup, bu bilgi deprem tahminlerinin
doğruluğunu önemli ölçüde artırabilir (Kaya, 2016).
Deprem araştırmalarındaki en büyük zorluklardan biri, sınırlı veri erişimi veya eksik veri
kümeleridir. Özellikle uzak yerlerde veya deniz altında meydana gelen depremler, doğru
ve kapsamlı veri toplamayı zorlaştırmaktadır. Ek olarak, tüm ülkelerin sismik aktiviteyi
izlemek için gerekli ekipmana veya kaynaklara sahip olmaması da bir başka zorluktur.
Depremlerin büyüklüğünü ve yerini kesin olarak belirlemek, konum ve derinliklerindeki
sürekli değişim nedeniyle bir başka büyük zorluktur. Bir ana şoktan sonra artçı şokları
veya ikincil depremleri tahmin etmek de karmaşıktır çünkü bu depremler ana şoktan
saatler hatta aylar sonra meydana gelebilir (Dell'Acqua & Gamba, 2012).
Son yıllarda birçok başarılı deprem analizi yapılmıştır. Japonya'daki 2011 Tohoku
depremi buna bir örnektir. Depremin neden olduğu yer değiştirmeyi doğru bir şekilde
4
ölçmek için GPS verileri kullanıldı ve gelecekteki deprem modellemesi için değerli
bilgiler sağladı (Simson vd., 2011). Öte yandan 2010 Haiti depremi, sınırlı veri ve
kaynaklar nedeniyle zorluklar ortaya çıkardı. Ancak araştırmacılar, çöken binaların
sayısını tahmin etmek için uydu görüntülerini kullanabildiler ve bu da acil durum
müdahale çabaları için önemli bilgiler sağladı (Hough & Bilham, 2011). Son olarak,
Kaliforniya'daki 2019 Ridgecrest depremi, hızlı müdahale ve analiz için ileri teknolojinin
kullanıldığını gösterdi. Hasarı araştırmak için insansız hava araçları, yer hareketini
ölçmek için sismometreler kullanıldı (Donnellan vd., 2020).
Sonuç olarak, doğru deprem analizi, depremlerin etkisini azaltmak için çok önemlidir.
Deprem analizini engelleyebilecek potansiyel sorunlar olsa da, araştırmacılar ve bilim
adamları yeni teknolojilerin geliştirilmesi ve uluslararası işbirliği yoluyla bu zorlukların
üstesinden gelmek için çalışıyorlar. Bu yazıda sunulan vaka çalışmaları, doğru deprem
analizinin önemini ve deprem izleme ve analizine yatırım yapmanın potansiyel
faydalarını göstermektedir.
Amaç
Deprem, yer kabuğundaki gerilimlerin birikmesi sonucu meydana gelen ani enerji
salınımının oluşturduğu sismik olaydır. Türkiye, coğrafi konumu itibariyle deprem
aktivitesi yüksek olan bir ülke olup, geçmiş yüz yıllık dönemde pek çok büyük ölçekli
deprem yaşamıştır. Bu çalışmanın temel amacı, Türkiye'de son 100 yılda meydana gelen
4.5 MW ve üzeri büyüklükteki depremlerin analiz edilmesi ve belirli istatistiklere göre
grafiklendirilmesidir.
Tezin ilk iki bölümünde, depremlerin derinliği ve büyüklüğünün, özellikle can ve mal
kaybı ile hasarlı bina sayısı üzerindeki etkileri detaylı olarak incelenecektir. Depremin
büyüklüğü, hissedilir şiddeti ve yarattığı hasarı belirlerken, depremin odak derinliği ise
depremin yüzeye ne kadar yakın olduğunu ve dolayısıyla yüzeyde ne kadar şiddetli
hissedileceğini belirler.
5
deprem riskinin daha yüksek olduğu bölgelerde alınacak önlemleri planlamaya yardımcı
olur.
Depremlerin zaman içindeki dağılımı, en çok deprem olan 10 bölge ve en çok yıkıma yol
açan 10 deprem, tezin bir diğer önemli bölümünü oluşturur. Bu, hangi yılların ve
bölgelerin en fazla deprem aktivitesine maruz kaldığını ve en çok hasara neden olan
depremlerin hangileri olduğunu belirler.
10. Depremlerin yıllara göre dağılımı hangi yıllarda depremler daha çok.
6
11. Depremlerin bölgelere göre dağılımı 7 Bölge.
Önem
Depremler, insanlık tarihinin en büyük doğal felaketlerinden biri olarak kabul edilir ve
bu felaketlerin yarattığı yıkımı anlamak ve en aza indirmek, modern toplumlar için bir
öncelik haline gelmiştir. Tarihsel ve bilimsel kayıtlar, depremlerin büyüklüğü, derinliği
ve yerel jeolojik koşullar gibi çeşitli faktörlere bağlı olarak, can kaybı, mülk hasarı ve
ekonomik kayıplara yol açabileceğini göstermektedir.
Bu tezin temel amacı, Türkiye'de son 100 yılda meydana gelen 4.5 MW ve üzeri
depremlerin incelenmesi ve analiz edilmesidir. Bu analizler, hem tarihsel deprem
aktivitesinin daha iyi anlaşılmasına yardımcı olacak, hem de mevcut ve gelecekteki
deprem riski ve hasar tahminleri için değerli bilgiler sağlayacaktır.
7
gerçekleşebileceği konusunda bilgi sağlar. Bu bilgi, halkı eğitmek, acil durum planları
oluşturmak ve altyapıyı depreme dayanıklı hale getirmek için kullanılabilir (Tierney,
Lindell & Perry, 2001).
Bu çalışma, tüm bu faktörleri dikkate alarak, Türkiye'nin deprem riskini daha iyi anlamak
ve yönetmek için bir temel oluşturmayı amaçlamaktadır. Deprem hasarının en aza
indirilmesi ve depreme dayanıklı bir toplum oluşturulması, bu tezin ana hedeflerinden
biridir. Bu hedefe ulaşmak için, deprem bilimindeki en son bilgi ve teknolojilerin
kullanılması ve bunların deprem riski ve hasar değerlendirmesinde nasıl
kullanılabileceğine dair bir anlayış oluşturulması gerekmektedir.
Sonuç olarak, bu tez, depremlerin karmaşık doğasını ve etkilerini anlamak, deprem riskini
değerlendirmek ve yönetmek, ve depreme dayanıklı bir toplum oluşturmak için önemli
bir katkı sağlayacaktır. Bu çalışmanın, Türkiye'nin deprem riskini azaltmaya ve bu
felaketlerin yarattığı hasarı en aza indirmeye yardımcı olacak politika ve uygulamaların
geliştirilmesine yardımcı olacağına inanıyoruz.
Tanımlar
Deprem: Yer kabuğunun ani sarsılması veya sallanması sonucu oluşan bir doğa olayıdır.
Bu sarsıntılar, yerin kabuğunu oluşturan plakaların birbirlerine çarpması, birbirlerinden
ayrılması veya birbirlerinin altına geçmesi sonucu oluşur.
8
Deprem tahmininde, makine öğrenmesi modelleri, depremlerin meydana gelmesi için
gerekli olan çeşitli faktörleri analiz ederek, gelecekteki deprem aktivitelerinin tahmininde
kullanılabilir.
Sismoloji: Depremleri ve yerin içindeki sismik dalgaları inceleyen bir jeofizik dalıdır.
Zemin Şartları: Bir deprem sırasında yer hareketlerini etkileyen yer yüzeyinin
özellikleridir. Sismik dalgaların hızı, zeminin sertliği ve elastikiyeti, yeraltı suyu
seviyeleri ve diğer faktörler bu koşulları oluşturur.
Şiddet: Bir depremin neden olduğu hasarın ölçüsüdür. Depremin büyüklüğü, derinliği,
zemin koşulları ve nüfus yoğunluğu gibi faktörler, depremin şiddetini belirler.
Varsayımlar
Bu makaleyi hazırlarken, depremleri daha iyi anlamak için bazı temel varsayımlara
ihtiyacımız var. Bu varsayımlar, depremlerin nedenini, büyüklüğünü, sıklığını ve etkisini
anlamamıza yardımcı olacak ve bu olayları tahmin etmek için kullandığımız modellere
ve analitik yöntemlere rehberlik edecektir. Bu hipotezler daha geniş bir bilimsel anlayışa
dayanmaktadır, ancak deprem bilimi hala gelişmekte olan bir alan olduğundan, her
hipotezin kendi sınırlamaları ve belirsizlikleri vardır. Şimdi bu varsayımları ayrıntılı
olarak inceleyelim.
Fay Hareketliliği: Bilindiği gibi, yer kabuğu, birbiriyle sürekli hareket halinde olan bir
dizi plaka tarafından oluşturulur. Bu plakaların birleşme noktaları boyunca oluşan
çatlaklara "fay" adı verilir. Bazı faylar oldukça aktifken, diğerleri daha az aktif olabilir.
Bir fayın hareketliliği genellikle geçmişteki deprem aktivitesi, GPS ölçümleri ve jeolojik
verilere dayanarak belirlenir.
Bu tezde, bir fayın hareketliliğinin veya aktivitesinin, o fayda meydana gelen depremlerin
büyüklüğü ve sıklığı üzerinde büyük bir etkisi olduğunu varsayıyoruz. Yani, daha aktif
fayların, daha büyük ve daha sık depremlere neden olabileceğini düşünüyoruz. Bu
varsayım, belirli bir bölgedeki deprem riskini tahmin etmek için önemlidir. Örneğin, aktif
9
bir fay boyunca yerleşim bölgeleri, daha büyük ve daha sık depremler nedeniyle daha
yüksek bir risk altında olabilir.
Ancak, bu varsayımın kendi sınırlılıkları vardır. Depremlerin neden olduğu hasar yalnızca
yapıların dayanıklılığına değil, aynı zamanda depremin büyüklüğüne, derinliğine ve
yerleşim yerlerine olan uzaklığına da bağlıdır. Ayrıca, yerel zemin koşulları ve yapıların
yanı sıra altyapı ve hizmetlerin (örneğin su ve elektrik) nasıl etkilendiği de önemli rol
oynar. Bu nedenle, bu varsayım genellikle daha geniş bir deprem riski değerlendirmesinin
bir parçası olarak kullanılır.
10
Zemin Koşulları: Bu varsayım, depremlerin yerel zemin koşullarından önemli ölçüde
etkilendiğini öne sürer. Zemin tipleri ve karakteristikleri, deprem dalgalarının hızını,
yönünü ve büyüklüğünü etkiler. Örneğin, yumuşak ve gevşek zeminler genellikle deprem
dalgalarını amplifiye eder ve daha büyük yüzey hareketlerine neden olur. Bu, binalar ve
diğer yapılar üzerinde daha fazla stres oluşturarak daha fazla hasara yol açabilir.
Ayrıca, bazı zemin tipleri (örneğin, sıvılaşmaya eğilimli zeminler) deprem sırasında
stabilitesini kaybedebilir. Bu, zeminin taşıma kapasitesini azaltır ve yapıların çökmesine
neden olabilir. Bu varsayım, deprem hasarını ve riskini tahmin etmek ve azaltmak için
zemin koşullarının dikkate alınması gerektiğini belirtir.
İklim Değişikliği: Bu varsayım, iklim değişikliğinin depremler üzerinde dolaylı bir etkisi
olabileceğini ileri sürer. İklim değişikliği, deniz seviyelerinin yükselmesi, buzulların
erimesi ve yağış rejimlerindeki değişiklikler gibi faktörlerle yer kabuğunun üzerindeki
yükü değiştirir. Bu değişiklikler, yer kabuğunun içindeki gerilimleri değiştirebilir ve bu
da fay hatlarının hareketini tetikleyebilir.
Deprem analizi için toplanan verilerin çeşitli kaynaklardan geldiği ve deprem büyüklüğü,
derinliği, enlem ve boylamı gibi birçok parametre içerdiği düşünüldüğünde, veri toplama
ve işleme sürecinde hataların oluşması kaçınılmazdır. Ayrıca, deprem büyüklüğünün
ölçümünde kullanılan çeşitli ölçekler ve yöntemler, büyüklük değerlerinde farklılıklara
yol açabilir. Tüm bu nedenlerle, veri doğruluğu varsayımı, tezin amacına ulaşılabilmesi
için önemlidir.
11
Bu varsayım, verilerin doğru bir şekilde toplanmasını, işlenmesini ve analiz edilmesini
gerektirir. Bu, veri hatalarının, yanıltıcı bilgilerin ve eksik verilerin tespit edilmesini ve
düzeltilmesini, veri toplama ve işleme süreçlerinin standartlaştırılmasını ve verilerin
düzgün bir şekilde analiz edilmesini içerir. Ayrıca, bu varsayım, analiz sonuçlarının
doğruluğunu ve güvenilirliğini sağlamak için veri kalitesi kontrol mekanizmalarının
kullanılmasını gerektirir.
Kısıtlar
Veri Doğruluğu: Yukarıda belirtildiği gibi, verinin doğruluğu ve kalitesi her zaman bir
kısıtlama olabilir. Deprem verileri farklı ölçüm teknikleri ve cihazları kullanılarak
toplandığından, bazı veriler yanıltıcı veya eksik olabilir.
Zaman Kısıtlamaları: Tez sürecinde, belirli bir zaman dilimi içinde tamamlanması
gereken çok sayıda görev olduğu için zaman, bir başka önemli kısıtlama olabilir. Veri
toplama, işleme ve analiz aşamaları çok zaman alabilir ve bu süre, sonuçların derinliğini
ve kapsamını sınırlayabilir.
12
Bilgi ve Uzmanlık Kısıtlamaları: Deprem bilimi ve makine öğrenmesi, özel bilgi ve
beceri setleri gerektiren karmaşık alanlardır. Araştırmacının bu alanlardaki bilgisi ve
deneyimi, analizlerin kalitesini ve sonuçların doğruluğunu etkileyebilir.
13
1. BÖLÜM
KAVRAMSAL ÇERÇEVE
Bu, genel bir bakış açısıdır ve kullanılan her teknik hakkında daha fazla ayrıntıya
ihtiyaç duyulduğunda, bu ayrıntılar eklenip genişletilebilir. Tezin amacına ve hedeflerine
göre, belirli tekniklerin neden seçildiği ve nasıl kullanıldığı hakkında daha fazla bilgi
eklenmesi de mümkün olabilir.
14
1.1.1. Python
15
kütüphane vardır. Örneğin, Pandas, Seaborn, Matplotlib, Bokeh ve Plotly bu
kütüphanelerden bazılarıdır (Mckinney, 2012). Her biri, belirli türdeki görselleştirmeler
için farklı avantajlar sunar ve toplamda Python'un veri görselleştirmedeki çok
yönlülüğüne katkıda bulunur (Hunter, 2007). Python, kullanıcıların analiz iş akışlarına
kolayca entegre olabilen ve otomatik olarak profesyonel kalitede grafikler üretebilen
araçlara sahip olmasını sağlar (Millman & Aivazis, 2011). Bu, örneğin Snakemake gibi
popüler biyoinformatik iş akışı yöneticileri ile veri görselleştirmeyi hızlı ve kolay bir
şekilde birleştirebilme yeteneği sayesinde mümkün olmaktadır (Köster & Rahmann,
2012). Bu nedenlerle, Python veri görselleştirmesi için hızla en çok tercih edilen dil haline
gelmiştir (Mckinney, 2012).
16
Derin öğrenme, makine öğrenimi modellerinin bir türüdür ve yüksek seviye
performansı ile bilinir. Bu, özellikle sığ makine öğrenme modellerine ve geleneksel veri
analizi yaklaşımlarına göre belirgindir (LeCun, Bengio, & Hinton, 2015). Destek Vektör
Makineleri (SVM'ler), farklı sınıfların veri noktaları arasında ayrım yapmayı hedefleyen,
iyi bilinen bir denetimli öğrenme yöntemi türüdür (Cortes & Vapnik, 1995). SVM'ler, en
geniş boşluğu bulmak için hiper düzlem seçerek, bir sınıfı diğerinden ayırır. SVM'ler,
birçok farklı probleme genelleyebilen güçlü ve esnek bir modeldir.
Takviyeli öğrenme, algoritmanın belirli eylemler için ödül veya ceza almasını
içeren bir ortamla etkileşimini içerir. Bu algoritma, zamanla en yüksek toplam ödülü elde
etmek için nasıl davranacağını öğrenir (Sutton & Barto, 2018). Otonom araçlar ve oyun
oynayan bilgisayarlar gibi uygulamalar, bu tür bir öğrenme yaklaşımından büyük ölçüde
faydalanmaktadır (Mnih vd., 2015).
Bu öğrenme türleri, belirli türdeki görevler ve veri setleri için çeşitli derecelerde
etkin olan bir dizi farklı algoritma ve model türünü doğurmuştur. Makine öğreniminin bu
çeşitliliği, çok sayıda akademik ve endüstriyel uygulamanın bulunmasına yardımcı
olmuştur (Jordan & Mitchell, 2015).
Lineer regresyonun temel fikri, veriye en uygun düz çizgiyi (veya hiper düzlemi,
birden fazla bağımsız değişken olduğunda) çizmektir. Bu "en uygun çizgi" genellikle en
küçük kareler yöntemi kullanılarak bulunur - yani, gerçek veri noktaları ve çizginin
17
tahmin ettiği değerler arasındaki toplam kare farkının minimum olduğu çizgi (Amazon
Web Services, 2023).
Rastgele Orman, birden çok karar ağacının bir araya getirildiği ve her ağacın
çıktısının ortalama alınarak sonuç elde edildiği bir modelleme tekniğidir. Rastgele Orman
modeli, verinin farklı alt kümesinden oluşturulmuş çok sayıda karar ağacı içerir, bu da
modelin genelleme yeteneğini artırır ve overfitting'i (aşırı uyum) azaltır ( Breiman, 2001).
Rastgele Orman modeli, her bir özellik üzerinde ayrı ayrı eğitilmiş birçok karar
ağacını birleştirir. Her bir karar ağacı, bağımsız bir şekilde ve genellikle veri kümesinin
rastgele bir alt kümesi üzerinde eğitilir (Breiman, 2001).
Daha sonra, her bir ağacın tahminleri toplanır ve ortalama alınır. Bu, modelin
genelleştirme yeteneğini geliştirir ve aşırı uyumu azaltır. Bu yaklaşım, giriş özelliklerinin
karmaşık etkileşimlerini yakalayabilir, bu da onu deprem hasarı tahmininde özellikle
yararlı kılar (Breiman, 2001).
18
Örneğin, belirli bir büyüklükteki bir depremin neden olduğu hasarı tahmin
etmeye çalışıyorsak, sadece depremin büyüklüğünü değil, aynı zamanda derinliğini,
enlem ve boylam konumunu ve belki de yerel zemin koşullarını dikkate almalıyız.
Rastgele Orman Regresyonu, tüm bu değişkenleri hesaba katar ve her birinin hasar
tahminindeki rolünü belirler.
Destek Vektör Regresyonu (Support Vector Regression - SVR), bir çeşit destek
vektör makinesi (SVM) olarak adlandırılan daha büyük bir makine öğrenmesi algoritması
ailesinin parçasıdır. SVM'ler, ilk olarak sınıflandırma problemlerini çözmek için
geliştirilmiş olup, bir hedef değişkenin sürekli değerlerini tahmin etmek için de
uyarlanabilirler. Bu tür SVM'lere Destek Vektör Regresyonu denir (Drucker vd., 1997).
SVR, özellikle yüksek boyutlu veri kümeleriyle çalışırken son derece yararlıdır.
Örneğin, bir deprem veri seti, depremin büyüklüğü, derinliği, yerel jeoloji ve
yerleşimlerin yoğunluğu dahil olmak üzere birçok farklı özellik içerebilir. SVR, bu
özelliklerin her birinin depremin büyüklüğü üzerindeki etkisini öğrenerek, yeni bir
deprem olayının sonuçlarını tahmin etmek için kullanılabilir model oluşturabilir (Drucker
vd., 1997).
SVR'nin bir diğer avantajı, modelin gürültülü veri ile başa çıkabilme yeteneğidir.
Bu, özellikle deprem verileri gibi doğal olayları analiz ederken önemlidir çünkü bu tür
veriler genellikle belirsizlik ve gürültü içerir. SVR, bir hata marjı belirler ve bu marjın
dışında kalan veri noktalarını "yanlış" olarak kabul eder. Bu, modelin genel eğilimleri
öğrenmesine ve bireysel hataların model üzerindeki etkisini azaltmasına yardımcı olur
(Drucker vd., 1997).
20
vereceği genellikle özgün veri setine, hedef değişkenin özelliklerine ve özel araştırma
hedeflerine bağlıdır (Vapnik, 1998).
Bu araştırmada deprem büyüklüğü, hasarlı bina sayısı veya ölüm sayısı gibi
hedef değişkenleri tahmin etmek için kullanıldı.
21
1.1.9. Elastıcnet Regresyonu
Bu araştırmada deprem büyüklüğü, hasarlı bina sayısı veya ölüm sayısı gibi
hedef değişkenleri tahmin etmek için kullanıldı.
22
CatBoost: CatBoost, Yandex tarafından geliştirilmiş bir makine öğrenmesi
algoritmasıdır. Adını, "Category" ve "Boosting" kelimelerinin birleşiminden alır. En
belirgin özelliği, kategorik veri türleriyle daha iyi başa çıkabilme yeteneğidir. Bu, birçok
veri bilimci için büyük bir avantajdır çünkü kategorik veriler, birçok veri setinde yaygın
olarak bulunan bir veri türüdür (Şimşek & Doğan, 2020).
23
analizi, makine öğrenmesi ve yapay zeka (AI) alanlarında geniş ölçekte kullanılmaktadır.
(Carneiro, 2020).
5. Çoklu kullanıcı desteği: Bir notebook üzerinde aynı anda birden çok kişi
çalışabilir.
1. Sınırlı işlem süresi: Google Colab, belirli bir süre sonra kullanılan kaynakları
sıfırlar. Bu, uzun süreli hesaplamaların sıklıkla kesilmesine neden olabilir.
2. Sınırlı bellek: Google Colab, her kullanıcıya sınırlı miktarda bellek sağlar.
Yüksek bellek gerektiren işlemler bu sınırlamayı aşabilir.
Araştırmada Google Colab'ı kullanmak, veri analizi ve model eğitimi için gerekli
hesaplama gücünü sağlar. Ayrıca, çeşitli makine öğrenmesi algoritmalarının
uygulamalarını denemek ve tez çalışmanızın sonuçlarını doğrulamak için bir platform
sağlamaktadır (Carneiro, 2020).
24
1.2. Deprem ve Türkiye
25
Plakalar, sürtünme nedeniyle birbirlerine bağlandığında, enerji birikmeye başlar.
Biriken enerji, genellikle bir fay hattı boyunca birikir. Fay hatları, plakaların birleştiği
veya birbirine sürtündüğü yerlerdir. Biriken enerji, zamanla gerilme oluşturur (Lutgens,
Tarbuck & Tasa, 2017).
Biriken bu gerilme, fay hattında bir kırılma meydana gelene kadar artmaya
devam eder. Kırılma, biriken enerjinin aniden serbest kalmasına neden olur. Bu enerji,
sismik dalgalar şeklinde yayılır ve yerin yüzeyine ulaştığında depreme neden olur
(Lutgens, Tarbuck & Tasa, 2017).
Kırılma ve enerji salınımı: Biriken gerilim bir noktada dayanılmaz hale gelir
ve fay hattında bir kırılma meydana gelir. Bu kırılma noktası genellikle depremin odak
noktası (veya hiposentri) olarak adlandırılır ve yerin yüzeyinin altında yer alır. Yüzeyin
hemen üstünde, genellikle en çok hasarın olduğu yer olan depremin epicentri bulunur
(Stein & Wysession, 2003).
Kırılma sırasında biriken enerji aniden serbest kalır. Bu enerji, sismik dalgalar
şeklinde yayılır. Bu dalgalar, yer kabuğunu ve yerin yüzeyini sarsar. Bu, bir depremin
belirgin etkisidir ve genellikle şiddetli sarsıntılarla hissedilir. Depremlerin büyüklüğü ve
etkileri, serbest bırakılan enerjinin miktarına ve fay hattının derinliğine bağlıdır (Stein &
Wysession, 2003).
Depremin büyüklüğü genellikle Richter ölçeği veya moment büyüklük ölçeği ile
ölçülür. Bu ölçekler, bir deprem sırasında serbest bırakılan enerjinin miktarını temsil eder
(Stein & Wysession, 2003).
Sismik dalgalar genellikle iki ana türdedir: cisim dalgaları ve yüzey dalgaları.
1. Cisim dalgaları: Bunlar en hızlı seyahat eden dalgalar olup, deprem odak
noktasından her yönde yayılırlar. Cisim dalgaları iki alt tipe ayrılır: P
(birincil) dalgaları ve S (ikincil) dalgaları. P dalgaları, sıkıştırma ve genleşme
hareketleri yaratarak ilerlerler. S dalgaları, yüzey boyunca dik bir şekilde
hareket eder ve daha büyük sarsıntılara neden olur (Shearer, 2009).
26
2. Yüzey dalgaları: Bunlar deprem odak noktasından daha yavaş yayılır ve
genellikle yerin yüzeyine yakın bölgelerde en fazla hasara neden olur. Yüzey
dalgaları, genellikle sismogramlarda daha büyük amplitüde sahip olan ve
genellikle daha büyük sarsıntılara ve hasara neden olan dalgaları temsil eder
(Shearer, 2009).
Çökme: Bu, deprem sırasında veya hemen sonra bir binanın tamamen
çökmesidir. Bu, genellikle en ciddi ve ölümcül hasar türüdür.
Yıkılma: Bu, bir yapının bölümlerinin (duvarlar, tavanlar, vb.) çökmesi veya
yıkılmasıdır.
27
Sıvılaşma Nedeniyle Hasar: Sıvılaşma, suyla doyurulmuş ince taneli zeminin
sıvı gibi davranmaya başladığı bir süreçtir. Bu, yapıların temellerinin zayıflamasına ve
çökmesine neden olabilir (Dowrick, 2009).
28
genellikle heyelan tehlikesi haritalarını ve stabilite analizlerini kullanır.
Ayrıca, yamaçların stabilizasyonu, drenajın iyileştirilmesi ve diğer
mühendislik uygulamaları da kullanılır (Highland & Bobrowsky, 2008).
5. Yangınlar: Depremler, hasarlı elektrik hatları veya patlayan gaz hatları gibi
sebeplerle yangınlara yol açabilir. Elektrik kıvılcımları veya sızan gaz,
yanıcı malzemelerle temas ettiklerinde yangın çıkabilir. Ayrıca, depremler
aynı zamanda yangın söndürme çabalarını da zorlaştırabilir. Yıkılan yollar
ve köprüler, itfaiye ekiplerinin yangınları söndürme çabalarına engel
olabilir. Aynı şekilde, su hatlarının deprem sonucu zarar görmesi, söndürme
çabalarını da olumsuz etkileyebilir (Scawthorn, Eidinger & Schiff, 2005).
Türkiye'nin her yerinde çok sayıda fay hattı bulunmaktadır. En önemlileri Kuzey
Anadolu Fay Hattı (KAF), Doğu Anadolu Fay Hattı (DAF) ve Batı Anadolu Fay Hattı
(BAF)'dır (Koçyiğit, 2018). KAF ve DAF, Türkiye'deki en büyük ve en yıkıcı
depremlerden bazılarının kaynağı olmuştur (Ambraseys & Jackson, 2000).
Kuzey Anadolu Fay Hattı (KAF), Türkiye'nin kuzeyini batıdan doğuya doğru
geçer ve 1939 Erzincan depreminden bu yana bir dizi büyük depreme ev sahipliği
29
yapmıştır (Ambraseys & Jackson, 2000). En son 1999 Marmara Depremleri, bu fay hattı
boyunca meydana gelmiştir (Parsons vd., 2000).
Batı Anadolu'da ise, genellikle daha küçük ama sık sık depremler görülür. Bu
bölge, çoğunlukla normal faylardan oluşan bir fay sistemine sahiptir ve bu faylar,
Anadolu Plakası'nın batıya doğru hareketi sonucunda oluşmuştur (Koçyiğit, 2018).
30
2. BÖLÜM
METOT
31
2.2. Hedef Kitle
Bu tez çalışması, geniş bir hedef kitleye hitap etmektedir. Deprem bilimine ilgi
duyan ve bu alandaki çalışmaları takip eden herkes, sunulan bilgi ve analizlerden
faydalanabilir. Ancak, daha spesifik olarak, aşağıdaki gruplar bu tezin hedef kitlesi olarak
belirlenmiştir:
Ayrıca, bu çalışma, depremlerin sebep olduğu hasarın daha iyi anlaşılması için
ölçeklendirme ilişkileri ve diğer ilgili fenomenler hakkında da bilgi sağlar. Bu bilgiler,
deprem risk modellemesi ve tahmininde, bir depremin olası etkilerini önceden tahmin
etmek için hayati öneme sahip olabilir.
Fay hatları ve yer kabuğunun hareketi hakkında daha fazla bilgi sağlar. Bu,
jeoteknik mühendislerin zemin koşullarını ve yer altı yapılarını değerlendirirken ve
depreme dayanıklı tasarımlar geliştirirken göz önünde bulundurabileceği kritik bilgileri
içerir. Bu bilgiler, mühendislerin güvenli ve sağlam yapılar inşa etmek için gereken
kapsamlı bilgi tabanını genişletmeye yardımcı olabilir.
Genel Kamu: Genel halk, depremler hakkında daha fazla bilgi edinmek ve olası
bir depreme karşı hazırlıklı olmak için bu tezi kullanabilir.
33
3. BÖLÜM
BULGULAR
34
en düşük MSE değerlerine sahip olan GradientBoostingRegressor modelinin, log
dönüşümü sonrasında en etkili algoritma olduğu görülüyor.
Son olarak, deprem şiddetinin lineer bir şekilde değil, logaritmik olarak arttığı
gözlemlendi. Dolayısıyla, yıkımın ve ölümün etkilerini hesaplarken bu gözlemi dikkate
alındığında ve veri setimiz üzerinde bir log dönüşümü gerçekleştirildi. Bu dönüşüm
sonrası, makine öğrenme algoritmalarının performansı önemli ölçüde iyileşmiştir. Her ne
kadar log dönüşümü sonrası sonuçlarda gözle görülür iyileşme görülse de veri setinin
azlığı tahminlerin tutarlılığını azaltıyor. Her ne kadar hata payı azmış gibi görünse de veri
setimizde ölüm ve yıkım sayılarının az olması imbalanced data olarak adlandırılan
dengesiz veri dağılımına sebep olmuştur. Bu durum, özellikle verilerinizin çoğunluğunu
oluşturan sınıfı (bu durumda hasarlı bina ve ölüm içermeyen veriler) daha iyi tahmin
ederken, azınlıkta olan sınıfı (hasarlı bina ve ölüm içeren veriler) yanlış tahmin etme
eğiliminde olan modellerde sorun yaratır.
3.2. Analiz
35
Sonuçlar, her bir modelin hatalarının farklı ölçütler (Mean Squared Error, Root
Mean Squared Error ve Mean Absolute Error) kullanılarak hesaplandığı ve modellerin
ölüm sayılarını tahmin etme başarısının belirlendiği bir dizi hata analizi ile
değerlendirildi. Bu analizler, modellerin ölüm sayısını tahmin etme yetenekleri arasında
belirgin farklılıklar olduğunu göstermiştir.
36
Bu analizler ve modellemeler bize birçok önemli bulgu ve sonuç sağladı, ancak
aynı zamanda gelecekteki çalışmalara ışık tutacak bazı sorular ve zorluklar da ortaya çıktı.
Öncelikle, deprem etkilerini daha doğru bir şekilde tahmin etmek için daha fazla ve daha
tam verilere ihtiyaç duyduğumuz açıktır. Özellikle, daha fazla sayıda deprem olayının
hasarlı bina ve ölüm sayısı bilgilerini içeren daha geniş bir veri seti, makine öğrenme
modellerinin performansını büyük ölçüde artırabilir.
Bunun yanı sıra, deprem büyüklüğü ve derinliğinin yanı sıra, deprem etkilerini
etkileyebilecek başka faktörlerin de olabileceğini göz önünde bulundurmak önemlidir.
Örneğin, nüfus yoğunluğu, yapı kalitesi ve yapı malzemeleri, hükümetin acil durum
tepkisi ve altyapı durumu gibi faktörler de depremlerin sonuçları üzerinde önemli bir
etkiye sahip olabilir. Bu faktörlerin veri setine dahil edilmesi ve analiz edilmesi, daha
doğru ve kapsamlı bir tahmin modeli oluşturulmasına yardımcı olabilir.
Makine öğrenmesi, veri biliminin bir dalıdır ve büyük oranda veriye dayalıdır.
Eğitim verilerinin kalitesi ve niceliği, modelin performansını belirleyen ana faktörlerden
biridir. Dolayısıyla, doğru ve geniş çapta verilere sahip olmak, makine öğrenmesi
modellerinin daha doğru ve güvenilir tahminler yapabilmesi için son derece önemlidir.
Deprem tahmini, bilim insanları ve mühendisler için sürekli bir zorluk olmuştur.
Depremler, yer kabuğundaki stres birikimlerinin sonucu olarak meydana gelir ve bu stres
birikimlerinin ne zaman ve nerede serbest bırakılacağını tahmin etmek son derece
karmaşıktır. Yer kabuğunun altındaki süreçler çok çeşitli fiziksel ve kimyasal etmenlere
bağlıdır ve bu etmenlerin her biri, bir depremin ne zaman ve nerede meydana geleceğini
belirlemeye yardımcı olabilir (Car, Poli & Lu, 2020).
37
Bununla birlikte, deprem tahmini konusunda makine öğrenmesi ve derin
öğrenme tekniklerinin potansiyeli vardır. Bunlar, genellikle karmaşık ve doğrusal
olmayan ilişkileri modellemekte son derece etkilidirler ve bu, deprem tahmini gibi
karmaşık ve çok boyutlu problemler için idealdir. Ancak, bu tekniklerin deprem
tahmininde etkili bir şekilde kullanılabilmesi için büyük miktarda, kaliteli ve çeşitli
verilere ihtiyaç duyarız. Özellikle, depremlerin meydana geldiği yerler, zamanlar ve
koşullar hakkında daha fazla bilgiye ihtiyacımız vardır (Graves, Mohamed & Hinton,
2013).
Belirtmemiz gereken bir diğer konu da veri setimiz ile elde ettiğimiz grafik
görselleştirmeleri. Deprem analizinde özellikle önemlidir, çünkü depremler genellikle
karmaşık ve çok boyutlu fenomenlerdir ve bu fenomenleri anlamak için genellikle çok
çeşitli verilere ihtiyaç duyarız. Belirli sınıflara ve kategorilere ayırarak elde ettiğimiz
görselleştirmeler, bize geçmiş depremler hakkında farklı bir bakış açısı kazandırıyor.
Geçmiş depremlerin yorumlayarak belirli sonuçları elde edebiliyoruz. Elde ettiğimiz
sonuçlar genellikle depremlerin nasıl meydana geldiği, hangi faktörlerin etkili olduğu ve
depremlerin hangi özelliklere sahip olduğu hakkında önemli bilgiler sağlar.
38
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
from sklearn.ensemble import GradientBoostingRegresso
df =
pd.read_csv('data/main/turkey_earthquake_1915_to_2023_over_4.5mw.cs
v')
Burada görüldüğü üzere belirli bir ayda deprem faaliyetlerinin çok fazla
olduğunu söylemek çok zor. En çok deprem mayıs ayında gerçekleşmiş onu takip eden
ay ise şubat ayı gelmekte. Sadece bu grafiğe bakarak aralarında bir ilişki kurulması pek
olası değildir. En az deprem faaliyeti gerçekleşen aylar ise ekim ve kasım ayları. Farklı
grafikler ile bu bilgileri birleştirerek yorum yapmak daha doğru olur.
39
Grafiğin python kodu aşağıdaki gibidir;
df =
pd.read_csv('main/turkey_earthquake_1915_to_2023_over_4.5mw.csv')
df['ay'] = df['Olus tarihi'].dt.month
monthly_quakes = df.groupby('ay').size()
monthly_quakes.plot(kind='bar', title='Aylara Göre Deprem Sayısı')
Burada görüldüğü üzere enlem ve boylam’a göre yoğunluk alındığı zaman kara
sınırında ege bölgesi üzerinde faaliyetlerin daha fazla olduğu görülüyor. Türkiye 3 tarafı
denizlerle çevrili bir yarım ada olması sebebiyle tek fay faaliyetleri karalarda değil.
40
Grafiğin python kodu aşağıdaki gibidir;
plt.figure(figsize=(10, 6))
sns.scatterplot(x=df['Boylam'], y=df['Enlem'], hue=df['Mw'],
palette='viridis')
plt.show()
Burada görüldüğü üzere kırmızı renk ile ifade edilen yer olan Ege Bölgesi
deprem yoğunluğunun fazla olduğu yer olarak görülüyor. Tablo 2’de de ifade ettiğimiz
gibi kara olarak en yoğun deprem faaliyetlerinin görüldüğü yer ege bölgesi. Fakat yeşil
olarak renklendirilen ve 35-36 enlem aralığındaki 27-29 boylam aralığındaki yerde de
yoğun bir faaliyet söz konusu. Burası Türkiye kara sınırları içerisinde değil fakat
Akdeniz’in batısı ve ege denizinin biraz güney tarafında kalan bölge. Deniz içerisinde yer
alan bu bölge deprem yoğunluğu olarak fazlaca görünüyor.
41
Sonuç olarak Türkiye ve çevresinde deprem faaliyetlerinin en çok ege bölgesi
ve Akdeniz üzerinde yoğunlaştığı görülüyor. Ayrıca iç Anadolu bölgesi de deprem
faaliyetlerinden en az etkilenen bölgemiz.
plt.figure(figsize=(10, 6))
sns.scatterplot(x=df['Boylam'], y=df['Enlem'], hue=df['bölge'])
plt.show()
42
Şekil 4. 5 ve Üzeri Büyüklükteki Depremlerin Zaman Dilimlerine Göre Dağılımı
Burada görüldüğü üzere gün içerisindeki 24 saatlik zamanı 4’er saatlik 6 farklı
zaman dilimi ile ifade ettik. Bu grafikte 4.5mw üzeri depremlerin genelde hangi saat
aralıklarında olduklarını tespit eden bir analiz yaptık. Görüldüğü üzere gece 12-4 arası
deprem faaliyetlerinin en çok olduğu zaman dilimi. En az faaliyet görülen zaman dilimi
ise 20 ile 24 saatleri arasında. Bu grafiği daha anlamlı hale getirmek için bir de yıkım ve
ölüme sebep olan depremleri filtreleyip o depremleri zaman dilimlerine ayırıp aradaki
ilişkiyi yorumlayalım.
43
df['zaman_dilimi'] = pd.cut(df['saat'], bins=bins, labels=labels,
include_lowest=True)
Burada görüldüğü gibi yıkım ve ölüme sebep olan depremler içinde en çok gece
12 ile 4 arası olmuştur diyebiliriz. Gece saatlerinde çok fazla deprem faaliyeti olmasının
nedenini bir şeye bağlamak çok güç. Fakat deprem şiddetine bağlı olarak ölüm sayısının
artmış olması grafikte görüleceği üzere beklenen bir şeydir.
44
Grafiğin python kodu aşağıdaki gibidir;
45
Şekil 6. Mevsimlere Göre Deprem Dağılımı
Burada görüldüğü üzere veri setimizde depremleri oluştuğu tarihe göre hangi
mevsimlerde gerçekleşmiş gruplayarak görselleştirdik. En çok deprem faaliyeti ilkbahar
aylarında gerçekleşmiş. Diğer aylara göre neredeyse %20 lik bir fazla deprem faaliyeti
gerçekleştiği görülüyor. En az deprem faaliyetlerinin gerçekleştiği mevsim ise Sonbahar.
Bunu Grafik 1. De 10. ve 11. Aylarda depremin en az faaliyet gösterdiği aylar olarakta
belirtmiştik. Şuan için bu grafikte tutarlı görünüyor.
Tabiki İlkbahar mevsiminin depremlerin yıkım veya ölüm üzerine bir etkisi var
mı yoksa çok daha küçük büyüklükte depremler mi yoğunlukta bunu analiz edebilmek
için yıkım ve ölüm içeren depremlerin mevsimlere göre dağılımına bakmalıyız.
46
Grafiğin python kodu aşağıdaki gibidir;
47
görülüyor. Bu da demek oluyor ki Sonbahar aylarında deprem faaliyetleri az olmasına
rağmen oluşan depremlerin şiddeti ve yıkıma etkisi fazla.
48
Grafiğin python kodu aşağıdaki gibidir;
import plotly.express as px
Yer_count =
df.groupby(pd.Grouper(key='Yer')).size().reset_index(name='count')
Yer_count_top = Yer_count.nlargest(10, 'count')[['Yer', 'count']]
fig = px.bar(Yer_count_top, x='Yer', y='count', color='Yer',
text='count')
fig.update_layout(title_text='Top 10 En Sık Deprem Olan
Lokasyonlar',
title_x=0.5, title_font=dict(size=30))
fig.update_traces(texttemplate='%{text:.2s}',
textposition='outside')
fig.show()
Burada 4.5 üzeri depremler olmasına rağmen deprem sayısı oldukça fazla. Mart
ayında Gediz(Kütahya) Merkezli 7.2 büyüklüğünde ki deprem çok fazla artçıya sebep
olmuş görülüyor. Aynı şekilde 2023 yılının şubat ayında gerçekleşen Kahramanmaraş
merkezli deprem sebebiyle 116 deprem ile en çok 4.5mw üzeri deprem faaliyeti olan yıl
2023 olduğu görülüyor.
Yine 1970 yılının artçıları olabilecek olan 1971 yılında olan 115 deprem ise 3.
En fazla deprem faaliyeti gerçekleşen yıl. Büyük fay kırılımlarına sebep olan depremlerin
artçıları 1 sene sonra da devam etmiş gibi görünüyor. Tabi ki bunların sadece büyük
49
depremlerin artçıları olduğunu söylemek için daha fazla araştırma ve veriye ihtiyacımız
var. Şuan için bu yorumu istatiksel verilere dayanarak yapıyoruz.
50
Şekil 10’deki değerler, plotly kütüphanesi kullanılarak görselleştirilmiştir.
51
Şekil 11’deki değerler, seaborn kütüphanesi kullanılarak görselleştirilmiştir.
52
Grafiğin python kodu aşağıdaki gibidir;
1'e yakın bir korelasyon katsayısı, iki özelliğin birlikte arttığını veya azaldığını
(yani pozitif bir doğrusal ilişki olduğunu) gösterir.
-1'e yakın bir korelasyon katsayısı, bir özelliğin arttığı zaman diğerinin
azaldığını (yani negatif bir doğrusal ilişki olduğunu) gösterir.
53
0'a yakın bir korelasyon katsayısı, iki özelliğin arasında güçlü bir doğrusal
ilişkinin olmadığını gösterir.
'Mw' (Deprem büyüklüğü) ile 'Hasarlı Bina' ve 'Kayıp' arasında pozitif bir
korelasyon vardır. Bu, deprem büyüklüğünün artmasıyla beraber daha fazla hasarlı bina
ve kayıp sayısının beklenebileceğini gösterir. Ancak korelasyon değerleri tam 1 değil, bu
yüzden diğer faktörlerin de bu sonuçları etkilemiş olabilir.
Sonuç olarak kayıp ile hasarlı bina arasında ciddi bir ilişki vardır. Aynı
zamanda depremin büyüklüğünün de hasarlı bina ve kayıp arasında kayda değer bir
ilişkisi olduğunu söyleyebiliriz.
54
Grafiğin python kodu aşağıdaki gibidir;
Örneğin, eğer büyüklük veya derinlikte belirgin bir artış veya azalış trendi
görebilirsek, bu, belirli bir zaman diliminde deprem aktivitesinin yoğunlaştığı veya
azaldığı anlamına gelebilir. Buradaki görselde böyle bir trende rastlamıyoruz.
Öte yandan, önemli bir nokta, bu tür bir analizin rastgele deprem olaylarının
doğasını tam olarak yansıtmayabileceğidir. Depremler rastgele ve öngörülemeyen
55
olaylardır, bu yüzden geçmiş trendlerin gelecekteki deprem aktivitesi hakkında kesin
tahminlerde bulunmamızı sağlamazlar.
Son olarak, bu tür bir analiz genellikle daha karmaşık jeolojik ve sismolojik
çalışmalarla birlikte kullanılır. Bir bölgedeki deprem riskini anlamak için deprem
büyüklüğü ve derinliği dışında da birçok faktör dikkate alınmalıdır.
# Plot oluşturma
fig, ax1 = plt.subplots(figsize=(10, 6))
56
3.1.2. Makine Öğrenmesi Analiz
MSE (Mean Squared Error): Ortalama Kare Hatası olarak da bilinir. MSE,
tahmin edilen değerler ile gerçek değerler arasındaki farkların karelerinin ortalamasıdır.
MSE, hataların karelerini aldığı için büyük hataların etkisini daha çok vurgular.
Matematiksel ifadesi şöyledir: MSE = 1/n * Σ(actual - prediction)^2 (Hyndman &
Koehler, 2006).
RMSE (Root Mean Squared Error): Kök Ortalama Kare Hatası olarak da
bilinir. MSE'nin karekökünü alarak elde edilir. RMSE, hataların ölçeğini, hedef
değişkenin ölçeğiyle aynı birimlere getirir, bu da onu yorumlamayı kolaylaştırır.
Matematiksel ifadesi şöyledir: RMSE = √MSE (Hyndman & Koehler, 2006).
MAE (Mean Absolute Error): Ortalama Mutlak Hata olarak da bilinir. MAE,
tahmin edilen değerler ile gerçek değerler arasındaki mutlak farkların ortalamasıdır.
MAE, hataların büyüklüğünü ağırlıksız ve doğrudan bir şekilde ölçer. MSE ve RMSE'den
farklı olarak, MAE büyük hataların etkisini karelemez. Matematiksel ifadesi şöyledir:
MAE = 1/n * Σ|actual - prediction| (Hyndman & Koehler, 2006).
Bu metriklerin tümü, daha düşük değerlerin daha iyi bir model performansını
gösterdiği sürekli hedef değişkenler için kullanılır.
57
3.1.2.1. Derinlik ve Şiddetin Hasarlı Bina Üzerine Etkilerinin İncelenmesi
Lineer Regression:
# Modeli eğit
reg.fit(X_train, y_train)
# Tahminleri elde et
predictions = reg.predict(X_test)
# RMSE'nin hesaplanması
rmse = np.sqrt(mean_squared_error(y_test, predictions))
print("RMSE: ", rmse)
# MAE'nin hesaplanması
mae = mean_absolute_error(y_test, predictions)
print("MAE: ", mae)
MSE: 32803067.680171266
RMSE: 5727.39623914491
MAE: 1758.2534384564806
58
Görüldüğü üzere MSE değeri baya yüksek buda demek oluyor ki modelimizin
hata payı biraz yüksek. RMSE değerimiz ise tahminlerimizin 5727 birim şekilde yanılma
payı olduğunu söylüyor buda yüksek bir değer. Depremler deprem zamanı, yer, zemin,
şiddet veya yapı birimlerinin dayanıklılıkları gibi parametrelere de bağımlı oldukları için
lineer regresyon tam olarak kesin tahmin yapmada yeterli olmuyor.
# Tahminler yap
predictions = model.predict(X_test)
MSE: 6643892.734698474
RMSE: 2577.574971693059
MAE: 364.953591699939
59
Görüldüğü üzere MSE değeri baya yüksek buda demek oluyor ki modelimizin
hata payı biraz yüksek. RMSE değerimiz ise tahminlerimizin 2577 birim şekilde yanılma
payı olduğunu söylüyor buda yüksek bir değer. MAE değeri lineer regresyona kıyasla
daha az hatalı görünüyor. Modelimiz Rastgele Orman Regresyonuna daha tutarlı
tahminler yapabiliyor.
X = df[['Derinlik', 'Mw']]
y = df['Hasarlı Bina']
# Tahminler yap
predictions = model.predict(X_test)
MSE: 11889556.485871544
RMSE: 3448.123618125015
MAE: 464.89609974790716
60
Regresyonuna benzer sonuçlar aldığımızı gösteriyor. Zaten bu iki algoritma birbirlerine
benzer mantıklarla çalışır.
X = df[['Derinlik', 'Mw']]
y = df['Hasarlı Bina']
# Tahminler yap
predictions = model.predict(X_test)
MSE: 37578761.84573017
RMSE: 6130.151861555321
MAE: 453.3201759200736
61
Ridge Regression:
X = df[['Derinlik', 'Mw']]
y = df['Hasarlı Bina']
# Modelin eğitilmesi
ridge = Ridge(alpha=1.0)
ridge.fit(X_train, y_train)
# Tahminlerin yapılması
y_pred = ridge.predict(X_test)
MSE: 32803467.59033477
RMSE: 5727.43115107766
MAE: 1754.1560719410634
62
Lasso Regression:
X = df[['Derinlik', 'Mw']]
y = df['Hasarlı Bina']
# Modelin eğitilmesi
lasso = Lasso(alpha=1.0)
lasso.fit(X_train, y_train)
# Tahminlerin yapılması
y_pred = lasso.predict(X_test)
MSE: 32803206.785260618
RMSE: 5727.40838296525
MAE: 1756.6911806702753
63
ElasticNet Regression:
X = df[['Derinlik', 'Mw']]
y = df['Hasarlı Bina']
# Modelin eğitilmesi
elasticnet = ElasticNet(alpha=1.0, l1_ratio=0.5)
elasticnet.fit(X_train, y_train)
# Tahminlerin yapılması
y_pred = elasticnet.predict(X_test)
MSE: 35030192.38070129
RMSE: 5918.630954933859
MAE: 891.642393232735
64
XGBoost Regression:
X = df[['Derinlik', 'Mw']]
y = df['Hasarlı Bina']
# Modelin eğitilmesi
xgb = XGBRegressor(objective ='reg:squarederror')
xgb.fit(X_train, y_train)
# Tahminlerin yapılması
y_pred = xgb.predict(X_test)
MSE: 8748091.484971365
RMSE: 2957.7172760376143
MAE: 406.6081627215368
65
LightGBM Regression:
X = df[['Derinlik', 'Mw']]
y = df['Hasarlı Bina']
# Modelin eğitilmesi
lgbm = LGBMRegressor()
lgbm.fit(X_train, y_train)
# Tahminlerin yapılması
y_pred = lgbm.predict(X_test)
MSE: 28852382.166996073
RMSE: 5371.441349116275
MAE: 716.3770797007198
66
CatBoost Regression:
X = df[['Derinlik', 'Mw']]
y = df['Hasarlı Bina']
# Modelin eğitilmesi
lgbm = LGBMRegressor()
lgbm.fit(X_train, y_train)
# Tahminlerin yapılması
y_pred = lgbm.predict(X_test)
MSE: 17788155.42077696
RMSE: 4217.60067108978
MAE: 499.54038841905975
67
3.1.2.2. Derinlik ve Şiddetin Ölüm Üzerine Etkilerinin İncelenmesi
Lineer Regression:
# Modeli eğit
reg.fit(X_train, y_train)
# Tahminleri elde et
predictions = reg.predict(X_test)
# RMSE'nin hesaplanması
rmse = np.sqrt(mean_squared_error(y_test, predictions))
print("RMSE: ", rmse)
# MAE'nin hesaplanması
mae = mean_absolute_error(y_test, predictions)
print("MAE: ", mae)
MSE: 2448549.440235167
RMSE: 1564.7841513241265
MAE: 418.71231729173167
68
Görüldüğü üzere burada da MSE değeri baya yüksek fakat ölüm sayıları hasarlı
binalara göre daha stabil bir artış gösterdiği için MSE değer hasarlı bina değişkeni eğitimi
kadar hatalı değil.
# Tahminler yap
predictions = model.predict(X_test)
MSE: 369072.4145256453
RMSE: 607.5133039906577
MAE: 60.07756268120767
Hasarlı bina için yapılan Rastgele Orman Regresyonundaki gibi Ölüm sayısının
tahmini içinde Rasgele Orman Regresyonu daha verimli çıkıyor.
69
Gradyan Destekli Regresyon:
X = df[['Derinlik', 'Mw']]
y = df['Kayıp']
# Tahminler yap
predictions = model.predict(X_test)
MSE: 837979.5760876004
RMSE: 915.4122437938005
MAE: 75.2931736389155
70
Support Vector Regression:
X = df[['Derinlik', 'Mw']]
y = df['Kayıp']
# Tahminler yap
predictions = model.predict(X_test)
MSE: 2719058.6313192416
RMSE: 1648.9568312479382
MAE: 99.7545562441039
71
Ridge Regression:
X = df[['Derinlik', 'Mw']]
y = df['Kayıp']
# Modelin eğitilmesi
ridge = Ridge(alpha=1.0)
ridge.fit(X_train, y_train)
# Tahminlerin yapılması
y_pred = ridge.predict(X_test)
MSE: 2448626.9528793227
RMSE: 1564.8089189672082
MAE: 417.7835709227948
72
Lasso Regression:
X = df[['Derinlik', 'Mw']]
y = df['Kayıp']
# Modelin eğitilmesi
lasso = Lasso(alpha=1.0)
lasso.fit(X_train, y_train)
# Tahminlerin yapılması
y_pred = lasso.predict(X_test)
MSE: 2448676.486416817
RMSE: 1564.8247462309691
MAE: 417.1779488642151
73
ElasticNet Regression:
X = df[['Derinlik', 'Mw']]
y = df['Kayıp']
# Modelin eğitilmesi
elasticnet = ElasticNet(alpha=1.0, l1_ratio=0.5)
elasticnet.fit(X_train, y_train)
# Tahminlerin yapılması
y_pred = elasticnet.predict(X_test)
MSE: 2581314.80062154
RMSE: 1606.647067847055
MAE: 209.17901144670495
74
XGBoost Regression:
X = df[['Derinlik', 'Mw']]
y = df['Kayıp']
# Modelin eğitilmesi
xgb = XGBRegressor(objective ='reg:squarederror')
xgb.fit(X_train, y_train)
# Tahminlerin yapılması
y_pred = xgb.predict(X_test)
MSE: 446155.40861458896
RMSE: 667.9486571695379
MAE: 60.46920845487993
75
LightGBM Regression:
X = df[['Derinlik', 'Mw']]
y = df['Kayıp']
# Modelin eğitilmesi
lgbm = LGBMRegressor()
lgbm.fit(X_train, y_train)
# Tahminlerin yapılması
y_pred = lgbm.predict(X_test)
MSE: 2262510.908515663
RMSE: 1504.164521758063
MAE: 159.32111248383197
76
CatBoost Regression:
X = df[['Derinlik', 'Mw']]
y = df['Kayıp']
# Modelin eğitilmesi
catb = CatBoostRegressor(verbose=0)
catb.fit(X_train, y_train)
# Tahminlerin yapılması
y_pred = catb.predict(X_test)
MSE: 975361.8873336819
RMSE: 987.6041146804127
MAE: 76.65522382865346
Genel olarak kullandığımız algoritmalar bizi çok iyi tahminler vermeye itmiyor.
Burada farklı bir yöntem denemek gerekiyor. Deprem büyüklüğü ve şiddeti lineer olarak
değil logaritmik olarak artıyor. Biz veri setimizde Mw değerimizi sanki lineer artıyormuş
77
gibi almaya çalıştık. Fakat Mw değeri lineer değil logaritmik olarak artar. Bu bilgileri göz
önünde bulundurarak şiddet değerimizi makine öğrenmesi algoritmalarına logaritmik
değer gözeterek tekrardan eğittiğimiz zaman sonuçlar çok daha stabil çıkmaktadır.
Lineer Regresyon:
# Log dönüşümü
df['Log_Hasarli_Bina'] = np.log1p(df['Hasarlı Bina'])
df['Log_Kayip'] = np.log1p(df['Kayıp'])
lr_kayip = LinearRegression()
lr_kayip.fit(X_train, y_train_kayip)
Sonuçlar diğer regresyon modeline göre çok ciddi şekilde iyi çıkmaktadır.
Bunun en temel sebebi şiddetin logaritmik olarak ele alınması. Öncelikle, hedef
değişkenlerin dağılımlarını normalleştirmek için logaritmik bir dönüşüm uyguluyoruz.
78
Bu, modelin iyileştirdi, çünkü birçok makine öğrenmesi algoritması normal dağılımlı
veriyle daha iyi çalışır.
Hasarlı Bina' ve 'Kayıp' hedef değişkenlerini ayrı ayrı tahmin etmek için iki ayrı
model oluşturuluyor. Her model, 'Mw' (Deprem Büyüklüğü) ve 'Derinlik' özellikleri
üzerinde eğitiliyor.
79
Random Forest ve Gradient Boosting Regressor:
# Özellikler ve hedefler
features = ['Derinlik', 'Mw']
targets = ['Hasarlı Bina', 'Kayıp']
# Modeller
models = [RandomForestRegressor(random_state=42),
GradientBoostingRegressor(random_state=42)]
# Modeli eğit
multioutput_model.fit(X_train, y_train)
# Tahminler
y_pred = multioutput_model.predict(X_test)
# Hataları hesapla
mse_hasarli_bina = mean_squared_error(y_test['Hasarlı Bina'],
y_pred[:, 0])
mse_kayip = mean_squared_error(y_test['Kayıp'], y_pred[:, 1])
# Sonuçları yazdır
print(f"{model.__class__.__name__} için:")
print(f"Hasarli Bina için Mean Squared Error:
{mse_hasarli_bina}")
print(f"Kayip için Mean Squared Error: {mse_kayip}\n")
RandomForestRegressor için:
GradientBoostingRegressor için:
80
Hasarli Bina için Mean Squared Error: 1.0577339799853007
81
SONUÇ
Veri Setinin Doğruluğu: Her tür analiz için oldukça önemlidir ve bu tez
çalışması için de durum aynıdır. Veri setimizde, bir depremin çeşitli özelliklerini (deprem
kodu, oluş tarihi, oluş zamanı, enlem, boylam, derinlik ve büyüklük vb.) içeren 2000'e
yakın deprem kaydı bulunmaktadır. Ancak, bu kayıtların sadece 150'si hasarlı bina ve
ölüm sayısı bilgisi içerir. Bu durum, analiz yaparken ciddi bir kısıtlama oluşturmuştur.
Her ne kadar büyük bir veri seti olsa da, bu veri seti hasar ve ölüm bilgisi
açısından eksik olduğu için, analizlerimizde bu tür olayların gerçek etkilerini tam olarak
yansıtmayabilir. Bu nedenle, veri setinin doğruluğu ve tamamlığı konusundaki kaygılar,
tezimizin sonuçlarını etkileyebilir.
82
Ayrıca, veri setindeki eksiklikler makine öğrenmesi algoritmalarının
performansını da etkiler. Algoritmalar, eğitim setindeki bilgileri kullanarak öğrenir ve
tahminler yapar. Eğer eğitim verileri yetersiz veya eksik ise, algoritma da aynı şekilde
yanıltıcı tahminler yapabilir. Bu da ölüm ve bina hasarı tahminlerimizin doğruluğunu
olumsuz etkileyebilir.
Mevcut veri seti, özellikle daha önceki deprem olaylarına dayalı olarak
gelecekteki depremlerin etkilerini tahmin etmek için kullanıldığında, geçmiş depremlerin
etkileri üzerinde önemli bir rol oynayan çeşitli faktörlerin göz ardı edilmiş olabileceği
gerçeğine dayanır. Bunlar arasında yerleşim yerlerinin yapısı, binaların yapı kalitesi ve
depreme dayanıklılığı, bölgenin demografik özellikleri ve hatta bölgedeki sosyo-
ekonomik koşullar gibi faktörler bulunabilir.
Her algoritma, verilerimizi kendi özgün yollarıyla analiz etmiş ve çıktıları MSE
(Mean Squared Error), RMSE (Root Mean Squared Error) ve MAE (Mean Absolute
Error) gibi metrikler kullanarak değerlendirildi. Bu metrikler, modelin gerçek değerlerle
ne kadar iyi uyuştuğunu ve tahmin hatalarının büyüklüğünü ölçmede yardımcı oldu.
84
Makine öğrenimi ve yapay zeka teknikleri deprem tahmininde umut verici
araçlar olabilir, ancak kullanımlarının sınırlamalarını ve zorluklarını anlamak ve bu
teknikleri etkili bir şekilde kullanmak için daha fazla araştırma ve geliştirmeye ihtiyaç
vardır.
Grafiklerin kullanılmasının bir diğer önemli yararı da, veri setindeki potansiyel
sorunları veya eksiklikleri belirlemeye yardımcı olmasıdır. Örneğin, bir grafik, veri
setindeki eksik değerler veya aykırı değerler gibi potansiyel sorunları görselleştirebilir.
Bu, veri setinin kalitesini ve tahminlerin doğruluğunu etkileyebilecek potansiyel sorunları
belirlemede önemli rol oynadı.
85
Bu, belirli örüntülerin ve ilişkilerin belirlenmesine yardımcı olabilir, bu da daha güçlü ve
daha doğru tahminler yapmamıza yardımcı olur. Bu araştırmada, verilerin
gruplandırılması ve sınıflandırılması, deprem hasarı ve ölüm sayısı üzerindeki çeşitli
faktörlerin etkisini anlamada kritik bir rol oynadı.
Sınıflandırma, belirli bir hedef değişkeni tahmin etmek için veri öğelerini farklı
kategorilere ayırır. Bu, makine öğrenmesi modelleri tarafından tahmin edilecek hedef
değişkenin daha doğru bir şekilde tahmin edilmesine yardımcı olabilir. Örneğin, hasarlı
bina sayısını ve ölüm sayısını tahmin etmek için depremleri belirli sınıflara ayırabiliriz.
Bu sınıflar, depremin derinliği, şiddeti veya başka bir faktör gibi değişkenlere dayanabilir.
86
derinliğin hasar ve ölüm sayıları üzerindeki etkisini daha da anlamak için makine
öğrenmesi modelleri kullanıldı.
Deprem Şiddeti: Depremin şiddeti genellikle Richter ölçeği veya daha yeni
Moment Büyüklük (Mw) ölçeği ile ölçülür. Büyüklük arttıkça, depremin enerjisi
logaritmik olarak artar ve bu da daha fazla hasara ve potansiyel olarak daha yüksek ölüm
sayılarına neden olabilir. Makine öğrenmesi modellemesi, büyüklüğün hasar ve ölüm
sayıları üzerinde belirleyici bir faktör olduğunu göstermiştir.
Her ne kadar bu iki faktör önemli olsa da, diğer faktörlerin - örneğin yerleşim
bölgelerinin yapısal dayanıklılığı, halkın depreme hazırlık durumları ve deprem anındaki
nüfus yoğunluğu gibi - depremden kaynaklanan ölümler ve hasar üzerinde büyük etkisi
olabilir. Bu faktörlerin hepsi bir araya geldiğinde, depremlerin neden olduğu hasar ve
ölüm sayıları üzerinde karmaşık ve çok boyutlu bir etkiye sahip olabilirler.
87
Bu araştırmada, özellikle hasarlı bina sayısı ve ölüm sayısı verileri üzerinde
logaritmik dönüşüm kullanılmıştır. Bu, özellikle bu verilerin büyük ölçekte değişkenlik
gösterdiği ve aşırı değerler içerdiği göz önüne alındığında, modelin performansını
artırmak ve daha güvenilir tahminler yapmak için önemli bir adımdır.
Depremlerin tahmin edilmesi hâlâ son derece zor ve karmaşık bir görev olmakla
birlikte, bu araştırma, makine öğrenmesinin deprem etkilerini modelleme ve anlama
kapasitesini göstermiştir. Gelecekte, daha geniş ve daha tam veri setlerinin elde
edilmesiyle, bu tekniklerin deprem etkilerini daha kesin bir şekilde tahmin etmek ve belki
de depremlerin zamanını, yerini ve büyüklüğünü tahmin etmek için kullanılması mümkün
olabilir. Bu nedenle, bu çalışma, deprem etkilerinin daha iyi anlaşılması ve yönetilmesi
için yapay zeka ve makine öğrenmesi tekniklerinin değerli bir araç olabileceğini
göstermektedir.
88
İlgili başka bir çalışma, Nishar ve diğerleri tarafından 2019 yılında yapılan bir
çalışmadır. Bu çalışmada, deprem büyüklük tahmini için rastgele ormanlar ve gradyan
artırma gibi makine öğrenmesi modelleri kullanılmıştır. Çalışma aynı şekilde
kullandığımız veri setlerinin kalitesinin ve eksiksizliğinin model performansı üzerinde
önemli bir etkiye sahip olduğunu vurgulamaktadır. Kendi analizimiz de bu bulgunun
altını çiziyor.
89
KAYNAKÇA
Ambraseys, N., & Jackson, J. (2000). Seismicity of the Sea of Marmara (Turkey) since
1500. Geophysical Journal International, 141(3), F1-F6.
Aktar, T., & Aydin, A. (2008). Türkiye'deki tektonik yapı ve depremler. Jeoloji
Mühendisleri Odası Yayınları, 101-123.
Akdeniz, F., & Kızılaslan, N. (2016). Lasso, Ridge ve Elastik Net Regresyon
Yöntemlerinin Tahmin Performanslarının İncelenmesi: BIST İmalat Endeksi
Üzerine Bir Uygulama. Business and Economics Research Journal, 7(4), 143-
159.
Car, G., Poli, P., & Lu, P. (2020). Deep Learning for Earthquake Detection and Location.
Scientific Reports, 10(1). https://doi.org/10.1038/s41598-020-57768-9
Dell'Acqua, F., & Gamba, P. (2012). Remote sensing and earthquake damage assessment:
Experiences, limits, and perspectives. Pure and Applied Geophysics, 169(1-2),
1-15.
Dowrick, D.J. (2009). Earthquake Resistant Design and Risk Reduction, 2nd Edition.
Wiley.
Drucker, H., Burges, C. J. C., Kaufman, L., Smola, A. J., & Vapnik, V. (1997). Support
vector regression machines. In M. C. Mozer, M. I. Jordan, & T. Petsche (Eds.),
Advances in neural information processing systems 9 (pp. 155–161). MIT Press.
Donnellan, A., Parker, J. W., Hensley, S., Pierce, M., Wang, J., & Rundle, J. (2020).
Geodetic imaging: 2019 Ridgecrest, California earthquakes. Earth and Space
Science, 7(4), e2019EA000960.
Erdik, M. (2019). Earthquake risk assessment for Istanbul metropolitan area. Earthquake
and Structures, 2(2), 239-256.
Ertuğrul, A. ve Zengin, S., (2015). Ridge Regresyon Modeli İle İlgili Bir Uygulama.
Karadeniz Sosyal Bilimler Dergisi, 1(2), 1-11.
90
Gökçe, A. (2020). XGBoost Algoritması ile Sınıflandırma Problemlerinin Çözümü: Bir
Uygulama. Mehmet Akif Ersoy Üniversitesi Sosyal Bilimler Enstitüsü Dergisi,
12(33), 114-125.
Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. The MIT Press.
Graves, A., Mohamed, A. R., & Hinton, G. (2013). Speech recognition with deep
recurrent neural networks. 2013 IEEE International Conference on Acoustics,
Speech and Signal Processing. https://doi.org/10.1109/icassp.2013.6638947
Google Colaboratory. (2023). Google Colab. Retrieved June 20, 2023, from
https://colab.research.google.com/notebooks/intro.ipynb
Hough, S. E., & Bilham, R. (2011). Site response of the Gorkha earthquake sequence:
implications for hazard and disaster planning in and around Kathmandu, Nepal.
Seismological Research Letters, 86(6), 1533-1538.
Hyndman, R. J., & Koehler, A. B. (2006). Another look at measures of forecast accuracy.
International journal of forecasting, 22(4), 679-688.
Jordan, M. I., & Mitchell, T. M. (2015). Machine learning: Trends, perspectives, and
prospects. Science, 349(6245), 255-260.
Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., ... & Liu, T. Y. (2017).
LightGBM: A highly efficient gradient boosting decision tree. In Advances in
Neural Information Processing Systems (Vol. 30, pp. 3146-3154).
Koçyiğit, A. (2018). Tectonics of the West Anatolian Shear Zone. In Tectonic Evolution,
Collision, and Seismicity of Southwest Asia (pp. 297-330). Geological Society
of America.
91
Main, I. (1996). Statistical physics, seismogenesis, and seismic hazard. Reviews of
Geophysics, 34(4), 433-462.
McKinney, W. (2012). Python for data analysis: Data wrangling with Pandas, NumPy,
and IPython. O'Reilly Media, Inc.
Millman, K. J., & Aivazis, M. (2011). Python for scientists and engineers. Computing in
Science & Engineering, 13(2), 9-12.
Mnih, V., Kavukcuoglu, K., Silver, D., Graves, A., Antonoglou, I., Wierstra, D., &
Riedmiller, M. (2015). Human-level control through deep reinforcement
learning. Nature, 518(7540), 529-533.
Murray, J. R., Segall, P., Foxall, W., & Bachmann, C. E. (2000). Seismic and geodetic
evidence for coseismic slip on the Hayward fault from the 1984 Morgan Hill,
California, earthquake. Bulletin of the Seismological Society of America, 90(2),
295-314.
Nishar, A., Bal, A., Singhal, R., & Singh, A. K. (2019). Prediction of earthquake
magnitude using Machine Learning Methods. Procedia Computer Science, 152,
396-405.
Parsons, T., Toda, S., Stein, R. S., Barka, A., & Dieterich, J. H. (2000). Heightened odds
of large earthquakes near Istanbul: An interaction-based probability calculation.
Science, 288(5466), 661-665.
Reilinger, R., McClusky, S., Vernant, P., Lawrence, S., Ergintav, S., Cakmak, R., ... &
Lenk, O. (2006). GPS constraints on continental deformation in the Africa-
Arabia-Eurasia continental collision zone and implications for the dynamics of
plate interactions. Journal of Geophysical Research: Solid Earth, 111(B5).
Satake, K., & Atwater, B.F. (2007). Long-term perspectives on giant earthquakes and
tsunamis at subduction zones. Annual Review of Earth and Planetary Sciences,
35, 349-374.
Scawthorn, C., Eidinger, J., & Schiff, A. (2005). Fire following earthquake. Reston, VA:
American Society of Civil Engineers.
Şimşek, A., & Doğan, N. (2020). Kategorik ve Sürekli Veriler İçin Yeni Bir Gradyan
Artırma Algoritması: CatBoost. Öneri Dergisi, 15(59), 71-78.
Simons, M., Minson, S. E., Sladen, A., Ortega, F., Jiang, J., Owen, S. E., ... & Moore, A.
W. (2011). The 2011 magnitude 9.0 Tohoku-Oki earthquake: Mosaicking the
megathrust from seconds to centuries. Science, 332(6036), 1421-1425.
92
Stein, S., & Wysession, M. (2003). An Introduction to Seismology, Earthquakes, and
Earth Structure. Wiley-Blackwell.
Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction. MIT press.
Tierney, K., Lindell, M. K., & Perry, R. W. (2001). Facing the Unexpected: Disaster
Preparedness and Response in the United States. Joseph Henry Press.
Tibshirani, R. (1996). Regression shrinkage and selection via the lasso. Journal of the
Royal Statistical Society: Series B (Methodological), 58(1), 267-288.
United States Geological Survey (USGS). (2022). Earthquake Hazards Program: How
Earthquakes Happen. Retrieved June 15, 2023, from
https://www.usgs.gov/natural-hazards/earthquake-hazards/science/how-
earthquakes-happen?qt-science_center_objects=0#qt-science_center_objects
Willmott, C.J., & Matsuura, K. (2005). Advantages of the mean absolute error (MAE)
over the root mean square error (RMSE) in assessing average model
performance. Climate research, 30(1), 79-82.
Yamanaka, Y., & Kikuchi, M. (2004). Asperity map along the subduction zone in
northeastern Japan inferred from regional seismic data. Journal of Geophysical
Research: Solid Earth, 109(B7).
Zhang, T. (2004). Solving large scale linear prediction problems using stochastic gradient
descent algorithms. In Proceedings of the twenty-first international conference
on Machine learning (p. 116).
93