You are on page 1of 50

ZAMAN SERİSİ

ANALİZLERİ İÇİN TEMEL


KAVRAMLAR
PROF. DR. VEDAT CEYHAN
İstatistik kavramlar

 Merkezi eğilim ölçüleri


 Dağılım ölçüleri
 Olasılık, olasılık dağılımı ve beklenen değer
 Tahmin
 Hipotez testi süreci
 Doğrusal regresyon
 Doğrusal korelasyon
Merkezi eğilim ölçüleri

 Aritmetik ortalama
Normal dağılım gösteren serilerde tipik bir ölçüdür.
 Tepe değeri (mod)
Kesikli değişkenlerde oldukça kullanışlıdır. Subjektif
yaklaşımlarda önemli bir parametredir. (Üçgen dağılımda kullanacağız)
 Ortanca değer (medyan)
Tercih ölçeklerinin değerlendirilmesinde oldukça kullanışlıdır.
Normal dağılım göstermeyen serilerde önemli bir ölçüdür.
 Ağırlıklı ortalama
İlgili seride rakamların ortalamaya katkılarının farklı olduğu
durumlarda kullanılır. (Delphi metodunda kullanacağız)
Dağılım ölçüleri

 Mutlak değişim
1) Değişim genişliği
2) Varyans ve standart sapma
 Nispi değişim
1) Değişim katsayısı
Değişim genişliği

 Serideki en büyük değer ile en küçük değer arasındaki


fark.
 Bir birimi var ve karşılaştırma yapabilmek için grup
sayıları eşit olmalı. Bu sebeple artık kullanmıyoruz.
 Minimum ve maksimum değerleri kullanıyoruz.
Uç değerlerin tespitinde kullanıyoruz. Üçgen
dağılımda kullanacağız.
Varyans

 Aritmetik ortalamadan sapmaların karelerinin


toplamıdır.
 Tahmin ve hipotez testi sürecinde çok
kullanılmaktadır.
 Hesaplanması çok kolaydır. Zaten bilgisayar yapıyor.
Ana kitle Örnek
( x ) 2 ( x ) 2
x 2

N
x 2

n
2  S2 
N n 1
Standart sapma

 En yaygın kullanılan dağılım ölçüsüdür


 Gözlemlerin ortalamaya yakınlığını gösterir.
 Gözlemlerin birimi (dekar, TL vb) ne ise, standart
sapmanın birimi de aynıdır. Gözlem sayılarının eşit
olmasına gerek yok
 Varyansın toplam gözlem sayısına oranlanması ve bu
değerin karekökünün alınmasıyla elde ediliyor.
Ana kitle Örnek
  2 S  S2
Standart sapma nasıl kullanılır?

 Chebyhsev teoremi
Normal dağılım göstermeyen serilerde
 Deneysel yaklaşım
Normal dağılım gösteren serilerde
Değişim katsayısı

 Nispi değişimi ortaya koyar.


 Birimi yoktur.
 Gözlem sayısının eşit olmasına gerek yoktur.
 Hesaplanması çok kolaydır.


DK  .100

Olasılık ve olasılık dağılımı

 Olasılık kavramı
 Olasılık yaklaşımları
1) Klasik olasılık yaklaşımı
2) Nispi frekans yaklaşımı
3) Subjektif olasılık yaklaşımı
 Sürekli ve kesikli olasılık dağılımları
 Subjektif olasılık dağılımları (üçgen dağılım)
 Beklenen değer
Olasılık kavramının tanımı

 Bernoulli’ye göre olasılık, gelecekteki bir olay


hakkındaki beklentinin kuvvetinin bir ölçüsüdür.
 Keynes ise olasılığın olaylarla ilgili değil, düşüncelerle
tanımlanmasının doğru olacağını savunmuştur
(Parzen, 1960).
 Özellikleri
1) 0 ile 1 arasında değişir.
2) Olasılıkların toplamı «1» dir.
Olasılık yaklaşımları

 Klasik olasılık yaklaşımı (zar örneği)

 Nispi frekans yaklaşımı (en yaygın kullanılan yaklaşım)

 Subjektif olasılık yaklaşımı (üçgen dağılım)


Nispi frekans yaklaşımı (1)

 Olayların meydana gelme sayısını hesaplamaya


dayanır.
 Denemeler bağımsızdır. Yani bir denemenin sonucu
diğerini etkilemez.
 Deneme sayısı artırıldıkça nispi frekans yaklaşımıyla
bulunan olasılık, gerçek olasılığa yaklaşmaktadır.

P  A 
f
n
Nispi frekans yaklaşımı (2)

Otomobil f Nispi frekans Olasılık

Normal 490 490/500=0.98 0.98


Hatalı 10 10/500=0.02 0.02

500 1.00
Subjektif olasılık

 Bu yaklaşıma göre olasılığın temeli “sezgiler” dir.

 Subjektif olasılık 0 ile 1 arasında değişmekte olup,


belirsiz olayın sonucu hakkında bireysel inanç
derecelerini yansıtmaktadır.

 Doğrudan doğruya kişilerin verdiği ifadelerden elde


edilebildiği gibi, üçgen dağılım vb. gibi metotlar ile de
elde edilebilmektedir
Olasılık dağılımı (1)

 Olasılık dağılımları olasılık değerlerinin sunumunu


sağlamakta ve dağılımın genel formunun belirlenmesinde
kullanılmaktadır.
 Karakteristikleri
1) ortalama
2) varyans
3) eğrilik katsayısı
4) diklik katsayısı
Olasılık dağılımının gösterim biçimleri (1)

 Tablo formunda

 Grafik olarak

 Matematik eşitlik olarak


Tablo formunda olasılık dağılımı

Otomobil Frekans Nispi Olasılık


sayısı frekans
0 850 0.425 0.425
1 490 0.245 0.245
2 470 0.235 0.235
3 160 0.080 0.080
4 30 0.015 0.015
N 2000 1.00 1.00
Grafik şeklinde olasılık dağılımı

Olasılık [P(X)]
1

0.8

0.6

0.4

0.2

0
1 2 3 4 5
Otomobil sayısı (X)
Matematik olasılık gösterimi

P = 0.538 – 0.1349X + 0.0061X2 (R2 = 0.9516)


Olasılık dağılımları

 Kesikli olasılık dağılımları


1) Binomiyal dağılım
2) Hipergeometrik dağılım
3) Poisson dağılımı
 Sürekli olasılık dağılımları
1) Normal dağılım
2) Üstel dağılım
3) Uniform dağılım
4) Diğer sürekli olasılık dağılımları
 Subjektif dağılımlar
1) Üçgen dağılım
Üçgen dağılım (1)

 Olasılık fonksiyonu üçgene benzeyen sürekli bir


olasılık dağılımıdır.
 En küçük değer (a), en büyük değer (b) ve tipik değer
(c) olmak üzere üç temel karakteristiği var.
 Normal dağılım göstermeyen, çarpık dağılıma sahip
değişkenler için üçgen dağılım oldukça uygun bir
yaklaşımdır.
Üçgen dağılım (2)

Üçgen dağılımın olasılık yoğunluk fonksiyonu


0,3

0,25

0,2

0,15

0,1

0,05

0
0 1 2 3 4 5 6 7 8 9 10
Üçgen dağılım (3)

 Ortalaması

 Varyansı
Üçgen dağılım (4)

 Olasılık yoğunluk fonksiyonu


Beklenen değer

 Tesadüfi değişkene ait dağılımın tam orta noktasıdır.

 Sürekli tesadüfi değişkenlerde beklenen değer, bir


dağılımın ortalamasına eşittir.

 Kesikli tesadüfi değişkenlerde beklenen değer


hesaplanırken olasılıkların, değerler ile çarpılması
yoluyla bulunur.
Tahmin

 Tahmin kavramını tanımı


 Tahmin süreci
 Tahmin tipleri
1) Tek dönemlik tahminler
a) Nokta tahmini
b) Aralıklı tahmin
2) Belirli bir periyotta gerçekleştirilen (kümülatif) tahminler
a) Nokta tahmini
b) Aralıklı tahmin
 Tahminin özellikleri
Tahminin tanımı

 Ana kitle değerlerini örneğe dayanarak belirlemektir.

 Tahmin eğer zaman serisi verileriyle yapılıyorsa


“projeksiyon/geleceği tahmin” adını almaktadır.
Tahmin süreci

 Örneği seçmek

 Örneğe giren bireylerden bilgileri toplamak

 Örneğe ait istatistikleri hesaplamak

 Ana kitle parametresinin değerini belirlemek


Tahmin tipleri

1) Tek dönemlik tahminler


a) Nokta tahmini
b) Aralıklı tahmin
2)Belirli bir periyotta gerçekleştirilen (kümülatif) tahminler
a) Nokta tahmini
b) Aralıklı tahmin
Ortalama için tahmine ait en büyük
hata (E)


 

 n>30 ise x n

zS  Örnekleme dağılımının standart


x hatası

 n<30 ise
tS 
x

İstenen güven derecesini ifade eden tablo değerleri


Oran için tahmine ait en büyük hata (E)

z 
Orana ait örnekleme dağılımının
standart hatası
x

pq
 
p n
İstenen güven derecesini ifade eden tablo değeri
Nokta tahmini

 Ortalama için

x  zS  n  30
x

x  tS  n  30
x
 Oran için


p ± z S np  5 nq  5
x
Aralıklı tahmin

 Ortalamaya ait
Üst sınır
 
x- E < X < +E
x
Alt sınır

 Orana ait
Üst sınır
 
p - E < p < p +E
Alt sınır
Tahminin özellikleri

 Sapmasızlık
Ana kitle parametresi ile örnekten hesaplanan istatistik arasındaki fark

 Etkinlik
Tahminlerin, mümkün olduğunca ana kitle parametresine yığılması

 Tutarlılık
Örnek hacmi arttıkça, tahminlerin giderek ana kitle parametresine yığılması
Sapmasız ve sapmalı tahmin

 
b b b b
Sapmasız tahmin Sapmalı tahmin
Etkin ve etkin olmayan tahmin

 
b b b b
Etkin tahmin Etkin olmayan tahmin
Tutarlı ve tutarsız tahmin

n1

n2

b
Tutarlı tahmin (n1>n2)
Hipotez testi süreci

 Hipotezlerin oluşturulması
 Hipotez testinde kullanılacak test dağılımının
seçilmesi
 Kabul ve red bölgelerinin belirlenmesi
 Test istatistiğinin hesaplanması
 Karar verilmesi
Hipotezlerin oluşturulması (1)

 İstatistikte bir şeyin doğru olduğunu ispatlamak


yerine, onun yanlış olduğunu ispatlamak esastır.

 Başlangıç hipotezi daima ana kitleye ait ilk ifadenin


doğru olduğunu kabul etmektedir.
Hipotezlerin oluşturulması (2)

 Bir firma bir meşrubat şişesinin ortalama olduğunu 120


ml olduğunu savunuyorsa, ve örnek alınan şişelerin
ortalaması 119 ml ise hipotezler:
 Başlangıç hipotezi
H 0 :   120

 Alternatif hipotez

H 1 :   120
Test dağılımının belirlenmesi (1)

 Z dağılımı

 T dağılımı

  dağılımı
2

 F dağılımı
Test dağılımının belirlenmesi (2)
Test dağılımı Test adı
Binomial Binomiyal (n<26, p=0.5)
İşaret testi (<26 fark)

Ki kare Ki kare testi


Pearson olağanlık katsayısı
Friedman 2 yönlü varyans analizi
Tek yönlü kolmogorov-simirnov testi (n1+n2<60)
Kruskal-Wallis testi
McNemar testi
Medyan testi
Phi katsayısı

F Varyans ve kovaryans analizi


2 ve daha fazla grupta eş varyans analizi
Çoklu korelasyon
Çoklu regresyon

t Regresyon katsayılarının testi


2 gruplu ortalama karşılaştırmaları
Pearson korelasyon katsayısı
Spearman Rho

z Kendall tau c
Eğrilik katsayısının testi
Diklik katsayısının testi
Mann-Whitney U (n1+n2<20)
İşaret testi (>25 fark)
Wilcoxon testi (>25 fark)
Kabul ve red bölgeleri (Çif taraflı test)

Kabul bölgesi

Red bölgesi Red bölgesi

C1  C2

Kritik nokta Kritik nokta

ÇİFT TARAFLI
Kabul ve red bölgeleri(tek taraflı test)

Kabul bölgesi

Red bölgesi

 C1

Kritik nokta
TEK TARAFLI (Pozitif)
Kabul ve red bölgeleri(tek taraflı test)

Kabul bölgesi

Red bölgesi

C1 

Kritik nokta
TEK TARAFLI (Negatif)
Ne zaman tek taraflı? Ne zaman çift
taraflı?

Tek taraflı test


Çift taraflı test Sol uç Sağ uç
Başlangıç hipotezinin işareti (H0)   veya   veya 
Alternatif hipotezinin işareti (H1)  < >
Red bölgesi Her iki uçta Sol uçta Sağ uçta
Test istatistiğinin hesaplanması

 Her birinin formülü eğitim notlarında var!!!!!!!!!!


Regresyon/korelasyon

 Korelasyon
Ekonomik değişkenler arasındaki ilişkinin varlığını, yönünü ve
kabaca kuvvetini gösterir. Sebep sonuç ilişkisi göstermez.

 Regresyon
Ekonomik değişkenler arasındaki sebep-sonuç ilişkisini yani
fonksiyonel ilişkileri gösterir.
 Sabrınıza ve ilginize teşekkür ederim!!!!

Katkı ++++++

Soru ?????????????

Eleştiri #########
vceyhan@omu.edu.tr

You might also like