You are on page 1of 18

Shmei¸sveic Perigrafik c Statisvtik c

E. G. Tsvi¸nac

Ας θεωρήσvουμε έναν πίνακα αριθμών

X ={x1 , x2 , ..., xn } (1)


Το σvύνολο αυτό θα μπορούσvε να αποτελείται από τις αποδόσvεις μιας μετοχής σvε
διαφορετικές ημέρες που σvυμβολίζουμε με τον δείκτη 1, 2, 3, ..., n. Θα μπορούσvαμε
να γράψουμε τη σvειρά των αριθμών πιο σvυνοπτικά ως εξής:
(xi , i = 1, ..., n).
Είναι γνωσvτή η έννοια της ‘μέσvης απόδοσvης’ που ορίζεται ως εξής:

Pn
x1 + x2 + ... + xn xi
x̄ = = i=1 (2)
n n
Pn
ή εναλλακτικά x̄ = n−1 i=1 xi . Από την (2) προκύπτει ότι:
n
X
xi = nx̄ (3)
i=1

Ποια έννοια μπορούμε να αποδώσvουμε σvτη ‘μέσvη’ απόδοσvη όπως την ορίσvαμε
παραπάνω· Στη Βικιπαίδεια διαβάζουμε:
‘Μέσvος όρος ή αλλιώς δειγματική μέσvη τιμή ενός σvυνόλου ν παρα-
τηρήσvεων αποτελεί το σvπουδαιότερο και χρησvιμότερο μέτρο της Στα-
τισvτικής και είναι ένα μέτρο θέσvης, δηλαδή δείχνει σvχετικά τις θέσvεις
των αριθμών σvτους οποίους αναφέρεται. Η μέσvη τιμή σvυμμετέχει σvε
αρκετούς τύπους της σvτατισvτικής και εξετάζεται σvε σvχεδόν όλες τις
σvτατισvτικές κατανομές. Γενικά, ορίζεται ως το άθροισvμα των παρατη-
ρήσvεων δια του πλήθους αυτών. Είναι δηλαδή η μαθηματική πράξη
ανεύρεσvης της «μέσvης απόσvτασvης» ανάμεσvα σvε δύο ή περισvσvότερους
αριθμούς’.

Σχεδόν όλα όσvα αναφέρονται είναι λανθασvμένα λιγότερο ή περισvσvότερο. Είναι


ασvφαλώς σvωσvτό ότι ‘ορίζεται ως το άθροισvμα των παρατηρήσvεων δια του πλήθους
αυτών’ αλλά δεν είναι σvαφές (α) για ποιον λόγο λέγεται και ‘δειγματική μέσvη τιμή’,
(β) που υπάρχει η μαθηματική πράξη ανεύρεσvης της ‘μέσvης απόσvτασvης’ η τι είναι
μια ‘απόσvτασvη’ και πως σvυνδέεται με τον μέσvο όρο (πράγμα που είναι λάθος) και

1
(γ) με ποιον τρόπο ο μέσvος όρος ‘δείχνει σvχετικά τις θέσvεις των αριθμών σvτους
οποίους αναφέρεται’.
Ο όρος ‘δειγματική μέσvη τιμή’ αναφέρεται σvτο ‘δείγμα’ που έχουμε σvτη διάθεσvη
μας και δεν είναι παρά το σvύνολο των αριθμών X. Οι όροι ‘δείγμα’ η ‘τυχαίο δείγμα’
δεν έχουν ακόμη νόημα σvτη σvυζήτησvή μας αν και πρέπει να είναι γνωσvτοί από την
καθημερινή ζωή.

1 Skopìc twn perigrafik¸n mètrwn.

1.1 Eisvagwgikˆ

Σκοπός του μέσvου όρου δεν είναι παρά να περιγράψει ή να σvυνοψίσvει το σvύνολο
των αριθμών X. Στη γενική περίπτωσvη το σvύνολο των αριθμών αποτελείται από
μεγάλο αριθμό σvτοιχείων ή παρατηρήσvεων, όπως λέγονται. Για παράδειγμα ένα
έτος ημερήσvιων αποδόσvεων μιας μετοχής θα έχει 250 παρατηρήσvεις. Προφανώς
το σvύνολο αυτό περιέχει όλη την πληροφόρησvη που χρειαζόμασvτε για να μάθουμε
σvχετικά με τη σvυμπεριφορά της μετοχής αλλά το πλήθος των παρατηρήσvεων δεν
μας επιτρέπει να διαχειρισvθούμε αποτελεσvματικά αυτή την πληροφόρησvη.
Στην περιγραφική σvτατισvτική προσvπαθούμε να σvυνοψίσvουμε την πληροφόρη-
σvη σvε μερικά σvτατισvτικά μέτρα ένα από τα οποία είναι ο αριθμητικός μέσvος. Σε
σvχέσvη με τις αποδόσvεις των μετοχών από την καθημερινή ζωή είμασvτε εξοικειω-
μένοι με τις έννοιες της ‘μέσvης απόδοσvης’ και του ‘κινδύνου’ ή ‘ρίσvκου’. Είναι
λογικό να υποθέσvουμε ότι οι έννοιες αυτές αποτελούν θεμελιώδη χαρακτηρισvτικά
της ταυτότητας ή σvυμπεριφοράς μιας μετοχής. Αυτά τα θεμελιώδη χαρακτηρισvτικά
είναι επίσvης λογικό να υποθέσvουμε ότι μπορούν να υπολογισvθούν από την παρα-
τηρούμενη σvυμπεριφορά της μετοχής, δηλαδή τις αποδόσvεις της σvτη διάρκεια μιας
ορισvμένης χρονικής περιόδου. Με τον τρόπο αυτό, αν πραγματικά η μέσvη απόδοσvη
και ο κίνδυνος χαρακτηρίζουν μια οποιαδήποτε μετοχή τότε οι παρατηρήσvεις για
μια σvειρά μετοχών μπορούν ν΄ αντικατασvταθούν από τα θεμελιώδη χαρακτηρισvτικά
της.
Για παράδειγμα αν είχαμε τρεις μετοχές, Α, Β και Γ, και οι παρατηρήσvεις μας
ήταν:
XA = {α1 , α2 , ..., αn }, XB = {β1 , β2 , ..., βn }, XΓ = {γ1 , γ2 , ..., γn }

θα μπορούσvαμε ν΄ αντικατασvτήσvουμε τα σvύνολα των παρατηρήσvεων με


µ = {µA , µB , µΓ } για τις μέσvες αποδόσvεις και σ = {σA , σB , σΓ }
για τον κίνδυνο.
Αν οι μέσvες αποδόσvεις και ο κίνδυνος είναι γνωσvτά τότε θα έχουμε επιτύχει ν΄
αντικατασvτήσvουμε τα σvύνολα παρατηρήσvεων ή δείγματα XA , XB , XΓ με τα χαρακτη-
ρισvτικά µ και σ. Αν επιπλέον είναι γνωσvτό ότι οι τρεις μετοχές έχουν τον ίδιο
κίνδυνο, δηλαδή σA = σB = σΓ , τότε θα αρκούσvαν οι μέσvες αποδόσvεις µ για να
περιγράψουμε ή να σvυνοψίσvουμε πλήρως την πληροφόρησvη που χρειαζόμασvτε. Για
παράδειγμα αν έπρεπε να επιλέξουμε τότε θα επιλέγαμε τη μετοχή που έχει τη
μεγαλύτερη μέσvη απόδοσvη.

2
Για τη μέσvη απόδοσvη ο υπολογισvμός της μπορεί να γίνει με βάσvη τον αριθμητικό
μέσvο
n
X n
X n
X
−1 −1 −1
µA ' n αi , µB ' n βi , µΓ ' n γi (4)
i=1 i=1 i=1

Στον υπολογισvμό του κινδύνου θα αναφερθούμε αργότερα. Από τις παραπάνω


εκφράσvεις είναι σvαφές ότι αν έχουμε μια επιπλέον παρατήρησvη αn+1 η τιμή του
μέσvου µA θα μεταβληθεί. Αν χρησvιμοποιήσvουμε την έκφρασvη (2) θα έχουμε:
Pn+1 Pn
xi
i=1 i=1 xi + xn+1 nx̄n + xn+1
x̄n+1 = = = (5)
n+1 n+1 n+1
Pn
x i
όπου x̄n = i=1 n . Η έκφρασvη (5) παρέχει έναν τρόπο υπολογισvμού του
μέσvου όταν προσvτίθεται μια παρατήρησvη χωρίς να είναι υποχρεωτικό να υπολογί-
σvουμε τον αριθμητικό μέσvο όλων των n + 1 παρατηρήσvεων απ΄ την αρχή. Στην
πραγματικότητα είναι μια αναδρομική έκφρασvη η οποία σvυνδέει τους αριθμητικούς
μέσvους x̄n+1 και x̄n . Ωσvτόσvο το ερώτημα είναι πως μπορούμε να δικαιολογήσvουμε
το γεγονός ότι τα ‘θεμελιώδη’ χαρακτηρισvτικά, όπως η μέσvη απόδοσvη, είναι δυ-
νατόν να μεταβάλλονται όταν απλώς προσvτίθεται μια παρατήρησvη. Αν πραγματικά
είναι θεμελιώδη τότε δεν θα έπρεπε να μεταβάλλονται. Αυτός είναι ο λόγος για
τον οποίο χρησvιμοποιήσvαμε το σvύμβολο της ισvότητας κατά προσvέγγισvη σvτην (4).
Για μια μετοχή η θεμελιώδης μέσvη της απόδοσvη θα είναι µ ενώ η δειγματική
μέσvη απόδοσvη θα είναι ο αριθμητικός μέσvος x̄. Η διάκρισvη μπορεί να φαίνεται
τεχνητή αλλά σvτην πραγματικότητα δεν είναι. Για παράδειγμα ας υποθέσvουμε ότι
σvτον ‘πληθυσvμό’ το άγνωσvτο ποσvοσvτό που έχει κάποιο πολιτικό κόμμα αν γίνονταν
σvήμερα εκλογές είναι µ. Αν λάβουμε ένα τυχαίο δείγμα μεγέθους n = 1000 ατόμων
καταγράφουμε τις απαντήσvεις:
xi = 1 αν το άτομο i προτίθεται να ψηφίσvει το κόμμα αυτό και 0
διαφορετικά.
Είναι
Pn φανερό ότι το ποσvοσvτό του κόμματος σvτο σvυγκεκριμένο δείγμα είναι x̄ =
i=1 xi
n , για παράδειγμα 0,252 δηλαδή 25,2%. Αν λάβουμε ένα τυχαίο δείγμα του
ίδιου μεγέθους η απάντησvη δεν μπορεί παρά να είναι διαφορετική, πχ 25,1% ή 25,8%
σvε κάποιο τρίτο τυχαίο δείγμα. Αυτό δεν σvημαίνει ότι μεταβάλλεται το θεμελιώδες
χαρακτηρισvτικό µ αλλά απλώς ότι ο αριθμητικός μέσvος αναπόφευκτα μεταβάλλεται
όταν λαμβάνουμε διαφορετικά τυχαία δείγματα. Το ίδιο σvυμβαίνει με τα λεγόμενα
exit polls. Το εκλογικό αποτέλεσvμα µ έχει ήδη διαμορφωθεί αλλά οι απαντήσvεις x̄
από διαφορετικά τυχαία δείγματα θα είναι διαφορετικές. ΄Οπως λέμε, ο αριθμητικός
μέσvος υπόκειται σvτις κυμάνσvεις της τυχαίας δειγματοληψίας.
Δεν είναι ακόμη δυνατόν να ορίσvουμε αυσvτηρά την έννοια του πληθυσvμού, της
τυχαίας δειγματοληψίας, του δείγματος και του τυχαίου δείγματος εφόσvον απαιτεί-
ται θεωρία πιθανοτήτων. Ωσvτόσvο η έννοια δεν πρέπει να είναι τελείως άγνωσvτη
από την καθημερινή ζωή. Για τους σvκοπούς μας ‘πληθυσvμός’ είναι ολόκληρο το
εκλογικό σvώμα και ‘τυχαίο δείγμα’ είναι ένα υποσvύνολο του πληθυσvμού που έχει
ληφθεί με ‘τυχαίο’ τρόπο, δηλαδή χωρίς κάποια σvυσvτηματικότητα σvτην επιλογή

3
των ατόμων (σvυγκεκριμένα η επιλογή ενός ατόμου δεν εξαρτάται καθόλου από το
αν έχει ή όχι επιλεγεί κάποιο άλλο).
Ο σvυγκεκριμένος τρόπος να κατανοήσvουμε τον πληθυσvμό μπορεί να φαίνεται
πολύ γενικός ή ακόμα και σvωσvτός αλλά σvτην πραγματικότητα δεν είναι. Αν έ-
χουμε για παράδειγμα σvτη διάθεσvη μας τις παρατηρήσvεις X = {x1 , x2 , ..., xn } των
αποδόσvεων μιας μετοχής για n ημέρες τότε ποιος είναι ο πληθυσvμός και το δείγμα·
Στην περίπτωσvη αυτή φαίνεται πως το δείγμα είναι και ολόκληρος ο πληθυσvμός!
Μια τέτοια θεώρησvη των πραγμάτων προφανώς δεν μπορεί να είναι σvωσvτή. Αυτό
φαίνεται από την εξής παρατήρησvη: Αν η μέσvη απόδοσvη της μετοχής, µ, παραμέ-
νει αμετάβλητη διαχρονικά αλλά έχουμε μια επιπλέον παρατήρησvη όπως σvτην (5)
ο αριθμητικός μέσvος x̄n+1 φυσvικά θα διαφέρει από τον x̄n αλλά η πραγματική ή
θεμελιώδης μέσvη απόδοσvη µ παραμένει αμετάβλητη.
Ο τρόπος με τον οποίο μπορούμε να σvυμβιβάσvουμε αυτές τις παρατηρήσvεις με-
ταξύ τους παρέχεται από τη θεωρία της δειγματοληψίας που θα μας απασvχολήσvει
μετά τη θεωρία πιθανοτήτων. Στο σvτάδιο αυτό μας αρκεί να παρατηρήσvουμε ότι ο
αριθμητικός μέσvος φαίνεται ν΄ αποτελεί ένα φυσvικό μέτρο προσvέγγισvης της άγνω-
σvτης θεμελιώδους μέσvης απόδοσvης όπως σvτην (4). Αν μη τι άλλο οπωσvδήποτε
αποτελεί ένα λογικό μέτρο θέσvης όπως λέμε. Τα σvτατισvτικά μέτρα θέσvης έχουν
σvαν σvκοπό τους να μας δώσvουν μια εικόνα σvχετικά με την πιο αντιπροσvωπευτική
τιμή των παρατηρήσvεων X = {x1 , x2 , ..., xn } ή τη θέσvη σvτην οποία αναμένουμε
να βρίσvκονται οι περισvσvότερες παρατηρήσvεις. Με την έννοια αυτή ο αριθμητικός
μέσvος δεν είναι πολύ διαφορετικός από το κέντρο βάρους.
΄Ενα άλλο μέτρο θέσvης είναι η διάμεσvος. Αν έχουμε τις παρατηρήσvεις X =
{x1 , x2 , ..., xn } μπορούμε να τις διατάξουμε σvε αύξουσvα σvειρά, έσvτω x(1) ≤ x(2) ≤ ... ≤ x(n) .
Η διάμεσvος θα είναι η κεντρική παρατήρησvη

∆=x n+1 (6)


( 2 )

αν το ν είναι περιττός και


x( n ) + x( n +1)
2 2
∆= (7)
2
αν το ν είναι άρτιος. Στη σvχέσvη (6) η κεντρική παρατήρησvη μπορεί να βρεθεί
ακριβώς. Στην (7) αυτό δεν είναι δυνατόν και επομένως παίρνουμε τον μέσvον όρο
των παρατηρήσvεων που θα περιλάμβαναν την κεντρική παρατήρησvη.
Για παράδειγμα έσvτω ότι έχουμε παρατηρήσvεις X = {4, 3, 2, 1}. Ο αριθμη-
τικός μέσvος είναι 2,5. Οι διατεταγμένες παρατηρήσvεις είναι {1, 2, 3, 4}, δηλα-
δή x(1) = 1, x(2) = 2, x(3) = 3, x(4) = 4. Εφόσvον n = 4 η διάμεσvος είναι ∆ =
x(2) + x(3)
2 = 2, 5. Αυτό το αποτέλεσvμα δεν είναι γενικό εφόσvον ο μέσvος και η διάμε-
σvος δεν σvυμπίπτουν σvτη γενική περίπτωσvη. Για τις παρατηρήσvεις X = {1, 2, 3, 994}
η διάμεσvος παραμένει αμετάβλητη αλλά ο μέσvος είναι 250. Από το παράδειγμα αυτό
φαίνεται ότι η διάμεσvος εξαρτάται μόνο από τις δυο κεντρικές παρατηρήσvεις χωρίς
να επηρεάζεται από τις ακραίες τιμές σvτα δεδομένα. Η τιμή 994 είναι προφανώς
ακραία σvε σvχέσvη με τις υπόλοιπες, πράγμα που επηρεάζει αρκετά τον μέσvο αλλά
όχι τη διάμεσvο.
Ο γεωμετρικός μέσvος ορίζεται ως εξής:

4
1/n
G = (x1 x2 ...xn ) (8)
Ο λόγος για την ύπαρξη αυτής της έκφρασvης γίνεται σvαφής αν λάβουμε λογαρίθ-
μους:
Pn
lnxi i=1
lnG = (9)
n
Από την έκφρασvη αυτή βλέπουμε ότι ο λογάριθμος του γεωμετρικού μέσvου είναι ο
απλός μέσvος των λογαρίθμων των δεδομένων μας. Ο λόγος για τον οποίο χρησvι-
μοποιούμε λογαρίθμους είναι ότι ο μετασvχηματισvμός αυτός κάνει την κλίμακα των
δεδομένων πιο ομοιόμορφη. Για παράδειγμα σvτις παρατηρήσvεις X = {1, 2, 3, 994}
έχουμε G = 8, 79 που αποτελεί μια πιο λογική απάντησvη σvε σvχέσvη με τον αριθμη-
τικό μέσvο.
Ο αρμονικός μέσvος είναι:

n n
H = Pn 1 = 1 1 1 (10)
i=1 xi x1 + x2 + ... + xn

Στο παράδειγμά μας ο αρμονικός μέσvος είναι 2,181 περίπου. Από την (10) έχουμε:

1 1
H= 1
Pn 1 = (11)
n i=1 xi ȳ
με τη σvύμβασvη
Pn
yi 1
ȳ = i=1
n , yi = xi , i = 1, .., n.
Αν έχουμε δυο παρατηρήσvεις X = {x1 , x2 } τότε οι τρεις μέσvοι είναι:
√ 2
x̄ = x1 +x
2
2
, G = x1 x2 και H = x2x 1 x2
1 +x2
= Gx̄ .

Από τη σvχέσvη αυτή βλέπουμε ότι G = H x̄, δηλαδή ο γεωμετρικός μέσvος των
δυο παρατηρήσvεων είναι ο γεωμετρικός μέσvος των δυο άλλων μέσvων.
Ας υποθέσvουμε ότι έχουμε τις παρατηρήσvεις X = {x1 , x2 , ..., xn } και θεωρούμε
τον γραμμικό μετασvχηματισvμό:

yi = α + βxi , i = 1, ..., n (12)


Αν αθροίσvουμε τις παραπάνω εξισvώσvεις έχουμε:
Pn
y1 +P... + yn = (α + ... + α) + β(x1 + ... + xn ) ⇒ i=1 yi =
n
nα + β i=1 xi .
Διαιρώντας κατά μέλη με n έχουμε:

ȳ = α + β x̄ (13)
Επομένως ο γραμμικός μετασvχηματισvμός τροποποιεί τον αριθμητικό μέσvο κατά τον
προφανή τρόπο.

5
1.2 Exagwg tou arijmhtikoÔ mèsvou

Ας υποθέσvουμε σvτη σvυνέχεια ότι ορίζουμε την αντιπροσvωπευτική τιμή των δεδο-
μένων X = {x1 , x2 , ..., xn } ως εκείνη την τιμή, έσvτω A, η οποία βρίσvκεται πλησvιέ-
σvτερα προς όλες τις παρατηρήσvεις. Θα πρέπει φυσvικά να εξειδικεύσvουμε μια έννοια
απόσvτασvης. Δυο τέτοιες επιλογές είναι:

n
X
Q(Α) = |xi − A| (14)
i=1
και
n
X 2
S(Α) = (xi − A) (15)
i=1

Για να ελαχισvτοποιήσvουμε την (15) λαμβάνουμε την πρώτη παράγωγο και έχουμε:

n
0 d  2 2 2
X
S (A) = (x1 − A) + (x2 − A) + ... + (xn − A) = −2 (xi −A)
dA i=1
(16)
Θέτοντας την πρώτη παράγωγο ίσvη με το μηδέν προκύπτει

n n Pn
X X xi
(xi − A) = 0 ⇒ xi − nA = 0 ⇒ A = i=1 = x̄ (17)
i=1 i=1
n

Επομένως αν θεωρήσvουμε σvαν έννοια απόσvτασvης την (15) η αντιπροσvωπευτική


τιμή σvε κάθε σvύνολο παρατηρήσvεων θα πρέπει να είναι ο αριθμητικός μέσvος. Από
την (17) προκύπτει απευθείας η ακόλουθη σvημαντική ιδιότητα:

n
X
(xi − x̄) = 0 (18)
i=1

δηλαδή το άθροισvμα των αποκλίσvεων από τον μέσvο είναι πάντα μηδέν. Η ιδιότητα
αυτή προκύπτει κατευθείαν από τη σvυνθήκη πρώτης τάξης (17). Από την (16) η
δεύτερη παράγωγος είναι

( n
) ( n
)
00 d X d X
S (A) = −2 (xi − A) = −2 xi + 2nA = 2n > 0, ∀A ∈ R
dA i=1
dA i=1
(19)

6
και επομένως σvτο σvημείο A = x̄ η (15) θα έχει ολικό ελάχισvτο1 . Αν η έννοια της
απόσvτασvης που υιοθετούμε είναι η (14) τότε το πρόβλημα είναι:

n
X
min(A) : Q(A) = |xi − A| (20)
i=1

Εφόσvον η αντικειμενική σvυνάρτησvη δεν είναι παραγωγίσvιμη για A = xi (για κά-


ποιο i = 1, ..., n) δεν μπορούμε να πάρουμε παραγώγους. Για να προσvδιορίσvουμε
τη λύσvη του προβλήματος έσvτω ότι έχουμε δυο παρατηρήσvεις οπότε η (20) είναι
Q(A) = |x1 − A| + |x2 − A|. Χωρίς βλάβη της γενικότητας έσvτω x1 < x2 . Κατ΄
αρχήν δεν είναι δυνατόν να έχουμε A > x2 > x1 . Στην περίπτωσvη αυτή θα είχαμε
S(A) = 2A − x1 − x2 και το ελάχισvτο της (20) θα ήταν σvτο A = −∞. Παρό-
μοια δεν είναι δυνατόν να έχουμε A < x1 < x2 . Στην περίπτωσvη αυτή θα είχαμε
Q(A) = x1 + x2 − 2A και το ελάχισvτο της (20) θα ήταν σvτο A = +∞. Επομένως
σvτη λύσvη του προβλήματος έχουμε A ∈ (x1 , x2 ) και επομένως: S(A) = x2 − x1 .
Εφόσvον η τιμή της σvυνάρτησvης δεν μεταβάλλεται με την τιμή του Α σvτο διά-
σvτημα A ∈ (x1 , x2 ) κάθε τιμή σvτο διάσvτημα αυτό αποτελεί λύσvη του προβλήμα-
τος και σvυμβατικά μπορούμε να θέσvουμε A = x1 +x 2
2
. Στη γενική περίπτωσvη που
έχουμε παρατηρήσvεις X = {x1 , ..., xn } η αντικειμενική σvυνάρτησvη (20) γίνεται:
Q(A) = |x1 − A| + |x2 − A| + ... + |xn − A|. Χωρίς βλάβη της γενικότητας έσvτω
x1 < x2 < ... < xn . Θα υπάρχει ένας δείκτης ν ∈ {2, ..., n − 1} τέτοιος ώσvτε:
x1 < x2 < ... < xν ≤ A και A ≥ xν+1 > xν+2 > ... > xn .
Επομένως η λύσvη A θα είναι οποιοσvδήποτε αριθμός σvτο διάσvτημα [xν , xν+1 ] και
σvυμβατικά μπορούμε να θέσvουμε A = xν +x2
ν+1
. Από την απόδειξη είναι σvαφές ότι
η λύσvη του προβλήματος δεν είναι παρά η διάμεσvος ∆.

1.3 Diasvporˆ

Από την κατασvκευή των προβλημάτων (14) και (15) είναι σvαφές ότι δεν έχουμε
μόνο τη λύσvη A αλλά και ένα μέτρου του κατά πόσvο μια σvυγκεκριμένη λύσvη είναι
καλή. Αυτό το μέτρο δεν είναι παρά η τιμή της αντικειμενικής σvυνάρτησvης. Αν
σvυμφωνήσvουμε ότι

n
1X
q= |xi − ∆| (21)
n i=1
και
n
1X
s2 = (xi − x̄)2 (22)
n i=1
1 Na dikaiologhjeÐ svan ˆsvkhsvh.

7
τότε οι (21) και (22) είναι μη αρνητικές, είναι μηδέν μόνο αν όλες οι παρατηρήσvεις
είναι ίσvες μεταξύ τους και όσvο περισvσvότερο αποκλίνουν οι παρατηρήσvεις από τη
διάμεσvο σvτην (21) ή τον μέσvο σvτην (22) τόσvο περισvσvότερο η τιμή τους αυξάνεται.
Αλλά όσvο αυξάνεται η τιμή των q και s2 τόσvο περισvσvότερο αυξάνεται η απόσvτασvη
των παρατηρήσvεων από το αντιπροσvωπευτικό μέσvο θέσvης. Επομένως η τιμή των q
και s2 σvχετίζεται άμεσvα με τη διασvπορά των δεδομένων από τη διάμεσvο ή τον μέσvο
και λέγονται μέτρα διασvποράς. Οι (21) και (22) αποτελούν μερικές περιπτώσvεις
του μέτρου

n
!1/p
1X
Lp = |xi − θ|p (23)
n i=1

όπου θ είναι ένα μέτρο θέσvης και p > 0. Για p = 1 έχουμε την (21) ενώ για p = 2
προκύπτει το s σvτην (22). Μπορεί να αποδειχθεί ότι:

L∞ = max : |xi − θ| (24)


i=1,...,n

δηλαδή L∞ = max{|x1 − θ|, |x2 − θ|, ...., |xn − θ|}, η μέγισvτη απόσvτασvη από το
μέτρο θέσvης. Το μέτρο q είναι γνωσvτό σvαν ‘απόλυτη απόκλισvη’. Το μέτρο s2
λέγεται ‘διακύμανσvη’ ενώ η (θετική) τετραγωνική του ρίζα s είναι γνωσvτή σvαν
‘τυπική απόκλισvη’.
Ο δειγματικός μέσvος x̄ και η δειγματική τυπική απόκλισvη ή η διακύμανσvη είναι
τα πιο γνωσvτά μέτρα θέσvης και διασvποράς αντίσvτοιχα. Υπολογίζονται αυτόματα
από τα σvτατισvτικά προγράμματα και όλα τα προγράμματα φύλλων εργασvίας όπως
το Excel .

1.4 Idiìthtec thc diakÔmansvhc

Από την (22) το άθροισvμα των τετραγώνων μπορεί να αναλυθεί ως εξής:

n
X n
X
2
x2i + x̄2 − 2x̄xi

S= (xi − x̄) = (25)
i=1 i=1

Αθροίζοντας τους επιμέρους όρους έχουμε:

n
X n n
 X X
S= x2i + x̄2 − 2x̄xi = x2i + nx̄2 − 2nx̄2 = x2i − nx̄2
i=1 i=1 i=1
(26)
σvτην οποία έχουμε χρησvιμοποιήσvει την (3). Από την (26) και την (22) έχουμε:

Pn
2 S x2i
s = = i=1
− x̄2 (27)
n n

8
Από την (27) προκύπτει ότι μπορούμε να υπολογίσvουμε τη διακύμανσvη χωρίς να
πάρουμε διαφορές από τον μέσvο όπως σvτην (22) αλλά υπολογίζοντας μόνο το
άθροισvμα των τετραγώνων των αρχικών δεδομένων. Ας θεωρήσvουμε τα δεδομένα
X = {1, 2, 3} σvτα οποία έχουμε x̄ = 2 και s2 = 143 και s = 2, 16. Αν ωσvτόσvο
αντικατασvτήσvουμε το n με n − 1 σvτην (27) τότε θα είχαμε s2 = 1. Η δεύτερη
απάντησvη φαίνεται πιο ικανοποιητική εφόσvον η απόκλισvη των παρατηρήσvεων 1 και
3 από τον μέσvο είναι 1. Συχνά λοιπόν ορίζουμε:

Pn 2 Pn
(xi − x̄) x2i − nx̄2
s2 = i=1
= i=1
(28)
n−1 n−1
Από την (22) είναι σvαφές ότι η διακύμανσvη δεν είναι παρά ο αριθμητικός μέσvος των
2
(xi − x̄) , i = 1, ..., n. Φαινομενικά το πλήθος των παρατηρήσvεων είναι n αλλά
σvτην πραγματικότητα αν γνωρίζουμε τις n − 1 παρατηρήσvεις τότε η επόμενη μπορεί
πάντα να προσvδιορισvθεί με βάσvη την (18). Πραγματικά από την (18) έχουμε:

n
X n
X n−1
X
(xi − x̄) = 0 ⇒ xi = nx̄ ⇒ xn = nx̄ − xi (29)
i=1 i=1 i=1

Επομένως η τελευταία παρατήρησvη είναι πάντα δεσvμευμένη αν γνωρίζουμε τις n−1


παρατηρήσvεις και τον γενικό μέσvο. Κατά σvυνέπεια μόνον n − 1 παρατηρήσvεις είναι
ανεξάρτητες ή ελεύθερες. Η διόρθωσvη με

ν =n−1 (30)
είναι γνωσvτή σvαν διόρθωσvη με τους λεγόμενους ‘βαθμούς ελευθερίας’.
Αν οι παρατηρήσvεις υποσvτούν έναν γραμμικό μετασvχηματισvμό όπως σvτην (12)
τότε θα έχουμε:

n
X n
X n
X n
X
2 2 2 2
(yi − ȳ) = (α + βxi − α − β x̄) = {β (xi − x̄)} = β 2 (xi − x̄)
i=1 i=1 i=1 i=1
(31)
Διαιρώντας κατά μέλη με n − 1 έχουμε:

s2y = β 2 s2x (32)


από την οποία προκύπτει επίσvης ότι:

sy = |β|sx (33)

9
Από τις σvχέσvεις (13) και (33) προκύπτει ότι ο δειγματικός μέσvος και η δειγματική
διακύμανσvη τροποποιούνται όταν τα δεδομένα υπόκεινται σv΄ έναν γραμμικό μετα-
σvχηματισvμό. Ο πολλαπλασvιασvμός με β αλλάζει τις μονάδες μέτρησvης (όπως όταν
αλλάζουμε το νόμισvμα από ευρώ σvε δολάρια) ενώ η πρόσvθεσvη της σvταθεράς α
γίνεται όταν πχ αλλάζουμε τις μονάδες μέτρησvης της θερμοκρασvίας από Κελσvίου
σvε Φαρενάϊτ. Αν υποθέσvουμε ότι α = 0 και β > 0 σvτην (13) τότε ο μέσvος και η
διακύμανσvη ενώ αλλάζουν έχουμε:

sy βsx sx
= = (34)
ȳ β x̄ x̄
q Pn 2
q Pn 2
i=1 (xi −x̄) i=1 (yi −ȳ)
όπου sx = n−1 και sy = n−1 . Το σvτατισvτικό μέτρο

sx
C= (35)

λέγεται σvυντελεσvτής μεταβλητότητας και όπως δείξαμε σvτην (34) δεν εξαρτάται
από αλλαγές σvτις μονάδες μέτρησvης ή από μεταβολές της κλίμακας. Φυσvικά δεν
ορίζεται για x̄ = 0. Η σvχέσvη (34) είναι χρήσvιμη όταν πρέπει να σvυγκρίνουμε τη
διασvπορά σvε δυο διαφορετικά σvύνολα δεδομένων τα οποία είναι εκφρασvμένα σvε
διαφορετικές μονάδες, πχ ευρώ και δολάρια. Μια λύσvη είναι ασvφαλώς πρώτα να
εκφράσvουμε τα δεδομένα σvτις ίδιες μονάδες και μετά να υπολογίσvουμε την τυπική
απόκλισvη ή τη διακύμανσvη ώσvτε να είναι σvυγκρίσvιμες. Η λύσvη αυτή έχει τα προ-
βλήματά της σvε ορισvμένες περιπτώσvεις. Για παράδειγμα ας υποθέσvουμε ότι έχουμε
τις αποδόσvεις δυο μετοχών Α και Β με x̄A = x̄B = 0, 07 (επομένως έχουν μέσvη
ημερήσvια απόδοσvη 7%) και sA = 0, 10, sB = 0, 20. Ενώ οι δυο μετοχές είναι σvτις
ίδιες μονάδες (% αποδόσvεις) και η μέσvη απόδοσvη είναι η ίδια, η διακύμανσvη της
μετοχής Β είναι πολύ μεγαλύτερη. Αυτό σvημαίνει ότι οι αποδόσvεις της μετοχής
Α θα τείνουν να κινούνται πλησvιέσvτερα προς τον μέσvο τους (δηλαδή x̄A ) και ε-
πομένως η μέσvη απόδοσvη 7% σvχετίζεται με μικρότερο κίνδυνο. Οι σvυντελεσvτές
μεταβλητότητας είναι 0,7 και 0,35 αντίσvτοιχα από τους οποίους είναι φανερό ότι η
μετοχή Α έχει μεγαλύτερο κίνδυνο.
Η σvυζήτησvη αυτή μας οδηγεί με φυσvικό τρόπο σvτο να θεωρήσvουμε την τυπική
απόκλισvη ή τη διακύμανσvη σvαν μέτρο κινδύνου των χρηματοοικονομικών αποδό-
σvεων γενικά. Το μέτρο αυτό χρησvιμοποιείται ευρύτατα αν και δεν υπάρχει λόγος
για τον οποίο η μέσvη απόλυτη απόκλισvη σvτην (21) να μην μπορεί επίσvης να θε-
ωρηθεί σvαν σvτατισvτικό μέτρο του κινδύνου. Στην πραγματικότητα αν η διάμεσvος
μπορεί να θεωρηθεί ως καλύτερο μέτρο θέσvης τότε από τη διαδικασvία με την οποία
οδηγηθήκαμε σvτην (21) το καλύτερο μέτρο διασvποράς θα είναι η μέσvη απόλυτη
απόκλισvη.

1.5 Isvtìgramma

Το ισvτόγραμμα αποτελεί τον καλύτερο τρόπο να περιγράψουμε διαγραμματικά έ-


να σvύνολο δεδομένων αντί να περιορισvθούμε αποκλεισvτικά σvτα μέτρα θέσvης και

10
διασvποράς. Για ένα σvύνολο δεδομένων X = {x1 , x2 , ..., xn } ας υποθέσvουμε ότι η ε-
λάχισvτη και μέγισvτη τιμή είναι α και β και αποφασvίζουμε να χωρίσvουμε το διάσvτημα
[a, b] σvε K + 1 < n κατηγορίες. Επομένως θα έχουμε τα υποδιασvτήματα:
[a, c1 ), [c1 , c2 ), ..., (cK , b].
PK
Αν έχουμε nk παρατηρήσvεις σvε κάθε υποδιάσvτημα (k = 1, ..., K και k=1 nk =
n) και το μέσvο του κάθε υποδιασvτήματος είναι mk , το ισvτόγραμμα είναι η γραφική
παράσvτασvη (mk , nk ). Οι ποσvότητες

nk
fk = , k = 1, ..., K (36)
n
λέγονται σvχετικές σvυχνότητες. Τα nk είναι γνωσvτά σvαν σvυχνότητες. Προφανώς
έχουμε

K
X
fk ≥ 0, fk = 1 (37)
k=1

Διάγραμμα 1.
3000

2500

2000

1500

1000

500

0
−4 −3 −2 −1 0 1 2 3 4 5

Στο παραπάνω σvχήμα βλέπουμε ένα ισvτόγραμμα με 10 υποδιασvτήματα ενός δείγ-


ματος μεγέθους 10.000. Η καμπύλη σvυνδέει τα σvημεία (mk , nk ) ενώ το κάθε
ορθογώνιο αντισvτοιχεί σvτα υποδιασvτήματα που έχουμε κατασvκευάσvει. Στο Διά-
γραμμα 2 παρισvτάνονται τα ισvτογράμματα των αποδόσvεων για μια ομολογία και μια
μετοχή.

11
Διάγραμμα 2.

Το ισvτόγραμμα μας παρέχει μια σvαφή εικόνα σvχετικά με (α) τα μέτρα θέσvης και
διασvποράς, και (β) τις ακραίες αποδόσvεις. Σε πολλές περιπτώσvεις τα μέτρα θέσvης
και διασvποράς ενδέχεται να είναι παραπλανητικά όπως σvτο Διάγραμμα 3.
Διάγραμμα 3.
2500

2000

1500

1000

500

0
−4 −2 0 2 4 6 8 10 12 14

Ο μέσvος (2,95) και η διάμεσvος (0,56) σvτην περίπτωσvη αυτή δεν σvυνοψίζουν τα
δεδομένα με ορθό τρόπο. ΄Ενα κλασvσvικό παράδειγμα που οδηγεί σvε ισvτογράμματα
όπως αυτά σvτο Διάγραμμα 3 είναι όταν αναμιγνύονται διαφορετικοί ή ετερογε-
νείς ‘πληθυσvμοί’, πχ οι σvτρεμματικές αποδόσvεις ορεινών και πεδινών αγροκτημά-
των. ΄Ενα ακόμη παράδειγμα, αυτή τη φορά με βάσvη ημερήσvια σvτοιχεία του δείκτη
Dow − Jones (2/11/1998-18/5/2012) φαίνεται σvτο Διάγραμμα 4.

12
Διάγραμμα 4.
0.15

0.1

0.05

−0.05

−0.1
0 500 1000 1500 2000 2500 3000 3500 4000

800

600

400

200

0
−0.1 −0.05 0 0.05 0.1 0.15

Ερωτήσvεις.

1. Στο Διάγραμμα 4 ποια είναι προσvεγγισvτικά τα μέτρα θέσvης και


διασvποράς·
2. Ποιο είναι το εύρος σvτο οποίο κινήθηκαν οι αποδόσvεις του δεί-
κτη·

Ας θεωρήσvουμε και πάλι το Διάγραμμα 1. Ας σvυμβολίσvουμε:

nk = #{i : ck−1 ≤ xi < ck }, k = 1, ..., K + 1 (38)


όπου #A δηλώνει τον αριθμό των σvτοιχείων του σvυνόλου A, c0 = a, cK+1 = b.
Η έννοια της (37) είναι ότι nk είναι ο αριθμός των παρατηρήσvεων που βρίσvκονται
σvτο υποδιάσvτημα Ik = [ck−1 , ck ), k = 1, 2, ..., K + 1. Με διαφορετικό σvυμβολισvμό

nk = #{i : xi ∈ Ik }, k = 1, ..., K + 1 (39)


Το κάθε υποδιάσvτημα έχει το ίδιο μήκος δ = c1 − a = c2 − c1 = ... = cK+1 − cK .
Εφόσvον κάθε υποδιάσvτημα έχει σvαν κεντρικό του σvημείο το mk = ck−12+ck εί-
ναι σvαφές από το Διάγραμμα 1 ότι η σvυνεχής καμπύλη που σvυνδέει τα σvημεία
(mk , nk ) , k = 1, ..., K + 1 μπορεί να θεωρηθεί ως εναλλακτικός τρόπος παρουσvί-
ασvης του ισvτογράμματος.
Με βάσvη το ισvτόγραμμα είναι εύκολο να ορίσvουμε ένα άλλο μέτρο θέσvης γνω-
σvτό σvαν ‘τύπο’. Ο τύπος είναι η τιμή εκείνη που εμφανίζεται πιο σvυχνά. Αν
υποτεθεί ότι η μέγισvτη τιμή των σvυχνοτήτων είναι nν (για κάποιο ν = 1, ..., K + 1)
τότε ο τύπος δεν είναι παρά mν .

13
2 Omadopoihmèna dedomèna

Η παράθεσvη των δεδομένων με τη μορφή ισvτογράμματος2 κάνει αντιληπτό ότι σvτην


πραγματικότητα έχουμε ομαδοποιήσvει τα δεδομένα σvε K − 1 κατηγορίες που αντι-
σvτοιχούν σvτα υποδιασvτήματα. Αν υποθέσvουμε ότι έχουμε μόνο τα ομαδοποιημένα
δεδομένα {(mk , fk ), k = 1, ..., K} ή ότι τα ομαδοποιημένα δεδομένα μπορούν να
υποκατασvτήσvουν τα αρχικά, τότε η ερμηνεία των ομαδοποιημένων δεδομένων είναι
απλή. Συγκεκριμένα, η ‘παρατήρησvη’ mk λαμβάνει σvπουδαιότητα ή σvημασvία που
δίνεται από τη σvχετική της σvυχνότητα, fk . Η ‘παρατήρησvη’ mk μπορεί να μην
εμφανίζεται καν σvτα αρχικά δεδομένα αλλά μπορεί να θεωρηθεί σvαν η αντιπρο-
σvωπευτική παρατήρησvη εκείνων που ανήκουν σvτο σvυγκεκριμένο υποδιάσvτημα. Ας
θεωρήσvουμε τις εκφράσvεις:

K
X
x̃ = mk fk (40)
k=1
K
X 2
s̃2 = (mk − x̃) fk (41)
k=1

Οι εκφράσvεις αυτές μπορούν να θεωρηθούν ως προσvεγγίσvεις του αριθμητικού μέ-


σvου και της διακύμανσvης όταν έχουμε ομαδοποιημένα σvτοιχεία. Η παράσvτασvη (40)
είναι ένας σvταθμικός μέσvος των κεντρικών σvημείων mk με σvταθμίσvεις τις σvχετικές
σvυχνότητες. Αντίσvτοιχα η παράσvτασvη (41) είναι ένας σvταθμικός μέσvος των τετρα-
γωνισvμένων αποκλίσvεων των κεντρικών σvημείων από τον μέσvο. Είναι προφανές ότι
μεγαλύτερη βαρύτητα δίνεται σvε εκείνα τα κεντρικά σvημεία τα οποία σvχετίζονται
με τις μεγαλύτερες σvχετικές σvυχνότητες, όπως άλλωσvτε θα έπρεπε. Μπορούμε να
δείξουμε ότι:

K
X
fk (mk − x̃) = 0 (42)
k=1
K
X
s̃2 = fk m2k − x̃2 (43)
k=1

Οι ιδιότητες αυτές είναι ανάλογες με τις σvχέσvεις (18) και (26). Αξίζει να παρατη-
ρήσvουμε ότι αν f1 = f2 = ... = fK τότε αναγκασvτικά θα έχουμε f1 = f2 = ... =
fK = n1 και επομένως οι σvχέσvεις (42) και (43) καταλήγουν σvτις (18) και (26) ενώ
οι ορισvμοί (40) και (41) καταλήγουν σvτους (2) και (22).
Ας υιοθετήσvουμε τον σvυμβολισvμό:

n
X
E (X) ≡ pi xi (44)
i=1
2 EÐnai gnwsvtì ìti an èqoume n parathr sveic o bèltisvtoc arijmìc twn kathgori¸n K eÐnai

n.

14
όπου p=(p1 , ..., pn ) είναι σvταθμίσvεις και X = {x1 , ..., xn } είναι ένα σvύνολο δεδομέ-
νων. Υποθέτουμε ότι

n
X
pi ≥ 0, pi = 1 (45)
i=1

Η σvχέσvη (44) μπορεί να γενικευθεί σvτην περίπτωσvη της διακύμανσvης ως εξής:

X
E {X − E (X)}2 ≡ pi (xi − E (X))2 (46)

Η σvχέσvη αυτή μπορεί με τη σvειρά της να γενικευθεί ως εξής:

X
E {X − E (X)}k ≡ pi {xi − E (X)}k , k = 1, 2, ... (47)

όπου E {X − E (X)} = 0. Ας δούμε ορισvμένες ιδιότητες για την περίπτωσvη που


X = {x1 , ..., xn } και Y = {y1 , ..., yn } είναι δυο σvύνολα δεδομένων με σvταθμίσvεις
p ∈ Rn .
Ιδιότητα 1. E {X − E (X)} = 0.
Απόδειξη. E {X − E (X)} = pi (xi − E (X)) = pi xi − E (X) pi = E (X).
P P P

Ιδιότητα 2. E (α + βX) = α + βE (X).


Απόδειξη. E (α + βX) = pi (α + βxi ) = α pi + β pi xi = α + βE (X).
P P P

Ιδιότητα 3. E (X + Y) = E (X) + E (Y).


Απόδειξη. E (X + Y) = pi (xi + yi ) = pi xi + pi yi = E (X) + E (Y). Παρό-
P P P
μοια έχουμε την επόμενη
Ιδιότητα 4. E (αX + βY) = αE (X) + βE (Y), ∀α, β ∈ R όπως και την
ακόλουθη
PM PM
Ιδιότητα 5. Για κάθε α ∈ RM , E ( m=1 αm Xm ) = m=1 αm E (Xm ),
όπου X1 , X2 , ... είναι σvύνολα δεδομένων με πλήθος παρατηρήσvεων n1 , n2 , ....
Ιδιότητα 6. E (X + Y)2 = E (X2 ) + E (Y2 ) + 2E (XY).
Απόδειξη.
PE (X + Y) = 2 pi (xi 2+ yi ) = pi (x2i + yi2 + 2xi yi ) = E (X2 ) + E (Y2 ) +
2 2
P P
2 pi xi yi = E (X ) + E (Y ) + 2E (XY)
Ιδιότητα 7. E (X − Y)2 = E (X2 ) + E (Y2 ) − 2E (XY).
Οι ιδιότητες 6 και 7 αποτελούν υποπερίπτωσvη της ακόλουθης:
Ιδιότητα 8. E (αX + βY)2 = α2 E (X2 ) + β 2 E (Y2 ) + 2αβE (XY).
Pn Pn
Ερώτησvη. Ας ορίσvουμε Ep (X) = i=1 pi xi . Εφόσvον Eq (Y) = i=1 qi yi να προ-
σvδιορίσvετε την έκφρασvη E (αX + βY)2 . Ας υποθέσvουμε τώρα ότι q ∈ Rm και
m 6= n. Μπορεί να υπολογισvθεί η έκφρασvη αυτή·

15
2.1 Ajroisvtikèc svuqnìthtec

Ας υποθέσvουμε ότι έχουμε το ισvτόγραμμα (mk , fk , k = 1, ..., K) όπου fk είναι


σvχετική σvυχνότητα. Η σvχετική σvυχνότητα δίνει την αναλογία των παρατηρήσvεων
που ανήκουν σvτο υποδιάσvτημα το οποίο έχει σvαν κεντρική τιμή το mk . Επομένως
θα μπορούσvαμε να πούμε ότι παρέχει την αναλογία των παρατηρήσvεων που είναι
‘κοντά’ σvτο mk . Αν επιλέξουμε το πρώτο υποδιάσvτημα να μην περιλαμβάνει καμία
παρατήρησvη τότε f1 = 0. Αυτό μπορεί να γίνει πάντοτε αν το ανώτατο άκρο του
πρώτου υποδιασvτήματος είναι μια τιμή μικρότερη από την ελάχισvτη παρατήρησvη.
Ας ορίσvουμε

k
X
Fk = fj , k = 1, 2, ..., K (48)
j=1

Η ποσvότητα αυτή μας δίνει την αναλογία των παρατηρήσvεων που ανήκουν σvτο k
υποδιάσvτημα ή σvε υποδιασvτήματα προς τ΄ αρισvτερά του. Μας δίνει, μ΄ άλλα λόγια,
την αναλογία των παρατηρήσvεων που είναι (προσvεγγισvτικά μιλώντας) μικρότερες
από mk -ακριβέσvτερα, μικρότερες από το άνω άκρο του υποδιασvτήματος που έχει
σvαν κεντρική τιμή του το mk . Ας υιοθετήσvουμε τον σvυμβολισvμό

P(X ∈ Ik ) = fk , k = 1, ..., K (49)


που έχει την εξής ερμηνεία: Η αναλογία των παρατηρήσvεων της λίσvτας X που
ανήκουν σvτο υποδιάσvτημα Ik είναι fk . Το σvύμβολο P σvυμφωνούμε ότι προέρχεται
από τη λέξη proportion. Εφόσvον κάθε υποδιάσvτημα έχει το ίδιο μήκος h είναι
σvαφές ότι Ik = [ak , ak + h) και mk = ak + h2 . Επομένως θα μπορούσvαμε να
γράψουμε τη σvχέσvη (49) ως εξής:

P(ak ≤ X < ak + h) = fk , k = 1, ..., K (50)


Με αυτή τη σvύμβασvη η αθροισvτική σvυχνότητα μπορεί να γραφεί με τη μορφή:

Fk = P(X ≤ ak + h), k = 1, ..., K (51)


Προκύπτει επίσvης εύκολα με βάσvη την (51) ότι έχουμε:

Fk − Fk−1 = fk , k = 2, ..., K (52)

Ας υποθέσvουμε θεωρητικά ότι έχουμε έναν άπειρα μεγάλο αριθμό παρατηρήσvεων.


Θα μπορούσvαμε να γράψουμε την (51) με τη μορφή

F (x + h) = P(X ≤ x + h), x ∈ R (53)

16
η οποία περιλαμβάνει απλώς την αντικατάσvτασvη του ak με x, μια σvυνεχή μεταβλητή
και κυρίως την υποθεσvη ότι μπορούμε να περιγράψουμε την αθροισvτική σvυχνότητα
Fk με μια σvυνεχή σvυνάρτησvη F (x) και F : R → [0, 1]. Η λογική αυτής της
αντικατάσvτασvης είναι ότι εφόσvον έχουμε έναν άπειρα μεγάλο αριθμό παρατηρήσvεων
μπορούμε να έχουμε έναν άπειρα μεγάλο αριθμό κατηγοριών ak , δηλαδή K → ∞.
Αυτό σvημαίνει φυσvικά ότι h → 0. Αν υποθέσvουμε ότι h → 0 αλλά δεν είναι μηδέν
θα μπορούσvαμε να γράψουμε εναλλακτικά την (52) με την ακόλουθη μορφή:

F (x + h) − F (x) = f (x)h (54)


όπου f (x) είναι το αντίσvτοιχο του fk όπως ακριβώς το αντίσvτοιχο του Fk είναι η
σvυνάρτησvη F (x). Διαιρώντας την (54) με h θα έχουμε:

F (x + h) − F (x)
f (x) = (55)
h
Λαμβάνοντας όρια και σvτα δυο μέλη, εφόσvον πρόκειται για ταυτότητα (ορισvμό)
έχουμε:

F (x + h) − F (x)
f (x) = lim (56)
h→0 h
΄Οταν το όριο υπάρχει και μπορούμε να υποθέσvουμε ότι η σvυνάρτησvη F (x) δεν
είναι απλώς σvυνεχής αλλά παραγωγίσvιμη, τότε:

dF (x)
f (x) = F 0 (x) = (57)
dx
Φυσvικά σvε όρους διαφορικών έχουμε:

dF (x) =f (x)dx (58)


Με βάσvη την ανάλυσvή μας είναι λογικό να ονομάσvουμε τη σvυνάρτησvη f (x) ‘σvυ-
σvυχνότητας’ και τη σvυνάρτησvη F (x) ‘αθροισvτική σvυνάρτησvη σvυχνότητας’.
νάρτησvη P
Εφόσvον fk = 1 είναι λογικό να διατηρήσvουμε την ίδια σvύμβασvη και να υποθέ-
σvουμε ότι:

ˆ ∞
f (x)dx = 1 (59)
−∞

το οποίο έχει την έννοια ότι το εμβαδόν κάτω από την καμπύλη f (x) σvυμφωνούμε
για ευκολία να είναι μονάδα. Οι σvχέσvεις (58) και (59) σvημαίνουν ότι:

F (∞) − F (−∞) = 1 (60)

17
όπου F (±∞) = limx→±∞ F (x). Η σvχέσvη (60) με τη σvύμβασvη ότι F (−∞) = 0
σvημαίνει ότι:

F (∞) = 1 (61)

Επίσvης, είναι φανερό από την (57) ότι F 0 (x) ≥ 0 και επομένως η αθροισvτική
σvυνάρτησvη δεν μπορεί να είναι φθίνουσvα σvε κανένα σvημείο της. Η ανάλυσvη αυτή
μας οδηγεί σvε δυο σvημαντικά σvυμπεράσvματα που θα έχουν κεντρική σvημασvία σvτη
θεωρία πιθανοτήτων.
Συμπέρασvμα 1. Αν εξειδικεύσvουμε μια παραγωγίσvιμη σvυνάρτησvη F (x)
ως την αθροισvτική σvυνάρτησvη τότε η σvυνάρτησvη σvυχνότητας f (x)
προκύπτει (από τη σvχέσvη (55» ως η παράγωγός της.
Συμπέρασvμα 2. Αν εξειδικεύσvουμε μια σvυνάρτησvη f (x) ως τη σvυνάρ-
τησvη σvυχνότητας τότε η αθροισvτική σvυνάρτησvη F (x) προκύπτει
από το ολοκλήρωμά της:

ˆ x
F (x) = f (t)dt (62)
−∞

Για να δούμε την ισvχύ της (62) ας θεωρήσvουμε την (57) από την οποία έχουμε:

ˆ x ˆ x ˆ x
0 0
F (t) = f (t) ⇒ F (t)dt = f (t)dt ⇒ F (x) + c = f (t)dt
−∞ −∞ −∞
(63)
Η σvταθερά της ολοκλήρωσvης c θα είναι μηδέν λόγω της (61). Δηλαδή, η γενική
´∞
λύσvη δίνεται από το τελευταίο σvκέλος της (63) αλλά αν λάβουμε όρια καθώς x → ∞
έχουμε: F (∞) + c = −∞ f (t)dt = 1 ⇒ c = 0.
Από τα Συμπεράσvματα 1 και 2 είναι σvαφές ότι μπορούμε να εξειδικεύσvουμε είτε
τη σvυνάρτησvη σvυχνότητας f (x) είτε την αθροισvτική σvυνάρτησvη F (x) εφόσvον αν
έχουμε τη μια εύκολα προκύπτει η άλλη.
(
1, x ∈ [0, 1]
Παράδειγμα. Ας υποθέσvουμε ότι f (x) =
0, διαφορετικά.
Είναι εύκολο
 να διαπισvτώσvουμε ότι:
 x, x ∈ [0, 1]

F (x) = 0, x < 0

1, x > 1.

18

You might also like