Professional Documents
Culture Documents
E. G. Tsvi¸nac
Pn
x1 + x2 + ... + xn xi
x̄ = = i=1 (2)
n n
Pn
ή εναλλακτικά x̄ = n−1 i=1 xi . Από την (2) προκύπτει ότι:
n
X
xi = nx̄ (3)
i=1
Ποια έννοια μπορούμε να αποδώσvουμε σvτη ‘μέσvη’ απόδοσvη όπως την ορίσvαμε
παραπάνω· Στη Βικιπαίδεια διαβάζουμε:
‘Μέσvος όρος ή αλλιώς δειγματική μέσvη τιμή ενός σvυνόλου ν παρα-
τηρήσvεων αποτελεί το σvπουδαιότερο και χρησvιμότερο μέτρο της Στα-
τισvτικής και είναι ένα μέτρο θέσvης, δηλαδή δείχνει σvχετικά τις θέσvεις
των αριθμών σvτους οποίους αναφέρεται. Η μέσvη τιμή σvυμμετέχει σvε
αρκετούς τύπους της σvτατισvτικής και εξετάζεται σvε σvχεδόν όλες τις
σvτατισvτικές κατανομές. Γενικά, ορίζεται ως το άθροισvμα των παρατη-
ρήσvεων δια του πλήθους αυτών. Είναι δηλαδή η μαθηματική πράξη
ανεύρεσvης της «μέσvης απόσvτασvης» ανάμεσvα σvε δύο ή περισvσvότερους
αριθμούς’.
1
(γ) με ποιον τρόπο ο μέσvος όρος ‘δείχνει σvχετικά τις θέσvεις των αριθμών σvτους
οποίους αναφέρεται’.
Ο όρος ‘δειγματική μέσvη τιμή’ αναφέρεται σvτο ‘δείγμα’ που έχουμε σvτη διάθεσvη
μας και δεν είναι παρά το σvύνολο των αριθμών X. Οι όροι ‘δείγμα’ η ‘τυχαίο δείγμα’
δεν έχουν ακόμη νόημα σvτη σvυζήτησvή μας αν και πρέπει να είναι γνωσvτοί από την
καθημερινή ζωή.
1.1 Eisvagwgik
Σκοπός του μέσvου όρου δεν είναι παρά να περιγράψει ή να σvυνοψίσvει το σvύνολο
των αριθμών X. Στη γενική περίπτωσvη το σvύνολο των αριθμών αποτελείται από
μεγάλο αριθμό σvτοιχείων ή παρατηρήσvεων, όπως λέγονται. Για παράδειγμα ένα
έτος ημερήσvιων αποδόσvεων μιας μετοχής θα έχει 250 παρατηρήσvεις. Προφανώς
το σvύνολο αυτό περιέχει όλη την πληροφόρησvη που χρειαζόμασvτε για να μάθουμε
σvχετικά με τη σvυμπεριφορά της μετοχής αλλά το πλήθος των παρατηρήσvεων δεν
μας επιτρέπει να διαχειρισvθούμε αποτελεσvματικά αυτή την πληροφόρησvη.
Στην περιγραφική σvτατισvτική προσvπαθούμε να σvυνοψίσvουμε την πληροφόρη-
σvη σvε μερικά σvτατισvτικά μέτρα ένα από τα οποία είναι ο αριθμητικός μέσvος. Σε
σvχέσvη με τις αποδόσvεις των μετοχών από την καθημερινή ζωή είμασvτε εξοικειω-
μένοι με τις έννοιες της ‘μέσvης απόδοσvης’ και του ‘κινδύνου’ ή ‘ρίσvκου’. Είναι
λογικό να υποθέσvουμε ότι οι έννοιες αυτές αποτελούν θεμελιώδη χαρακτηρισvτικά
της ταυτότητας ή σvυμπεριφοράς μιας μετοχής. Αυτά τα θεμελιώδη χαρακτηρισvτικά
είναι επίσvης λογικό να υποθέσvουμε ότι μπορούν να υπολογισvθούν από την παρα-
τηρούμενη σvυμπεριφορά της μετοχής, δηλαδή τις αποδόσvεις της σvτη διάρκεια μιας
ορισvμένης χρονικής περιόδου. Με τον τρόπο αυτό, αν πραγματικά η μέσvη απόδοσvη
και ο κίνδυνος χαρακτηρίζουν μια οποιαδήποτε μετοχή τότε οι παρατηρήσvεις για
μια σvειρά μετοχών μπορούν ν΄ αντικατασvταθούν από τα θεμελιώδη χαρακτηρισvτικά
της.
Για παράδειγμα αν είχαμε τρεις μετοχές, Α, Β και Γ, και οι παρατηρήσvεις μας
ήταν:
XA = {α1 , α2 , ..., αn }, XB = {β1 , β2 , ..., βn }, XΓ = {γ1 , γ2 , ..., γn }
2
Για τη μέσvη απόδοσvη ο υπολογισvμός της μπορεί να γίνει με βάσvη τον αριθμητικό
μέσvο
n
X n
X n
X
−1 −1 −1
µA ' n αi , µB ' n βi , µΓ ' n γi (4)
i=1 i=1 i=1
3
των ατόμων (σvυγκεκριμένα η επιλογή ενός ατόμου δεν εξαρτάται καθόλου από το
αν έχει ή όχι επιλεγεί κάποιο άλλο).
Ο σvυγκεκριμένος τρόπος να κατανοήσvουμε τον πληθυσvμό μπορεί να φαίνεται
πολύ γενικός ή ακόμα και σvωσvτός αλλά σvτην πραγματικότητα δεν είναι. Αν έ-
χουμε για παράδειγμα σvτη διάθεσvη μας τις παρατηρήσvεις X = {x1 , x2 , ..., xn } των
αποδόσvεων μιας μετοχής για n ημέρες τότε ποιος είναι ο πληθυσvμός και το δείγμα·
Στην περίπτωσvη αυτή φαίνεται πως το δείγμα είναι και ολόκληρος ο πληθυσvμός!
Μια τέτοια θεώρησvη των πραγμάτων προφανώς δεν μπορεί να είναι σvωσvτή. Αυτό
φαίνεται από την εξής παρατήρησvη: Αν η μέσvη απόδοσvη της μετοχής, µ, παραμέ-
νει αμετάβλητη διαχρονικά αλλά έχουμε μια επιπλέον παρατήρησvη όπως σvτην (5)
ο αριθμητικός μέσvος x̄n+1 φυσvικά θα διαφέρει από τον x̄n αλλά η πραγματική ή
θεμελιώδης μέσvη απόδοσvη µ παραμένει αμετάβλητη.
Ο τρόπος με τον οποίο μπορούμε να σvυμβιβάσvουμε αυτές τις παρατηρήσvεις με-
ταξύ τους παρέχεται από τη θεωρία της δειγματοληψίας που θα μας απασvχολήσvει
μετά τη θεωρία πιθανοτήτων. Στο σvτάδιο αυτό μας αρκεί να παρατηρήσvουμε ότι ο
αριθμητικός μέσvος φαίνεται ν΄ αποτελεί ένα φυσvικό μέτρο προσvέγγισvης της άγνω-
σvτης θεμελιώδους μέσvης απόδοσvης όπως σvτην (4). Αν μη τι άλλο οπωσvδήποτε
αποτελεί ένα λογικό μέτρο θέσvης όπως λέμε. Τα σvτατισvτικά μέτρα θέσvης έχουν
σvαν σvκοπό τους να μας δώσvουν μια εικόνα σvχετικά με την πιο αντιπροσvωπευτική
τιμή των παρατηρήσvεων X = {x1 , x2 , ..., xn } ή τη θέσvη σvτην οποία αναμένουμε
να βρίσvκονται οι περισvσvότερες παρατηρήσvεις. Με την έννοια αυτή ο αριθμητικός
μέσvος δεν είναι πολύ διαφορετικός από το κέντρο βάρους.
΄Ενα άλλο μέτρο θέσvης είναι η διάμεσvος. Αν έχουμε τις παρατηρήσvεις X =
{x1 , x2 , ..., xn } μπορούμε να τις διατάξουμε σvε αύξουσvα σvειρά, έσvτω x(1) ≤ x(2) ≤ ... ≤ x(n) .
Η διάμεσvος θα είναι η κεντρική παρατήρησvη
4
1/n
G = (x1 x2 ...xn ) (8)
Ο λόγος για την ύπαρξη αυτής της έκφρασvης γίνεται σvαφής αν λάβουμε λογαρίθ-
μους:
Pn
lnxi i=1
lnG = (9)
n
Από την έκφρασvη αυτή βλέπουμε ότι ο λογάριθμος του γεωμετρικού μέσvου είναι ο
απλός μέσvος των λογαρίθμων των δεδομένων μας. Ο λόγος για τον οποίο χρησvι-
μοποιούμε λογαρίθμους είναι ότι ο μετασvχηματισvμός αυτός κάνει την κλίμακα των
δεδομένων πιο ομοιόμορφη. Για παράδειγμα σvτις παρατηρήσvεις X = {1, 2, 3, 994}
έχουμε G = 8, 79 που αποτελεί μια πιο λογική απάντησvη σvε σvχέσvη με τον αριθμη-
τικό μέσvο.
Ο αρμονικός μέσvος είναι:
n n
H = Pn 1 = 1 1 1 (10)
i=1 xi x1 + x2 + ... + xn
Στο παράδειγμά μας ο αρμονικός μέσvος είναι 2,181 περίπου. Από την (10) έχουμε:
1 1
H= 1
Pn 1 = (11)
n i=1 xi ȳ
με τη σvύμβασvη
Pn
yi 1
ȳ = i=1
n , yi = xi , i = 1, .., n.
Αν έχουμε δυο παρατηρήσvεις X = {x1 , x2 } τότε οι τρεις μέσvοι είναι:
√ 2
x̄ = x1 +x
2
2
, G = x1 x2 και H = x2x 1 x2
1 +x2
= Gx̄ .
√
Από τη σvχέσvη αυτή βλέπουμε ότι G = H x̄, δηλαδή ο γεωμετρικός μέσvος των
δυο παρατηρήσvεων είναι ο γεωμετρικός μέσvος των δυο άλλων μέσvων.
Ας υποθέσvουμε ότι έχουμε τις παρατηρήσvεις X = {x1 , x2 , ..., xn } και θεωρούμε
τον γραμμικό μετασvχηματισvμό:
ȳ = α + β x̄ (13)
Επομένως ο γραμμικός μετασvχηματισvμός τροποποιεί τον αριθμητικό μέσvο κατά τον
προφανή τρόπο.
5
1.2 Exagwg tou arijmhtikoÔ mèsvou
Ας υποθέσvουμε σvτη σvυνέχεια ότι ορίζουμε την αντιπροσvωπευτική τιμή των δεδο-
μένων X = {x1 , x2 , ..., xn } ως εκείνη την τιμή, έσvτω A, η οποία βρίσvκεται πλησvιέ-
σvτερα προς όλες τις παρατηρήσvεις. Θα πρέπει φυσvικά να εξειδικεύσvουμε μια έννοια
απόσvτασvης. Δυο τέτοιες επιλογές είναι:
n
X
Q(Α) = |xi − A| (14)
i=1
και
n
X 2
S(Α) = (xi − A) (15)
i=1
Για να ελαχισvτοποιήσvουμε την (15) λαμβάνουμε την πρώτη παράγωγο και έχουμε:
n
0 d 2 2 2
X
S (A) = (x1 − A) + (x2 − A) + ... + (xn − A) = −2 (xi −A)
dA i=1
(16)
Θέτοντας την πρώτη παράγωγο ίσvη με το μηδέν προκύπτει
n n Pn
X X xi
(xi − A) = 0 ⇒ xi − nA = 0 ⇒ A = i=1 = x̄ (17)
i=1 i=1
n
n
X
(xi − x̄) = 0 (18)
i=1
δηλαδή το άθροισvμα των αποκλίσvεων από τον μέσvο είναι πάντα μηδέν. Η ιδιότητα
αυτή προκύπτει κατευθείαν από τη σvυνθήκη πρώτης τάξης (17). Από την (16) η
δεύτερη παράγωγος είναι
( n
) ( n
)
00 d X d X
S (A) = −2 (xi − A) = −2 xi + 2nA = 2n > 0, ∀A ∈ R
dA i=1
dA i=1
(19)
6
και επομένως σvτο σvημείο A = x̄ η (15) θα έχει ολικό ελάχισvτο1 . Αν η έννοια της
απόσvτασvης που υιοθετούμε είναι η (14) τότε το πρόβλημα είναι:
n
X
min(A) : Q(A) = |xi − A| (20)
i=1
1.3 Diasvpor
Από την κατασvκευή των προβλημάτων (14) και (15) είναι σvαφές ότι δεν έχουμε
μόνο τη λύσvη A αλλά και ένα μέτρου του κατά πόσvο μια σvυγκεκριμένη λύσvη είναι
καλή. Αυτό το μέτρο δεν είναι παρά η τιμή της αντικειμενικής σvυνάρτησvης. Αν
σvυμφωνήσvουμε ότι
n
1X
q= |xi − ∆| (21)
n i=1
και
n
1X
s2 = (xi − x̄)2 (22)
n i=1
1 Na dikaiologhjeÐ svan svkhsvh.
7
τότε οι (21) και (22) είναι μη αρνητικές, είναι μηδέν μόνο αν όλες οι παρατηρήσvεις
είναι ίσvες μεταξύ τους και όσvο περισvσvότερο αποκλίνουν οι παρατηρήσvεις από τη
διάμεσvο σvτην (21) ή τον μέσvο σvτην (22) τόσvο περισvσvότερο η τιμή τους αυξάνεται.
Αλλά όσvο αυξάνεται η τιμή των q και s2 τόσvο περισvσvότερο αυξάνεται η απόσvτασvη
των παρατηρήσvεων από το αντιπροσvωπευτικό μέσvο θέσvης. Επομένως η τιμή των q
και s2 σvχετίζεται άμεσvα με τη διασvπορά των δεδομένων από τη διάμεσvο ή τον μέσvο
και λέγονται μέτρα διασvποράς. Οι (21) και (22) αποτελούν μερικές περιπτώσvεις
του μέτρου
n
!1/p
1X
Lp = |xi − θ|p (23)
n i=1
όπου θ είναι ένα μέτρο θέσvης και p > 0. Για p = 1 έχουμε την (21) ενώ για p = 2
προκύπτει το s σvτην (22). Μπορεί να αποδειχθεί ότι:
δηλαδή L∞ = max{|x1 − θ|, |x2 − θ|, ...., |xn − θ|}, η μέγισvτη απόσvτασvη από το
μέτρο θέσvης. Το μέτρο q είναι γνωσvτό σvαν ‘απόλυτη απόκλισvη’. Το μέτρο s2
λέγεται ‘διακύμανσvη’ ενώ η (θετική) τετραγωνική του ρίζα s είναι γνωσvτή σvαν
‘τυπική απόκλισvη’.
Ο δειγματικός μέσvος x̄ και η δειγματική τυπική απόκλισvη ή η διακύμανσvη είναι
τα πιο γνωσvτά μέτρα θέσvης και διασvποράς αντίσvτοιχα. Υπολογίζονται αυτόματα
από τα σvτατισvτικά προγράμματα και όλα τα προγράμματα φύλλων εργασvίας όπως
το Excel .
n
X n
X
2
x2i + x̄2 − 2x̄xi
S= (xi − x̄) = (25)
i=1 i=1
n
X n n
X X
S= x2i + x̄2 − 2x̄xi = x2i + nx̄2 − 2nx̄2 = x2i − nx̄2
i=1 i=1 i=1
(26)
σvτην οποία έχουμε χρησvιμοποιήσvει την (3). Από την (26) και την (22) έχουμε:
Pn
2 S x2i
s = = i=1
− x̄2 (27)
n n
8
Από την (27) προκύπτει ότι μπορούμε να υπολογίσvουμε τη διακύμανσvη χωρίς να
πάρουμε διαφορές από τον μέσvο όπως σvτην (22) αλλά υπολογίζοντας μόνο το
άθροισvμα των τετραγώνων των αρχικών δεδομένων. Ας θεωρήσvουμε τα δεδομένα
X = {1, 2, 3} σvτα οποία έχουμε x̄ = 2 και s2 = 143 και s = 2, 16. Αν ωσvτόσvο
αντικατασvτήσvουμε το n με n − 1 σvτην (27) τότε θα είχαμε s2 = 1. Η δεύτερη
απάντησvη φαίνεται πιο ικανοποιητική εφόσvον η απόκλισvη των παρατηρήσvεων 1 και
3 από τον μέσvο είναι 1. Συχνά λοιπόν ορίζουμε:
Pn 2 Pn
(xi − x̄) x2i − nx̄2
s2 = i=1
= i=1
(28)
n−1 n−1
Από την (22) είναι σvαφές ότι η διακύμανσvη δεν είναι παρά ο αριθμητικός μέσvος των
2
(xi − x̄) , i = 1, ..., n. Φαινομενικά το πλήθος των παρατηρήσvεων είναι n αλλά
σvτην πραγματικότητα αν γνωρίζουμε τις n − 1 παρατηρήσvεις τότε η επόμενη μπορεί
πάντα να προσvδιορισvθεί με βάσvη την (18). Πραγματικά από την (18) έχουμε:
n
X n
X n−1
X
(xi − x̄) = 0 ⇒ xi = nx̄ ⇒ xn = nx̄ − xi (29)
i=1 i=1 i=1
ν =n−1 (30)
είναι γνωσvτή σvαν διόρθωσvη με τους λεγόμενους ‘βαθμούς ελευθερίας’.
Αν οι παρατηρήσvεις υποσvτούν έναν γραμμικό μετασvχηματισvμό όπως σvτην (12)
τότε θα έχουμε:
n
X n
X n
X n
X
2 2 2 2
(yi − ȳ) = (α + βxi − α − β x̄) = {β (xi − x̄)} = β 2 (xi − x̄)
i=1 i=1 i=1 i=1
(31)
Διαιρώντας κατά μέλη με n − 1 έχουμε:
sy = |β|sx (33)
9
Από τις σvχέσvεις (13) και (33) προκύπτει ότι ο δειγματικός μέσvος και η δειγματική
διακύμανσvη τροποποιούνται όταν τα δεδομένα υπόκεινται σv΄ έναν γραμμικό μετα-
σvχηματισvμό. Ο πολλαπλασvιασvμός με β αλλάζει τις μονάδες μέτρησvης (όπως όταν
αλλάζουμε το νόμισvμα από ευρώ σvε δολάρια) ενώ η πρόσvθεσvη της σvταθεράς α
γίνεται όταν πχ αλλάζουμε τις μονάδες μέτρησvης της θερμοκρασvίας από Κελσvίου
σvε Φαρενάϊτ. Αν υποθέσvουμε ότι α = 0 και β > 0 σvτην (13) τότε ο μέσvος και η
διακύμανσvη ενώ αλλάζουν έχουμε:
sy βsx sx
= = (34)
ȳ β x̄ x̄
q Pn 2
q Pn 2
i=1 (xi −x̄) i=1 (yi −ȳ)
όπου sx = n−1 και sy = n−1 . Το σvτατισvτικό μέτρο
sx
C= (35)
x̄
λέγεται σvυντελεσvτής μεταβλητότητας και όπως δείξαμε σvτην (34) δεν εξαρτάται
από αλλαγές σvτις μονάδες μέτρησvης ή από μεταβολές της κλίμακας. Φυσvικά δεν
ορίζεται για x̄ = 0. Η σvχέσvη (34) είναι χρήσvιμη όταν πρέπει να σvυγκρίνουμε τη
διασvπορά σvε δυο διαφορετικά σvύνολα δεδομένων τα οποία είναι εκφρασvμένα σvε
διαφορετικές μονάδες, πχ ευρώ και δολάρια. Μια λύσvη είναι ασvφαλώς πρώτα να
εκφράσvουμε τα δεδομένα σvτις ίδιες μονάδες και μετά να υπολογίσvουμε την τυπική
απόκλισvη ή τη διακύμανσvη ώσvτε να είναι σvυγκρίσvιμες. Η λύσvη αυτή έχει τα προ-
βλήματά της σvε ορισvμένες περιπτώσvεις. Για παράδειγμα ας υποθέσvουμε ότι έχουμε
τις αποδόσvεις δυο μετοχών Α και Β με x̄A = x̄B = 0, 07 (επομένως έχουν μέσvη
ημερήσvια απόδοσvη 7%) και sA = 0, 10, sB = 0, 20. Ενώ οι δυο μετοχές είναι σvτις
ίδιες μονάδες (% αποδόσvεις) και η μέσvη απόδοσvη είναι η ίδια, η διακύμανσvη της
μετοχής Β είναι πολύ μεγαλύτερη. Αυτό σvημαίνει ότι οι αποδόσvεις της μετοχής
Α θα τείνουν να κινούνται πλησvιέσvτερα προς τον μέσvο τους (δηλαδή x̄A ) και ε-
πομένως η μέσvη απόδοσvη 7% σvχετίζεται με μικρότερο κίνδυνο. Οι σvυντελεσvτές
μεταβλητότητας είναι 0,7 και 0,35 αντίσvτοιχα από τους οποίους είναι φανερό ότι η
μετοχή Α έχει μεγαλύτερο κίνδυνο.
Η σvυζήτησvη αυτή μας οδηγεί με φυσvικό τρόπο σvτο να θεωρήσvουμε την τυπική
απόκλισvη ή τη διακύμανσvη σvαν μέτρο κινδύνου των χρηματοοικονομικών αποδό-
σvεων γενικά. Το μέτρο αυτό χρησvιμοποιείται ευρύτατα αν και δεν υπάρχει λόγος
για τον οποίο η μέσvη απόλυτη απόκλισvη σvτην (21) να μην μπορεί επίσvης να θε-
ωρηθεί σvαν σvτατισvτικό μέτρο του κινδύνου. Στην πραγματικότητα αν η διάμεσvος
μπορεί να θεωρηθεί ως καλύτερο μέτρο θέσvης τότε από τη διαδικασvία με την οποία
οδηγηθήκαμε σvτην (21) το καλύτερο μέτρο διασvποράς θα είναι η μέσvη απόλυτη
απόκλισvη.
1.5 Isvtìgramma
10
διασvποράς. Για ένα σvύνολο δεδομένων X = {x1 , x2 , ..., xn } ας υποθέσvουμε ότι η ε-
λάχισvτη και μέγισvτη τιμή είναι α και β και αποφασvίζουμε να χωρίσvουμε το διάσvτημα
[a, b] σvε K + 1 < n κατηγορίες. Επομένως θα έχουμε τα υποδιασvτήματα:
[a, c1 ), [c1 , c2 ), ..., (cK , b].
PK
Αν έχουμε nk παρατηρήσvεις σvε κάθε υποδιάσvτημα (k = 1, ..., K και k=1 nk =
n) και το μέσvο του κάθε υποδιασvτήματος είναι mk , το ισvτόγραμμα είναι η γραφική
παράσvτασvη (mk , nk ). Οι ποσvότητες
nk
fk = , k = 1, ..., K (36)
n
λέγονται σvχετικές σvυχνότητες. Τα nk είναι γνωσvτά σvαν σvυχνότητες. Προφανώς
έχουμε
K
X
fk ≥ 0, fk = 1 (37)
k=1
Διάγραμμα 1.
3000
2500
2000
1500
1000
500
0
−4 −3 −2 −1 0 1 2 3 4 5
11
Διάγραμμα 2.
Το ισvτόγραμμα μας παρέχει μια σvαφή εικόνα σvχετικά με (α) τα μέτρα θέσvης και
διασvποράς, και (β) τις ακραίες αποδόσvεις. Σε πολλές περιπτώσvεις τα μέτρα θέσvης
και διασvποράς ενδέχεται να είναι παραπλανητικά όπως σvτο Διάγραμμα 3.
Διάγραμμα 3.
2500
2000
1500
1000
500
0
−4 −2 0 2 4 6 8 10 12 14
Ο μέσvος (2,95) και η διάμεσvος (0,56) σvτην περίπτωσvη αυτή δεν σvυνοψίζουν τα
δεδομένα με ορθό τρόπο. ΄Ενα κλασvσvικό παράδειγμα που οδηγεί σvε ισvτογράμματα
όπως αυτά σvτο Διάγραμμα 3 είναι όταν αναμιγνύονται διαφορετικοί ή ετερογε-
νείς ‘πληθυσvμοί’, πχ οι σvτρεμματικές αποδόσvεις ορεινών και πεδινών αγροκτημά-
των. ΄Ενα ακόμη παράδειγμα, αυτή τη φορά με βάσvη ημερήσvια σvτοιχεία του δείκτη
Dow − Jones (2/11/1998-18/5/2012) φαίνεται σvτο Διάγραμμα 4.
12
Διάγραμμα 4.
0.15
0.1
0.05
−0.05
−0.1
0 500 1000 1500 2000 2500 3000 3500 4000
800
600
400
200
0
−0.1 −0.05 0 0.05 0.1 0.15
Ερωτήσvεις.
13
2 Omadopoihmèna dedomèna
K
X
x̃ = mk fk (40)
k=1
K
X 2
s̃2 = (mk − x̃) fk (41)
k=1
K
X
fk (mk − x̃) = 0 (42)
k=1
K
X
s̃2 = fk m2k − x̃2 (43)
k=1
Οι ιδιότητες αυτές είναι ανάλογες με τις σvχέσvεις (18) και (26). Αξίζει να παρατη-
ρήσvουμε ότι αν f1 = f2 = ... = fK τότε αναγκασvτικά θα έχουμε f1 = f2 = ... =
fK = n1 και επομένως οι σvχέσvεις (42) και (43) καταλήγουν σvτις (18) και (26) ενώ
οι ορισvμοί (40) και (41) καταλήγουν σvτους (2) και (22).
Ας υιοθετήσvουμε τον σvυμβολισvμό:
n
X
E (X) ≡ pi xi (44)
i=1
2 EÐnai gnwsvtì ìti an èqoume n parathr sveic o bèltisvtoc arijmìc twn kathgori¸n K eÐnai
√
n.
14
όπου p=(p1 , ..., pn ) είναι σvταθμίσvεις και X = {x1 , ..., xn } είναι ένα σvύνολο δεδομέ-
νων. Υποθέτουμε ότι
n
X
pi ≥ 0, pi = 1 (45)
i=1
X
E {X − E (X)}2 ≡ pi (xi − E (X))2 (46)
X
E {X − E (X)}k ≡ pi {xi − E (X)}k , k = 1, 2, ... (47)
15
2.1 Ajroisvtikèc svuqnìthtec
k
X
Fk = fj , k = 1, 2, ..., K (48)
j=1
Η ποσvότητα αυτή μας δίνει την αναλογία των παρατηρήσvεων που ανήκουν σvτο k
υποδιάσvτημα ή σvε υποδιασvτήματα προς τ΄ αρισvτερά του. Μας δίνει, μ΄ άλλα λόγια,
την αναλογία των παρατηρήσvεων που είναι (προσvεγγισvτικά μιλώντας) μικρότερες
από mk -ακριβέσvτερα, μικρότερες από το άνω άκρο του υποδιασvτήματος που έχει
σvαν κεντρική τιμή του το mk . Ας υιοθετήσvουμε τον σvυμβολισvμό
16
η οποία περιλαμβάνει απλώς την αντικατάσvτασvη του ak με x, μια σvυνεχή μεταβλητή
και κυρίως την υποθεσvη ότι μπορούμε να περιγράψουμε την αθροισvτική σvυχνότητα
Fk με μια σvυνεχή σvυνάρτησvη F (x) και F : R → [0, 1]. Η λογική αυτής της
αντικατάσvτασvης είναι ότι εφόσvον έχουμε έναν άπειρα μεγάλο αριθμό παρατηρήσvεων
μπορούμε να έχουμε έναν άπειρα μεγάλο αριθμό κατηγοριών ak , δηλαδή K → ∞.
Αυτό σvημαίνει φυσvικά ότι h → 0. Αν υποθέσvουμε ότι h → 0 αλλά δεν είναι μηδέν
θα μπορούσvαμε να γράψουμε εναλλακτικά την (52) με την ακόλουθη μορφή:
F (x + h) − F (x)
f (x) = (55)
h
Λαμβάνοντας όρια και σvτα δυο μέλη, εφόσvον πρόκειται για ταυτότητα (ορισvμό)
έχουμε:
F (x + h) − F (x)
f (x) = lim (56)
h→0 h
΄Οταν το όριο υπάρχει και μπορούμε να υποθέσvουμε ότι η σvυνάρτησvη F (x) δεν
είναι απλώς σvυνεχής αλλά παραγωγίσvιμη, τότε:
dF (x)
f (x) = F 0 (x) = (57)
dx
Φυσvικά σvε όρους διαφορικών έχουμε:
ˆ ∞
f (x)dx = 1 (59)
−∞
το οποίο έχει την έννοια ότι το εμβαδόν κάτω από την καμπύλη f (x) σvυμφωνούμε
για ευκολία να είναι μονάδα. Οι σvχέσvεις (58) και (59) σvημαίνουν ότι:
17
όπου F (±∞) = limx→±∞ F (x). Η σvχέσvη (60) με τη σvύμβασvη ότι F (−∞) = 0
σvημαίνει ότι:
F (∞) = 1 (61)
Επίσvης, είναι φανερό από την (57) ότι F 0 (x) ≥ 0 και επομένως η αθροισvτική
σvυνάρτησvη δεν μπορεί να είναι φθίνουσvα σvε κανένα σvημείο της. Η ανάλυσvη αυτή
μας οδηγεί σvε δυο σvημαντικά σvυμπεράσvματα που θα έχουν κεντρική σvημασvία σvτη
θεωρία πιθανοτήτων.
Συμπέρασvμα 1. Αν εξειδικεύσvουμε μια παραγωγίσvιμη σvυνάρτησvη F (x)
ως την αθροισvτική σvυνάρτησvη τότε η σvυνάρτησvη σvυχνότητας f (x)
προκύπτει (από τη σvχέσvη (55» ως η παράγωγός της.
Συμπέρασvμα 2. Αν εξειδικεύσvουμε μια σvυνάρτησvη f (x) ως τη σvυνάρ-
τησvη σvυχνότητας τότε η αθροισvτική σvυνάρτησvη F (x) προκύπτει
από το ολοκλήρωμά της:
ˆ x
F (x) = f (t)dt (62)
−∞
Για να δούμε την ισvχύ της (62) ας θεωρήσvουμε την (57) από την οποία έχουμε:
ˆ x ˆ x ˆ x
0 0
F (t) = f (t) ⇒ F (t)dt = f (t)dt ⇒ F (x) + c = f (t)dt
−∞ −∞ −∞
(63)
Η σvταθερά της ολοκλήρωσvης c θα είναι μηδέν λόγω της (61). Δηλαδή, η γενική
´∞
λύσvη δίνεται από το τελευταίο σvκέλος της (63) αλλά αν λάβουμε όρια καθώς x → ∞
έχουμε: F (∞) + c = −∞ f (t)dt = 1 ⇒ c = 0.
Από τα Συμπεράσvματα 1 και 2 είναι σvαφές ότι μπορούμε να εξειδικεύσvουμε είτε
τη σvυνάρτησvη σvυχνότητας f (x) είτε την αθροισvτική σvυνάρτησvη F (x) εφόσvον αν
έχουμε τη μια εύκολα προκύπτει η άλλη.
(
1, x ∈ [0, 1]
Παράδειγμα. Ας υποθέσvουμε ότι f (x) =
0, διαφορετικά.
Είναι εύκολο
να διαπισvτώσvουμε ότι:
x, x ∈ [0, 1]
F (x) = 0, x < 0
1, x > 1.
18