Professional Documents
Culture Documents
Στατιστικές Κατανομές Και Πιθανότητες Θεωρία Και Παραδείγματα
Στατιστικές Κατανομές Και Πιθανότητες Θεωρία Και Παραδείγματα
ΕΙΣΑΓΩΓΗ
Παράδειγμα. 1) Ηλικία (15, 50, 60 κτλ), 2)Ύψος (1.75, 1.80, 1.90 κτλ). Μεταξύ
αυτών των μεμονωμένων τιμών λαμβάνονται όλες οι ενδιάμεσες τιμές. Δηλαδή,
υφίστανται ηλικίες 20 ετών και 2 μηνών, 35 ετών 5 μηνών και 4 ημερών κτλ. Ομοίως
υπάρχει τιμή ύψους 1.76, 1.77, 1.80 και 4 χιλιοστά κτλ
Συνεχής Κατανομή (Μη Φραγμένη). Τούτη η κατανομή λαμβάνει όλες τις πιθανές
τιμές στο διάστημα (-∞,+∞).
Συνεχής Κατανομή (Φραγμένη). Τούτη η κατανομή λαμβάνει όλες τις πιθανές τιμές
στο διάστημα [α,β]
Συνεχής Κατανομή (Μη αρνητική). Οι περισσότερες μη αρνητικές κατανομές
ορίζονται για x>γ ετσι ώστε x-γ>0, όπου γ είναι συνεχής παράμετρος.
Στην παρουσίασή μας δεν είναι δυνατόν να αναλύσουμε λεπτομερώς όλες τις
παραπανω κατανομές. Θα επιλέξουμε μερικές από αυτές οι οποίες έχουν ευρεία
χρήση και εφαρμογή. Εξάλλου πολλές από αυτές προσεγγίζονται ικανοποιητικά από
την κανονική κατανομή, όπως θα εξηγήσουμε παρακάτω, οπότε έχουμε την ευχέρεια
να χρησιμοποιούμε την κανονική κατανομή στην περίπτωση που αντιμετωπίζουμε
δυσκολίες με τη χρήση άλλων πιο εξειδικευμένων κατανομών.
----------------ΣΥΝΕΧΕΙΣ ΚΑΤΑΝΟΜΕΣ
1 − 1*( x − μ ) 2
f ( x) = e 2 σ , Συμβολισμός Χ~Ν(μ,σ)
σ * 2π
1
Συνάρτηση Πυκνότητας Πιθανότητας- Probability Density Function
2
−t
⎛x−μ⎞ 1 x
F(x)= Φ⎜ ⎟ , Φ είναι το ολοκλήρωμα Laplace // Φ(x)= * e 2∫ dt
⎝ σ ⎠ 2π 0
x−μ
Εναλλακτικά με μετασχηματισμό έχουμε ότι F(x)=z= ,
σ
0,32
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
Ορισμός
[μ-σ, μ+σ]Æ68.28%
[μ-2σ, μ+2σ]Æ95.44%
[μ-3σ, μ+3σ]Æ99.75%
Παράδειγμα
x−μ
Χρησιμοποιώντας τον μετασχηματισμό z= θα έχουμε ότι
σ
5−8
z= = -1
3
10 − 8
z= = 0.66
3
e−z
f ( x) = , Συμβολισμός X~Logistic(μ,σ)
− z 2
σ * (1 + e )
1
F ( x) = ,
1 + e−z
x−μ
Όπου z = ,
σ
σ>0 (scale parameter), μ ∈ R (location parameter) και − ∞ < x < +∞
2
Παχιές ουρέςÆ Πλακυκυρτη (Βαθμός Κυρτωσης<3) Λεπτές ουρέςÆ Λεπτοκυρτη (Βαθμός
Κυρτωσης>3)
ΓΡΑΦΗΜΑ LOGISTIC ΚΑΤΑΝΟΜΗΣ
0,32
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
Η κατανομή Cauchy επινοήθηκε από τους Augustin Cauchy και Hendrik Lorentz
Τούτη η κατανομή αποτελεί ένα πρότυπο για κατανομές που δεν έχουν μέση τιμή και
διακύμανση, εντούτοις η επικρατούσα τιμή και η διάμεσος είναι καλά ορισμένες.
Μοιάζει πολύ με την κατανομή Poisson Kernel.
Όταν δυο μεταβλητές Χ,Υ ακολουθούν την κανονική κατανομή με μέση τιμή ιση με
μηδέν και σταθερή διακύμανση ίση με την μονάδα, τότε το πηλίκο Χ/Υ ακολουθεί
την τυπική Cauchy κατανομή.
Συνάρτηση Πυκνότητας Πιθανότητας
x − μ 2 −1
f ( x) = (π *σ * (1 + ( ) )) , Συμβολισμός X~C(μ,σ)
σ
1 ⎛ x−μ⎞
F ( x) = arctan⎜ ⎟ + 0.5
π ⎝ σ ⎠
0,32
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
Histogram Cauchy
JOHNSON SU ΚΑΤΑΝΟΜΗ (JOHNSON SU DISTRIBUTION)
Τούτη η κατανομή που επινοήθηκε από τον Norman Lloyd Johnson (1917-2004).
Στην ίδια οικογένεια ανήκουν η Johnson SB και Log-Normal κατανομές. Αυτές οι
τρεις κατανομές είναι παρόμοιες με την κανονική κατανομή ωστόσο δεν έχουν τους
περιορισμούς της, καθώς διαθέτουν εκείνες τις ιδιότητες που τις καθιστούν ικανές να
προσαρμοστούν σε δεδομένα με διάφορες τιμές ασυμμετρίας και κύρτωσης, ιδιότητες
τις οποίες δεν διαθέτει η κανονική κατανομή.
Η κανονική κατανομή, γνωστή και ως ‘’καμπάνα’’, προσαρμόζεται σε δεδομένα
όπου υποθέτουμε ακολουθούν μια κατανομή μεσόκυρτη (βαθμός κυρτωσης=3) και
συμμετρική (βαθμός ασυμετριας=0). Ωστόσο, επειδή στην πράξη τούτο σπάνια
συμβαίνει, οι προαναφερθείσες κατανομές είναι ιδανικές σε περιπτώσεις όπου δεν
ισχύουν οι υποθέσεις της κανονικής κατανομής. Ειδικότερα για τις λεπτοκυρτες
κατανομές, οι Johnson SB, Johnson, SU και Log-Normal είναι αποτελεσματικότερες
και πιο ιδανικές από την κανονική.
2
2
− 0.5 * (γ + δ * ln( z + z + 1))
δ
f ( x) = *e ,
λ * 2π * z 2 + 1
Συμβολισμός Χ~ Jsu(γ,δ,λ,ξ)
Αθροιστική Συνάρτηση Πιθανότητας
2
−t
x −ξ 1 x 2
όπου z = , ΦÆΟλοκλήρωμα Laplace // Φ(x)= *∫e dt
λ 2π 0
0,32
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
Histogram Johnson SU
LAPLACE ή DOUBLE EXPONENTIAL ΚΑΤΑΝΟΜΗ
(LAPLACE ή DOUBLE EXPONENTIAL DISTRIBUTION)
Τούτη η κατανομή επινοήθηκε από τον Pierre-Simon Laplace. Ονομάζεται και double
exponential (διπλή εκθετική) κατανομή διοτι το γράφημά της μοιάζει με δυο
εκθετικές κατανομές η μια διπλά στην άλλη και συμμετρικές ως προς τον
κατακόρυφο άξονα..
Από μαθηματικής απόψεως έχει κοινά χαρακτηριστικά με την κανονική κατανομή
καθώς η μεν Laplace εκφράζεται σε απόλυτες διαφορές η δε κανονική σε διαφορές
τετραγώνων (βλ τα αντίστοιχα ‘’Συνάρτηση Πυκνότητας Πιθανότητας’’).
λ − λ* | x − μ |
f ( x) = * e , Συμβολισμός Χ~ Laplace(μ,λ)
2
1 − λ * ( μ − x) x≤μ
*e
2
F ( x) =
1 − λ * (x − μ)
1− *e x>μ
2
0,32
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
Histogram Laplace
3
Για μετοχές ισχύει συνήθως το εξής: Όταν η απόδοση μια μετοχής ακολουθει την κανονική κατανομή
τότε η τιμή ακολουθει την Log-Normal κατανομή
Συνάρτηση Πυκνότητας Πιθανότητας
2
⎛ ln( x − γ ) − μ ⎞
− 0.5 * ⎜ ⎟
e ⎝ σ ⎠
f ( x) = , Συμβολισμός Χ~ LogN(μ,σ,γ)
( x − γ ) *σ * 2 * π
ln( x − γ ) − μ ⎞
F ( x) = Φ⎛⎜ ⎟
⎝ σ ⎠
2
−t
1 x
ΦÆ Ολοκλήρωμα Laplace // Φ(x)= * ∫ e 2 dt
2π 0
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
− (x − γ )
α −1
(x − γ ) β
f ( x) = *e , Συμβολισμός Χ~ Γ(α,β,γ)
α
β * Γ(α )
Αθροιστική Συνάρτηση Πιθανότητας
Γ( x−γ ) / β (α )
F ( x) =
Γ(α )
x
Γx(α)Æ ‘’Ατελής’’ Συνάρτηση Gamma// Γx(α) = ∫ t a −1 * e − t dt
0
Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Gamma κατανομή
2-παραμετρων (Gamma 2Ρ). Το τυπολόγιο των συναρτήσεων των πιθανοτήτων της
Gamma 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0
Αν α ∈ Ζ τότε η Gamma κατανομή αναπαριστά την Erlang κατανομή
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
α −1 α
⎛ x −γ ⎞
−⎜
α ⎛⎜ x − γ ⎞ ⎟
⎟ ⎝ β ⎠
f ( x) = * *e , Συμβολισμός Χ~ W(α,β,γ)
β ⎜⎝ β ⎟
⎠
α
⎛ x −γ ⎞
−⎜ ⎟
F ( x) = 1 − e ⎝ β ⎠
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
x −γ β
+
β x −γ ⎛ 1 ⎛ x −γ β ⎞⎞
f ( x) = *φ ⎜ * ⎜ − ⎟⎟
2* a *(x − γ ) ⎜α ⎜ β x −γ ⎟⎟
⎝ ⎝ ⎠⎠
Συμβολισμός Χ~ BS(α,β,γ)
⎛ 1 ⎛ x −γ β ⎞⎟ ⎞⎟
F ( x) = Φ⎜ * ⎜ −
⎜α ⎜ β x − γ ⎟⎠ ⎟⎠
⎝ ⎝
2
−t
1 x
Όπου ΦÆ Ολοκλήρωμα Laplace // Φ(x)= * ∫ e 2 dt
2π 0
− x2
e 2
φÆ
2 *π
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
Η κατανομή Erlang επινοήθηκε από τον μαθηματικό Agner Krarup Erlang (1878 –
1929). Ανήκει στην ίδια οικογένεια και έχει πολλές ομοιότητες με την Gamma και
Exponential κατανομή. Αρχικά χρησιμοποιήθηκε από τον Agner Krarup Erlang για
να μελετήσει τον ρυθμό των τηλεφωνικών κλήσεων που γίνονται την ίδια ώρα σε ένα
σταθμό. Μετέπειτα εφαρμόστηκε στις στοχαστικές διαδικασίες και τα
βιομαθηματικά.
Παρατηρώντας προσεκτικά το τυπολόγιο της Erlang και της Gamma κατανομής θα
διαπιστώσουμε ότι πρόκειται για ακριβώς τις ίδιες εξισώσεις με την μόνη διαφορά ότι
η shape parameter της Erlang (m) ανήκει στους θετικούς ακέραιους αριθμούς ενώ η
shape parameter της Gamma (α) ανήκει στους θετικούς αριθμούς. Εναλλακτικά
μπορεί να ειπωθεί ότι η Erlang αποτελεί ειδική περίπτωση της Gamma. Να
σημειώσουμε επιπλέον ότι για m=1 η Erlang καταλήγει στην Exponential κατανομή.
− (x − γ )
m −1
(x − γ ) β
f ( x) = *e , Συμβολισμός Χ~ Erlang(m,β,γ)
m
β * Γ ( m)
Γ( x−γ ) / β ( m)
F ( x) =
Γ( m)
x
Γx(α)Æ ‘’Ατελής’’ Συνάρτηση Gamma// Γx(α) = ∫ t a −1 * e − t dt
0
Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Erlang κατανομή 2-
παραμετρων (Erlang 2Ρ). Το τυπολόγιο των συναρτήσεων των πιθανοτήτων της
Erlang 2Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0
ΓΡΑΦΗΜΑ ERLANG ΚΑΤΑΝΟΜΗΣ
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
F ( x) = 1 − exp − λ * ( x − γ )
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
Αυτή η κατανομή επινοήθηκε από τον Άγγλο μαθηματικό Karl Pearson (1857-1936)
και χρησιμοποιήθηκε αρχικά για μελέτες βιοστατιστικης. Μετέπειτα και με την
εξέλιξη των υπολογιστών εφαρμόστηκε στις χρηματοοικονομικές αναλύσεις, στην
συμπεριφορά των αποδοσεων των μετοχών, στα επιτόκια, στις συναλλαγματικές
ισοτιμίες, στις συχνότητα των πλημμύρων και των σεισμών κτλ. Είναι επίσης
ιδιαίτερα χρήσιμη στις περιπτώσεις όπου η κατανομή εμφανίζει διάφορες μορφές
κύρτωσης. Εκτός από την Pearson Type6 κατανομή προηγήθηκαν 5 ακόμα τύποι
κατανομών οι όποιοι είτε βελτίωναν είτε συμπλήρωναν είτε επέκτειναν τις
δυνατότητες τις προηγούμενης εξίσωσης της κατανομής.
Σε ότι αφόρα την σχέση της με τις υπόλοιπες κατανομές, έχει αποδειχτεί ότι
εμφανίζει αρκετές ομοιότητες με την Cauchy, Κανονική, Βeta, Gamma, X2 και την F
κατανομή.
x − γ a1 − 1
( )
f ( x) = b
x − γ a1 + a 2
b * B(a , a ) * (1 + ( ))
1 2 b
F ( x) = I (a , a2 )
x −γ 1
x −γ +b
Όπου α1, α2, b, γ είναι παράμετροι με α1,α2,b>0 , γ ≤ x ≤ +∞
a −1
1 a −1
BÆ Συνάρτηση Beta: B(α1,α2)= ∫ t 1 * (1 − t ) 2 dt
0
B x ( a1 , a 2 )
Iz Æ Κανονικοποιημένη ‘’Ατελής’’ Συνάρτηση Beta: Ix=
B (a1 , a 2 )
Σημείωση: Στην περίπτωση όπου γ=0, τότε καταλήγουμε στην Pearson κατανομή
3-παραμετρων (Pearson 3Ρ). Το τυπολόγιο των συναρτήσεων των πιθανοτήτων της
Pearson 3Ρ είναι το ίδιο όπως τα παραπανω με τη διαφορά ότι θέτουμε γ=0
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
1 1
− −1−
− (1 + k * z ) k * (1 + k * z ) k
1 k ≠0
*e
f ( x) = σ
−z
(− z − e )
1 k =0
*e
σ
Συμβολισμός Χ~ GEV(μ,σ,k)
Αθροιστική Συνάρτηση Πιθανότητας
1
−
− (1 + k * z ) k
k ≠0
e
F ( x) =
−z
(− z − e )
k =0
e
x−μ
Όπου z= , σ>0
σ
x−μ
1+ k > 0 για k ≠ 0 και − ∞ < x < +∞ για k =0
σ
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
−1
−|c *z|
f ( x) = c *σ − 1 * e 0 Συμβολισμός Χ~ Error(μ,σ,k)
1
⎛ 1 ⎞
⎜ Γ ( )⎟
⎜ |c *z| k ⎟
k
0.5 * ⎜1 + 0 ⎟ x≥μ
⎜ 1 ⎟
⎜ Γ( ) ⎟
⎜ k ⎟
⎝ ⎠
F ( x) = ⎛ 1 ⎞
⎜ Γ ( )⎟
⎜ |c *z| k ⎟
k
0.5 * ⎜1 − 0 ⎟ x<μ
⎜ 1 ⎟
⎜ Γ( ) ⎟
⎜ k ⎟
⎝ ⎠
1
⎛ 3 ⎞ 2 ⎛ ⎞
⎜ Γ( ) ⎟ ⎜ k *c ⎟ x−μ
Όπου c0 = ⎜ k ⎟ c1 = ⎜ 0 ⎟ z=
⎜ Γ( 1 ) ⎟ ⎜ 2 * Γ( 1 ) ⎟ σ
⎜ ⎟ ⎜ ⎟
⎝ k ⎠ ⎝ k ⎠
x
Γx(α)Æ ‘’Ατελής’’ Συνάρτηση Gamma// Γx(α) = ∫ t a −1 * e − t dt
0
Σημείωση: Για k=2 η Error καταλήγει στην Κανονική κατανομή ενώ για k=1
καταλήγει στην Laplace
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
Histogram Error
F -ΚΑΤΑΝΟΜΗ (F- DISTRIBUTION)
ν ν2
1 (ν * x) 1 *ν
f ( x) = * 1 1 Συμβολισμός Χ~ F(ν1,ν2)
x * B(ν ,ν ) ν 1 +ν 2
1 2 (ν * x +ν )
1 2
F ( x) = Ι (ν 1 ,ν )
z 2
1
a −1 a −1
BÆ Συνάρτηση Beta: B(α1,α2)= ∫ t 1 * (1 − t ) 2 dt
0
B x ( a1 , a 2 )
Iz Æ Κανονικοποιημενη ‘’Ατελής’’ Συνάρτηση Beta: Ix=
B(a1 , a 2 )
ν1 * x
z=
ν1 * x +ν 2
ν − (x − γ )
(x − γ ) 2 − 1 *e 2
f ( x) = Συμβολισμός Χ~ Χ2(ν,γ)
ν
ν
2 2 * Γ( )
2
ν
Γ ( )
( ) 2
x
F ( x) = 2
ν
Γ( )
2
x
Γx(α)Æ ‘’Ατελής’’ Συνάρτηση Gamma// Γx(α) = ∫ t a −1 * e − t dt
0
∞
Γ(α)Æ Συνάρτηση Gamma// Γ(α) = ∫ t a −1 * e − t dt
0
γ (location parameter)
Η ομοιόμορφη κατανομή είναι μια από τις πιο συχνές και απλές κατανομές που
μπορούν να συναντηθούν στις αναλύσεις και τη έρευνα. Είναι επίσης γνωστή με το
όνομα ορθογωνική κατανομή εξαιτίας του σχήματός της. Μερικές μεταβλητές που
συνήθως ακολουθούν την ομοιόμορφη κατανομή είναι το ύψος, ηλικία και βάρος των
μαθητών μιας συγκεκριμένης σχολικής τάξης (π.χ. οι μαθητές τη Γ λυκείου έχουν
άλικα από 17-18 ετών με όλες τις ενδιάμεσες τιμές να είναι πιθανές, έχουν περίπου
ίδιο ύψος (τόσο τα αγόρια οσο και τα κορίτσια) και περίπου ίδιο βάρος. Άλλο
παράδειγμα είναι ο μισθός μιας συγκεκριμένης κατηγορίας υπάλληλων σε μια
επιχείρηση (π.χ. υπάλληλοι γραφείου)
Τούτη η κατανομή είναι εύκολη στη χρήση της, ενώ παράλληλα το τυπολογιο της
είναι εξαιρετικά απλό και εύχρηστο, όπου δεν χρειάζεται η χρήση Η/Υ. Επιπλέον με
την χρήση διαφόρων μετασχηματισμών η ομοιόμορφη κατανομή σχετίζεται με την
εκθετική, την Beta και την τριγωνική κατανομή
1
f ( x) = , Συμβολισμός Χ~ U(a,b)
b−a
x−a
F ( x) =
b−a
0,32
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
Histogram Uniform
Παράδειγμα
Αρχικά κατασκευάζουμε τον παρακάτω πίνακα στον οποίο έχουμε υπολογίσει όλα τα
πιθανά αθροίσματα
1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
Παρατηρούμε ότι έχουμε 36 (6*6) πιθανά ενδεχόμενα. Έχοντας τούτο υπόψη μας
μπορούμε να απαντήσουμε στα ερωτήματα.
Γενικά όλα τα διπλά νούμερα (άσσοι, δίπλες, τριάρες…..) έχουν πιθανότητα p=1/36
να εμφανιστούν
Αρά Ρ(ολικό)=Ρ(2,3)+Ρ(3,2)=1/6*1/6+1/6*1/6=1/36+1/36=2/36
Ομοίως στο ίδιο συμπέρασμα καταλήγουμε από τον παραπανω πίνακα.
4
A-PrioriÆ Οι πιθανότητες των ενδεχομένων είναι γνώστες εκ των πρότερων. π.χ. Ρίψη ενός ζαριού
Α-Posteriori (εμπειρική πιθανότητα)Æ Οι πιθανότητες των ενδεχομένων είναι γνωστές αφού
ολοκληρωθεί το πείραμα. Π.χ. Σουτ από την γραμμή των βολών σε έναν αγώνα μπάσκετ.
Συνάρτηση Πυκνότητας Πιθανότητας
a −1 a −1
1 ( x − a) 1 * (b − x) 2
f ( x) = *
B(a , a ) a + a −1
1 2 (b − a) 1 2
Συμβολισμός Χ~ Βeta(α1,α2, α, b)
F ( x) = I (a , a2 )
z 1
1
a −1 a −1
BÆ Συνάρτηση Beta: B(α1,α2)= ∫ t 1 * (1 − t ) 2 dt
0
B x ( a1 , a 2 )
Iz Æ Κανονικοποιημενη ‘’Ατελής’’ Συνάρτηση Beta: Ix=
B (a1 , a 2 )
Παρατηρήσεις
Για α1<1 και α2 ≥ 1 ή α1=1 και α2>1 Æ Η Beta κατανομή είναι φθίνουσα συνάρτηση
Για α1>1 και α2 ≤ 1 ή α2=1 α2<1Æ Æ Η Beta κατανομή είναι αύξουσα συνάρτηση
Για α1<1 και α2<1Æ Η Beta κατανομή έχει σχήμα U (U-shaped). Μοιάζει με το
παρακάτω γράφημα γυρνώντας το ανάποδα
Για α1>1, α2>1Æ Η Beta είναι unimodal (Έχει δηλαδή μια επικρατούσα τιμη.
Γραφικά αυτό ορίζεται με τη συνάρτηση πυκνότητας πιθανότητας να έχει μια μόνο
κορυφή. Βλ το παρακάτω γράφημα ‘’unimodal-bimodal’’ )
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
Histogram Beta
KUMARASWAMY ΚΑΤΑΝΟΜΗ (KUMARASWAMY DISTRIBUTION)
a −1 a a −1
a *a * z 1 * (1 − z 1 ) 2
f ( x) = 1 2
(b − a)
Συμβολισμός Χ~ Kumaraswamy(α1,α2, α, b)
Αθροιστική Συνάρτηση Πιθανότητας
a a
F ( x) = 1 − (1 − z 1 )
2
x−a
Όπου α1, α2, α, b είναι παράμετροι με α1,α2>0 και α<b, a ≤ x ≤ b , z= ,
b−a
α1,α2 (shape parameter)
Παρατηρήσεις
Για α1<1 και α2 ≥ 1 ή α1=1 και α2>1 Æ Η Kumaraswamy είναι φθίνουσα συνάρτηση
Για α1<1 και α2<1Æ Η Kumaraswamy κατανομή έχει σχήμα U (U-shaped). Μοιάζει
με το παρακάτω γράφημα γυρνώντας το ανάποδα
Για α1>1, α2>1Æ Η Kumaraswamy είναι unimodal (Έχει δηλαδή μια επικρατούσα
τιμη)
ΓΡΑΦΗΜΑ KUMARASWAMY ΚΑΤΑΝΟΜΗΣ
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
Histogram Kumaraswamy
0,32
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
0,32
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
0,32
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
0,32
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
0,32
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
0,32
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
0,32
0,28
0,24
0,2
f(x)
0,16
0,12
0,08
0,04
0
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
x
Τελειώνοντας να τονίσουμε ότι το πρόγραμμα Easy Fit 5.1 εχει την δυνατότητα
σύγκρισης των κατανομών με τρία κριτήρια ώστε να επιλέξουμε ποια από όλες
προσαρμόζεται καλύτερα στα δεδομένα μας. Τα κριτήρια που χρησιμοποιούνται είναι
οι στατιστικές Kolmogorov-Smirnov, Anderson-Darling και η Chi-Squared, Καθεμία
επικεντρώνεται σε διαφορετικά γνωρίσματα και χαρακτηριστικά και εξάγει
διαφορετικά αποτελέσματα. Ωστόσο είναι στην διακριτική ευχέρεια του αναλυτή να
δώσει βαρύτητα στα κριτήρια που επιθυμεί και να επιλέξει τη στατιστική μέθοδο με
την οποία θα γίνει η σύγκριση των κατανομών. Παρακάτω ακολουθεί ο πίνακας με
την ταξινόμηση των κατανομών.
Goodness of Fit – Summary
Kolmogorov Anderson
Chi-Squared
Distribution Smirnov Darling
Statistic Rank Statistic Rank Statistic Rank
Normal 0,05615 1 0,23175 9 1,5421 5
Beta 0,05627 2 0,22765 8 1,5311 2
Pearson 6 (4P) 0,05665 3 0,22592 6 1,5333 3
Fatigue Life (3P) 0,05684 4 0,22559 5 1,5337 4
Johnson SU 0,05764 5 0,19995 1 1,9826 9
Lognormal (3P) 0,05888 6 0,22212 3 2,0897 10
Error 0,05989 7 0,20537 2 1,5881 8
Gen. Extreme Value 0,06144 8 0,27963 11 1,0682 1
Gamma (3P) 0,06228 9 0,22488 4 1,5591 7
Logistic 0,06339 10 0,22756 7 2,2183 11
Weibull (3P) 0,06475 11 0,3477 12 2,5702 12
Kumaraswamy 0,06487 12 0,34846 13 2,5706 13
Erlang (3P) 0,0685 13 0,2426 10 1,5534 6
Cauchy 0,0892 14 1,2244 15 10,665 14
Laplace 0,10541 15 0,87108 14 14,147 15
Θεωρούμε την τυχαία μεταβλητή Χ που εκφράζει τον αριθμό των επιτυχιών. Η
πιθανότητα να έχουμε k επιτυχίες σε n ανεξάρτητα πειράματα με πιθανότητα
επιτυχίας p κάθε φορά είναι:
⎛ n⎞
f ( x) = ⎜⎜ ⎟⎟ * p x * (1 − p) n − x , Συμβολισμός Χ ~ Β(n,p)
⎝ x⎠
n
F ( x) = ∑ p * (1 − p) n − i
i=0
⎛n⎞ n!
Όπου ⎜⎜ ⎟⎟ = , πιθανότητα 0<p<1 και 0 ≤ x ≤ n
⎝ x ⎠ (n − x)! x!
Παράδειγμα 1.
Σε μια πολύ το 48% των παιδιών είναι αγόρια (Α) και το 52% κορίτσια (Κ). Αν
επιλέξουμε μια πενταμελή οικογένεια να βρεθούν
ι) Πιθανότητα να έχει μόνο αγόρια.
ιι) Πιθανότητα να έχει ένα κορίτσι
ιιι) Πιθανότητα να έχει τουλάχιστον ένα αγόρι
ιv) Πιθανότητα να έχει το πολύ ένα κορίτσι.
Έστω Α ο αριθμός των αγοριών και Κ ο αριθμός των κοριτσιών. Από τα δεδομένα
του προβλήματος έχουμε ότι το Α είναι τυχαία μεταβλητή λαμβάνοντας τις τιμές
0,1,2,3,4,5 και ακολουθεί την διωνυμική κατανομή Β(5,0.48) Ομοίως και για το Κ
ακολουθεί την διωνυμικη κατανομή Β(5,0.52).
⎛ 5⎞
ι) Ρ(Α=5) = ⎜ ⎟ * 0.485 * (1 − 0.48) 5 − 5 = 0.025
⎜ 5⎟
⎝ ⎠
⎛ 5⎞
ιι) Ρ(Κ=1) = ⎜ ⎟ * 0.521 * (1 − 0.52) 5 − 1 = 0.138
⎜1⎟
⎝ ⎠
⎛ 5⎞
iii) Ρ(Α ≥ 1) = 1-Ρ(Α=0)= 1- ⎜ ⎟ * 0.480 * (1 − 0.48) 5 − 0 = 0.962
⎜ 0⎟
⎝ ⎠
⎛ 5⎞ ⎛ 5⎞
⎜⎜ ⎟⎟ * 0.52 0 * (1 − 0.52)5 − 0 + ⎜⎜ ⎟⎟ * 0.521 * (1 − 0.52)5 − 1 = 0.025+0.138=0.163
⎝ 0⎠ ⎝1⎠
(Το πολύ ένα κορίτσι συνεπάγεται ότι θα έχουμε είτε ένα είτε κανένα κορίτσι)
Παράδειγμα 2.
Έστω ότι ένας πωλητής εχει πιθανότητα p=28% να επιτύχει πώληση. Έστω ότι ο
πωλητής σε μια τυχαία ημέρα τηλεφωνεί σε 12 άτομα.
Να υπολογισθούν:
i) Η πιθανότητα να επιτύχει 4 πωλήσεις.
ii) Η πιθανότητα να επιτύχει το πολύ 2 πωλήσεις.
iii) Η πιθανότητα να επιτύχει τουλάχιστον 3 πωλήσεις.
⎛12 ⎞
i) Ρ(Χ=4) = ⎜ ⎟ * 0.28 4 * (1 − 0.28)12 − 4 = 0.2197
⎜4⎟
⎝ ⎠
λx * e− λ
f ( x) = Συμβολισμός Χ~ Po(np)
x!
x λi
F ( x) = e − λ * ∑
i=0
i!
Έστω Χ η μεταβλητή που εκφράζει τον αριθμό των οδηγών που δεν έχουν θεωρήσει
το δίπλωμά τους. Επειδή πιθανότητα p=0.05<0.2 και δείγμα n=50>20, η μεταβλητή
προσεγγίζεται από την κατανομή Poisson. Άρα έχουμε ότι λ=n*p=0.05*20Æ λ=2.5
2.5 2 * e −2,5
i) p(X=2)= =0.2562
2!
iι) p(X ≤ 2)= p(X=0)+ p(X=1)+ p(X=2) =
2.5 0 * e −2.5 2.51 * e −2.5 2.5 2 * e −2.5
+ + =0.5432
0! 1! 2!
2) Έστω σε ένα γραφείο δέχονται 2 φαξ ανα 4 ώρες τα οποία απαντώνται με ρυθμό 2
φαξ ανα 6 ώρες
i) Ποια η πιθανότητα σε μια μέρα να λάβουμε τουλάχιστον 4 φαξ;
ii) Ποια η πιθανότητα να απαντήσουμε σε τρία φαξ σε μια μερα;
iii) Έστω ότι δεν έχουμε κανένα φαξ. Ποια η πιθανότητα να λάβουμε 6 φαξ σε μια
μέρα και να μην προλάβουμε απαντήσουμε σε όλα;
Έστω Χ ο αριθμός των φαξ που λαμβάνουμε κα Υ ο αριθμός των φαξ που απαντάμε
Από τα δεδομένα έχουμε ότι λαμβάνουμε 2 φαξ/ 4 ώρεςÆ 12 φαξ/ 24ώρες. Επίσης
απαντάμε σε 2 φαξ/6ωρεςÆ 8 φαξ/24 ώρες
83
−8
ii) Ρ(Υ=3) = e * = 0,0286
3!
12 6
−12
(e * ) * [ P (Y = 5) + P (Y = 4) + P (Y = 3) + P (Y = 2) + P (Y = 1) + P (Y = 0)]
6!
12 6 85 8 4 −8 8 3 82 81 −8 8 0
−12
(e * ) * [ e * + e * +e * + e * + e * +e * ] = 0,0048
−8 −8 −8 −8
6! 5! 4! 3! 2! 1! 0!
f ( x) = p * (1 − p) x Συμβολισμός Χ~Ge(p)
F ( x) = 1 − (1 − p) x + 1
1
Μαθηματική Ελπίδα: E(X)=
p
1− p
Διακύμανση V(X)=
p2
Παράδειγμα.
1 5
P(x)= * ( ) 4 = 0,0803. Η πιθανότητα να φέρουμε 1 στην 5η ρίψη είναι p=0.0803
6 6
2) Ένας παίχτης μπάσκετ ρίχνει βολές με επιτυχία 93%. Ποια η πιθανότητα να μην
αστοχήσει μέχρι την 20η βολή;
Ρ(x)= 0.07*0.9319 = 0.0176. Η πιθανότητα να μην αστοχήσει μέχρι την 20η βολή είναι
0.0176
ΥΠΕΡΓΕΩΜΕΤΡΙΚΗ ΚΑΤΑΝΟΜΗ (HYPERGEOMETRIC DISTRIBUTION)
⎛ m⎞ ⎛ N − m⎞
⎜ ⎟ *⎜ ⎟
−
f ( x) = ⎝ ⎠ ⎝ ⎠,
x n x
Συμβολισμός X ~ h(N,m,n)
⎛N⎞
⎜ ⎟
⎝n⎠
⎛ m⎞ ⎛ N − m⎞
⎜ ⎟*⎜ ⎟
x ⎝ i ⎠ ⎝ n−i ⎠
F ( x) = ∑
i=0 ⎛N⎞
⎜ ⎟
⎝n⎠
n*m
Μαθηματική Ελπίδα: E(X)=
N
n * m * ( N − m) * ( N − n)
Διακύμανση V(X)=
N 2 * ( N − 1)
Όπου nÆ Μέγεθος δείγματος , mÆΑριθμός επιτυχιών πληθυσμού,
NÆ Μέγεθος πληθυσμού, xÆ Αριθμός επιτυχιών δείγματος
Ισχύουν επίσης ότι
max(0, n+m-N)< x <min(n,m) , 0<n ≤ N , 0<m ≤ N
⎛a⎞ a!
Υπενθυμίζουμε επίσης ότι ⎜⎜ ⎟⎟ =
⎝ b ⎠ (a − b)!b!
Παράδειγμα
1) Υποθέτουμε ότι σε ένα δοχείο έχουμε 50 βόλους. Από αυτούς 5 είναι άσπροι ναι
45 μαύροι. Επιλεγούμε στην τύχη 10 βόλους χωρίς επαναφορά στο δοχείο. Ποια η
πιθανότητα να έχουμε 4 άσπρους από τους 10 βόλους που επιλέξαμε;
⎛ 5 ⎞ ⎛ 50 − 5 ⎞ ⎛ 5 ⎞ ⎛ 45 ⎞
⎜ ⎟ *⎜ ⎟ ⎜ ⎟ *⎜ ⎟
⎝ 4 ⎠ ⎝10 − 4 ⎠ ⎝ 4 ⎠ ⎝ 6 ⎠ =……=0.0039
f (x) = =
⎛ 50 ⎞ ⎛ 50 ⎞
⎜ ⎟ ⎜ ⎟
⎝ 10 ⎠ ⎝ 10 ⎠
Η πιθανότητα να έχουμε 4 άσπρους βόλους από τους 10 βόλους που επιλέξαμε είναι
0.0039
2) Διαθέτουμε μια τράπουλα 52 φύλλων. Επιλεγούμε 8 φύλλα χωρίς επαναφορά.
Ποια η πιθανότητα να έχουμε 2 Βαλέδες στα 8 φύλλα;
(Η τράπουλα διαθέτει τους αριθμούς 1,2,3….,10 και τις 3 φιγούρες στα τέσσερα
χρώματα: καρό, μπαστούνι, σπαθί και κούπα. Σύνολο 52 τραπουλόχαρτα)
⎛ 4 ⎞ ⎛ 52 − 4 ⎞ ⎛ 4 ⎞ ⎛ 48 ⎞
⎜ ⎟*⎜ ⎟ ⎜ ⎟ *⎜ ⎟
⎝ 2⎠ ⎝ 8 − 2 ⎠ ⎝ 2 ⎠ ⎝ 6 ⎠ =……=0.0978
f (x) = =
⎛ 52 ⎞ ⎛ 52 ⎞
⎜ ⎟ ⎜ ⎟
⎝8⎠ ⎝8⎠
−θ x
f ( x) = , Συμβολισμός Χ~log(θ)
x * ln(1 − θ )
Αθροιστική Συνάρτηση Πιθανότητας
−1 x θι
F ( x) = * ∑
ln(1 − θ ) ι = 1 ι
−p
Μαθηματική Ελπίδα: E(X)=
ln(1 − p ) * (1 − p )
p + ln(1 − p )
Διακύμανση V(X)= − p *
(1 − p ) 2 * ln 2 (1 − p )
ΠΑΡΑΡΤΗΜΑ
Το excel διαθέτει τις εξης κατανομές, οι οποίες είναι αρκετά εύκολες στη χρήση τους.
1) Κατανομή Beta
Αθροιστική Συνάρτηση Πιθανότητας Æ BETADIST
Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας Æ BETAINV
2) Κατανομή Nomral
Αθροιστική Συνάρτηση Πιθανότητας Æ NORMDIST
Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας Æ NORMINV
3) Κατανομή X2
Αθροιστική Συνάρτηση Πιθανότητας Æ CHIDIST
Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας Æ CHIINV
4) Κατανομή F
Αθροιστική Συνάρτηση Πιθανότητας Æ FDIST
Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας Æ FINV
5) Κατανομή Gamma
Αθροιστική Συνάρτηση Πιθανότητας Æ GAMMADIST
Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας Æ GAMMAINV
6) Κατανομή T-student (Παρομοια με την Κανονική. Χρησιμοποιείται όταν έχουμε
μικρό αριθμό παρατηρήσεων, λιγότερες από 50)
Αθροιστική Συνάρτηση Πιθανότητας Æ ΤDIST
Αντίστροφο της Αθροιστική Συνάρτηση Πιθανότητας Æ ΤINV
7) ΔιωνυμικηÆ BINOMDIST
8) ΥπεργεωμετρικηÆ HYPDEOMDIST
9) PoissonÆ POISSON
ΑΝΑΦΟΡΕΣ- ΒΙΒΛΙΟΓΡΑΦΙΑ