You are on page 1of 6

2.

11 ΓΕΩΜΕΤΡΙΚΗ ΚΑΤΑΝΟΜΗ

Αν αντί της ερώτησης "πόσες επιτυχίες σημειώνονται σε n δοκιμές


Bernoulli;" ενδιαφέρει η ερώτηση "πόσες δοκιμές απαιτούνται μέχρι να
σημειωθεί η πρώτη επιτυχία;", οδηγούμαστε σε μία κατανομή πιθανότητας
που διαμορφώνεται διαφορετικά από την κατανομή Bernoulli. Υποθέτουμε
και σε αυτήν την περίπτωση στατιστική ανεξαρτησία των στοιχείων της
ακολουθίας των δοκιμών και υποθέτουμε επίσης ότι η πιθανότητα
επιτυχούς έκβασης μίας δοκιμής είναι σταθερά p για όλες τις δοκιμές. Η
πιθανότητα εμφάνισης της πρώτης επιτυχίας στην n δοκιμή από μία
ακολουθία Ν δοκιμών, σημαίνει ότι προηγήθηκαν n-1 ανεπιτυχείς δοκιμές
και έτσι διαμορφώνεται ως εξής:
Ρ(N=n) =pN(n) = (1-p)n-1p, n=1,2,3, …
Ας σημειωθεί ότι Ν μπορεί να πάρει τιμές μέχρι άπειρο. Η α.σ.κ.. της
τ.μ. Ν αναφέρεται ως Γεωμετρική κατανομή.

σ.π.π. Γεωμετρικής Κατανομής με p=0,6

0,7
0,6
0,5
0,4
pΝ(n)

0,3
0,2
0,1
0
0 1 2 3 4 5 6 7 8 9 10 11 12
Αριθμός επιτυχιών μέχρι την πρώτη επιτυχία

H Γεωμετρική κατανομή περιγράφει την κατανομή του αριθμού δο-


κιμών που απαιτούνται σε μια ακολουθία Bernoulli, μέχρι να πραγ-
ματοποιηθεί ένα ενδεχόμενο (που αφορά την ακολουθία Bernoulli).
Αν λοιπόν Τ ο αριθμός επιτυχιών μέχρι την 1η επιτυχία, η σ.π.π.
έχει τη μορφή
fT(t) = pqt-1
όπου p και q όπως και στην κατανομή Bernoulli.
Η Γεωμετρική α.σ.κ. δίνεται με τη σχέση:
n 1
(1  p) n  1
FN (n)   (1  p) j p = p =1-(1-p)n
j 1 (1  p)  1 2.12.1

Σημείωση
Κύριες περιγραφικές παράμετροι (ή ροπές) της γεωμετρικής κατανομής.
Αποδεικνύεται ότι

1
E[ N ]   n(1  p) n 1 p 
j 1 p 2.12.2

που σημαίνει ότι η μέση τιμή εμφάνισης της πρώτης επιτυχίας είναι το
αντίστροφο της πιθανότητας επιτυχίας μιας δοκιμής. Αν λοιπόν
θεωρήσουμε ότι σε μια παραγωγική διαδικασία, που έχει τα χαρακτηριστικά
των δοκιμών Bernoulli, ενδιαφέρει ο προσδιορισμός του αριθμού των
μονάδων προϊόντος που πρέπει να ελεγχθούν μέχρι να εντοπιστεί το
πρώτο ελαττωματικό, εύκολα αυτό προσδιορίζεται με βάση την
εξακριβωμένη σχετική συχνότητα εμφάνισης ελαττωματικού προϊόντος,
όπως αυτή έχει προκύψει μετά από μακροχρόνιες παρατηρήσεις κάτω από
σταθερές συνθήκες λειτουργίας της παραγωγικής μονάδας. Όταν η
ακολουθία των δοκιμών είναι χρονικά εξαρτημένη, όπως θα συνέβαινε όταν
ενδιαφέρει μία ακολουθία σεισμικών δονήσεων σε συγκεκριμένη γεωγραφική
περιοχή, η μέση τιμή θα καλείται και χρόνος πρώτης επαναφοράς.
Η μεταβλητότητα Var[N] εύκολα αποδεικνύεται ότι είναι :
1 p
Var[N] = Ε[Ν2] -Ε2[Ν] = .
p2

Παράδειγμα 2.6.5
Τα μηχανήματα δοκιμάζονται σε λειτουργίες υπερφορτώσεων. Η πιθανότητα
του κάθε μηχανήματος να περάσει την δοκιμασία είναι 4/5 και η διαδικασία
χαρακτηρίζεται ως στατιστικά ανεξάρτητη. Οι δόκιμες σταματάνε μόλις κάποιο
μηχάνημα αποτύχει να περάσει την δοκιμασία. Υπολογίστε για μια σειρά
κατανομής του αριθμού δοκιμών.
ΛΥΣΗ
Οι δόκιμες τελειώνουν όταν στο μηχάνημα (=1, 2, 3 ), αν τα πρώτα 1
μηχανήματα περάσουν την δοκιμασία, και στο μηχάνημα που θα αποτύχει.
Αν Χ τυχαίος αριθμός δοκίμων, τότε
Ρ(Χ=) = (4/5) (1/5) (=1, 2, 3 ).
Το αποτέλεσμα του τύπου φαίνεται στο παρακάτω πίνακα:

χi 1 2 3 … n-1 n

pi 4 4 4 4
5 5 5 5 5

Η ιδιαιτερότητα της άσκησης είναι ότι ο θεωρητικός αριθμός των δοκίμων


μπορεί να είναι άπειρος, όμως η πιθανότητα τείνει στο μηδέν.
4 1
lim P( X  )  lim   0
    5
Παράδειγμα 2.6.9β
Κατά μήκος της πορείας ενός αυτοκινήτου υπάρχουν 4 σηματοδότες. Ο καθένας
τους με πιθανότητα 0,5 επιτρέπει ή απαγορεύει την διέλευση του αυτοκινήτου.
Να βρεθεί η συνάρτηση κατανομής της πιθανότητας ύπαρξης σηματοδοτών, οι
οποίοι επιτρέπουν το αυτοκίνητο να περάσει με κάθε δυνατό αριθμό στάσεων.
Λύση
Χi τυχαίος αριθμός σηματοδοτών, τους οποίους το αυτοκίνητο πέρασε χωρίς
στάση, και μπορεί να πάρει τις έξης τιμές:
x1=0, x2=1, x3=2, x4=3, x5=4
Οι πιθανότητες pi=Ρ(Χ=xi) ότι ο αριθμός των σηματοδοτών που πέρασε το
αυτοκίνητο υπολογίζονται από τον τύπο:

 p(1  p) i 1    1,2,3,4



p1  P( X  xi )  
 (1  p) 4  i  5

όπου: p η πιθανότητα του σηματοδότη να δείχνει κόκκινο (p=0,5)


Σαν αποτέλεσμα παίρνουμε:
p1=0,5, p2=0,25, p3=0,125, p4=0,0625

Παράδειγμα 2.6.9β

Σ΄ένα σύνολο από λαμπάκια τα % είναι χαλασμένα. Πόσα λαμπάκια πρέπει να


πάρουμε έτσι ώστε η πιθανότητα, να υπάρχει τουλάχιστον ένα χαλασμένο
λαμπάκι, θα είναι μικρότερη από 0,95;
Λύση
Τουλάχιστον ένα ελαττωματικό λαμπάκι σημαίνει ότι πριν από αυτό εξετάσθηκε
μία σειρά από λαμπάκια που λειτουργούν χωρίς πρόβλημα. Αναμένει κανείς ότι
το ελαττωματικό λαμπάκι μπορεί να εμφανισθεί στην πρώτη επιλογή ή στη
δεύτερη ή στην τρίτη κ.ό.κ. ή στη n επιλογή. Ζητείται να βρεθεί το n που
ανταποκρίνεται στα δεδομένα της ερώτησης. Αυτό θα γίνει με χρήση της Α.Σ.Κ.
της γεωμετρικής καταναομής, σύμφωνα με τη σχέση 2. 9.8 α
Έτσι, ο ζητούμενος αριθμός n βρίσκεται από:
n( )
n( )
Σ’ αυτήν την περίπτωση p1 = 0,95 p2 = 0,01
Τότε n  ln 0,05 / ln 0,09 
Παράδειγμα 2.6.9γ
Για να προωθήσει τις πωλήσεις της, μια εταιρεία που παράγει πατατάκια
τοποθετεί στις συσκευασίες ένα πλαστικό ομοίωμα κατοικίδιου ζώου. Στη
διάθεσή της η γραμμή παραγωγής έχει ομοιώματα από δέκα διαφορετικά
κατοικίδια ζώα, και στη συσκευασία τοποθετείται ένα εξ αυτών που επιλέγεται
με τυχαίο τρόπο. Πρακτικά, η κατανομή της πιθανότητας επιλογής των ζώων
είναι ομοιόμορφη κατανομή, καθώς ο αριθμός των ομοιωμάτων κάθε ζώου είναι
πολύ μεγάλος και πάντως ίσος με τον αριθμό των ομοιωμάτων άλλων ζώων.
Επίσης, οι τοποθετήσεις ομοιωμάτων στις συσκευασίες είναι γεγονότα
στατιστικά ανεξάρτητα.
Πόσες συσκευασίες πρέπει να αγοράσει ένας καταναλωτής προκειμένου να
αποκτήσει την πλήρη συλλογή;
Απάντηση.
Παρατηρεί κανείς ότι για να αποκτήσει την πλήρη συλλογή πρέπει να αγοράσει
περισσότερες από 0 συσκευασίες. Επίσης είναι προφανές ότι η ερώτηση
αναφέρετε στην μέση τιμή Ε[Χ] των συσκευασιών Χ που πρέπει να αγοράσει
κάποιος προκειμένου να αποκτήσει την πλήρη συλλογή. Έτσι, πρέπει να
διακρίνουμε δύο χαρακτηριστικά του προβλήματος: ) τι αντιπροσωπεύει η
τυχαία μεταβλητή Χ και 2) ποια είναι η κατανομή της πιθανότητας της Χ.
1) Αν Υ1 είναι η τυχαία μεταβλητή που αντιστοιχεί στο σύνολο των
συσκευασιών που απαιτείται να αγοραστούν προκειμένου να έχουμε το
πρώτο ομοίωμα, τότε Υi , όπου i = 2,3,…,10 θα είναι to πλήθος των
πακέτων μέχρι να βρεθεί το 2ο, 3ο, κ.λ.π. διαφορετικό από τα
προηγούμενα ομοίωμα. Έτσι θα ισχύει ότι Χ=Υ1+Υ2+…+Υ10 .
2) Επειδή Υi , i= ,2, … , 0 το πλήθος των συσκευασιών μέχρι την πρώτη
επιτυχία (ομοίωμα διαφορετικό από τα προηγούμενα, η κατανομή των Υi
, i= ,2, … , 0 είναι γεωμετρική. Για παράδειγμα, αν αντί για 0
ομοιώματα ή συλλογή είχε μόνο 3, θα είχαμε Ρ(Υ1)= 3/3, Ρ(Υ2)=(2/3)
και Ρ(Υ3)=( /3). Σύμφωνα με τη σχέση 2. 2.2, θα έχουμε Ε[Υ 1]=1,
Ε[Υ2]=3/2 και Ε[Υ3]=3.
Για τη συλλογή των 0 ομοιωμάτων, θα έχουμε αντίστοιχα
Ρ(Υ1)= 0/ 0, διότι επιτυχείς περιπτώσεις είναι 0 αφού δεν έχουμε ακόμα
ανοίξει συσκευασία με ομοίωμα.
Ρ(Υ2) = (1-p2)p2 = (1/10)(9/ 0), διότι στη δεύτερη συσκευασία επιτυχία
νοείται η εύρεση ενός από τα 9 ομοιώματα που δεν βρίσκονται στη συλλογή/
Ρ(Υ3) = (1-p3)2p3 = (2/10)2(8/10),
…………………………………
Ρ(Υ10) = (1-p10)9p10 = (2/10)2(8/10)
Έτσι, p1=1, p2=9/10, p2=8/10, p3=7/ 0, … p10= / 0, με τις αντίστοιχες
Ε[Υ1]= , Ε[Υ2]=10/9 , Ε[Υ3]= 0/8, … ., Ε[Υ10]=10/1 .
Τελικά, Ε[Χ]= Ε[Υ1]+ Ε[Υ2]+ Ε[Υ3] + … + Ε[Υ10] = + 0/9 + 0/8 + … + 0/
= 29,7 .
Παράδειγμα 2.6.9δ
Σε συνέχεια της ερώτησης του προηγούμενου παραδείγματος 2.6.9δ, να
υπολογίσετε τον αριθμό των συσκευασιών που πρέπει να αγοράσει
κάποιος μέχρι να βρει το πρώτο διπλότυπο ομοίωμα.

Ανάλυση

Η ανάλυση που ακολουθεί, δημοσιεύτηκε από τον Tim Rowland1


Ας θεωρήσουμε την περίπτωση συλλογής τεσσάρων διαφορετικών
ομοιωμάτων (n=4) . Η πιθανότητα ότι μια συσκευασία περιέχει ένα
συγκεκριμένο ομοίωμα είναι ¼. Θέτουμε p2= ¼ επειδή η δεύτερη συσκευασία
θα πρέπει να περιέχει το ίδιο ομοίωμα, που περιείχε η πρώτη συσκευασία.
Στη συνέχεια για την τρίτη έχουμε p3 = ¾  ½ , επειδή το δεύτερο ομοίωμα
δεν πρέπει να είναι το ίδιο με το πρώτο και το τρίτο επιλέγεται από τα δύο που
έχουν είδη επιλεγεί στην πρώτη και δεύτερη συσκευασία.. Για την τέταρτη
συσκευασία προκύπτει ομοίως ότι p4 = ¾  ½  ¾ και τέλος p5 = ¾  ½  ¾  1
Παρατηρούμε ότι = , όπως αναμενόταν. Τελικά,
[ ]= = 2 + 3p + 4p + 5p = 3

Απάντηση

Γενικεύοντας, έχουμε για n ομοιώματα,

= , p = , p = ,… , p = ( )
, για
k=2, … , n+1
Έτσι, ισχύει ότι = .
Ενδιαφέρον σε αυτό το σημείο παρουσιάζει η απόδειξη2 της συνολικής
Αθροιστικής Συνάρτησης Κατανομής η οποία πρέπει να ισούται με 1, δηλαδή.
= ( )
= ,
Παρατηρούμε ότι αποδεικνύεται επαγωγικά ότι για το άθροισμα των
τελευταίων j+1 όρων ισχύει

=
( +)
Έτσι όταν j=n-1 το παραπάνω γίνεται ίσο με 1.
Παρατηρούμε επίσης ότι για συλλογή n ομοιωμάτων
= , … , p = p , για k=2 έως n. Η αναλυτική αυτή
έκφραση επιτρέπει τον εύκολο υπολογισμό των πιθανοτήτων σε ένα φύλλο
εργασίας. Στη συνέχεια υπολογίζεται και η μαθηματική προσδοκία.
Από τους υπολογισμούς προκύπτει ότι η Ε[Ζn] είναι εξαιρετικά μικρή ακόμα
και για πολύ μεγάλο n . Για n = 10, 100, 365, 1000 η προσδοκώμενη τιμή θα
είναι Ε[Ζn] = 4,66 13,2 24,6 και 40,3. Ειδικά αναφέρεται ο αριθμός 365 γιατί
από τον υπολογισμό της προσδοκώμενης τιμής προκύπτει ότι σε μια ομάδα 26

1 Homerton College, Cambridge CB2 2PH, United Kingdom.


2 H απόδειξη οφείλεται στον Rex Watson, συνεργάτη του Rowland στο Cambridge.
ατόμων το πλέον πιθανό είναι ότι δεν θα βρεθούν δυο εξ αυτών με την ίδια
γενέθλια ημέρα.

You might also like