Professional Documents
Culture Documents
劉仁沛教授
國立台灣大學農藝學研究所生物統計組
國立台灣大學流行病學與預防醫學研究所
國家衛生研究院生物統計與生統資訊組
jpliu@ntu.edu.tw
【本著作除另有註明,網站之內容皆採用 創用CC 姓名標示-非
商業使用 - 相同方式分享 3.0 台灣 授權條款釋出】
例:擲硬幣三次
令 X 為出現正面的次數
X 可能的值為 0,1,2,3
在未擲硬幣三次前不知 X 之值
但 X 出現為 0,1,2 或 3 之可能性可用機率表之
X 為整數故 X 稱為分立隨機變數 (Discrete Random
Variables)
其相應的機率稱為分立隨機變數之機率分布
擲硬幣三次的樣品空間
HHH,HHT,HTH,THH
HTT, THT,TTH, TTT
X Event 機率
0 { TTT } 1/8
1 { HTT,THT,TTH } 3/8
2 { HHT,HTH,THH } 3/8
3 { HHH } 1/8
4 111/10/03 Jen-pei Liu, PhD
分立隨機變數
例:擲硬幣三次正面出現至少二次的機率
P(X≧2)=P(X=2)+P(X=3)
=3/8+1/8
=1/2
正面出現少於二次的機率
P(X < 2)= 1-P(X≧2)
=1-1/2
=1/2
5 111/10/03 Jen-pei Liu, PhD
分立變數期望值 (Expected Value)
分立變數期望值為該變數可能值的加權平均,
其權數為該數值出現的機率。
利潤 x 機率 x‧p(x)
p(x)
$300 0.999 299.7
( 保險人未死亡 )
$300-20,000=-19,700 0.001 -19.7
( 保險人死亡 )
和 280== 利潤
大樂透頭彩 2 億, 49 號取 6 號,要不要玩 ?
- 大樂透 1/ C649 7.15 108
- 買一張 50 元,中獎得 2 億的機率為7.15 108
- 期望值為
(199,999,950)(7.15 10 8 ) ( 50)(1 (7.15 10 8 )) 35.698
- 平均而言,每個買彩券的人樂捐了 35.698 元 ( 另一種稅 ?)
- 要不要玩 ?
- 多人參加對誰有利 ?
- 每天十萬人買大樂透,收入 350 萬,一年 12 億 7750 萬
分立變數的變方
σ = (x - μ) p(x i )= x p(x i ) - μ
2 2 2 2
i i
分立變數之變方為每個可能值與期望值偏差平方之
加權平均,權數為其數值之機率
2
σ = SD = σ
σ= 0.75=0.8660
12 111/10/03 Jen-pei Liu, PhD
二項分佈 (Binomial distribution)
問題:根據過去經驗一個顧客進入
某一家商店會購買商品的機率為
0.4(40 % ) ,請問三位顧客中
有二位會購買商品之機率為何?
隨機變數 X :購買商品的顧客
可能出現的值: 0,1,2,3
問題 :p(x=2)=?
問題特性:
1. 本試驗包括三個相同的小試驗
每一小試驗是顧客購買商品
2. 每一小試驗只有二種結果
購買 (S) 或不購買 (F)
3.P(S)=0.4 ; P(F)=1-P(S)=0.6
4. 每一個顧客買的機率均為 0.4
5. 每一個顧客均獨立購買商品 ( 不受他人影響 )
樣品空間
SSS FFS
SSF FSF
SFS SFF
FSS FFF
X=2 之事件包含的結果為
{ SSF,SFS,FSS }
P(SSF)=P(S)P(S)P(F)=(0.4)(0.4)(0.6)=(0.4)20.6
P(SFS)=P(S)P(F)P(S)=(0.4)(0.6)(0.4)=(0.4)20.6
P(FSS)=P(F)P(S)P(S)=(0.6)(0.4)(0.4)=(0.4)20.6
P(X=2)=P(SSF)+P(SFS)+P(FSS)
=(0.4)20.6+(0.4)20.6+(0.4)20.6
=3(0.4)20.6
1. 試驗包括 n 個相同小試驗
2. 每個小試驗包括二個結果成功 (S) 或失敗 (F)
3. 成功機率為 p, 失敗機率為 q=1-p
4. 小試驗間為互相獨立
5. X 為成功次數
6. n x n x n!
P( x) p q p x qn x
x x !( n x)!
附表 2 (P.469-480)
19 111/10/03 Jen-pei Liu, PhD
二項分佈 (Binomial Distribution)
n
μ = E(X) = X P(X )
i=0
i i
n
n x n-x n
n!
= x p q = x p x q n-x
x=0 x x=0 x!(n-x)!
n-1
(n-1)!
= np p x-1q n-x
x=1 (x-1)!(n-x)!
= np(p+q) n-1 = np
n
n x n-x n
n!
= x p q = x
2 2
p x q n-x
x=0 x x=0 x!(n-x)!
n
x(x-1)n! x n-x n!
= [ p q x p x q n-x ]
x=0 x!(n-x)! x!(n-x)!
(n-2)!
n-2
= n(n-1)p 2
p x-2 q n-x np
x=2 (x-2)!(n-x)!
i
2
σ
2
= (x - μ) p(x i )
= x p(x i ) - μ
2
i
2
2 2
=n(n-1)p + np -(np)
= n 2 p 2 -np 2 +np-n 2 p 2
2
= np - np
= np(1-p) = npq
22 111/10/03 Jen-pei Liu, PhD
二項分佈 (Binomial Distribution)
二項分布之期望值與變方
= np
2 = npq
= npq
n 個相同小試驗其成功機率
為 p 之二項分立隨機變數,記為 X~Bin(n,p)
由二項分布期望值公式,其治癒人數為:
E(X)=np=20(0.9)=18 人
0.0432(表二)
至少有 16 位病人治癒的機率為:
P( X 16) 1 p ( X 15)
1 0.0432
0.9568
卜瓦松分布為稀少事件個數之分布
二項分布中 n 很大且 p 很小時,其分布即變成
卜瓦松分布 ( 時間及空間 )
例:某十字路口每月發生車禍之次數
每年騎兵被馬踢死之人數
某機場塔台每半年發生錯誤的次數
一 c.c. 血液中某種細菌之個數
附表 3(P.481-P.482)
‧ 卜瓦松分布之特性 : 平均數 = 變方
=2
σ= μ
μ x e-
E(X)= xP(x)= x
x=0 x=0 x!
μ x e-
μ x-1e -
= =μ =μ.
x=1 (x-1)! x=1 (x-1)!
μ x e-
E[X(X-1)]= x(x-1)P(x)= x(x-1)
x=0 x=0 x!
μ x e-
μ x-2 e-
= =μ
2
μ2
x=2 (x-2)! x 2 (x-2)!
完全沒有車禍病人之機率只有 13.534 %,
有一個車禍病人之機率為 27.067 %,
有二個車禍病人之機率為 27.067 %,
而有三個車禍病人之機率為 18.045 %,
大於三個車禍病人之機率為:
P(X > 3)=1-p(X≦3)=1-0.85713
=0.14287=14.287%
x 50
50
5 5 5
1
5 5
2
5 5
3
(b) P ( X 3) e e e e
0! 1! 2! 3!
=0.00674+0.03369+0.08422+0.14037
=0.26502=26.502%
(c) P(X>3)=1-P(X≦3)=1-0.26502=0.73498=73.498%
34 111/10/03 Jen-pei Liu, PhD
μ=5 時二項分布與卜瓦松分布比較表
卜瓦松
p 0.5 0.10 0.05
分布
n 10 50 100 機率
x
0 0.0010 0.0052 0.0059 0.0067
1 0.0098 0.0286 0.0312 0.0337
2 0.0439 0.0779 0.0812 0.0842
3 0.1172 0.1386 0.1396 0.1404
4 0.2051 0.1809 0.1781 0.1755
5 0.2461 0.1849 0.1800 0.1755
6 0.2051 0.1541 0.1500 0.1462
7 0.1172 0.1076 0.1060 0.1044
8 0.0439 0.0643 0.0649 0.0653
9 0.0098 0.0333 0.0349 0.0363
10 0.0010 0.0152 0.0167 0.0181
>10 0 0.0094 0.0115 0.0137
1.0000 1.0000 1.0000 1.0000
35 111/10/03 Jen-pei Liu, PhD
總結 (Summary)
n x n x
機率分布 P( x) p q
x
二項分布
= np
2 = npq
卜瓦松分布
e x
P( x)
x!
= 2
36 111/10/03 Jen-pei Liu, PhD
習題:
P.105: 2,3
P.106: 5
頁碼 作品 授權條件 作者 / 來源