You are on page 1of 39

【統計簡單學】

第二單元

常用統計量

授課教師:唐麗英 教授

新竹交通大學
工業工程與管理學系

新竹交通大學唐麗英教授 | 統計簡單學 1
第二單元 內容大綱
• 第一部份:連續型數據特徵值之計算
1. 集中趨勢指標– 平均數、中位數與眾數
2. 分散趨勢指標– 全距、變異數與標準差
3. 偏態係數
4. 峰度係數

• 第二部份:數據特徵值之應用
1. 經驗法則
2. 盒鬚圖

新竹交通大學唐麗英教授 | 統計簡單學 2
第一部份:連續型數據特徵值之計算

新竹交通大學唐麗英教授 | 統計簡單學 3
連續型數據特徵值之計算

• 連續型原始數據(raw data)之特徵值包括:

1. 集中趨勢 (Central Tendency of Location)指標


2. 分散趨勢 (Dispersion)指標
3. 偏態 (Skewness)指標
4. 峰度 (Kurtosis)指標

新竹交通大學唐麗英教授 | 統計簡單學 4
1.集中趨勢指標

• 集中趨勢
– 「集中趨勢」是指一組數據往其中央點位置集中的趨勢。
• 常用的集中趨勢指標
– 平均數(mean)、中位數(median)、眾數(mode)。

1) 平均數
 xi
– 群體平均數:   N

– 樣本平均數: X 
x i

其中N表群體大小,n表樣本大小。

新竹交通大學唐麗英教授 | 統計簡單學 5
1.集中趨勢指標(續)
• 例1:請找出下列群體數據之平均數:0, 7, 3, 9, -2, 4, 6。

0 7 39 2 4 6
答:   3.857
7

• 例2:請找出下列樣本數據之平均數:25, 12, 23, 28, 17, 15。

25  12  23  28  17  15
答: X  20
6

• 例3:將例2之資料繪入下面之點圖中,其平均數即為數據之「平衡點」。

答:
10 15 20 25 30

新竹交通大學唐麗英教授 | 統計簡單學 6
1.集中趨勢指標(續)

2) 中位數
– 將一組數據由小至大排序後,位置在最中間的數值稱為中位數。
– 群體中位數:  讀音:eta
– 樣本中位數: X~ 讀音:X tilde

• 找中位數之方法:
~
 當n=奇數,X  排序第(n+1)/2位之數值。
~
 當n=偶數,X  排序第(n/2)位及第(n/2)+1位的兩數值之平均數。

新竹交通大學唐麗英教授 | 統計簡單學 7
1.集中趨勢指標(續)

• 例4:請找出下列樣本數據之中位數:9, 2, 7, 11, 14。

答: 將樣本數據排序後:2, 7, 9, 11, 14

~
X 9

• 例5:請找出下列樣本數據之中位數:9, 2, 7, 11, 14, 6。

答: 將樣本數據排序後:2, 6, 7, 9, 11, 14

~ 79
X 8
2

新竹交通大學唐麗英教授 | 統計簡單學 8
1.集中趨勢指標(續)

3) 眾數
答: 在一組數據中,出現次數最多的數值稱為眾數。

• 例6:請找出下列樣本數據之眾數:3, 3, 2, 1, 4, 2, 3。

答: 眾數=3。

• 例7:請找出下列樣本數據之眾數:3, 1, 4, 2。

答: 眾數= 無。

新竹交通大學唐麗英教授 | 統計簡單學 9
1.集中趨勢指標(續)

• 何時用平均數?何時用中位數或眾數?

– 平均數對離群值非常敏感,而中位數或眾數則對離群值較不敏感。

– 當資料中有離群值時,建議使用中位數或眾數,否則,使用平均數。

新竹交通大學唐麗英教授 | 統計簡單學 10
1.集中趨勢指標(續)

• 例8:請找出下列樣本數據之平均數、中位數與眾數:
1, 3, 4, 6, 6, 9, 13。
1  3  4  6  6  9  13
答: 平均數 X  6 ,中位數  6 ,眾數  6
7

• 例9:若此組數據最後一筆資料改成70: 1, 3, 4, 6, 6, 9, 70
,請重新計算平均數、中位數與眾數。

1  3  4  6  6  9  70
答: 平均數 X   14.14 ,中位數  6 ,眾數  6
7

新竹交通大學唐麗英教授 | 統計簡單學 11
1.集中趨勢指標(續)

• 例10:設有甲、乙兩個學校大學生,其每月花費如下表(以
新台幣計)。請問哪一個學校的學生有較高的月花費?

甲 乙
平均數 $4,750 $5,450
中位數 $4,450 $3,200

– 答: 甲 校的學生有較高之月花費。因其平均數和中位數非常接近,
表示了該校有許多學生之月花費至少超過該校學生月花費之平均數或
中位數。然而, 乙 校有一半的學生月花費是低於$3,200元,而只
有少數學生之月花費非常高。

新竹交通大學唐麗英教授 | 統計簡單學 12
2.分散趨勢指標

• 分散趨勢
– 是表示一組數據分散的趨勢。

• 常用的分散趨勢指標
– 全距 (Range)
– 變異數(Variance)
– 標準差 (Standard Deviation)

新竹交通大學唐麗英教授 | 統計簡單學 13
2.分散趨勢指標(續)

1) 全距
– 全距是用來衡量一組數據分散程度最簡單的指標。

• 公式: R = 最大值-最小值

• 用全距之缺點
– 當一組數據中出現 離群值 或樣本數很大時,全距並非一個很好
的衡量數據分散程度的指標,因其無法解釋最小值與最大值之間數
據分散的情形。

新竹交通大學唐麗英教授 | 統計簡單學 14
2.分散趨勢指標(續)

• 例11:以下三組數據有相同之 全距 ,不同之 分佈 。

新竹交通大學唐麗英教授 | 統計簡單學 15
2.分散趨勢指標(續)

2) 變異數
n

 (x  ) i
2

• 群體變異數: 2  i 1
N

 (x  X ) i
2

• 樣本變異數: S2  i 1
n 1

n n n n n n

 (x 2
i  2 xi X  X ) 2
x 2
i  2 X  xi   X 2
x 2
i  2 X  xi  nX 2
 i 1
 i 1 i 1 i 1
 i 1 i 1
n 1 n 1 n 1
n n n n n

n x i n x i n
( xi ) 2
( xi ) 2
n
( xi ) 2
(和的平方)
x 2
i  2( i 1 ) xi  n( i 1 ) 2
n i 1 n
x 2
i 2 i 1
n
 i 1
n
x 2
i  i 1
n
平方和 
數據總和
 i 1
 i 1
 i 1

n 1 n 1 n 1 數據總和  1

計算用公式

新竹交通大學唐麗英教授 | 統計簡單學 16
2.分散趨勢指標(續)

3) 標準差

• 群體標準差:  = 
2

• 樣本標準差: S= S 2

新竹交通大學唐麗英教授 | 統計簡單學 17
2.分散趨勢指標(續)

• 例12:請找出下列樣本數據之平均數、變異數及標準差:
5, 8, 1, 2, 4。
5

xi 5 8 1 2 4 x
i 1
i  20

x 2
i 25 64 1 4 16 x
i 1
2
i  110

5
樣本平均數 X   xi / 5  20 / 5  4
i 1

5 5

 x - ( x )
2
i i
2
/5
110 - (20 2 ) / 5
樣本變異數 S  2 i 1 i 1
  7.5
5 1 5 1

樣本標準差 S  S 2  7.5

新竹交通大學唐麗英教授 | 統計簡單學 18
3.偏態係數

• 偏態
– 是用來說明一組數據分佈的形態。

對稱
• 單峰分佈有三種形態之偏態
1) 對稱:平均數 = 中位數 平均數=中位數=眾數

右偏

2) 右偏,正偏:平均數 > 中位數


眾數 中位數 平均數

左偏
3) 左偏,負偏:平均數 < 中位數
平均數 中位數 眾數

新竹交通大學唐麗英教授 | 統計簡單學 19
3.偏態係數(續)

• 樣本偏態係數之公式如下:

M3 n 
g1  其中,M 3   ( xi  x ) 3  / n
S (n  1) / n 
3
 i 1 

1) 偏態係數 = 0 ,表示樣本分佈呈對稱。

2) 偏態係數 > 0 ,表示樣本分佈呈右偏。

3) 偏態係數 < 0 ,表示樣本分佈呈左偏。

新竹交通大學唐麗英教授 | 統計簡單學 20
4. 峰度係數

• 樣本峰度係數之公式如下:

M4 n 
g2  3 其中,M 4   ( xi  x ) 4  / n
S (n  1) / n 
4
 i 1 

1) 峰度係數 = 3 ,表示資料呈常態峰。
高峽峰
2) 峰度係數 > 3 ,表示資料呈高峽峰。

3) 峰度係數 < 3 ,表示資料呈低闊峰。

常態峰
低闊峰

新竹交通大學唐麗英教授 | 統計簡單學 21
第一部份:連續型數據特徵值之計算

【統計軟體範例】

新竹交通大學唐麗英教授 | 統計簡單學 22
統計軟體範例

• 某品牌手機經銷站負責人為了要瞭解該手機在大台北地
區銷售的遠景,特別檢查最近六十天的銷售記錄,得銷
售量如下表所示
23 60 79 32 57 70 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61

試求該品牌手機在大台北地區銷售量之平均數、中位數、
眾數、全距、變異數、標準差、偏態係數及峰度係數。

新竹交通大學唐麗英教授 | 統計簡單學 23
統計軟體範例 – Excel 報表

新竹交通大學唐麗英教授 | 統計簡單學 24
統計軟體範例 – Excel 報表

中位數

全距

新竹交通大學唐麗英教授 | 統計簡單學 25
統計軟體範例 – Minitab 報表

新竹交通大學唐麗英教授 | 統計簡單學 26
統計軟體範例 – Minitab 報表

Minitab 報表

樣本數 平均數 標準差 變異數 最小值 中位數 最大值 眾數

偏態係數 峰度係數

新竹交通大學唐麗英教授 | 統計簡單學 27
第二部份:數據特徵值之應用

新竹交通大學唐麗英教授 | 統計簡單學 28
經驗法則(又稱68%-95%-99.73%法則)

• 利用經驗法則(The Empirical Rule)可以決定數據分佈之情


形。

• 經驗法則:若數據資料呈鐘形分布,則約有
1) 68.26% 的數據在 μ±σ 範圍內
2) 95.44% 的數據在 μ±2σ 範圍內
3) 99.73% 的數據在 μ±3σ 範圍內

新竹交通大學唐麗英教授 | 統計簡單學 29
經驗法則(續)

• 例13:一家半導體廠經理想要研究員工完成某項製程的時間。
經理於是隨機挑選了40位員工作測試,得到平均數12.8分鐘
與標準差1.7分鐘。請以經驗法則來描述此樣本資料。

【解】:n=40 , X  12.8 , S=1.7

• 大約有68.26%的員工完成該製程的時間是介於12.8±1.7=(11.1,14.5)分鐘。

• 大約有95.44%的員工完成該製程的時間是介於12.8±2×1.7=(9.4,16.2)分鐘。

• 大約有99.73%的員工完成該製程的時間是介於12.8±3×1.7=(7.7,17.9)分鐘。

新竹交通大學唐麗英教授 | 統計簡單學 30
盒鬚圖

• 盒鬚圖(Box-Whisker Plot)
– 是資料的一種圖形展示法。此圖可同時顯示資料之集中趨勢、分散趨
勢、偏態、最小值、最大值等。此圖又稱「五指標摘要圖」(five-
number summary plot)

– Q1:第一四分位數或第25百分位數。
– Q2:第二四分位數或中位數(Md.)。
– Q3:第三四分位數或第75百分位數。

新竹交通大學唐麗英教授 | 統計簡單學 31
盒鬚圖(續)

• 盒鬚圖之主要功用
1) 可有效的找出資料之主要特徵值。
2) 可同時比較數組資料。

3) 可辦認出離群值。

新竹交通大學唐麗英教授 | 統計簡單學 32
盒鬚圖(續)

• 何謂離群值(Outliers)?
– 離群值是遠大於或遠小於同一筆數據中之其它值之數據。
• 如何利用盒鬚圖辨認出離群值?
1) 超過盒鬚圖之盒 1.5×(Q3-Q1)至 3×(Q3-Q1)距離內之值可當作「可
能之離群值」。
2) 超過盒鬚圖之盒 3× (Q3-Q1)距離外之值可當作「非常可能之離群值
(或極端值)」。

註:中四分位距 (Interquartile Range, IR)=Q3-Q1=第75百分位數-第25百分位數

新竹交通大學唐麗英教授 | 統計簡單學 33

極端值

離群值
¡

+3 IR

+1.5 IR

Q3
非離群
值資料 IR
Q1

-1.5 IR

-3 IR
¡

離群值
¡


¡:可能之離群值
極端值 * *:離群值/極端值

新竹交通大學唐麗英教授 | 統計簡單學 34
盒鬚圖(續)

• 例14:下列資料為三條生產線的良率,請依資料繪製盒鬚圖。

生產線1 生產線2 生產線3


0.99 0.98 0.91
0.86 0.97 0.91
0.95 0.94 0.92
0.94 0.97 0.93
0.93 0.97 0.91
0.96 0.96 0.94
0.95 0.94 0.92
0.92 0.97 0.95
0.96 0.98 0.88
0.94 0.97 0.95

新竹交通大學唐麗英教授 | 統計簡單學 35
盒鬚圖(續)

• 例14:三條生產線良率之盒鬚圖繪製如下。

新竹交通大學唐麗英教授 | 統計簡單學 36
本單元結束

新竹交通大學唐麗英教授 | 統計簡單學 37
第二單元 簡單回顧

新竹交通大學唐麗英教授 | 統計簡單學 38
簡單回顧

• 連續型數據之特性值:
– 集中趨勢指標
• 平均數、中位數及眾數

– 分散趨勢指標
• 全劇、變異數及標準差

– 偏態系數
– 峰度係數
• 數據特性值之應用:
– 經驗法則
– 合鬚圖

新竹交通大學唐麗英教授 | 統計簡單學 39

You might also like