You are on page 1of 8

淺談百分位數 文/建國中學 繆友勇老師

國中正式綱要在統計部分出現了百分位數,讓一些老師緊張了一下,在高中考大學的學測與

指考,都會出現頂標(第 88%位置的分數)
、高標(第 75%位置的分數)
、均標(第 50%位置的分

數)、低標(第 25%位置的分數)、後標(第 12%位置的分數)作為篩選學生分數的依據,國中考

高中基測也會出現百分等級資料,故值得針對百分位數與百分等級做一些介紹。

一、分組資料的百分位數

利用累積相對次數來定義分組資料的百分位數,在製圖時,縱軸上從 0%至 100%的資料中標

示,其中 1%、2%、3%、……、99%的點將資料均分成 100 等分,中間 99 個分割點所對應的數

值,我們稱為該批資料的第 1、2、3、……、99 百分位數。

例如:右圖是正義國中三年級 1200 位學生數學成績分組統計

後所繪製的累積相對次數折線圖。在右圖中,從橫軸成績 50 分上

作一條垂直線使其與折線相交,再由此交點作一水平線與縱軸相

交,交點所對應的累積相對次數是 40(%),我們稱成績 50 分是

這 1200 個成績的第 40 百分位數。同樣的,縱軸 80(%)所對應 正義國中三年級 1200 位學生數學


成績累積相對次數折線圖
的分數是 70 分,所以 70 分是這 1200 個成績的第 80 百分位數。

二、未分組資料的百分位數 註
P{x∈X:x≦A}≧m%:
(一)百分位數
在一組資料中任取一個數值,其小於
在統計學上 The m-th percentile(第 m 百分位數)為 A, 或等於 A 的機率大於或等於 m%

P{x∈X:x≧A}≧(1-m%)
是指 P{x∈X:x≦A}≧m%,且 P{x∈X:x≧A}≧(1-m%)
在一組資料中任取一個數值,其大於
都成立。 或等於 A 的機率大於或等於
(1-m%)

在國中教材無法用機率來介紹百分位數的概念,我們試著將其解讀成:
「將資料中的數值先由

小排到大,會有一個數值 A,如果這組資料中至少有 m%的數值資料小於或等於 A,且至少有

(100-m)%的資料數值料大於或等於 A。」我們就稱這組資料的第 m 百分位數是 A,(其中 m

是正整數,且 1≦m≦99),其相關位置如右圖。
(二)中位數的百分位數

我們先從容易懂的中位數舉例來說明,

如果一組數值資料有 30 個連續奇數,由小排到大分別是:1,3,5,7,9,11,……,55,57,59。

求這組數值資料的中位數?

這組資料的中位數是由小排到大的第 15 筆(29)與第 16 筆數值(31)的平均,

(29+31)÷2=30,所以這組資料的中位數是 30。

數值 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29

排序 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

數值 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59

排序 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

將這組資料由小到大排列如上表,我們發現至少有 50%(15 筆)的數值資料小於或等於中

位數(30),且至少有(100-50)%(15 筆)的數值資料大於或等於中位數(30)。我們稱『30』

是這組資料的第 50 百分位數。

利用中位數來進入百分位數,我們來思考下列問題:

(1) 如果第 50 百分位數是 29,是否仍符合「至少有 50%的數值資料小於或等於 29,且至少有

(100-50)%的數值資料大於或等於 29」?

(2) 如果第 50 百分位數是 31,是否仍符合「至少有 50%的數值資料小於或等於 31,且至少有

(100-50)%的數值資料大於或等於 31」?

(3) 如果第 50 百分位數是 29.1,是否仍符合「至少有 50%的數值資料小於或等於 29.1,且至

少有(100-50)%的數值資料大於或等於 29.1」?

(4) 如果第 50 百分位數是 30.9,是否仍符合「至少有 50%的數值資料小於或等於 30.9,且至

少有(100-50)%的數值資料大於或等於 30.9」?

從前面的思考問題可以發現從第 15 筆資料(數值 29,包括 29)到第 16 筆(數值 31,

包括 31)之間所有的數,不管是否為數值資料內的數,都可以是第 50 百分位數,通常我們取第 15

筆數值(29)與第 16 筆數值(31)的平均(30)來表示其第 50 百分位數。


(三)百分位數(個數乘以 P%為整數)

我們直接用例子來說明百分位數的求法:

一組數值資料有 30 個連續奇數,分別是:1,3,5,7,9,11、……、57,59。

求該組資料的第 40 百分位數是多少?

設第 40 百分位數是 A,

1. 30×40%=12,表示這組資料中至少要有 12 個數小於或等於 A。參考下表,資料由大排到

小的第 12 筆數值是 23。

(1) 若 A=23,小於或等於 23 的數共有 12 個。

(2) 若 A=23.1,小於或等於 23.1 的數共有 12 個。

(3) 其他如 A=23.2、23.3、223.4、……等也都符合條件。

亦即所有大於或等於 23 的數都可能是 A。A≧23---------------------○


1 。

數值 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29

排序 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

數值 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59

排序 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

2. 30×(1-40%)=18,表示這組資料中至少要有 18 個數大於或等於 A。參考上表,

資料由大排到小的第 18 筆數值是 25。

(1) 若 A=25,大於或等於 25 的數共有 18 個。

(2) 若 A=24.9,大於或等於 24.9 的數共有 18 個。

(3) 其他如 A=24.8、24.7、24.6、……等都符合。

亦即所有小於或等於 25 的數都可能是 A。A≦25------------------------○


2 。

從○
1 和○
2 可得 23≦A≦25,也就是說介於第 12 筆(23)與第 13 筆(25)之間的所有數值皆可

以是這組資料的第 40 百分位數。通常我們以 23 和 25 的平均來表示,亦即以 24 來表示第 40 百分

位數。

由前面的例題可知百分位數的求法:

如果將資料個數乘以 P%為 I,當 I 是整數時,則第 P 百分位數為第 I 筆資料數值

與第 I+1 筆資料數值的平均值。
(四)百分位數(個數乘以 P%不是整數)

還是一樣,用例子來說明百分位數的求法,

一組數值資料有 30 個連續奇數,由小排到大分別是:1,3,5,7,9,11,……,55,57,59。

求該組資料的第 68 百分位數是多少?

設第 68 百分位數是 A,

1. 30×68%=20.4,表示這組資料中至少要有 20.4 個數(取整數要有 21 個)小於或等於 A,

參考下表,資料的第 21 筆數值是 41。

(1) 如果 A=41,小於或等於 41 的數共有 21 個;

(2) A=41.1,小於或等於 41 的數也是有 21 個,

亦即所有大於或等於 41 的數都可能是 A。A≧41--------------------------○


3

數值 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29

排序 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

數值 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59

排序 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

2. 30×(1-68%)=9.6,表示這組資料中至少要有 9.6 個數(取整數要有 10 個)大於或

等於 A,參考上表,資料由大排到小的第 10 筆數值是 41。

(1) 若 A=41,大於或等於 41 的數共有 10 個

(2) 若 A=40.9,大於或等於 40.9 的數也共有 10 個

亦即所有小於或等於 41 的數都可能是 A。A≦41--------------------------○


4

從○
3 和○
4 可得這組資料的第 68 百分位數是 41,它是第 21 筆數值。

由前面的例題可知百分位數的求法:

如果將資料總個數乘以 P%為 I,當 I 不是整數時,若 M 為大於 I 的最小整數,

則第 P 百分位數為第 M 筆資料數值。
三、四分位距

在國中課本中可以利用資料中的第 25 百分位數、第 50 百分位數、第 75 百分位數這三個百分

位數來定義四分位數。

第 25 百分位數稱為第 1 四分位數,簡記為 Q1;第 50 百分位數稱為第 2 四分位數,簡記為 Q2,

也就是中位數;第 75 百分位數稱為第 3 四分位數,簡記為 Q3。

Q1、Q2、Q3 在整體資料位置的分布情形如下圖,第 3 四分位數與第 1 四分位數的差

(Q3-Q1)稱為四分位距(簡稱 IQR)。

全距
四分位距(IQR)

0% 25% 50% 75% 100%

第 1 四分位數(Q1) 第 2 四分位數(Q2) 第 3 四分位數(Q3)


[中位數]

關於四分位數也可以這樣定義:將一群統計資料的數據,依照其大小順序,由小到大排成一

列,設中位數為 M,在此數列中,位在 M 後段各數的中位數(稱為第 3 個四分位數,以 Q3 表示),

又位在 M 前段各數的中位數(稱為第 1 個四分位數,以 Q1 表示)。

這兩種定義法的計算,大致上都一樣,但是在資料數目為(4n+1)時,會出現不同的結果,

舉例說明如下表:

資料 國中課本 另一種算法
數值資料 中位數
個數 Q1 Q3 Q1 Q3
13 1,2,3,4,5,6,7,8,9,10,11,12,13 7 4 10 3.5 10.5
14 1,2,3,4,5,6,7,8,9,10,11,12,13,14 7.5 4 11 4 11
15 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15 8 4 12 4 12
16 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16 8.5 4.5 12.5 4.5 12.5

統計常因不同的解讀與定義而有不同的數據,故這兩種算法都是對的,教師在命題上,請盡

量避開數目為(4n+1)的情形,以免增加困擾。
四、利用 EXCEL 求百分位數

利用 EXCEL 軟體可以協助我們來做資料的分析,方法如下:

第 1 四分位數:

‹ 進入 EXCEL
‹ 在 A 欄輸入全部數值,例如在第一欄(A1 到 A20)輸入 1,2,3,……,20
‹ 在上方輸入函數『=QUARTILE(A1 : A20 , 1)』

或者從插入欄中的函數中尋找統計部分,再輸入起始數值與終止數值的欄位請參考下圖。

其他有關四分位數與百分位數的函數如下:

第 2 四分位數:『=QUARTILE(範圍 , 2)』

第 3 四分位數:『=QUARTILE(範圍 , 3)』

第 30 百分位數:『=PERCENTILE(範圍 , 0.3)』

第 60 百分分位數:『=PERCENTILE(範圍 , 0.6)』

不過,因為統計學者對於百分位數的解讀不一樣,且統計資料只是提供參考,不是拿來當作

考試,故利用 EXCEL 計算出來的資料與課本所學可能會有一點出入,請不必在意,因為統計的資

料分析是提供參考的,而我們的統計教學是偏重計算數值的。
五、百分等級

在一個參加人數眾多的測驗中,用 99 個百分位數可以將所有測驗者的資料平均分成 100 個小

群體,每個小群體稱為 1 個等級,共可分為 100 個等級,稱為百分等級,並以 PR 值表示。

習慣上我們不使用PR=0的表示法,而是將最低的2個小群體合併為PR=1。

最高的1個等級是PR=99,表示這個小群體裡的成績大於或等於全體考生的99%。PR=63表示

該群體裡的成績都大於或等於全體考生的63%,但不到全體考生的64%。例如:第一次模擬考有6400
4096
人參加,彥昌的排名是第2304名,表示他贏過6400-2304=4096(人), ×100%=64%,
6400
所以彥昌的百分等級(PR值)是64。


‹ 關於百分等級也有其他類似的算法,提供參考如下:
R:由高而低之排名
(1) PR=(N-R+0.5)/ N*100
N:測驗總人數
(2) PR=(a-0.5)/ N*100 a:由低排到高的名次

從前面的定義與算法可知,百分位數是一個分數共有99個(1%、2%、……、99%)將所有的
資料平均分成100個小群體,每個小群體稱為1個等級。而百分等級是資料中某些筆資料在群體中所
占的位置。

‹ 依據國中基本學力網站對於基本學力測驗分數通知單上所提供的 PR 值代表的意義如下:

※基本學力測驗分數通知單上所提供 PR 值是什麼意思?

答:國中基本學力測驗分數通知單上所提供的 PR 值(又稱為百分等級)
,是先將該次測驗所
有考生的量尺總分排序後,依照人數均分成一百等分,該生大約會落在第幾個等分中。
簡單來說,若某位考生的 PR 值為 95,即表示該生的分數高於該次測驗全國約 95%考生。
但是因為每次測驗的總人數不相同,所以不同次測驗中每個百分等級所包含的人數並不
相同。例如,98 年第一次基本學力測驗的總人數是 315408,每個百分等級平均約包含了
3154 人;至於 98 年第二次基本學力測驗的總人數是 152370,每個百分等級平均約包含
了 1524 人。兩次基測的總分經過測驗等化機制,所以可以互相比較,但要注意的是兩次
測驗分數通知單上所提供的 PR 值是無法直接比較的。
六、教學提醒

1. 目前所學的統計課程重視的是資料的集中與分布的情形,有些資料分析的名詞會因不同的學

者而有不同的定義與解讀,教燢時建議以課本為依據。統計的目的是在處理大筆的資料,一

次基測大約有三十萬人,我們平常的考試絕對不可能用這樣大的數據命題,故建議教師可以

多教導學生去了解每筆資料的分析介紹,懂得解讀資料的特性與變化。

2. 在百分位數的教學時,建議在教中位數時可以先引導介紹第 50 百分位數,讓學生先有一點點

的概念,接著介紹百分位數,會更容易聽懂。而大部分的學生對於處理百分位數的態度,可

能都用背的,直接帶入公式來算,未必懂得其意義,教師可針對學生程度給予適當的說明。

3. 在命題上,數字要盡量好算,避免出現極端數值(過大或過小)
,也不要出現一大堆相同的數

值,這會增加教師本身教學的困擾。

4. 統計教學是很輕鬆愉快的,不要太斤斤計較細微數值的差距,或花費時間停留在追求絕對標

準答案中。但請別忘記,事先的準備充足是上好統計課程的不二法門。

參 考 資 料
‹ 翰林九下課本

‹ 翰林九下教師手冊

‹ 統計學的世界 墨爾 著 鄭惟厚 譯 天下出版社發行

‹ 國民中學學生基本學力測驗推動工作委員會網站:http://www.bctest.ntnu.edu.tw/

‹ http://www.nchu.edu.tw/~etc/range.htm

‹ http://mathseed.ntue.edu.tw/hard/%E6%95%99%E5%AD%B8%E7%96%91%E9%9B%

A3%E5%BD%99%E7%B7%A8/ch4/95Q-J37.pdf

‹ http://tw.knowledge.yahoo.com/question/question?qid=1105060610469

You might also like